问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

2024中国虚拟数字人影响力指数报告

创作时间:
作者:
@小白创作中心

2024中国虚拟数字人影响力指数报告

引用
1
来源
1.
https://www.fxbaogao.com/detail/4212101

随着人工智能技术的飞速发展,AIGC(Artificial Intelligence Generated Content)已成为促动数字创新的关键驱动力。AIGC技术不仅具备多模态内容自动生成的能力,涵盖了从文本、图像、音频乃至视频等多种媒介形式的创造性生产,并且正逐步与数字人概念深度融合,昭示着一个全新的虚拟数字互动时代——媒体融合面向纵深发展时代的到来。

虚拟数字人的定义与分类

在往期《报告》中,我们对研究对象“虚拟数字人”的概念和外延进行了详细的分析及定义。从技术层面,虚拟数字人可以理解为,是通过计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等技术手段创设,并具有“人”的外观、行为、甚至思想(价值观)的可交互的虚拟形象。从未来媒体形态和服务模式看,计算机图形学、语音合成技术、深度学习、类脑科学、生物科技、计算科学等聚合科技(Converging Technologies)带来语义传播与无障碍传播的新空间,由此诞生的虚拟数字人将以新媒介角色,广泛应用在元宇宙新生态中,担任着信息制造、传递的责任,是元宇宙中“人”与“人”、“人”与事物或事物与事物之间产生联系或发生孪生关系的新介质。

经过新一年度的快速发展,“虚拟数字人”已然从小众走向大众,从商业渗透进民用,成为政府政策、学术研究、产业深耕的重要领域,在日常表达、甚至是政策制定中,开始简称为“数字人”。

《报告》的评估对象锁定为当前国内商业化应用最好、最具人气的三类数字人:虚拟偶像、虚拟主播、数字员工。

  • 虚拟偶像
    定义:以歌手、演员、模特、网红、游戏高手等“艺人”身份出现,拥有鲜明的个性、才艺设定,活跃于各大社交平台、视频平台、综艺节目等,通过积累流量、人气而获得更多的“工作”的虚拟数字人。
    运营方式:与真人艺人相似,通过歌曲、硬照、短剧、综艺等作品进行运营。主要代表:洛天依、星瞳、苏小妹等。

  • 虚拟主播
    定义:虚拟世界的“主持人”,在专业赛道上包括各大媒体推出的数字主持人、数字记者、数字编辑等;而在视频平台上活跃的虚拟UP主们则由企业或个人运营,数量庞大。
    运营方式:专业赛道以新闻报道、综艺节目为主,替代真人主播、记者和编辑;视频平台则以直播互动、直播带货为主。主要代表:央视总台AI王冠、央视网小C、YOYO鹿鸣、狐璃璃等。

  • 数字员工
    定义:由政府、企事业单位推出,作为机构的“虚拟员工”,对外展示企业的产品、服务、文化,对内替代行政、培训等部分内部运营功能。智能客服、企业品牌官、虚拟导游、虚拟老师、虚拟学生等是当前数字员工的主要呈现形式。
    运营方式:对内以替代企业经营各环节的部分功能为主;对外主要以智能服务、品牌代言等为主。主要代表:爱加、班长小艾、度晓晓等。

虚拟数字人的研究新命题

2023年是虚拟数字人行业的政策年也是规范年。国家部委、省、市各级政府持续推出促进元宇宙、虚拟数字人发展的政策数十个(详见行业观察“政策端”数据);与此同时,知名数字人公司魔珐科技与杭州某网络公司的“首例涉虚拟数字人侵权案”二审胜诉,并入选“2023年度人民法院十大案件”,虚拟数字人及其作品的版权等问题开始受到专业关注。

2023年是虚拟数字人行业的AIGC的变现年也是冲击年。在AIGC的带动下,数字人的生产、运营都在降本增效,商业应用开始普及,从广电到文旅,从金融到教育,从电商到餐饮,数字人相关的制作、技术、运营招标屡见不鲜;但与此同时,大量同质化、低质量的数字人开始通过短视频入侵社交和电商领域,引发客户投诉。2023年5月9日,抖音发布《抖音关于人工智能生成内容的平台规范暨行业倡议(以下简称数字人行业倡议)》,国内流量最大的平台开始监管虚拟数字人这一新物种。

时间转至2024年,以SORA为代表的文生视频模型的长足进步,文生数字人开始出现,让更多的新研究命题开始浮现:数字人的版权问题、标识标准、跨平台通用规范、伦理道德问题、监管问题等。基于观察研究,课题组尝试使用模因论解题,通过拆解数字人的“多模态”特征,为数字人的标识、使用、监管等提供研究参考。

模因论视域下的虚拟数字人

模因(Meme),又译为觅母、弥母、米姆、谜因、拟子等,由英国进化生物学家理查德·道金斯对比基因(Gene)提出:基因存在于生物细胞的细胞核里面,而模因是以语言、信仰、故事、艺术设计、音乐、科学定理等形式存在于我们的大脑之中;模因是传递和繁衍社会文化与文明的基本单元,是文化复制因子,模因的传播是语言、信仰、观点、行为等的传播。

在AI技术的推动下,数字化生产、生活快速普及,虚拟偶像、数字员工、虚拟主播等“虚拟数字人”大量出现,并成为继语言、音乐、图片等之后模因的多模态融合新载体,其将模因理论中关于人本身、人创造的文化及社会关系融为一体,且具备了更快速、甚至可独立进化的新趋势。这为虚拟数字人的研究、应用观察都提供了新的理论和视角。

模因论视域下,虚拟数字人在数字世界中呈现的外形、声音、行为特征和数据,以及承载的文化模因,可统称为其的“数字模因”,结合“人”的个体表达特征,虚拟数字人包含了文本、图像、视频、音频的多模态信息,其数字模因包含了形、声、行、神(即文化模因)四个要素。

我们以交互、服务为目的,具备形、声、行、神四类模因中的一类或多类数字模因的对象,都属于虚拟数字人。本章节虚拟数字人模因内容引自课题组成员论文,如有使用请引用原文:张丽锦,吕欣,虚拟数字人:模因论的新“锚点”——模因论视域下的虚拟数字人:概念、特征和应用[J].学术探索,2024年第3期。

虚拟数字人四大模因的分类及特征

形模因

虚拟数字人的外观和形象层次,涵盖了其外观、造型、配饰等形象设计,是虚拟数字人在视觉上产生影响的基本元素,对用户第一印象的形成起着关键作用。

从“复制因子”属性来看,形模因的复制有两条明显的“道路”:一是以“真人复刻”为目标,不断拓展设计精度,去接近和还原真人;二是以“拟人”为目标,通过物理世界的动物、植物等赋予人的“形模因”进行再创造,如具有人类特征的眼、口、鼻、耳、手、脚、服装等。

结合当前实践,虚拟数字人的形模因可以进行更细致的分类,如根据图形维度,分为2D和3D两大类,2D为平面驱动式,3D需要建模完成;从外形上可分为二次元、高仿真、超写实等风格;按照设计由易到难,市场上有2D真人型、二次元型、3D卡通型、3D真人型、3D超写实等类型。

形模因是所有虚拟数字人“诞生”的首个要素,是承载了设计学、美学的重要模因,是最直观地形成用户印象的模因。形模因的演化与社会审美紧密相关,无论是哪种模因类型,都有其不同的追随者,因此形模因的多样性将长期存在,且其美术评级标准例将长期多元化。例如二次元风格的洛天依与超写实的星瞳虽然风格不一,但在审美评级上都成为成功范本。

声模因

虚拟数字人的语言和对话层次,包含了其音色、语调、语速、用词、语种等声音设计和语言表达,是虚拟数字人与用户交流的主要方式,会直接影响用户对其的感知和情感体验。

虚拟数字人声模因的表现主要通过声音克隆、语音合成。从“复制因子”的属性上看,声模因分为通用TTS和个性化TTS两大类,其复制方式目前主要有“拼接法”和“参数法”两种:拼接法,从预先录制的大量语音中,选择所需的音节、音素等基本单位拼接而成,这种声模因质量高,但所需语料数据大,成本也高;参数法,根据统计模型来产生每时每刻的语音参数(包括基频、共振峰频率等),然后把这些参数转化为波形。

作为重要的交互模因,声模因直接关系虚拟数字人的使用体验。当前,通用TTS主要用拼接法,个性化TTS则多使用参数法,智能客服、有声读物等都是声模因可以独立应用的、常见的应用场景。在抖音、快手、B站、小红书等虚拟数字人聚集平台,声模因往往是“通用模型”,如萝莉音、大叔音、游戏音,甚至是“广西老表语音包”等都成为流行的声模因。而在虚拟数字人的实际应用中,个性化TTS的制作、真人语音的“高保真、超写实”的克隆需求开始增加。如:3D真人虚拟主播,需要将真人的语音、语调、语速、语气、停顿、重音、尾音等都进行高保真,然后输出;而拥有“人设”的虚拟偶像、数字员工等,其设计者们也是不断追求其声音的“真”度、独特性。

行模因

虚拟数字人的动作和行为层次,包括其表情、动作、互动方式等。虚拟数字人的动作、行为及互动方式设计对于创造生动、有吸引力的用户体验至关重要,是与用户建立联系的重要手段。

虚拟数字人的行模因通过表情、微表情、肢体动作、标志性行为等进行表达,同时也包含了技能定义,如舞蹈技能、音乐技能、金融知识技能、模特表现技能等。例如,初音未来爱给粉丝进行“眨眼”的互动,美妆捉妖达人柳夜熙的“捉妖”动作,都是其行模因的重要组成部分。

行模因的复制和创造主要通过动作捕捉、动画制作、AI驱动等技术实现。动作捕捉技术可以实时捕捉真人的动作数据,然后映射到虚拟数字人身上;动画制作则通过关键帧动画、骨骼动画等方式实现虚拟数字人的动作设计;AI驱动则通过机器学习算法,让虚拟数字人能够自主生成自然、流畅的动作。

行模因的设计需要充分考虑虚拟数字人的应用场景和目标用户群体。例如,虚拟主播需要具备丰富的表情和肢体语言,以便更好地与观众互动;虚拟偶像则需要设计独特的标志性动作,以增强其辨识度和吸引力;而数字员工则需要具备专业领域的技能表现,如金融知识、医疗知识等。

行模因的创新和个性化是提升虚拟数字人竞争力的关键。通过不断优化动作捕捉技术、提升动画制作水平、开发更智能的AI驱动系统,可以为虚拟数字人创造出更多元、更生动的行为表现,从而提升用户体验和互动效果。

神模因

虚拟数字人的文化模因层次,包含了其性格、价值观、世界观等内在特质,是虚拟数字人与用户建立情感连接的核心要素。神模因的设计需要充分考虑虚拟数字人的应用场景和目标用户群体,通过塑造独特的个性和价值观,增强其吸引力和辨识度。

神模因的复制和创造主要通过剧本创作、角色设定、AI驱动等技术实现。剧本创作和角色设定是虚拟数字人“灵魂”的基础,通过精心设计的故事情节和人物背景,为虚拟数字人赋予独特的性格和价值观;AI驱动则通过机器学习算法,让虚拟数字人能够自主生成符合其性格和价值观的对话和行为。

神模因的设计需要充分考虑虚拟数字人的应用场景和目标用户群体。例如,虚拟偶像需要塑造鲜明的个性和价值观,以增强其吸引力和辨识度;虚拟主播则需要具备亲和力和互动性,以便更好地与观众建立情感连接;而数字员工则需要具备专业领域的知识和技能,如金融知识、医疗知识等。

神模因的创新和个性化是提升虚拟数字人竞争力的关键。通过不断优化剧本创作、提升角色设定水平、开发更智能的AI驱动系统,可以为虚拟数字人创造出更丰富、更立体的内在特质,从而提升用户体验和互动效果。

虚拟数字人行业面临的挑战

尽管AIGC与数字人融合的构想勾勒出一幅极具前景的未来画卷,但在实现这一愿景的过程中仍面临一系列挑战。技术的成熟度与应用的普及度构成了首要问题;VR/AR设备的普及率和用户体验,也成为推广元宇宙和数字人概念的关键因素;由于数字人的活动涉及到海量个人信息的处理,隐私与安全问题也构成了另一挑战维度;法律与伦理困境同样难以回避,数字人和元宇宙的发展或将引发包括版权、身份盗用、虚拟犯罪在内的一系列的法律和伦理问题;经济架构的设计与可持续性问题也值得深入探讨,如何在鼓励创新与激励机制的同时,构建起公正且持久的经济生态系统成为未来的重要课题。

未来展望

本《报告》今年发布第三期,以严谨的学术态度与全方位的数据洞察,为数字人行业的健康发展提供数据参考、关键的理论基础与实践指南。欢迎加入我们的探索之旅,我们将深入探讨AIGC与数字人融合的未来趋势,探究AIGC技术创新的应用,以及针对数字人在技术、法律、伦理及经济层面上所面临的挑战提出应对策略。我们坚信,通过跨学科的合作和产学研持续的创新,我们将携手迈进一个更为丰富多元、充满活力的数智未来。

本文原文来自中国传媒大学媒体融合与传播国家重点实验室

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号