资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

2024中国虚拟数字人影响力指数报告

创作时间:

作者:

@小白创作中心

2024中国虚拟数字人影响力指数报告

引用

来源

https://www.fxbaogao.com/detail/4212101

随着人工智能技术的飞速发展，AIGC（Artificial Intelligence Generated Content）已成为促动数字创新的关键驱动力。AIGC技术不仅具备多模态内容自动生成的能力，涵盖了从文本、图像、音频乃至视频等多种媒介形式的创造性生产，并且正逐步与数字人概念深度融合，昭示着一个全新的虚拟数字互动时代——媒体融合面向纵深发展时代的到来。

虚拟数字人的定义与分类

在往期《报告》中，我们对研究对象“虚拟数字人”的概念和外延进行了详细的分析及定义。从技术层面，虚拟数字人可以理解为，是通过计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等技术手段创设，并具有“人”的外观、行为、甚至思想（价值观）的可交互的虚拟形象。从未来媒体形态和服务模式看，计算机图形学、语音合成技术、深度学习、类脑科学、生物科技、计算科学等聚合科技（Converging Technologies）带来语义传播与无障碍传播的新空间，由此诞生的虚拟数字人将以新媒介角色，广泛应用在元宇宙新生态中，担任着信息制造、传递的责任，是元宇宙中“人”与“人”、“人”与事物或事物与事物之间产生联系或发生孪生关系的新介质。

经过新一年度的快速发展，“虚拟数字人”已然从小众走向大众，从商业渗透进民用，成为政府政策、学术研究、产业深耕的重要领域，在日常表达、甚至是政策制定中，开始简称为“数字人”。

《报告》的评估对象锁定为当前国内商业化应用最好、最具人气的三类数字人：虚拟偶像、虚拟主播、数字员工。

虚拟偶像
定义：以歌手、演员、模特、网红、游戏高手等“艺人”身份出现，拥有鲜明的个性、才艺设定，活跃于各大社交平台、视频平台、综艺节目等，通过积累流量、人气而获得更多的“工作”的虚拟数字人。
运营方式：与真人艺人相似，通过歌曲、硬照、短剧、综艺等作品进行运营。主要代表：洛天依、星瞳、苏小妹等。
虚拟主播
定义：虚拟世界的“主持人”，在专业赛道上包括各大媒体推出的数字主持人、数字记者、数字编辑等；而在视频平台上活跃的虚拟UP主们则由企业或个人运营，数量庞大。
运营方式：专业赛道以新闻报道、综艺节目为主，替代真人主播、记者和编辑；视频平台则以直播互动、直播带货为主。主要代表：央视总台AI王冠、央视网小C、YOYO鹿鸣、狐璃璃等。
数字员工
定义：由政府、企事业单位推出，作为机构的“虚拟员工”，对外展示企业的产品、服务、文化，对内替代行政、培训等部分内部运营功能。智能客服、企业品牌官、虚拟导游、虚拟老师、虚拟学生等是当前数字员工的主要呈现形式。
运营方式：对内以替代企业经营各环节的部分功能为主；对外主要以智能服务、品牌代言等为主。主要代表：爱加、班长小艾、度晓晓等。

虚拟数字人的研究新命题

2023年是虚拟数字人行业的政策年也是规范年。国家部委、省、市各级政府持续推出促进元宇宙、虚拟数字人发展的政策数十个（详见行业观察“政策端”数据）；与此同时，知名数字人公司魔珐科技与杭州某网络公司的“首例涉虚拟数字人侵权案”二审胜诉，并入选“2023年度人民法院十大案件”，虚拟数字人及其作品的版权等问题开始受到专业关注。

2023年是虚拟数字人行业的AIGC的变现年也是冲击年。在AIGC的带动下，数字人的生产、运营都在降本增效，商业应用开始普及，从广电到文旅，从金融到教育，从电商到餐饮，数字人相关的制作、技术、运营招标屡见不鲜；但与此同时，大量同质化、低质量的数字人开始通过短视频入侵社交和电商领域，引发客户投诉。2023年5月9日，抖音发布《抖音关于人工智能生成内容的平台规范暨行业倡议（以下简称数字人行业倡议）》，国内流量最大的平台开始监管虚拟数字人这一新物种。

时间转至2024年，以SORA为代表的文生视频模型的长足进步，文生数字人开始出现，让更多的新研究命题开始浮现：数字人的版权问题、标识标准、跨平台通用规范、伦理道德问题、监管问题等。基于观察研究，课题组尝试使用模因论解题，通过拆解数字人的“多模态”特征，为数字人的标识、使用、监管等提供研究参考。

模因论视域下的虚拟数字人

模因（Meme），又译为觅母、弥母、米姆、谜因、拟子等，由英国进化生物学家理查德·道金斯对比基因（Gene）提出：基因存在于生物细胞的细胞核里面，而模因是以语言、信仰、故事、艺术设计、音乐、科学定理等形式存在于我们的大脑之中；模因是传递和繁衍社会文化与文明的基本单元，是文化复制因子，模因的传播是语言、信仰、观点、行为等的传播。

在AI技术的推动下，数字化生产、生活快速普及，虚拟偶像、数字员工、虚拟主播等“虚拟数字人”大量出现，并成为继语言、音乐、图片等之后模因的多模态融合新载体，其将模因理论中关于人本身、人创造的文化及社会关系融为一体，且具备了更快速、甚至可独立进化的新趋势。这为虚拟数字人的研究、应用观察都提供了新的理论和视角。

模因论视域下，虚拟数字人在数字世界中呈现的外形、声音、行为特征和数据，以及承载的文化模因，可统称为其的“数字模因”，结合“人”的个体表达特征，虚拟数字人包含了文本、图像、视频、音频的多模态信息，其数字模因包含了形、声、行、神（即文化模因）四个要素。

我们以交互、服务为目的，具备形、声、行、神四类模因中的一类或多类数字模因的对象，都属于虚拟数字人。本章节虚拟数字人模因内容引自课题组成员论文，如有使用请引用原文：张丽锦，吕欣，虚拟数字人：模因论的新“锚点”——模因论视域下的虚拟数字人：概念、特征和应用[J].学术探索，2024年第3期。

虚拟数字人四大模因的分类及特征

形模因

虚拟数字人的外观和形象层次，涵盖了其外观、造型、配饰等形象设计，是虚拟数字人在视觉上产生影响的基本元素，对用户第一印象的形成起着关键作用。

从“复制因子”属性来看，形模因的复制有两条明显的“道路”：一是以“真人复刻”为目标，不断拓展设计精度，去接近和还原真人；二是以“拟人”为目标，通过物理世界的动物、植物等赋予人的“形模因”进行再创造，如具有人类特征的眼、口、鼻、耳、手、脚、服装等。

结合当前实践，虚拟数字人的形模因可以进行更细致的分类，如根据图形维度，分为2D和3D两大类，2D为平面驱动式，3D需要建模完成；从外形上可分为二次元、高仿真、超写实等风格；按照设计由易到难，市场上有2D真人型、二次元型、3D卡通型、3D真人型、3D超写实等类型。

形模因是所有虚拟数字人“诞生”的首个要素，是承载了设计学、美学的重要模因，是最直观地形成用户印象的模因。形模因的演化与社会审美紧密相关，无论是哪种模因类型，都有其不同的追随者，因此形模因的多样性将长期存在，且其美术评级标准例将长期多元化。例如二次元风格的洛天依与超写实的星瞳虽然风格不一，但在审美评级上都成为成功范本。

声模因

虚拟数字人的语言和对话层次，包含了其音色、语调、语速、用词、语种等声音设计和语言表达，是虚拟数字人与用户交流的主要方式，会直接影响用户对其的感知和情感体验。

虚拟数字人声模因的表现主要通过声音克隆、语音合成。从“复制因子”的属性上看，声模因分为通用TTS和个性化TTS两大类，其复制方式目前主要有“拼接法”和“参数法”两种：拼接法，从预先录制的大量语音中，选择所需的音节、音素等基本单位拼接而成，这种声模因质量高，但所需语料数据大，成本也高；参数法，根据统计模型来产生每时每刻的语音参数（包括基频、共振峰频率等），然后把这些参数转化为波形。

作为重要的交互模因，声模因直接关系虚拟数字人的使用体验。当前，通用TTS主要用拼接法，个性化TTS则多使用参数法，智能客服、有声读物等都是声模因可以独立应用的、常见的应用场景。在抖音、快手、B站、小红书等虚拟数字人聚集平台，声模因往往是“通用模型”，如萝莉音、大叔音、游戏音，甚至是“广西老表语音包”等都成为流行的声模因。而在虚拟数字人的实际应用中，个性化TTS的制作、真人语音的“高保真、超写实”的克隆需求开始增加。如：3D真人虚拟主播，需要将真人的语音、语调、语速、语气、停顿、重音、尾音等都进行高保真，然后输出；而拥有“人设”的虚拟偶像、数字员工等，其设计者们也是不断追求其声音的“真”度、独特性。

行模因

虚拟数字人的动作和行为层次，包括其表情、动作、互动方式等。虚拟数字人的动作、行为及互动方式设计对于创造生动、有吸引力的用户体验至关重要，是与用户建立联系的重要手段。

虚拟数字人的行模因通过表情、微表情、肢体动作、标志性行为等进行表达，同时也包含了技能定义，如舞蹈技能、音乐技能、金融知识技能、模特表现技能等。例如，初音未来爱给粉丝进行“眨眼”的互动，美妆捉妖达人柳夜熙的“捉妖”动作，都是其行模因的重要组成部分。

行模因的复制和创造主要通过动作捕捉、动画制作、AI驱动等技术实现。动作捕捉技术可以实时捕捉真人的动作数据，然后映射到虚拟数字人身上；动画制作则通过关键帧动画、骨骼动画等方式实现虚拟数字人的动作设计；AI驱动则通过机器学习算法，让虚拟数字人能够自主生成自然、流畅的动作。

行模因的设计需要充分考虑虚拟数字人的应用场景和目标用户群体。例如，虚拟主播需要具备丰富的表情和肢体语言，以便更好地与观众互动；虚拟偶像则需要设计独特的标志性动作，以增强其辨识度和吸引力；而数字员工则需要具备专业领域的技能表现，如金融知识、医疗知识等。

行模因的创新和个性化是提升虚拟数字人竞争力的关键。通过不断优化动作捕捉技术、提升动画制作水平、开发更智能的AI驱动系统，可以为虚拟数字人创造出更多元、更生动的行为表现，从而提升用户体验和互动效果。

神模因

虚拟数字人的文化模因层次，包含了其性格、价值观、世界观等内在特质，是虚拟数字人与用户建立情感连接的核心要素。神模因的设计需要充分考虑虚拟数字人的应用场景和目标用户群体，通过塑造独特的个性和价值观，增强其吸引力和辨识度。

神模因的复制和创造主要通过剧本创作、角色设定、AI驱动等技术实现。剧本创作和角色设定是虚拟数字人“灵魂”的基础，通过精心设计的故事情节和人物背景，为虚拟数字人赋予独特的性格和价值观；AI驱动则通过机器学习算法，让虚拟数字人能够自主生成符合其性格和价值观的对话和行为。

神模因的设计需要充分考虑虚拟数字人的应用场景和目标用户群体。例如，虚拟偶像需要塑造鲜明的个性和价值观，以增强其吸引力和辨识度；虚拟主播则需要具备亲和力和互动性，以便更好地与观众建立情感连接；而数字员工则需要具备专业领域的知识和技能，如金融知识、医疗知识等。

神模因的创新和个性化是提升虚拟数字人竞争力的关键。通过不断优化剧本创作、提升角色设定水平、开发更智能的AI驱动系统，可以为虚拟数字人创造出更丰富、更立体的内在特质，从而提升用户体验和互动效果。

虚拟数字人行业面临的挑战

尽管AIGC与数字人融合的构想勾勒出一幅极具前景的未来画卷，但在实现这一愿景的过程中仍面临一系列挑战。技术的成熟度与应用的普及度构成了首要问题；VR/AR设备的普及率和用户体验，也成为推广元宇宙和数字人概念的关键因素；由于数字人的活动涉及到海量个人信息的处理，隐私与安全问题也构成了另一挑战维度；法律与伦理困境同样难以回避，数字人和元宇宙的发展或将引发包括版权、身份盗用、虚拟犯罪在内的一系列的法律和伦理问题；经济架构的设计与可持续性问题也值得深入探讨，如何在鼓励创新与激励机制的同时，构建起公正且持久的经济生态系统成为未来的重要课题。

未来展望

本《报告》今年发布第三期，以严谨的学术态度与全方位的数据洞察，为数字人行业的健康发展提供数据参考、关键的理论基础与实践指南。欢迎加入我们的探索之旅，我们将深入探讨AIGC与数字人融合的未来趋势，探究AIGC技术创新的应用，以及针对数字人在技术、法律、伦理及经济层面上所面临的挑战提出应对策略。我们坚信，通过跨学科的合作和产学研持续的创新，我们将携手迈进一个更为丰富多元、充满活力的数智未来。

本文原文来自中国传媒大学媒体融合与传播国家重点实验室