问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

研究员展示高质量实时对话互动的数字化身生成技术

创作时间:

作者:

@小白创作中心

研究员展示高质量实时对话互动的数字化身生成技术

引用

1

来源

1.

https://news.nweon.com/126676

近日，斯蒂文斯理工学院、佐治亚理工学院和伊利诺伊大学厄巴纳-香槟分校的研究人员开发了一种名为RITA的实时交互式对话化身框架。该框架能够将用户上传的照片转换为能够参与实时对话互动的数字化身，为虚拟现实和交互式游戏等应用开辟了新的可能性。

将单个图像动画化以创建动态语音驱动的面部动画是人工智能、计算机视觉和多媒体技术的交汇点。生成模型的出现极大地推动了有声视频的创作，将曾经静止的描述转变为生动的语音表现。

但由于视频生成的固有延迟，所述领域面临着挑战，因为将图像和音频转换为无缝视频序列需要大量的计算资源和时间，这通常使实时应用难以实现。

SadTalker和MakeItTalk等最先进的模型中率先通过复杂的面部建模和运动合成来生成对口型视频。以其作为灵感，研究人员提出的RITA框架在生成速度和交互质量方面取得了进展。

尽管SadTalker和类似模型表现出色，但它们主要依赖于离线处理，因为需要复杂的计算来确保音频线索和面部运动（包括嘴唇运动、头部姿势和眨眼）之间的同步性。模型非常有效，但在需要实时交互的应用程序中效果不佳，因而限制了它们在动态的、以用户为中心的场景中的效用。

RITA旨在通过促进端到端的实时对话解决方案来弥合这一差距。就其核心，RITA利用了一种新颖的架构，结合了实时处理的即时性和生成模型的深度来动画化静态肖像。

通过集成实时反馈机制，用户可以在一个无缝的、响应式的环境中与虚拟人物互动。虚拟人物不仅可以对口型，而且可以表现出自然的头部运动和表情，密切模仿人类的互动。这种技术创新的飞跃是通过轻量级模型的战略性应用实现，在不影响角色响应的丰富性的情况下，对速度进行了优化。

另外，RITA引入了大型语言模型的创新应用，以允许虚拟角色参与连贯的、与上下文相关的对话。这种集成不仅增强了交互体验，而且扩展了会说话的虚拟形象的潜在应用。

在RITA中，研究人员改进了生成过程，以确保高清晰度输出和数字化身-用户交互的流畅性。团队指出，所述方案既解决了实现实时交互性的技术挑战，同时解决了在以用户为中心的应用程序中部署这种技术的实际含义。

实验证明，RITA在延迟、质量和适用性方面优于现有模型，从而预示着交互式数字化身的新时代。

相关论文：RITA: A Real-time Interactive Talking Avatars Framework

总的来说，团队介绍的RITA是一个用于生成实时互动的说话化身的框架。RITA采用动态帧匹配和视频插值技术，大大减少了视频生成过程中所需的帧数，从而提高了生成速度。另外，RITA集成了大型语言模型来构建自然的虚拟用户对话，从而提升用户的交互体验。实证结果表明，与现有方法相比，RITA的性能优越，在生成速度、交互质量和用户参与度方面有显著改善。

热门推荐

缺水≠口渴：解锁科学饮水手册

缺水≠口渴：解锁科学饮水手册

ESC心衰杂志：芪苈强心改善患者生活质量延长寿命具成本效益

ESC心衰杂志：芪苈强心改善患者生活质量延长寿命具成本效益

照着做，体重管理不焦虑！

照着做，体重管理不焦虑！

2025年中国特高压电网行业深度分析：产业链、投融资、市场现状及发展趋势

2025年中国特高压电网行业深度分析：产业链、投融资、市场现状及发展趋势

选择适合你的洗发水，打造健康亮丽秀发

选择适合你的洗发水，打造健康亮丽秀发

过敏季靠“氯雷他定”续命！这个药具体该咋用？

过敏季靠“氯雷他定”续命！这个药具体该咋用？

净化车间洁净度分级与换气次数的技术适配性研究

净化车间洁净度分级与换气次数的技术适配性研究

芝麻和核桃对血脂的影响如何

芝麻和核桃对血脂的影响如何

热搜上细思恐极的“老鼠人”事件：当代成年人，只有30秒

热搜上细思恐极的“老鼠人”事件：当代成年人，只有30秒

老鼠人是什么梗,揭秘“老鼠人”梗：网络流行语背后的故事

老鼠人是什么梗,揭秘“老鼠人”梗：网络流行语背后的故事

失传两千多年的扁鹊医书找到了！药方还能用，116枚竹简被修复

失传两千多年的扁鹊医书找到了！药方还能用，116枚竹简被修复

智能仓储系统实战：PLC与RFID技术结合的物料分拣优化

智能仓储系统实战：PLC与RFID技术结合的物料分拣优化

赡养义务是必须的吗？一文详解赡养费计算标准

赡养义务是必须的吗？一文详解赡养费计算标准

建筑设计公司：20 家全球知名公司

建筑设计公司：20 家全球知名公司

芯片失效分析：方法、流程与应用

芯片失效分析：方法、流程与应用

粉体材料科普——氮化铝粉体

粉体材料科普——氮化铝粉体

中国沿海城市旅游推荐（中国十大海滨城市）

中国沿海城市旅游推荐（中国十大海滨城市）

舰R要火？幻萌网络新作《战舰少女：苍蓝避风港》情报泄露

舰R要火？幻萌网络新作《战舰少女：苍蓝避风港》情报泄露

红茶和绿茶，哪个对身体更好？北大研究给出了答案，你喝对了吗？

红茶和绿茶，哪个对身体更好？北大研究给出了答案，你喝对了吗？

正确洗头步骤是什麼？解析洗头7步骤，洗出头发健康光泽！

正确洗头步骤是什麼？解析洗头7步骤，洗出头发健康光泽！

紧急撤回一个夏天！山东发布寒潮蓝色预警，大风霜冻来袭多地降温8~12℃

紧急撤回一个夏天！山东发布寒潮蓝色预警，大风霜冻来袭多地降温8~12℃

备孕需要做些什么检查项目？

备孕需要做些什么检查项目？

MOS 管失效的六大原因

MOS 管失效的六大原因

四季变换对人类生活的意义

四季变换对人类生活的意义

差异解析：维卡软化点与热变形温度

差异解析：维卡软化点与热变形温度

海关知识产权保护三十年：海关执法现状与企业维权策略

海关知识产权保护三十年：海关执法现状与企业维权策略

完全性传导阻滞与心脏疾病的关系

完全性传导阻滞与心脏疾病的关系

扫二维码查真伪查溯源如何操作？需要注意什么？

扫二维码查真伪查溯源如何操作？需要注意什么？

茵陈的功效与作用

茵陈的功效与作用

迟子建的长篇小说《额尔古纳河右岸》鉴赏

迟子建的长篇小说《额尔古纳河右岸》鉴赏

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号