问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

智源发布2025年AI趋势:Emu3实现三模态统一,具身智能迎突破

创作时间:
2025-01-22 06:05:24
作者:
@小白创作中心

智源发布2025年AI趋势:Emu3实现三模态统一,具身智能迎突破

近日,北京智源人工智能研究院发布《十大人工智能技术及应用趋势》报告,对2025年AI技术发展趋势进行了预测和分析。报告指出,随着大模型的能力涌现加速通用人工智能(AGI)时代的到来,原生统一多模态、具身智能、AI for Science等技术将进一步深化人工智能对世界的感知、理解与推理,驱动科学研究创新突破。

01

多模态大模型的突破:Emu3实现图像、文本、视频大一统

在多模态大模型领域,智源研究院自主研发的Emu3模型展示了强大的视频、图像和文本处理能力。该模型基于下一个token预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。

Emu3提供了一个强大的视觉tokenizer,能够将视频和图像转换为离散token。这些视觉离散token可以与文本tokenizer输出的离散token一起送入模型中。与此同时,该模型输出的离散token可以被转换为文本、图像和视频,为Any-to-Any的任务提供了更加统一的研究范式。

Emu3一经上线便在社交媒体和技术社区引起了热议。有网友指出,“这是几个月以来最重要的研究,我们现在非常接近拥有一个处理所有数据模态的单一架构。”甚至有网友评价:“也许我们会得到一个真正开放的 OpenAI v2?”

02

具身智能元年:具身大小脑和本体的协同进化

2025年,“具身智能”将继续从本体扩展到具身脑的叙事主线。在行业格局上,国内近100家的具身初创公司或将迎来洗牌,厂商数量开始收敛;在技术路线上,端到端模型继续迭代,小脑大模型的尝试或有突破;在商业变现上,我们也必将看到更多的工业场景下的具身智能应用,部分人形机器人迎来量产。

03

AI for Science:驱动科学研究范式变革

据统计,2024年,接近半数的科研人员使用AI,并认为AI将对其工作领域产生积极影响。随着诺贝尔奖物理学、化学奖都颁给了AI赛道,推动科学研究与AI技术不断结合,从聚焦优化特定任务向更复杂、更动态、更交叉的问题发展。2025年,多模态大模型将进一步融入科学研究,将赋能多维数据的复杂结构挖掘,辅助科研问题综合理解与全局分析,为生物医学、气象、材料发现、生命模拟、能源等基础与应用科学研究开辟新方向。

日本发布的《AI for Science路线图》确定了11个科学研究领域作为AI for Science的重点应用方向,包括纳米科学、能源、生命科学等。并展示了AI在量子化学、结构优化、流体动力学和药物发现等领域的具体应用案例。

04

未来展望:AI将如何改变我们的生活

对于未来展望,多位行业专家纷纷表示,他们期望在2025年能够见证像GPT-5这样的下一代大模型的诞生,并在大模型的安全性和理论可解释性方面取得重大进展。

事实上,AI 作为新质生产力的重要引擎,不仅代表了科技的前沿趋势,更是未来经济发展的关键驱动力,目前已产生明显的经济效益和社会效益。研究机构IDC最新数据显示,随着 AI 应用持续走深向实,行业大模型在金融、医疗、教育、零售、能源等多个行业领域实现初步应用,到2025年,全球 AI 支出将达2270亿美元。预计到2030年,AI 将为全球经济贡献19.9万亿美元,推动全球GDP增长3.5%。而目前,几乎98%的企业领导者将AI视为其组织的优先事项。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号