四大AI巨头同日开源,昆仑万维、逐际动力等引领视频生成革命
四大AI巨头同日开源,昆仑万维、逐际动力等引领视频生成革命
2025年2月18日,中国四大AI巨头——昆仑万维、逐际动力、阶跃星辰和吉利汽车集团,纷纷宣布开源多个大型视频生成模型,以应对当前全球AI视频生成领域的痛点与挑战,并推动AI技术的普及和发展。
昆仑万维:引领AI短剧创作革命
昆仑万维是此次开源热潮中的重要参与者之一。该公司发布了中国首个面向AI短剧创作的视频生成模型SkyReels-V1,以及中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。这两个模型的发布,标志着昆仑万维在AI视频生成领域的一次重大技术突破。
SkyReels-V1是一个以人为中心的高性能视频生成模型,能生成影视级别的人物微表情,支持超过33种细腻人物表情和400多种自然动作组合。通过利用好莱坞级别的数据进行训练和微调,这个模型可以实现高度还原真人情感表现的视频生成,展现出一帧一画的电影级画质。SkyReels-V1不仅能够生成文生视频,还支持生成图像视频,这是目前参数最大的支持图生视频的开源视频生成模型,体现出其卓越的技术指标。
表情动作可控算法SkyReels-A1则对标Runway的Act-One,支持视频驱动的电影级表情捕捉,可以实现高保真微表情还原,生成高度逼真的人物动态视频。该算法能够模拟更复杂的表情动作,生成的人物面部神情可以配合肢体及画面内容达到栩栩如生的表现效果。SkyReels-A1还能够基于任意人体比例生成动态视频,对人物表情变化及身体动作进行深度还原。
昆仑万维的此次开源不仅仅是技术上的突破,某种程度上也标志着对行业生态的回馈和推动。通过开放这两个SOTA级别的模型,昆仑万维旨在为用户提供低成本、高效的AI短剧创作工具,帮助解决传统短剧制作流程中的诸多难题。在传统短剧制作中,剧本创作、演员选择、场景布置、分镜创作、拍摄和后期处理等流程繁琐而耗时,而AI生成模型的应用可以大幅缩短这些流程,降低制作成本。
昆仑万维的首席执行官方汉表示,此次开源的视频大模型不仅是一项技术突破,也有助于缩小全球内容产业的数字鸿沟,是文化产业生产力的一次革命。未来,公司还将持续开源更多AI视频生成模型和通用模型,推动AI短剧生态的建设和繁荣。
逐际动力:开创具身操作算法新纪元
与此同时,另一家AI企业逐际动力发布了基于视频生成大模型的具身操作算法LimX VGM,实现了国内首次将人类操作数据直接应用于机器人操作。这项技术将人类操作视频中提取的关键信息转化为机器人操作策略及行为,实现了操作数据到行为解算的无缝对接。通过引入空间智能模块,LimX VGM在生成操作视频时直接包含三维空间数据,从而确保机器人在物理空间中的操作能力。
逐际动力的研究人员使用多种差异较大的机械臂进行了演示,验证了算法的跨平台部署能力。算法通过少量的人类操作视频数据进行训练后,不仅大幅降低了数据采集成本,还提高了操作行为的泛化性与精确性。
阶跃星辰:赋能汽车智能座舱
同样活跃的还有阶跃星辰,他们与吉利汽车集联合发布了两款多模态大模型。其中,开源的Step-Video-T2V视频生成模型具有300亿参数,可直接生成204帧、540P分辨率的视频;Step-Audio则是一个语音交互大模型。这些模型结合汽车场景专用技术,旨在提升车载视频内容生成和语音交互的智能化程度,解决车企面临的数据隐私保护难题,使模型能够更有效地服务于汽车智能座舱环境。
开源生态:激发创新活力
AI开源技术的普及不仅对企业本身带来了技术的进步和市场影响力的提升,也为整个AI生态系统带来了新的机遇。开源模式降低创新门槛,激发行业创业者的创意和激情,为数字经济的发展注入了新的动力。上海对外经贸大学人工智能与变革管理研究院副院长张国锋表示,开源作为一种社会创新方法论,降低了软件产业链和供应链的门槛,改变了游戏规则,这也是历史的必然趋势。
未来,随着AI技术的不断发展和开源生态的逐步完善,人工智能视频生成技术将在更多的领域得到应用,从而为内容创作、机器人操作、自动驾驶等多领域带来更多的变革与创新。AI短剧、虚拟现实等领域的跨界发展,将推动产业融合,加速全球文化输出的脚步,把技术实验转变为主流创作。显然,开源大模型的时代已经到来,而这一波开源热潮正在不断引发新的创新浪潮。