问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

CVPR 2024:AIGC技术迎来重大突破

创作时间:
2025-01-22 20:18:34
作者:
@小白创作中心

CVPR 2024:AIGC技术迎来重大突破

计算机视觉领域顶级会议CVPR 2024于近期召开,汇聚了众多关于人工智能生成内容(AIGC)的前沿研究成果。本次会议中,研究人员在图像生成、视频生成、3D场景生成等多个方向取得了重大突破,为AIGC技术的未来发展指明了方向。

01

图像生成:从静态到动态的突破

美团技术团队在CVPR 2024上提出了大型视觉运动模型(LVMM),这是首次尝试构建大规模网络结构来预测复杂场景的光流。LVMM由神经渲染网络、光流预测网络、压缩和重建网络以及潜在空间的扩散模型构成,能够将静态图像转化为具有自然动态效果的视频。

另一篇获得最佳论文提名的《Generative Image Dynamics》则提出了一种从单张RGB图像生成场景运动的新方法。该研究通过学习从真实视频序列中提取的运动轨迹,在傅里叶域中建模为频谱体积,实现了静态图像到动态视频的转换。

02

视频生成:迈向开放式故事生成

上海交通大学与上海人工智能实验室联合团队提出了首个开放式视觉故事生成模型StoryGen。该模型基于扩散模型,能够根据任意给定的故事情节生成内容连贯、角色一致的故事图像序列。与传统的长视频生成相比,这种方法计算资源需求更低,但同样关注一致性和连贯性。

03

3D场景生成:精准编辑的新突破

在3D场景生成方面,美图影像研究院与中国科学院信息工程研究所等机构联合提出的CustomNeRF框架备受关注。该框架支持文本描述和参考图像作为3D场景的编辑提示,通过局部-全局迭代编辑方案实现精准控制,解决了当前3D场景编辑中普遍存在的几何不一致问题。

这些突破性的研究成果不仅展示了AIGC技术的最新进展,也为未来的发展指明了方向。随着技术的不断成熟,我们可以期待AIGC在创意设计、虚拟现实、智能制造等领域发挥越来越重要的作用,为人类的创造力提供强大的赋能工具。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号