图灵奖得主LeCun团队新作:在世界模型中导航
创作时间:
作者:
@小白创作中心
图灵奖得主LeCun团队新作:在世界模型中导航
引用
网易
1.
https://m.163.com/dy/article/JITBIH5V051193U6.html
Meta FAIR团队近日发布了最新的导航世界模型(Navigation World Models,NWM),这是继DeepMind和World Labs之后,又一个在世界模型领域取得重要进展的研究成果。
NWM的核心优势
NWM最大的特点是其强大的导航能力。它不仅能够在已知环境中按照给定轨迹行进,还能够在未知环境中自主寻找前进道路,并能执行路径规划。与DeepMind的Genie 2相比,NWM在单图生视频方面稍逊一筹,但在导航能力方面更具优势。
NWM的技术细节
NWM基于一种名为条件扩散Transformer(CDiT)的新架构。与标准的扩散Transformer(DiT)相比,CDiT能够更高效地扩展到10亿参数规模,同时计算需求更低。通过在不同机器人智能体的视频和导航动作上进行训练,NWM能够实现规划模拟,从而在视觉导航任务中达到当前最先进的性能。
NWM的实验结果
在已知环境中的实验结果显示,NWM在视频预测质量和一致性方面明显优于基线模型DIAMOND。在未知环境中的实验则表明,通过在Ego4D等无动作和无奖励的视频数据上训练,NWM能够在未见过的环境中取得更好的视频预测和生成性能。
NWM的应用前景
NWM不仅能够独立执行目标导向的导航,还可以增强现有的导航策略。通过与SOTA导航策略NoMaD结合使用,NWM能够对采样的导航轨迹进行评估和排序,从而实现更优的导航性能。
这项研究展示了世界模型在导航任务中的巨大潜力,也为未来AI系统在复杂环境中的自主导航提供了新的思路和方法。
热门推荐
一文读懂当前AI赛道的发展与投融资概况
特朗普首次表态称拜登“胜选” 指责大选被操控
MultiBank:股票市场中的波动率指数分析及其应用场景
电线电缆压降计算方法
胃息肉该不该切除?九成良性无需惊慌!
欧洲中世纪的人口
ESXi虚拟机登录指南:四种主流方式详解
自媒体运营如何实现盈利?六大关键策略助你变现
估值25亿的网红餐饮一夜崩塌,只因与外卖平台“为敌”?
贫血人群的高效饮食改善策略
燃气灶熄火保护机制的原理解析(保障燃气灶使用安全的关键技术)
健康真相:冬季流鼻血,是上火了,还是大病前兆?
一文带你看懂电商美工的工作日常!
走进北京朝阳公园:感受自然与文化的完美融合
中国力量改写面板业格局,未来十年靠什么逐鹿全球?
当ESG遇上可持续时尚:江南布衣致力成为国内ESG先行者
AI在时尚产业的革命性影响:设计、趋势与可持续性
低空产业助力农业现代化向“新”行 我国将加快农林植保无人机装备创新应用
欧洲杯、奥运会接踵而至,谁能玩转超级体育周期?
绵羊养殖户必读:打造完美饲养环境及超详细的养殖管理技巧
半包装修真的能省钱吗?资深业主亲测避坑指南
上海世博文化公园南区游玩攻略:交通、餐饮、门票全攻略
河北能源职业技术学院:校企合作筑就未来人才高地
无人机技术重塑交通版图的探索与展望
《宿敌》:以航天为镜,映照国家安全暗战的宿敌之影
二十四节气——惊蛰
六氟磷酸锂新进展!
盐城大纵湖:打造“全业态一站式休闲度假体验目的地”
人工智能时代的文学翻译:挑战与机遇
市场情绪有所提振 铁矿石价格震荡偏强