图灵奖得主LeCun团队新作:在世界模型中导航
创作时间:
作者:
@小白创作中心
图灵奖得主LeCun团队新作:在世界模型中导航
引用
网易
1.
https://m.163.com/dy/article/JITBIH5V051193U6.html
Meta FAIR团队近日发布了最新的导航世界模型(Navigation World Models,NWM),这是继DeepMind和World Labs之后,又一个在世界模型领域取得重要进展的研究成果。
NWM的核心优势
NWM最大的特点是其强大的导航能力。它不仅能够在已知环境中按照给定轨迹行进,还能够在未知环境中自主寻找前进道路,并能执行路径规划。与DeepMind的Genie 2相比,NWM在单图生视频方面稍逊一筹,但在导航能力方面更具优势。
NWM的技术细节
NWM基于一种名为条件扩散Transformer(CDiT)的新架构。与标准的扩散Transformer(DiT)相比,CDiT能够更高效地扩展到10亿参数规模,同时计算需求更低。通过在不同机器人智能体的视频和导航动作上进行训练,NWM能够实现规划模拟,从而在视觉导航任务中达到当前最先进的性能。
NWM的实验结果
在已知环境中的实验结果显示,NWM在视频预测质量和一致性方面明显优于基线模型DIAMOND。在未知环境中的实验则表明,通过在Ego4D等无动作和无奖励的视频数据上训练,NWM能够在未见过的环境中取得更好的视频预测和生成性能。
NWM的应用前景
NWM不仅能够独立执行目标导向的导航,还可以增强现有的导航策略。通过与SOTA导航策略NoMaD结合使用,NWM能够对采样的导航轨迹进行评估和排序,从而实现更优的导航性能。
这项研究展示了世界模型在导航任务中的巨大潜力,也为未来AI系统在复杂环境中的自主导航提供了新的思路和方法。
热门推荐
三国时期的徐州:地理范围与战略意义
王者荣耀S21赛季马超玩法攻略:疾跑削弱后的应对之道
贷款买房房产证办理流程详解
多地机场2024年捷报频传 空港为经济增长添动能
大红袍泥料:你真的懂它的收藏价值吗?
十二生肖贺岁图:新年头像的文化符号
家庭版松花蛋肠制作教程
CRISPR-Cas9能否实现永生?科学、伦理与未来展望
硅谷大佬们的永生梦:从科技投资到生命探索
奥布里·德·格雷:永生技术背后的伦理风暴
启智六班教师团队公益活动纪实:孩子们的成长之路
迎接蛇年:红色配金色头像大赏!
山东多地交警严查涉牌涉证违法行为
冬季打卡!哈尔滨中央大街必吃美食全攻略
山东华瑞源教你正确安装车牌
《哈尔滨味道》:一座城市的美食传奇
1992年出生属猴的人佩戴金银首饰的讲究与注意事项
秋冬养生新宠:羊奶的正确打开方式
“借荆州”给刘备,是不是孙权的重大失误?
孙权为何要将荆州借给刘备?各有各的小算盘
三国时期的十八个经典战役
寻迹函谷关:从军事要塞到文化地标
唐山周末打卡:清东陵、滦州古城、河头老街
清东陵:唐山必打卡的历史瑰宝
唐山自驾游:探秘最美海岛
唐山地震遗址公园:一座城市的记忆与重生
唐山地震遗址纪念公园:哀思有寄 数往知来
短期操作 vs长期持有:哪一种股票策略更适合您?
炒股融资的风险有哪些?这些风险如何控制?
春节呈现的璀璨光彩——读《过年书》