图灵奖得主LeCun团队新作:在世界模型中导航
创作时间:
作者:
@小白创作中心
图灵奖得主LeCun团队新作:在世界模型中导航
引用
网易
1.
https://m.163.com/dy/article/JITBIH5V051193U6.html
Meta FAIR团队近日发布了最新的导航世界模型(Navigation World Models,NWM),这是继DeepMind和World Labs之后,又一个在世界模型领域取得重要进展的研究成果。
NWM的核心优势
NWM最大的特点是其强大的导航能力。它不仅能够在已知环境中按照给定轨迹行进,还能够在未知环境中自主寻找前进道路,并能执行路径规划。与DeepMind的Genie 2相比,NWM在单图生视频方面稍逊一筹,但在导航能力方面更具优势。
NWM的技术细节
NWM基于一种名为条件扩散Transformer(CDiT)的新架构。与标准的扩散Transformer(DiT)相比,CDiT能够更高效地扩展到10亿参数规模,同时计算需求更低。通过在不同机器人智能体的视频和导航动作上进行训练,NWM能够实现规划模拟,从而在视觉导航任务中达到当前最先进的性能。
NWM的实验结果
在已知环境中的实验结果显示,NWM在视频预测质量和一致性方面明显优于基线模型DIAMOND。在未知环境中的实验则表明,通过在Ego4D等无动作和无奖励的视频数据上训练,NWM能够在未见过的环境中取得更好的视频预测和生成性能。
NWM的应用前景
NWM不仅能够独立执行目标导向的导航,还可以增强现有的导航策略。通过与SOTA导航策略NoMaD结合使用,NWM能够对采样的导航轨迹进行评估和排序,从而实现更优的导航性能。
这项研究展示了世界模型在导航任务中的巨大潜力,也为未来AI系统在复杂环境中的自主导航提供了新的思路和方法。
热门推荐
能源管理硕士有哪些项目
“双碳”背景下钢结构行业市场现状及未来展望
罗斯诸国统一之路:莫斯科公国用了200多年,多次与金帐汗国争锋
神木杨家城遗址:忠勇麟州 英雄故里
二次阳建议休息几天
想见你日语怎么说
脑动脉瘤术后一年流口水怎么办?
如何计算充电宝的功率大小?计算充电宝功率时要考虑哪些因素?
邮政编码是什么?了解邮政编码的定义与作用
收门票候补费、退费要出死亡证明:争议不断的“大麦网”,每月狂赚1个亿
各种颜色取名
DRAM基本单元最为通俗易懂的图文解说
日语表达想念的句子?
十月份可以扦插香椿树吗?附详细扦插指南
2024年金华各区县GDP:义乌超2500亿,东阳险胜婺城,武义第7
短剧营销推广和直播带货如何结合
《幻之试炼》全人物解锁攻略:37位忍者全收集指南
靶向并摧毁tau蛋白缠结的新疗法是未来阿尔茨海默病治疗的希望所在
康姓寻根:姬姓分支、部落名称由来
百姓的声音,听出来!
礼来阿尔茨海默病新药Donanemab获FDA批准上市
控制根系生长方向有助于拯救作物和缓解气候变化
奶奶控诉日本罪行:揭露二战期间日本对中国的暴行
洛可可白俄罗斯方块
华为省电模式怎么设置
杏林新语丨用中医药文化“解码”哪吒
猫咪咳嗽吃什么药好?了解常见药物与护理方法
一篇文章学会使用摩斯密码,简单易懂,你也可以使用“降维打击”
债券ETF课堂:投资要点和优势
一个暑假近视增加100度 医生:及时发现、及时干预是关键