深度:OpenAI 人形机器人的野望与 AGI背后
深度:OpenAI 人形机器人的野望与 AGI背后
OpenAI近期加速推进机器人项目,从软件到硬件,生成式AI到实体化智能的进阶。人形机器人成为实现AGI的重要载体,具有感知物理世界、执行动作、收集数据、进行学习和进化的能力。由于LLM的局限性,OpenAI认为人形机器人是其通往AGI的必经之路。为此,OpenAI在重启机器人项目后,积极招聘相关职位,加速人形机器人的研发。通过将先进的AI技术与人形机器人平台相结合,OpenAI期望打造真正意义上的智能体。
OpenAI 一直以其前沿的大语言模型(LLM)技术引领行业,从 GPT 系列的惊艳亮相到 ChatGPT 的风靡全球,OpenAI 的每一次突破都将 AI 的边界向前推进了一大步——尽管全球大模型能力距离在缩小。但是,对于这家 AI 巨头而言,并不满足于虚拟AI(生成式AI或AI Agent)成就。
就在最近一个月以来,OpenAI的机器人动作频频,先是三周前The Information透露OpenAI已经开始研发人形机器人,到最近其机器人团队公开招经验丰富的机器人系统集成、电子工程师、机械产品工程师、技术项目经理职位。
种种迹象表明,OpenAI从去年重启了搁置已久的机器人项目,并以前所未有的速度加速推进,从软件到硬件,生成式 AI 到实体化智能(Embodied AI)的进阶,其需要加速其通用人工智能(AGI)目标的实现....本文将深入剖析 OpenAI 的人形机器人战略,解读其背后的逻辑与动机,并展望其对 AI 未来发展的深远影响。
具身AI:AGI 的必经之路
尽管 LLM 在自然语言处理、知识推理等任务上展现出惊人的能力,其局限性也日益凸显。LLM 始终局限于虚拟世界,缺乏对物理世界的感知和交互能力,这成为了其通往 AGI 的一道难以逾越的鸿沟。正如认知科学和具身认知理论,包括MetaAI科学家YannLeCun多次所强调的,智能的产生离不开与物理世界的交互,感知、行动和环境构成了智能体认知发展的基础。对于 AI 而言,要实现真正的智能,就必须走出虚拟世界的舒适区,进入复杂性和不确定性的物理现实世界,扩展其能力。
人形机器人作为一种能够与物理世界进行交互的实体智能体,成为了实现 AGI 的重要载体或者说终极载体。人形机器人的设计理念根植于对人类智能的模仿,其类人的形态和结构使其能够更好地适应为人类设计的环境和工具,从而更容易地执行各种任务,并与人类进行自然而直观的交互。更重要的是,人形机器人为 AI 提供了感知物理世界、执行动作、收集数据、进行学习和进化的平台,使其能够像人类一样,通过与环境的交互不断积累经验,发展出更高级别的智能。
Sam Altman 很早表明这个观点,他在去年的五月一次访谈中毫不掩饰地表达了对人形机器人的热情,甚至认为其潜力超过了纯粹的基于文本和语音的交互方式。他提到的大概意思是,未来的人工智能需要与人类拥有相同的界面,并能理解人类体验的细微差别,而这正是人形机器人所能提供的关键优势。通过构建与人类相似的交互界面和工作流程,人工智能助手能够更好地理解人类的需求和意图,引导我们做出决策,并不断提供反馈。当人类和人工智能的体验存在于共享界面时,人机交互将变得更加无缝和高效。
“训练人工智能使用要与我们有相同的界面。界面和工作流程都要以人为本。人工智能助手理解体验的细微差别,能够引导我们做出决策并不断给我们反馈,这是很有意义的。仅靠基于文本/语音的体验是无法实现整个体验的。
当人类和人工智能的体验存在于共享界面时,我们和人工智能之间的交互也会变得无缝起来。”
9个月前与知名播客Lex Fridman的专访中问到具身AI对OpenAI有多重要时,Sam Atlman提到有了AGI人类不需要作为唯一方法去处理物理世界的事情,而要发生这样的转变,我们也需要人形机器人,意味着OpenAI已经在重启机器人项目。(字幕是机翻,不那么准确)
因此,OpenAI 对人形机器人的投入并非一时兴起,而是其长期 AI 战略的必然选择,或者说是其通往 AGI 的必经之路。通过将先进的 AI 技术与人形机器人平台相结合,OpenAI 期望打造出真正意义上的智能体,使其能够像人类一样感知、思考、行动和学习,最终实现从弱人工智能到通用人工智能的跨越。