谷歌再次调整AI团队,诺奖得主哈萨比斯统领研发
谷歌再次调整AI团队,诺奖得主哈萨比斯统领研发
在2025年伊始,谷歌向外界释放出明确信号:今年将是公司在AI领域的关键一年。一系列大刀阔斧的组织调整和战略部署背后,是这家科技巨头前所未有的紧迫感和进取心,也折射出其在AI赛道上重塑领导地位的雄心。
AI团队整合:哈萨比斯统领研发
1月9日,谷歌宣布AI Studio团队和负责Gemini API开发的团队将整体并入Google DeepMind。这是继去年将Gemini聊天机器人团队纳入DeepMind之后的又一重要举措。至此,谷歌的AI研发力量已全面统一归入DeepMind,由2024年诺贝尔化学奖得主德米斯·哈萨比斯(Demis Hassabis)领导。
哈萨比斯于2010年联合创立了DeepMind,在他的带领下,DeepMind取得了一系列突破性成就:2016年开发的AlphaGo击败围棋世界冠军李世石,2020年推出的AlphaFold 2成功预测蛋白质结构,后者的卓越贡献使他在2024年获得诺贝尔化学奖。如今,随着谷歌将更多AI团队纳入DeepMind,这位在游戏开发、神经科学和人工智能领域都有深厚造诣的科学家,将扮演更加关键的角色。
近期,谷歌已经三次将AI团队并入DeepMind,此前已完成模型研发、基础研究和负责任AI团队的转移。一系列调整再次强化了DeepMind在谷歌AI战略中的核心地位,也是其将研发-产品-应用全链条进行整合的举措。
Google DeepMind产品负责人Logan Kilpatrick表示,此次整合将“加倍深化现有合作,加速从研究到开发的转化进程”。参与此次调整的工程师Jaana Dogan也透露,重组后的DeepMind将“以前所未有的方式”向公众开放其研究成果,包括提供更好的API接口、更多的开源项目和开发工具。
图丨相关推文(来源:X)
技术创新:模拟物理世界的AI大模型
在组织整合的同时,谷歌也在全方位推进技术创新。
1月6日,公司宣布成立专门团队开发可模拟物理世界的AI大模型,由前OpenAI视频生成项目Sora联合负责人Tim Brooks领衔。“我们计划打造可以模拟世界的大规模生成式模型。”Brooks表示。根据招聘信息,团队将致力于解决“关键性新问题”,并将模型扩展到“最高计算水平”。
这支新团队将与Gemini、Veo和Genie等现有项目展开深度协作,致力于推进AI对现实世界的理解和模拟能力。
图丨Genie 2模型效果演示(来源:DeepMind)
世界模型是AI领域未来的重要发展方向之一。这类模型试图模仿人类认知过程,使AI系统能够理解和预测物理世界的运作规律。目前,包括李飞飞创立的World Labs在内的多家机构已在这一领域展开布局,其应用前景涵盖视频生成、机器人控制等多个领域。Google也认为,这将是实现通用人工智能的关键路径。
与此同时,谷歌的旗舰模型Gemini也在持续进化。新一代Gemini 2.0被专门设计用于应对“Agent时代”的挑战,整合了先进的多模态理解能力和行动规划功能。
根据公司规划,2025年将推出多项重要更新:面向开发者的Gemini 2.0 Flash将于本月开放使用,面向高端用户的“2.0 Experimental Advanced”版本即将发布。此外,Gemini 2.0也将在今年早些时候集成到更多谷歌产品中。
DeepMind联合创始人哈萨比斯描绘了一个雄心勃勃的愿景:打造一个能够“在任何领域、任何模态、任何设备上无缝运行”的通用AI助手。他向员工承诺,Gemini产品将在未来一两年内实现质的飞跃。
在内部会议上,开发主管Josh Woodward还展示了多个项目的最新进展。其中,代码助手Jules已进入可信测试阶段。AI笔记工具NotebookLM则新增了播客功能,允许用户“呼入”播客内容。
Project Mariner作为一个AI驱动的Chrome多任务扩展,在演示中成功实现了将热门餐厅信息自动添加到Maps应用的功能。
面临的挑战与竞争压力
一系列举措的背后,既是谷歌争夺AI领导权的雄心体现,也是其面临的日益激烈的竞争压力。
在日前的全员会议上,谷歌CEO桑达尔·皮查伊(Sundar Pichai)明确表示,2025年“风险很高”,公司必须加快步伐。
一方面,谷歌面临的监管压力在不断加大。2024年8月,联邦法官裁定谷歌在搜索市场存在垄断行为。司法部更是在11月要求谷歌剥离Chrome浏览器业务。
在英国,竞争监管机构也对谷歌的广告技术业务提出质疑。面对这些挑战,皮查伊在内部会议上坦言:“监管审查是规模和成功带来的必然结果,但我们不能让这些分散注意力。”
图丨相关新闻(来源:CNBC)
另一方面,自从OpenAI的ChatGPT掀起AI热潮以来,行业格局快速重塑。有微软支持的OpenAI快速扩张,新兴的Anthropic、Perplexity也崭露头角。尽管谷歌的Gemini在技术实力上不落下风,但在市场声量上还有待提升。
谷歌将大举投资以保持领先地位,其核心就是Gemini这一AI模型,他们将Gemini应用定位为下一个用户规模达到5亿的重要产品。“扩大Gemini在消费者市场的规模将是我们明年最大的关注点,”皮查伊强调。
“在2025年,我们可能会经历一些起起落落,”他说,“但我相信我们最终会达到业界最高水平。历史告诉我们,不一定要做第一个,但一定要把产品做到最好。这就是2025年的意义所在。”
自从ChatGPT问世以来,谷歌这一大象转身显得异常笨拙。正如外界所看到的那样,战略目标不清晰、研发资源不统一,导致谷歌在这一轮AI竞争中战绩薄弱。即便如此,手握操作系统、硬件和顶尖科研资源的谷歌或许依然是OpenAI身后那个“最领先的追随者”。