AGI破晓前夜?2025年AI之风将吹往何处
AGI破晓前夜?2025年AI之风将吹往何处
2024年,人工智能从年头火到年尾,始终占据着全球科技创新“C位”。年初Sora惊艳登场,OpenAI的草莓系列和谷歌的Gemini犹抱琵琶,大模型风起云涌,模型能力一节高过一节,应用一浪超过一浪,不断突破天花板;诺贝尔物理奖和化学奖授予人工智能相关项目,在两项成就的背后,人工智能发挥无可比拟的作用;华为昇思开源共建框架取得重要进展,数字人悉数登场,具身智能落地的呼声迭起,人形机器人你追我赶……
在即将到来的2025年,AI之风又将吹往何处?近日,上海召开了一场AI学术年会——由上海人工智能实验室主办的首届“浦江AI学术年会”。会上,国内AI领域最顶级的学术大咖们深入探讨了人工智能未来发展路径、关键技术挑战等议题。在他们眼中,属于人工智能的2025将这样打开——
“通专融合”或是通往AGI的重要途径
近日,ChatGPT之父、OpenAI首席执行官萨姆·奥尔特曼在接受媒体采访时表示,预计AGI将在2025年到来。
自今年9月,OpenAI发布拥有真正通用推理能力的o1大模型(即草莓大模型)后,AGI成为被科技大佬们频繁提及的词。AGI的字面意思是通用人工智能,它意味着机器能够像人类那样,灵活运用知识来处理各种复杂的任务,被视为是打开未来智能世界的钥匙。
梦想虽然美好,但要让AI像人一样无所不能,还有许多技术瓶颈需要突破。在上海人工智能实验室主任助理、教授乔宇看来:“除了o1,或者说除了推理能力的提升之外,在通往AGI的路上,至少还缺3到4个重要的突破,不是单纯靠提升模型的规模数据算力能解决的。”
基于人工智能领域的Scaling Law(尺度定律),通过数据升级和工程优化确实能让大模型性能变得更好,但事实上当数据达到一定规模时,大模型推理能力反而会停止增长甚至出现倒退的情况。OpenAI下一代旗舰模型“猎户座”、谷歌的Gemini 2.0等领先的AI模型,在Scaling Law的进化路线上,进步速度都在大幅放缓。
“因为新的、未开发的高质量人类生成训练数据正在成为稀缺资源。”上海人工智能实验室领军科学家欧阳万里指出,过去几年里,大模型的迭代升级过程几乎已把各种公开可用的数据集、网站、书籍,以及其他来源的数据耗尽,而合成数据的广泛使用,则会导致新模型在训练中变得与旧模型贴近。
面对大语言模型在Scaling Law等方面的技术瓶颈,上海人工智能实验室创新性地提出“通专融合”的方式来实现AGI。
比如ChatGPT和Sora在泛化性方面取得了显著进展,但在专业性方面仅达到人类15%-20%的水平。即便运用Scaling Law进一步增加模型参数,其专业性的提升效果并不显著,而成本却显著增加。专业性不足不仅限制了创新,还会导致大量事实错误的出现。而类似AlphaFold这种在蛋白质折叠领域人类无法击败的AI,其专业性极强,但泛化性往往较为有限。
11月25日,上海人工智能实验室推出了能够自主生成高智力密度数据、具备元动作思考能力的强推理模型书生InternThinker。该模型能在推理过程中进行自我反思和纠正,从而在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。
融合通用模型泛化能力与专用模型纵深能力优势,是上海人工智能实验室的“书生”系列正在不断探索的跨界创新实践。
“让一个具有基本能力的模型和一个能将产业能力提升得更高的专业模型相互配合,使其具有超过应用红线的能力,这是我们认为值得去探索的一个方向。”欧阳万里表示,人工智能可以赋能很多传统工业领域,从传统的重工业到尖端设计,AI都有很多事情可以做。
据了解,全球重型海工装备制造企业振华重工通过基于上海人工智能实验室书生·浦语百亿参数大模型而研发的ETO制造交付智能体,可以对图纸设计、物资采购、生产进度、船运计划等实现实时掌控与预测,能一站式轻松“拿捏”数百个并行交付项目。
欧阳万里透露,近期,上海人工智能实验室还在与中国商飞上海飞机设计研究院合作,联合推出“书生·翼飞”翼型AI生成式系统,希望通过人工智能赋能大飞机设计。“原先设计师去设计一个翼形,花费的时间可能要以周来计算,而现在借助人工智能技术,可能在数秒、一分钟内就可以生成好几十个翼形服务,供设计师们去进行选择。”
合力突破数据困境
过去的一年除了大模型持续火热,具身智能同样备受关注。具身智能是人工智能技术赋能真实物理世界新质生产力的重要方向,也是实现通用人工智能的必经之路。
具身智能也面临着数据困境。不过,与大模型所依赖的互联网数据不同,具身智能所依赖的数据涉及动态环境中的复杂交互,这使得收集数据成为具身智能发展过程中昂贵且具有挑战性的工作。
突破数据困境,需要一股合力。为此,今年4月,上海机器人产业技术研究院联合上海交通大学、复旦大学、同济大学的科研团队以及多家机器人企业,启动了人形机器人数据集建设项目。来自浦东的智元机器人和傅利叶智能参与其中。傅利叶研制的GR-1机器人和智元打造的“远征”系列机器人参与各种任务实验,协助科研团队完成数据采集。这些数据进入原始数据库后,将自动触发分类、清洗和标注的数据加工流水线。
“今年底,我们应该会跟几家单位一起联合推出一个数据集,首批数据会以公开开源的方式提供给大家。”智元机器人研究院执行院长姚卯青透露。
在傅利叶通用机器人事业部副总裁周斌看来,目前,在物理世界的数据集还是远远不够的,他认为虚实结合能极大地提升数据集的量级。
上海人工智能实验室尝试进行模型与环境长期实时交互,以及进行具身自主探索与世界模型构建,并发布了开源且通用的自动驾驶视频预测模型GenAD。“它类似于自动驾驶领域的‘Sora’,能够根据一张照片的输入,生成后续高质量、连续、多样化且遵循物理定律的未来场景预测,并可泛化到任意驾驶场景,被多种驾驶行为操控。”上海人工智能实验室主任、首席科学家周伯文介绍,在与物理世界的互动探索中,研究团队一方面深入物理世界,另一方面则在虚拟世界中通过模拟进一步提升效率。如具身智能训练,他们实现了在单卡上模拟训练1小时,相当于在真实物理世界训练380天的效率。
周伯文表示:“上述这些成果通过首个城市级具身智能仿真训练场浦源·桃源进行了开放,欢迎大家在这个平台上训练专属的具身智能。”