DeepMind AI首次在IMO中获奖,数学推理能力获重大突破
DeepMind AI首次在IMO中获奖,数学推理能力获重大突破
近日,Google DeepMind宣布了两项重大AI研究成果:AlphaProof和AlphaGeometry 2。这两个模型在解决高级数学问题方面展现了前所未有的能力,为AI领域带来了新的突破。
AlphaProof:用强化学习证明数学命题
AlphaProof是一个基于强化学习的模型,能够进行形式数学推理。它使用了DeepMind之前开发的AlphaZero算法,该算法曾成功掌握棋类游戏。AlphaProof的工作原理是通过证明数学命题来学习和优化其推理能力。
在形式语言Lean中,数学命题被表示为可以验证正确性的语句。由于形式语言的数据量相对有限,研究团队创新性地使用了Gemini模型(Google的大型语言模型)来将自然语言问题自动翻译成形式语言问题,创建了一个包含各种难度问题的大型题库。
AlphaGeometry 2:专攻几何问题的混合模型
AlphaGeometry 2是DeepMind现有几何问题求解系统的升级版。它是一个混合模型,结合了Gemini和神经符号系统。通过从头开始训练,该模型在几何问题上展现了卓越的解题能力。
奥数级别的AI:在国际数学奥林匹克竞赛中取得突破
为了测试这两个模型的能力,DeepMind团队让它们挑战了2024年国际数学奥林匹克竞赛(IMO)的题目。IMO是全球最负盛名的中学生数学竞赛,题目难度极高,涵盖代数、组合数学、几何和数论等领域。
结果显示,AlphaProof解决了两个代数问题和一个数论问题,而AlphaGeometry 2则成功解决了几何问题。虽然两个组合计未能解决组合数学问题,但它们的整体表现已经达到了银牌水平。
通往AGI的重要一步
DeepMind的研究人员认为,高级数学推理能力是实现通用人工智能(AGI)的关键。AGI的目标是开发出能够像人类一样学习、理解和应用知识的计算机系统。通过在数学领域取得突破,AI系统有望在未来解决更复杂、更抽象的问题。
数学与AI:相辅相成的未来
这一突破不仅展示了AI在数学领域的潜力,也凸显了数学理论对AI发展的重要性。正如NSF(美国国家科学基金会)所强调的,深入理解AI系统的数学基础是推动AI技术进步的关键。
随着研究的深入,我们有理由相信,数学与AI的结合将带来更多令人振奋的创新,为科学发现和社会发展开辟新的道路。