问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

李飞飞团队以不到50美元训练出AI新模型,性能媲美OpenAI和DeepSeek

创作时间:
作者:
@小白创作中心

李飞飞团队以不到50美元训练出AI新模型,性能媲美OpenAI和DeepSeek

引用
搜狐
1.
https://m.sohu.com/a/856441370_121118710/?pvid=000115_3w_a


(图片来源:摄图网)

近日,李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用,成功训练了一个名为s1的人工智能推理模型。这一突破性成果令人瞩目,因为s1的表现丝毫不逊色于OpenAI的o1和DeepSeek的R1等尖端推理模型。在数学和编码能力测试中,s1展现出了与之相当的实力。

研究人员表示,李飞飞团队通过蒸馏法,从谷歌的推理模型Gemini 2.0 Flash Thinking Experimental中提炼出了s1。使用了16个英伟达H100 GPU,仅仅进行了26分钟的训练,便诞生了一个能与顶尖推理模型相媲美的32B推理模型。这种方法的精髓在于如何有效地传递知识,使得小模型在保持大模型推理能力的同时,能够在资源消耗上展现出极大的优越性。

s1的诞生,标志着高效AI模型训练新时代的到来。s1所展现出的价格优势,折射出未来AI领域的一个重要趋势:大模型的训练和应用将愈发平民化,不再遥不可及。

本文原文来自搜狐新闻

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号