李飞飞团队以不到50美元训练出AI新模型,性能媲美OpenAI和DeepSeek
创作时间:
作者:
@小白创作中心
李飞飞团队以不到50美元训练出AI新模型,性能媲美OpenAI和DeepSeek
引用
搜狐
1.
https://m.sohu.com/a/856441370_121118710/?pvid=000115_3w_a
(图片来源:摄图网)
近日,李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用,成功训练了一个名为s1的人工智能推理模型。这一突破性成果令人瞩目,因为s1的表现丝毫不逊色于OpenAI的o1和DeepSeek的R1等尖端推理模型。在数学和编码能力测试中,s1展现出了与之相当的实力。
研究人员表示,李飞飞团队通过蒸馏法,从谷歌的推理模型Gemini 2.0 Flash Thinking Experimental中提炼出了s1。使用了16个英伟达H100 GPU,仅仅进行了26分钟的训练,便诞生了一个能与顶尖推理模型相媲美的32B推理模型。这种方法的精髓在于如何有效地传递知识,使得小模型在保持大模型推理能力的同时,能够在资源消耗上展现出极大的优越性。
s1的诞生,标志着高效AI模型训练新时代的到来。s1所展现出的价格优势,折射出未来AI领域的一个重要趋势:大模型的训练和应用将愈发平民化,不再遥不可及。
本文原文来自搜狐新闻
热门推荐
油菜的生长习性特点和生长环境条件
螨虫皮炎怎么治最有效
糖尿病7个并发症,各有哪些特点?怎样预防?
中华草龟和巴西龟哪个好养?有什么区别?
养龟大比拼:草龟VS巴西龟,哪个更适合你?
PVP龟裂:游戏对战模式中的平衡性与公平性探讨
金庸武侠中,乔峰、张三丰、张无忌、石破天、无崖子谁更厉害
澳大利亚十大城市:从悉尼到珀斯的独特魅力
澳大利亚城市人口排名前十
演员短剧成绩独家盘点:出道10年以上,靠短剧翻红?
这些食物会抑制铁吸收,食用需注意
厨房新发现:青椒肉丝的制作秘籍与注意事项大揭秘
新手骑行坐垫选择指南:测量坐骨、调整角度与材质推荐
七星连珠:从天文学现象到文化符号
保存您的进度:如何备份和恢复电脑游戏
异食癖发生的原因及对策
2024线下增速首超线上,大快消该变一变了
手机拍照功能如何操作?有哪些拍摄技巧?
跳绳后如何坐下放松
《红楼梦》人物关系图:搞清人物关系,才能读得懂
胃酸过多时的饮食注意事项
倚梅园莳花宫女:电视剧《甄嬛传》中人物余莺儿简介
苦荬菜种植技术:从土壤准备到收获全过程详解
企业请假制度怎么设计才能提高员工满意度?
舌尖上的湖湘⑩|祖庵豆腐:旧时王谢堂前燕,飞入寻常百姓家
推荐给糖尿病人的抗阻运动
《中国老年糖尿病诊疗指南(2024版)》这8点你值得关注!
网易云音乐投屏到电视的三种方法
投屏-网易云音乐可以投屏到电视上吗?有哪些方法可以实现?
从需求到满意:如何把客户的预期落地?