李飞飞团队以不到50美元训练出AI新模型,性能媲美OpenAI和DeepSeek
创作时间:
作者:
@小白创作中心
李飞飞团队以不到50美元训练出AI新模型,性能媲美OpenAI和DeepSeek
引用
搜狐
1.
https://m.sohu.com/a/856441370_121118710/?pvid=000115_3w_a
(图片来源:摄图网)
近日,李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用,成功训练了一个名为s1的人工智能推理模型。这一突破性成果令人瞩目,因为s1的表现丝毫不逊色于OpenAI的o1和DeepSeek的R1等尖端推理模型。在数学和编码能力测试中,s1展现出了与之相当的实力。
研究人员表示,李飞飞团队通过蒸馏法,从谷歌的推理模型Gemini 2.0 Flash Thinking Experimental中提炼出了s1。使用了16个英伟达H100 GPU,仅仅进行了26分钟的训练,便诞生了一个能与顶尖推理模型相媲美的32B推理模型。这种方法的精髓在于如何有效地传递知识,使得小模型在保持大模型推理能力的同时,能够在资源消耗上展现出极大的优越性。
s1的诞生,标志着高效AI模型训练新时代的到来。s1所展现出的价格优势,折射出未来AI领域的一个重要趋势:大模型的训练和应用将愈发平民化,不再遥不可及。
本文原文来自搜狐新闻
热门推荐
何为——防火墙安全区域?
不痛风也会尿酸高?这项体检指标升高须警惕
最护眼的显示器是什么?一文详解选购要点
养猫的家庭要避免养哪些植物
日常生活中,真的需要补充维生素C吗?
徐福求仙之旅:古代海上探险的传奇
南亚国家打击人口贩卖:法律框架、挑战与对策
怎样理解股票的斐波那契回撤
2025版胰腺癌抗癌宝典:已上市药物、在研新药及免疫疗法全解析
新房交易积极向好,轨交盘等去化状况最佳
盐酸泄漏事故环境风险评价及管控措施
求生之路2配置优化指南:提升游戏体验最全攻略
王政君的一生:历经六帝,潇洒从容地活了84岁
大蒜能通血管吗
科学实验活动:奇妙的影子
西南科技大学2025年在职研究生招生简章
一文解析 DeepSeek 大模型高效训练背后的极限 AI 工程优化
《滤镜》短剧情深似海:感受爱的波澜
不容错过!西安电子科技大学各个研究院宿舍集锦(含西安本部等)
什么是有理数和无理数?定义是什么?
二维MG动画制作过程中线条运用:赋予画面生命力的秘诀
白日依山尽,黄河入海流。
AI时代前端开发:持续学习与技能更新,拥抱AI代码生成器
美国人开什么车比较多?
重装系统需要备份什么?详解8个关键数据不容忽视
手机微信收不到声音怎么办?三种常见原因及解决方法
顽强创造奇迹!大鹰被箭贯穿,靠吃鸟蛋存活了下来
为世界贡献中国路径|电网企业助力能源绿色转型优秀解决方案亮相COP29
国电电力四项技术创新成果获中国职工技术协会表彰
黄金要上演午夜暴动?关键看这个位置!