问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

OpenAI服软!DeepSeek掀开源狂潮:四模型同日开源

创作时间:
作者:
@小白创作中心

OpenAI服软!DeepSeek掀开源狂潮:四模型同日开源

引用
1
来源
1.
https://news.sina.cn/ai/2025-02-19/detail-inekxrwy6364255.d.html?cre=tianyi&mod=pchp&loc=24&r=0&rfunc=74&tj=cxvertical_pc_hp&tr=12

OpenAI正在改变其一贯的闭源策略,开始向开源领域迈进。2月18日,OpenAI CEO Sam Altman在社交媒体上询问网友关于开源项目的建议,这标志着AI领域正在经历一场深刻的变革。

不只是百度大模型在调整到“开源与免费”的姿态。

2月初,OpenAI CEO Sam Altman罕见承认OpenAI的闭源策略站在了“错误的一边”,同时小心翼翼地放出了有限度“免费+开源”的消息。

现在更进一步了,2月18日,OpenAI CEO Sam Altman在X平台(原Twitter)上询问网友:

“对于我们的下一个开源项目,是做一个相当小巧但仍然需要在GPU上运行的o3-mini级别模型更有用,还是做我们能做的最好的手机尺寸模型?”


图:可能全都要,在手机上运行o3 mini水平模型

毫无疑问,结合之前OpenAI在DeepSeek冲击下放出的一系列消息,Sam Altman不仅官宣了“开源项目”,也是在暗示OpenAI开源计划的两个方向。而在过去六年,OpenAI一直坚守封闭策略(甚至因此被网友称为CloseAI),自GPT-2之后再未开源任何大模型。

背后DeepSeek带来的压力显而易见。

ChatGPT问世后,OpenAI在闭源模型的基础上通过“API+订阅制”构建起强大的商业护城河,但DeepSeek V3和R1证明了开源大模型同样可以媲美GPT-4o级别的能力,并且成本更低、可本地部署。

面对这一挑战,OpenAI再也无法对开源阵营置之不理。过去,企业几乎只能依赖OpenAI或Google等大模型厂商提供的封闭API,而现在,越来越多公司开始直接从云计算平台或者部署DeepSeek等开源大模型,大幅降低AI计算成本。

也不仅仅是OpenAI,整个AI生态都在拥抱开源,甚至一向推崇闭源的百度也宣布下一代文心大模型4.5系列将在6月底开源。而仅在2月18日一天,就有多个模型宣告开源:

  • 昆仑万维宣布,开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,以及基于视频基座模型的表情动作可控算法SkyReels-A1。

  • 阶跃星辰和吉利汽车联合宣布,将开源双方合作的视频生成模型阶跃Step-Video-T2V和语音交互大模型阶跃Step-Audio。

  • 逐际动力宣布,开源基于视频生成大模型的具身操作算法(VideoGenMotion,简称LimX VGM)。

  • 在刚刚发布Grok 3系列模型,马斯克旗下xAI宣布,上一代大模型Grok 2将在几个月后开源。


图:Grok 3发布直播

在DeepSeek这只“鲶鱼”的影响下,开源正在撬动整个AI生态,而一场AI产业的“开源革命”也已然开始。

开源AI,星火燎原

就在短短几个月前,关于AI的讨论还集中在GPT(OpenAI)、Claude(Anthropic)和Gemini(Google)这样的闭源模型上,而现在,DeepSeek几乎以一举之力扭转了市场的注意力,将其迅速转向开源阵营。

除了之前就采用不同开源策略的Llama(Meta)、通义千问Qwen(阿里巴巴)以及Grok(xAI),开源阵营也迎来了不同方向的大模型,腾讯和字节就在早些时候开源了各自的视频生成模型,也包括昆仑万维刚刚开源的SkyReels-V1视频模型。

不同于其他视频模型追求的通用性,SkyReels-V1视频可能是首个面向AI短剧生成的开源模型,性能上号称是最强的图生视频开源模型。


图:昆仑万维

与此同时,阶跃星辰和吉利汽车开源了面向座舱场景的阶跃Step-Video-T2V视频生成模型,以及阶跃Step-Audio语音交互大模型。另一边是逐际动力在视频生成大模型打造了一套从文本到视频,再到机器人运动和操作的算法LimX VGM,并将之开源给所有机器人开发者。

这场AI竞赛,已经远远超出了最初的语言模型之争,开源正以燎原之势,席卷整个AI生态,也在一定程度上意味着大模型迭代的范式转变。

最早,OpenAI以“开源”起家,GPT-2甚至还曾完全开放权重。但随后OpenAI就彻底转向闭源,并在基于GPT-3.5打造ChatGPT后迅速以API和订阅制建立起商业模式。

OpenAI转变的核心逻辑在于,训练大模型需要极高的算力成本,闭源可以确保盈利,避免开源导致的“免费竞争”。而通过API形式提供AI服务,而不开放底层权重,防止竞品复制其技术。


图:OpenAI

更重要的是,通过掌控用户交互数据,持续迭代GPT模型和ChatGPT,并维持市场领先地位。但OpenAI,终究还是忽略了开源的魔力以及最核心的技术创新。

如果回顾计算机技术史,实际上我们不难发现,开源未必会在早期占据最有利的位置,但往往就像滚雪球一般:越滚越大,最终势不可挡。

2008年,Google决定对Android采取开源+商业化的策略,这一决定彻底改变了移动操作系统格局。当时的iOS是封闭的,而Android通过开源吸引了三星、华为以及小米等全球硬件厂商的支持,迅速超越iOS,成为全球市场占有率最高的移动系统。

Chromium也是如此,尽管它最初只是一个开源浏览器引擎,但最终几乎吞噬了整个浏览器市场,就连微软的Edge都不得不基于Chromium内核重建。

今天AI领域在经历同样的变革。闭源AI依然能赚到钱,但随着DeepSeek带来的冲击,市场已经开始倾向于开源大模型的路线。一个核心在于,开源不仅降低了AI技术门槛,也给所有开发者和企业带来了更多自由度——API接入、云端调用、本地部署,甚至是基于不同需求和数据进行重新训练。

而这种自由,正是OpenAI体系下难以提供的。

DeepSeek R1,打出一个开源盛世

还是2月18日,DeepSeek在X平台上发布了一篇技术论文,主要内容是提出一种名为NSA(Natively Sparse Attention,原生稀疏注意力)的新型注意力机制。核心是通过对硬件的友好与端到端训练,取得推理、训练速度和任务表现的综合平衡:

让大模型在长上下文中兼具高效与高保真度。


图:DeepSeek团队新论文

这不是DeepSeek第一次发布技术论文,第一次为业界提供一种难题的解决思路。但更重要的其实是不同于o1模型,DeepSeek此前用R1彻底揭开了OpenAI无论如何都想藏起来的——推理类模型“算法的秘密”,给更多人、更多厂商复制和超越o1的可能。

过去,大模型行业默认接受了封闭模式——从GPT-3之后,AI技术的进步被归结为“资源游戏”,更大的算力、更贵的数据、更封闭的API,塑造了AI的商业逻辑。

这种逻辑一度被认为是不可逆的,毕竟AI训练的成本极高,封闭系统能确保收益最大化,同时维持技术优势。但DeepSeek R1彻底改变了这种假设。


图:DeepSeek

相比更早之前发布的OpenAI o1、Kimi k1,DeepSeek R1不仅是作为开源模型,而是一种全新的思维方式——它让AI的“思考过程”成为透明的,让所有开发者都能看到推理是如何发生的。

更重要的是,它证明了AI进步不必依赖“算力堆叠”,DeepSeek另辟蹊径,通过推理优化,而不是纯粹地算力扩展,重新定义AI进步的路径。

这种开源路径带来的变化,不只是技术上的,也是生态上的。在封闭体系下,企业只能被动接受OpenAI、Anthropic这样的巨头定价,而DeepSeek R1让企业有了更低的成本、更灵活的选择,所有过去被封闭AI掌控的能力,如今都可以在开源环境中自由演进。

这不仅提高了AI的普及度,也让整个行业面临的壁垒大幅削减,这也是为什么我们会看到,所有厂商似乎都在接入DeepSeek。当然,出于营销目的的接入以及简单粗暴的接入方式,也是这种变化中不可避免的一个过程。

写在最后

就在Sam Altman询问开源模型方向的推文下,有人依旧不满于OpenAI的“开源策略”,并提出至少应该开源GPT-4——尽管由于成本和延迟早已不是主力,但依然是非推理类模型的一流性能水平。

R1已经证明,不同于闭源的AI研究,开源的方式可以通过全球协作、技术共享,让整个生态的进步速度加快。未来的AI可能也不会是少数巨头的垄断,而是由大量参与者共同推进的技术体系。

而DeepSeek R1,正是这场“开源盛世”的开端。从这个角度来看,DeepSeek和R1之所以重要,并不仅仅是它的性能,而是它所开启的AI未来。开源不是封闭AI的备选方案,而是一条全新的康庄大道。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号