资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

DeepSeek：从技术突破到市场霸主，AI界的“拼多多”如何颠覆行业？

创作时间:

作者:

@小白创作中心

DeepSeek：从技术突破到市场霸主，AI界的“拼多多”如何颠覆行业？

引用

36氪

等

来源

https://36kr.com/p/2872793466982535

https://finance.sina.com.cn/chanjing/gsnews/2025-02-07/doc-ineirwmz9989976.shtml

https://36kr.com/p/3156302864563713

https://new.qq.com/rain/a/20250202A05WKP00

https://36kr.com/p/3135022841879040

https://m.21jingji.com/article/20250208/8a57643dfe4921e89dfd2913b20eb895.html

https://finance.sina.com.cn/roll/2025-02-08/doc-ineitvck6737484.shtml

https://new.qq.com/rain/a/20250207A090BV00

https://finance.sina.com.cn/money/fund/jjzl/2025-02-05/doc-ineimuvz5042023.shtml

10.

https://www.secrss.com/articles/75363

11.

https://www.showapi.com/news/article/67a4185e4ddd79f11a5d8139

12.

https://privatebank.jpmorgan.com/apac/cn/insights/markets-and-investing/tmt/is-the-deepseek-drama-a-gamechanger-for-the-ai-trade

从怀疑到信仰：DeepSeek引发AI界大地震

“我肯定会投啊！我肯定会投！”金沙江创投主管合伙人朱啸虎近日在接受36氪采访时，反复强调他对DeepSeek的投资意愿。这位曾经的AI怀疑论者，如今却成为了DeepSeek的“铁粉”。

仅仅一年前，朱啸虎还对大模型和通用人工智能（AGI）持强烈怀疑态度，直言“这个肯定没戏”。然而，DeepSeek的出现彻底颠覆了他的认知。在接受36氪采访时，他毫不掩饰自己的惊讶和震撼：“真的让我大开眼界”、“非常惊艳”、“非常惊讶”、“哇！”

技术创新：DeepSeek的制胜法宝

DeepSeek的崛起并非偶然。其核心技术团队来自幻方，是国内唯一一家储备万张A100芯片的公司。DeepSeek的创新主要体现在两个方面：新型的MLA（多头潜在注意力机制）架构和DeepSeekMoESparse结构。

据36氪报道，DeepSeek的MLA架构将显存占用降至传统MHA架构的5%-13%，而DeepSeekMoESparse结构则进一步优化了计算效率。这些技术创新使得DeepSeek能够以极低的成本实现高性能。目前，DeepSeek的推理成本仅为每百万token 1元，约为Llama3 70B的七分之一，GPT-4 Turbo的七十分之一。

硅谷科技界对DeepSeek的技术突破给予了高度评价。SemiAnalysis首席分析师认为DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr更是将其训练设置应用于自己的模型。多位行业人士表示，这种架构层面的创新在国产大模型中极为罕见，甚至在全球开源基座大模型中也属凤毛麟角。

市场表现：全球增速第一

DeepSeek的市场表现同样令人瞩目。自2025年春节以来，这款类ChatGPT产品在全球范围内大幅增长，迅速吸引了超过2000万日活跃用户。朱啸虎称其为“全球App增速历史第一，不需要任何限定语”。

小红书用户对DeepSeek的使用体验也给予了积极评价。一位用户表示：“DeepSeek的表达能力是它的大杀器，大受震撼，嘎嘎乱杀。”另一位用户则提到：“中文，数学分析，逻辑性思维训练DeepSeek真的好用，还免费，无次数上限。”

与竞品对比：优势明显

与市场上的主要竞品相比，DeepSeek展现出独特的优势。在与ChatGPT的对比中，DeepSeek在中文处理、数学分析和逻辑思维训练方面表现更优。一位长期使用ChatGPT的付费用户表示：“DeepSeek在中文处理方面更胜一筹，而且免费无次数限制。”

在算力使用效率方面，DeepSeek也远超竞争对手。DeepSeek-V3模型仅使用2048块H800芯片、历经两个月，便实现了6710亿参数的训练成果。相比之下，Meta的Llama 3训练参数为4050亿，则需要16384块性能更强的H100芯片、耗时54天才能完成训练，DeepSeek的训练效率提升了11倍。

商业模式：技术驱动的商业化路径

DeepSeek的商业模式体现了其技术驱动的特点。公司专注于技术研发和解决方案提供，已为超过500家企业提供服务，月活跃用户数突破百万。通过持续优化算法降低算力成本，DeepSeek不仅实现了盈利，还推动了整个行业对AI技术的重新思考。

未来展望：重塑AI行业格局

DeepSeek的崛起正在重塑全球AI行业的竞争格局。朱啸虎认为，DeepSeek已经建立了类似安卓的开源生态，这将为应用层带来极大解放，从而引发应用层的爆发。他指出，DeepSeek的低成本、高性能模式颠覆了此前对AI发展的普遍认知。“以前我觉得AI门槛很高、壁垒很高，但现在看来并不是这样的。”这使得后发跟进者具有很大优势。

面对DeepSeek的快速崛起，马斯克的xAI也感受到了压力。朱啸虎表示，如果闭源模型在成本上很高，性能上没有明显优势，“为什么大家用闭源模型？”他认为，如果10万卡集群的性能提升有限，闭源模型将失去存在的价值。