DeepSeek:从技术突破到市场霸主,AI界的“拼多多”如何颠覆行业?
DeepSeek:从技术突破到市场霸主,AI界的“拼多多”如何颠覆行业?
从怀疑到信仰:DeepSeek引发AI界大地震
“我肯定会投啊!我肯定会投!”金沙江创投主管合伙人朱啸虎近日在接受36氪采访时,反复强调他对DeepSeek的投资意愿。这位曾经的AI怀疑论者,如今却成为了DeepSeek的“铁粉”。
仅仅一年前,朱啸虎还对大模型和通用人工智能(AGI)持强烈怀疑态度,直言“这个肯定没戏”。然而,DeepSeek的出现彻底颠覆了他的认知。在接受36氪采访时,他毫不掩饰自己的惊讶和震撼:“真的让我大开眼界”、“非常惊艳”、“非常惊讶”、“哇!”
技术创新:DeepSeek的制胜法宝
DeepSeek的崛起并非偶然。其核心技术团队来自幻方,是国内唯一一家储备万张A100芯片的公司。DeepSeek的创新主要体现在两个方面:新型的MLA(多头潜在注意力机制)架构和DeepSeekMoESparse结构。
据36氪报道,DeepSeek的MLA架构将显存占用降至传统MHA架构的5%-13%,而DeepSeekMoESparse结构则进一步优化了计算效率。这些技术创新使得DeepSeek能够以极低的成本实现高性能。目前,DeepSeek的推理成本仅为每百万token 1元,约为Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。
硅谷科技界对DeepSeek的技术突破给予了高度评价。SemiAnalysis首席分析师认为DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew Carr更是将其训练设置应用于自己的模型。多位行业人士表示,这种架构层面的创新在国产大模型中极为罕见,甚至在全球开源基座大模型中也属凤毛麟角。
市场表现:全球增速第一
DeepSeek的市场表现同样令人瞩目。自2025年春节以来,这款类ChatGPT产品在全球范围内大幅增长,迅速吸引了超过2000万日活跃用户。朱啸虎称其为“全球App增速历史第一,不需要任何限定语”。
小红书用户对DeepSeek的使用体验也给予了积极评价。一位用户表示:“DeepSeek的表达能力是它的大杀器,大受震撼,嘎嘎乱杀。”另一位用户则提到:“中文,数学分析,逻辑性思维训练DeepSeek真的好用,还免费,无次数上限。”
与竞品对比:优势明显
与市场上的主要竞品相比,DeepSeek展现出独特的优势。在与ChatGPT的对比中,DeepSeek在中文处理、数学分析和逻辑思维训练方面表现更优。一位长期使用ChatGPT的付费用户表示:“DeepSeek在中文处理方面更胜一筹,而且免费无次数限制。”
在算力使用效率方面,DeepSeek也远超竞争对手。DeepSeek-V3模型仅使用2048块H800芯片、历经两个月,便实现了6710亿参数的训练成果。相比之下,Meta的Llama 3训练参数为4050亿,则需要16384块性能更强的H100芯片、耗时54天才能完成训练,DeepSeek的训练效率提升了11倍。
商业模式:技术驱动的商业化路径
DeepSeek的商业模式体现了其技术驱动的特点。公司专注于技术研发和解决方案提供,已为超过500家企业提供服务,月活跃用户数突破百万。通过持续优化算法降低算力成本,DeepSeek不仅实现了盈利,还推动了整个行业对AI技术的重新思考。
未来展望:重塑AI行业格局
DeepSeek的崛起正在重塑全球AI行业的竞争格局。朱啸虎认为,DeepSeek已经建立了类似安卓的开源生态,这将为应用层带来极大解放,从而引发应用层的爆发。他指出,DeepSeek的低成本、高性能模式颠覆了此前对AI发展的普遍认知。“以前我觉得AI门槛很高、壁垒很高,但现在看来并不是这样的。”这使得后发跟进者具有很大优势。
面对DeepSeek的快速崛起,马斯克的xAI也感受到了压力。朱啸虎表示,如果闭源模型在成本上很高,性能上没有明显优势,“为什么大家用闭源模型?”他认为,如果10万卡集群的性能提升有限,闭源模型将失去存在的价值。
结语:AI创业的新启示
DeepSeek的成功为AI创业公司提供了重要启示。朱啸虎预测,2025年将是AI应用爆发的关键一年。他建议AI创业公司重新思考自己的定位,“任何创业公司来说,千万别去研究底层模型”,而是应该专注于用户需求和场景。
DeepSeek的出现不仅改变了朱啸虎对AI的看法,更可能彻底改写全球AI行业的竞争格局。这场由DeepSeek引发的AI革命,才刚刚开始。