从怀疑到信仰:DeepSeek如何改变AI投资人的看法?
从怀疑到信仰:DeepSeek如何改变AI投资人的看法?
从怀疑到狂热:一位AI投资人的态度大转变
仅仅一年前,金沙江创投主管合伙人朱啸虎还是中国AI领域的现实主义者。他直言不讳地表示:"我们一看就知道,这个肯定没戏",甚至断言"AGI……现在的架构上根本不可能实现"。然而,DeepSeek的出现彻底颠覆了他的认知。
在接受36氪采访时,这位曾经的AI怀疑论者毫不掩饰自己的惊讶和震撼:"真的让我大开眼界"、"非常惊艳"、"非常惊讶"、"哇!"这些词汇频繁出现在他的描述中。更令人意外的是,这位曾经的AI怀疑论者如今表示:"DeepSeek快让我相信AGI了。"
DeepSeek:以技术创新突破算力瓶颈
DeepSeek的横空出世,不仅改变了朱啸虎等投资人的看法,更在全球范围内掀起了一场AI革命。这款基于Transformer架构的大型语言模型,通过多项技术创新实现了性能与成本的突破。
DeepSeek的核心技术优势在于其独特的架构设计。它采用了更深的网络结构和更大的模型规模,并创新性地引入了Multi-Head Latent Attention(MLA)机制。这种机制通过压缩键和值为低秩潜在向量,降低了内存占用,使得模型能够处理更长的序列。
更令人印象深刻的是,DeepSeek在训练效率和成本控制方面实现了重大突破。据统计,DeepSeek-V3模型仅使用了2048块H800芯片,历经两个月就完成了6710亿参数的训练。相比之下,Meta的Llama 3训练参数为4050亿,却需要16384块性能更强的H100芯片、耗时54天才能完成训练,DeepSeek的训练效率提升了11倍。
引发行业变革,也带来争议
DeepSeek的崛起速度之快,令人咋舌。在没有任何推广的情况下,这款类ChatGPT的中国AI对话产品仅用20天就实现了惊人的全球增长。朱啸虎称其为"全球App增速历史第一,不需要任何限定语"。
然而,DeepSeek的高效、低成本也引发了业界争议。一种观点认为DeepSeek可能隐瞒了真实算力,甚至有消息称美国白宫和FBI正在调查其是否通过新加坡获取H100显卡。另一种观点则指向数据蒸馏问题,质疑DeepSeek是否使用了OpenAI的闭源数据。
但也有专家认为,DeepSeek的成功在于算法上的优化。人工智能权威学者吴恩达就表示,DeepSeek通过算法创新而非纯粹的算力,为AI领域带来了新的思路转变。
2025:AI应用爆发的关键之年
DeepSeek的出现,不仅改变了朱啸虎等投资人的看法,更可能彻底改写全球AI行业的竞争格局。多位AI专家预测,2025年将是AI应用爆发的关键一年。
专家们普遍认为,生成式AI将更加成熟,能够生成更高质量的内容;多模态AI将融合文本、图像和音频等多种数据类型,创造更丰富的交互体验;量子计算与AI的结合有望在多个领域取得突破;自动驾驶技术将实现新的进展;AI代理系统将在医疗、金融等领域发挥更大作用。
朱啸虎也预测,DeepSeek已经证明了AI能力的强大和成本的可控,这将极大促进应用层的发展。同时,他也指出,AI创业公司需要重新思考自己的定位,"任何创业公司来说,千万别去研究底层模型",而是应该专注于用户需求和场景。
DeepSeek的出现不仅展示了AI技术的巨大潜力,更开启了AI应用的新纪元。这场由DeepSeek引发的AI革命,才刚刚开始。