DeepSeek开源革命:硅谷大佬张璐解读未来AI趋势
DeepSeek开源革命:硅谷大佬张璐解读未来AI趋势
2025年伊始,DeepSeek在海外掀起了一场AI革命。其开源推理模型R1在全球范围内引发广泛关注,不仅在多个基准测试中展现出卓越性能,更以其创新的开源模式和低成本优势,重新定义了AI模型的开发和应用方式。
开源生态的胜利
硅谷投资人张璐在达沃斯峰会上表示,DeepSeek的成功标志着开源生态的重大胜利。她指出,开源模式不仅加速了技术迭代,更为全球开发者和初创企业提供了前所未有的机遇。
“DeepSeek这次代表中国的模型公司,在国际科技领域获得了广泛认知和关注。”张璐在接受《晚点聊LateTalk》采访时说,“在硅谷这边,去年年中,我曾与一些OpenAI和Anthropic的朋友交流,他们当时已经提及正在关注DeepSeek所从事的领域。”
技术突破与成本革命
DeepSeek-V3的发布,进一步证明了开源模式的可行性。作为基于MoE架构的大模型,DeepSeek-V3总参数量达到671B,通过MLA和DeepSeekMoE架构的结合,实现了性能与成本的双重突破。
最引人注目的是其训练成本。DeepSeek-V3的完整训练仅消耗2.788M GPU小时,按照每GPU小时2美元的H800 GPU租用价格计算,总训练成本仅为557.6万美元。这一成本远低于同类模型,显示出DeepSeek在算法、框架和硬件层面的整体优化设计带来的显著优势。
开源模式的深远影响
张璐认为,DeepSeek的开源策略正在重塑全球AI格局。“开源的发展速度让大家看到构建广泛生态合作的可能性,这种合作超越了地域限制。即便像DeepSeek这样远在中国的团队,也能在开源生态中作出巨大贡献。”
同时,开源模式也在改变人们对AI技术的认知。张璐指出,DeepSeek不仅展示了中国AI公司在工程优化方面的实力,更在底层架构创新上取得了突破。“中国的这些人工智能公司、模型公司也在进行底层架构创新的探索。”
未来展望
DeepSeek的开源革命还在继续。HuggingFace牵头的Open R1项目正在努力完全复现DeepSeek R1,目前已发布OpenR1-Math-220k数据集,包含22万条高质量推理数据。这些数据可以支持更小的模型达到与DeepSeek R1相当的性能,进一步降低了AI应用的门槛。
张璐认为,长线来看,DeepSeek这类大幅降低AI模型训练、部署和使用成本的开源成果,会促进更多公司将AI大模型带到各行各业,提升AI用量和算力需求。这不仅对算力市场是一个利好,更将推动整个AI产业的蓬勃发展。
DeepSeek的开源革命,正在以一种前所未有的方式,改变着全球AI产业的格局。正如张璐所说:“技术的力量,开源的力量,初创生态的力量。”这场由DeepSeek引领的开源运动,正在为全球AI产业带来新的希望和可能。