问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

DeepSeek开源革命:硅谷大佬张璐解读未来AI趋势

创作时间:
作者:
@小白创作中心

DeepSeek开源革命:硅谷大佬张璐解读未来AI趋势

引用
网易
9
来源
1.
https://www.163.com/dy/article/JOAIDOJF0531M1CO.html
2.
https://36kr.com/p/3161851987864070
3.
https://36kr.com/p/3157283502578434
4.
https://k.sina.com.cn/article_7294209083_1b2c4cc3b00101jvra.html?from=tech&subch=otech
5.
https://finance.sina.com.cn/jjxw/2025-02-13/doc-inekhynm2022166.shtml
6.
https://linxkon.github.io/deepseekV3.html
7.
https://www.inhand.com/zh/support/blogs/running-deepseek-r1-distilled-model-on-inhand-ai-edge-computers/
8.
https://cloud.tencent.com/developer/article/2487319
9.
https://developer.volcengine.com/articles/7455586746282016805

2025年伊始,DeepSeek在海外掀起了一场AI革命。其开源推理模型R1在全球范围内引发广泛关注,不仅在多个基准测试中展现出卓越性能,更以其创新的开源模式和低成本优势,重新定义了AI模型的开发和应用方式。

01

开源生态的胜利

硅谷投资人张璐在达沃斯峰会上表示,DeepSeek的成功标志着开源生态的重大胜利。她指出,开源模式不仅加速了技术迭代,更为全球开发者和初创企业提供了前所未有的机遇。

“DeepSeek这次代表中国的模型公司,在国际科技领域获得了广泛认知和关注。”张璐在接受《晚点聊LateTalk》采访时说,“在硅谷这边,去年年中,我曾与一些OpenAI和Anthropic的朋友交流,他们当时已经提及正在关注DeepSeek所从事的领域。”

02

技术突破与成本革命

DeepSeek-V3的发布,进一步证明了开源模式的可行性。作为基于MoE架构的大模型,DeepSeek-V3总参数量达到671B,通过MLA和DeepSeekMoE架构的结合,实现了性能与成本的双重突破。

最引人注目的是其训练成本。DeepSeek-V3的完整训练仅消耗2.788M GPU小时,按照每GPU小时2美元的H800 GPU租用价格计算,总训练成本仅为557.6万美元。这一成本远低于同类模型,显示出DeepSeek在算法、框架和硬件层面的整体优化设计带来的显著优势。

03

开源模式的深远影响

张璐认为,DeepSeek的开源策略正在重塑全球AI格局。“开源的发展速度让大家看到构建广泛生态合作的可能性,这种合作超越了地域限制。即便像DeepSeek这样远在中国的团队,也能在开源生态中作出巨大贡献。”

同时,开源模式也在改变人们对AI技术的认知。张璐指出,DeepSeek不仅展示了中国AI公司在工程优化方面的实力,更在底层架构创新上取得了突破。“中国的这些人工智能公司、模型公司也在进行底层架构创新的探索。”

04

未来展望

DeepSeek的开源革命还在继续。HuggingFace牵头的Open R1项目正在努力完全复现DeepSeek R1,目前已发布OpenR1-Math-220k数据集,包含22万条高质量推理数据。这些数据可以支持更小的模型达到与DeepSeek R1相当的性能,进一步降低了AI应用的门槛。

张璐认为,长线来看,DeepSeek这类大幅降低AI模型训练、部署和使用成本的开源成果,会促进更多公司将AI大模型带到各行各业,提升AI用量和算力需求。这不仅对算力市场是一个利好,更将推动整个AI产业的蓬勃发展。

DeepSeek的开源革命,正在以一种前所未有的方式,改变着全球AI产业的格局。正如张璐所说:“技术的力量,开源的力量,初创生态的力量。”这场由DeepSeek引领的开源运动,正在为全球AI产业带来新的希望和可能。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号