资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

DeepSeek开源革命：硅谷大佬张璐解读未来AI趋势

创作时间:

作者:

@小白创作中心

DeepSeek开源革命：硅谷大佬张璐解读未来AI趋势

引用

网易

等

来源

https://www.163.com/dy/article/JOAIDOJF0531M1CO.html

https://36kr.com/p/3161851987864070

https://36kr.com/p/3157283502578434

https://k.sina.com.cn/article_7294209083_1b2c4cc3b00101jvra.html?from=tech&subch=otech

https://finance.sina.com.cn/jjxw/2025-02-13/doc-inekhynm2022166.shtml

https://linxkon.github.io/deepseekV3.html

https://www.inhand.com/zh/support/blogs/running-deepseek-r1-distilled-model-on-inhand-ai-edge-computers/

https://cloud.tencent.com/developer/article/2487319

https://developer.volcengine.com/articles/7455586746282016805

2025年伊始，DeepSeek在海外掀起了一场AI革命。其开源推理模型R1在全球范围内引发广泛关注，不仅在多个基准测试中展现出卓越性能，更以其创新的开源模式和低成本优势，重新定义了AI模型的开发和应用方式。

开源生态的胜利

硅谷投资人张璐在达沃斯峰会上表示，DeepSeek的成功标志着开源生态的重大胜利。她指出，开源模式不仅加速了技术迭代，更为全球开发者和初创企业提供了前所未有的机遇。

“DeepSeek这次代表中国的模型公司，在国际科技领域获得了广泛认知和关注。”张璐在接受《晚点聊LateTalk》采访时说，“在硅谷这边，去年年中，我曾与一些OpenAI和Anthropic的朋友交流，他们当时已经提及正在关注DeepSeek所从事的领域。”

技术突破与成本革命

DeepSeek-V3的发布，进一步证明了开源模式的可行性。作为基于MoE架构的大模型，DeepSeek-V3总参数量达到671B，通过MLA和DeepSeekMoE架构的结合，实现了性能与成本的双重突破。

最引人注目的是其训练成本。DeepSeek-V3的完整训练仅消耗2.788M GPU小时，按照每GPU小时2美元的H800 GPU租用价格计算，总训练成本仅为557.6万美元。这一成本远低于同类模型，显示出DeepSeek在算法、框架和硬件层面的整体优化设计带来的显著优势。

开源模式的深远影响

张璐认为，DeepSeek的开源策略正在重塑全球AI格局。“开源的发展速度让大家看到构建广泛生态合作的可能性，这种合作超越了地域限制。即便像DeepSeek这样远在中国的团队，也能在开源生态中作出巨大贡献。”

同时，开源模式也在改变人们对AI技术的认知。张璐指出，DeepSeek不仅展示了中国AI公司在工程优化方面的实力，更在底层架构创新上取得了突破。“中国的这些人工智能公司、模型公司也在进行底层架构创新的探索。”

未来展望

DeepSeek的开源革命还在继续。HuggingFace牵头的Open R1项目正在努力完全复现DeepSeek R1，目前已发布OpenR1-Math-220k数据集，包含22万条高质量推理数据。这些数据可以支持更小的模型达到与DeepSeek R1相当的性能，进一步降低了AI应用的门槛。

张璐认为，长线来看，DeepSeek这类大幅降低AI模型训练、部署和使用成本的开源成果，会促进更多公司将AI大模型带到各行各业，提升AI用量和算力需求。这不仅对算力市场是一个利好，更将推动整个AI产业的蓬勃发展。

DeepSeek的开源革命，正在以一种前所未有的方式，改变着全球AI产业的格局。正如张璐所说：“技术的力量，开源的力量，初创生态的力量。”这场由DeepSeek引领的开源运动，正在为全球AI产业带来新的希望和可能。

热门推荐

鹦鹉鱼饲养全攻略：从水温到健康管理的全方位指南

二十年，只为写出心中的《英雄志》

数据分析和数据挖掘的区别是什么如何做好数据挖掘

如何找到Web服务器的真实IP地址：多种实用方法详解

雪落无声竹林静谧，古诗词里的雪竹，冬日里最动人的画面！

PS5玩家必看：优化《生化危机8》体验的全面指南

大数据：处理海量、多样化和快速的数据，提取有用信息

揭秘闹钟的奥秘：提升睡眠品质、助你告别赖床困扰

三维数字化技术在不可移动文物保护领域的实践与思考

黄金一克价格构成深度解析：多重因素如何影响金价？

如何确保人力资源规划方案符合公司战略目标？

特拉雷乳胶和邓禄普乳胶区别

茉莉花的象征意义（探索茉莉花作为文化和象征的关键）

唐寅《事茗图》：山静日长，诗书茶香为伴

4A级景区复牌后再访仙岛湖，看“两山”理论的生动实践

现实解体症状：定义、病因、症状与预防

量比指标的定义是什么？量比指标在股票交易中的实际应用有哪些？

笔记本CPU对比桌面天梯图：性能差异及选购指南解析