资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

DeepSeek-v3震撼AI圈：清北应届生如何撑起一片天？

创作时间:

作者:

@小白创作中心

DeepSeek-v3震撼AI圈：清北应届生如何撑起一片天？

引用

新浪网

等

来源

https://finance.sina.com.cn/jjxw/2025-01-27/doc-inehmraw7717517.shtml

https://finance.sina.com.cn/tech/roll/2024-12-27/doc-ineawpiv5934697.shtml

https://finance.sina.com.cn/money/bond/2024-08-06/doc-inchtaqz9972992.shtml

https://finance.sina.com.cn/tech/csj/2025-01-06/doc-inecznxv3066739.shtml

https://post.smzdm.com/p/amve5dvd/

https://finance.sina.com.cn/stock/usstock/c/2025-01-27/doc-inehmenx8703110.shtml

https://finance.sina.com.cn/tech/discovery/2024-12-31/doc-ineciinf2277023.shtml

https://blog.csdn.net/weixin_44262492/article/details/145050627

https://finance.sina.com.cn/tech/csj/2025-01-04/doc-inecuumu7781519.shtml

10.

https://mt.sohu.com/a/845625543_121924584

11.

https://www.sohu.com/a/845625548_121798711

12.

https://www.takungpao.com/opinion/233119/2025/0128/1055267.html

13.

https://finance.sina.com.cn/chanjing/gsnews/2025-01-27/doc-inehmvkt0830183.shtml

14.

https://finance.sina.cn/usstock/mggd/2025-01-27/detail-inehmkuy7811061.d.html?oid=%E4%BA%9A%E9%A9%AC%E9%80%8A%E7%9C%8B%E4%B8%8D%E5%88%B0%E6%8E%92%E5%90%8D%E4%BF%A1%E6%81%AF%E3%80%8E%E9%9C%80%E8%A6%81%E8%81%94%E7%B3%BBTG:@HHCH8%E6%92%9E%E5%BA%93%E6%95%B0%E6%8D%AE%E6%B8%97%E9%80%8F%E6%95%B0%E6%8D%AE%E6%B5%B7%E5%A4%96%E6%94%AF%E4%BB%98%E9%80%9A%E9%81%93%E3%80%8F%E4%BA%BA%E8%84%89%E5%BE%AE%E4%BF%A1%E7%BE%A4%E6%BA%90%E7%A0%81%E6%98%AF%E4%BB%80%E4%B9%88%E6%84%8F%E6%80%9D%E5%95%8A%E6%80%8E%E4%B9%88%E5%BC%84%E2%86%96%E9%9C%80%E8%A6%81%E8%81%94%E7%B3%BBTG:@HHCH8%E6%92%9E%E5%BA%93%E6%95%B0%E6%8D%AE%E6%B8%97%E9%80%8F%E6%95%B0%E6%8D%AE%E6%B5%B7%E5%A4%96%E6%94%AF%E4%BB%98%E9%80%9A%E9%81%93%E2%86%97%E9%87%8F%E8%83%BD%E7%BA%A7%E5%88%AB%E6%98%AF%E4%BB%80%E4%B9%88%E6%84%8F%E6%80%9D%E2%86%96%E9%9C%80%E8%A6%81%E8%81%94%E7%B3%BBTG:@HHCH8%E6%92%9E%E5%BA%93%E6%95%B0%E6%8D%AE%E6%B8%97%E9%80%8F%E6%95%B0%E6%8D%AE%E6%B5%B7%E5%A4%96%E6%94%AF%E4%BB%98%E9%80%9A%E9%81%93%E2%86%97GB8r&vt=4

15.

https://www.cnblogs.com/zengzuo613/p/18684303

2025年1月，一家名不见经传的中国AI初创公司DeepSeek，凭借其最新发布的v3大模型，在全球科技圈掀起了一场轩然大波。这款仅用560万美元训练成本、2048个英伟达H800芯片就达到超越Llama 3性能的AI模型，不仅让英伟达市值蒸发3000亿美元，更让整个华尔街陷入恐慌。

技术突破：以1/11算力实现性能超越

DeepSeek-v3最引人注目的成就，是在仅用Llama 3十分之一算力的情况下，实现了性能的全面超越。这个拥有6710亿参数的MoE模型，通过14.8T高质量token的预训练，不仅在多项测评中达到开源SOTA（State of the Art，即当前最佳）水平，更在性价比上创造了新的纪录。

具体来看，DeepSeek-v3的训练成本仅为557.6万美元，而同等规模的AI模型训练成本通常要高出十倍以上。这种惊人的效率提升，主要得益于DeepSeek团队在算法层面的两大创新：MLA（Multi-head Latent Attention）和GRPO（Group Relative Policy Optimization）。

MLA是一种新型的多头注意力机制，能够显著减少计算量和推理显存占用。相比传统的MHA（Multi-Head Attention）架构，MLA将显存占用降低到了5%-13%。这一突破性创新，使得DeepSeek能够在有限的算力资源下完成更大规模的模型训练。

GRPO则是DeepSeek团队提出的基于PPO（Proximal Policy Optimization）的变体强化学习算法。通过放弃传统的critic模型，转而从群体得分中估算baseline，GRPO显著减少了训练资源的需求。这一算法创新，不仅优化了模型的训练效率，更降低了整体训练成本。

年轻团队：清北应届生撑起AI新星

DeepSeek的成功，很大程度上归功于其独特的团队构成。这支不到140人的团队，成员几乎全部来自中国顶尖高校，如清华大学和北京大学。团队中既有刚走出校园的应届毕业生，也有仍在校攻读学位的实习生，平均年龄远低于行业平均水平。

在这些年轻面孔中，不乏已经在学术界崭露头角的佼佼者。例如，来自清华大学的代达劢，2024年博士毕业于北京大学计算机学院计算语言所，曾获EMNLP 2023最佳长论文奖、CCL 2021最佳中文论文奖，在各大顶会发表学术论文20篇+。2024年中国中文信息学会“博士学位论文激励计划”共入选10篇来自中国大陆高校的博士毕业论文，其中就有他的《预训练语言模型知识记忆的机理分析及能力增强关键技术研究》。

来自北京大学的邵智宏，是清华交互式人工智能（CoAI）课题组博士生，师从黄民烈教授。他的研究领域包括自然语言处理、深度学习，特别对如何能构建一个稳健且可扩展的AI系统感兴趣，这个AI系统能利用多样化的技能整合异构信息，并能准确回答各种复杂的自然语言问题。邵智宏之前还曾在微软研究院工作过。DeepSeekMath之后，他还参与了DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等项目。

同样来自北大的朱琪豪，2024届博士毕业生，发表CCF-A类论文16篇，在ASE和ESEC/FSE上分别获得ACM SIGSOFT杰出论文奖一次，提名一次。一篇论文进入ESEC/FSE会议同年的引用前三名。在DeepSeek团队，朱琪豪还基于他的博士论文工作，主导开发了DeepSeek-Coder-V1。其博士论文《语言定义感知的深度代码学习技术及应用》也入选了2024CCF软件工程专业委员会博士学位论文激励计划。

值得注意的是，这些年轻人并非简单地执行既定任务，而是真正成为了技术创新的主导力量。MLA和GRPO两大核心创新，正是由这些年轻的团队成员提出并实现的。这种以年轻人为主导的创新模式，不仅展现了中国新一代AI人才的实力，也为整个行业注入了新的活力。

开源策略：重塑全球AI竞争格局

DeepSeek的崛起，正在悄然改变全球AI领域的竞争格局。与许多追求商业利益最大化的公司不同，DeepSeek选择了完全开源的策略，不仅公开了模型的训练细节，还提供了原生FP8权重和转换脚本。这种开放态度，使得全球开发者都能在DeepSeek的基础上进行二次开发和创新。

DeepSeek的低成本优势，更是对传统AI巨头构成了重大挑战。其API价格仅为Claude 3.5 Sonnet的9%，每百万输入tokens仅需0.5元（缓存命中）/ 2元（缓存未命中），每百万输出tokens 8元。这种价格优势，使得更多企业和开发者能够负担得起AI技术的应用，推动了AI技术的普及。

DeepSeek的出现，打破了美国在AI领域的技术垄断，挑战了美国的技术霸权。其开源技术和低成本算法使得AI技术更加普及和易用，这无疑削弱了美国对AI技术的控制权，进而对其全球经济主导地位构成了威胁。

未来展望：机遇与挑战并存

尽管DeepSeek目前取得了令人瞩目的成就，但其发展道路上仍面临诸多挑战。首先是技术层面，虽然MLA和GRPO等创新技术带来了显著的性能提升，但如何在更大规模的模型上保持这种优势，仍是一个需要解决的问题。此外，如何在开源策略下保持持续的创新动力，也是DeepSeek需要面对的考验。

其次是市场竞争。随着DeepSeek的崛起，越来越多的科技巨头开始关注并投入AI技术的研发。这种竞争加剧的环境，既是对DeepSeek的挑战，也是其发展的机遇。DeepSeek需要在保持技术领先的同时，不断拓展应用场景，形成良性发展的生态系统。

最后是全球化战略。虽然DeepSeek目前主要在中国市场运营，但其技术影响力已经扩散至全球。如何在保持本土优势的同时，开拓国际市场，是DeepSeek未来需要思考的重要课题。

DeepSeek的崛起，无疑是对全球科技竞争规则的一次深刻颠覆。它打破了美国在AI领域的垄断地位，挑战了美国的技术霸权，推动了全球科技的均衡发展。然而，我们也应看到DeepSeek崛起背后所隐藏的挑战和风险。首先，随着AI技术的普及和应用，数据安全和隐私保护问题将愈发凸显。如何在享受AI技术带来的便利的同时，保障个人隐私和数据安全将成为亟待解决的问题。其次，AI技术的快速发展也可能引发就业结构的变革和社会伦理的挑战。我们需要在推动AI技术发展的同时，加强相关法规和政策的建设，确保AI技术的规范化和可持续发展。

此外，我们还应看到DeepSeek等开源AI技术的局限性。虽然开源技术有助于降低AI技术的开发成本和提高算法效率，但也可能导致技术同质化和创新动力不足的问题。因此，在推动开源技术发展的同时，我们也需要鼓励和保护企业的自主创新能力，推动AI技术的多元化和差异化发展。只有这样，才能确保AI技术的健康发展，为人类社会带来更大的福祉。