问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

DeepSeek-v3震撼AI圈:清北应届生如何撑起一片天?

创作时间:
作者:
@小白创作中心

DeepSeek-v3震撼AI圈:清北应届生如何撑起一片天?

引用
新浪网
15
来源
1.
https://finance.sina.com.cn/jjxw/2025-01-27/doc-inehmraw7717517.shtml
2.
https://finance.sina.com.cn/tech/roll/2024-12-27/doc-ineawpiv5934697.shtml
3.
https://finance.sina.com.cn/money/bond/2024-08-06/doc-inchtaqz9972992.shtml
4.
https://finance.sina.com.cn/tech/csj/2025-01-06/doc-inecznxv3066739.shtml
5.
https://post.smzdm.com/p/amve5dvd/
6.
https://finance.sina.com.cn/stock/usstock/c/2025-01-27/doc-inehmenx8703110.shtml
7.
https://finance.sina.com.cn/tech/discovery/2024-12-31/doc-ineciinf2277023.shtml
8.
https://blog.csdn.net/weixin_44262492/article/details/145050627
9.
https://finance.sina.com.cn/tech/csj/2025-01-04/doc-inecuumu7781519.shtml
10.
https://mt.sohu.com/a/845625543_121924584
11.
https://www.sohu.com/a/845625548_121798711
12.
https://www.takungpao.com/opinion/233119/2025/0128/1055267.html
13.
https://finance.sina.com.cn/chanjing/gsnews/2025-01-27/doc-inehmvkt0830183.shtml
14.
https://finance.sina.cn/usstock/mggd/2025-01-27/detail-inehmkuy7811061.d.html?oid=%E4%BA%9A%E9%A9%AC%E9%80%8A%E7%9C%8B%E4%B8%8D%E5%88%B0%E6%8E%92%E5%90%8D%E4%BF%A1%E6%81%AF%E3%80%8E%E9%9C%80%E8%A6%81%E8%81%94%E7%B3%BBTG:@HHCH8%E6%92%9E%E5%BA%93%E6%95%B0%E6%8D%AE%E6%B8%97%E9%80%8F%E6%95%B0%E6%8D%AE%E6%B5%B7%E5%A4%96%E6%94%AF%E4%BB%98%E9%80%9A%E9%81%93%E3%80%8F%E4%BA%BA%E8%84%89%E5%BE%AE%E4%BF%A1%E7%BE%A4%E6%BA%90%E7%A0%81%E6%98%AF%E4%BB%80%E4%B9%88%E6%84%8F%E6%80%9D%E5%95%8A%E6%80%8E%E4%B9%88%E5%BC%84%E2%86%96%E9%9C%80%E8%A6%81%E8%81%94%E7%B3%BBTG:@HHCH8%E6%92%9E%E5%BA%93%E6%95%B0%E6%8D%AE%E6%B8%97%E9%80%8F%E6%95%B0%E6%8D%AE%E6%B5%B7%E5%A4%96%E6%94%AF%E4%BB%98%E9%80%9A%E9%81%93%E2%86%97%E9%87%8F%E8%83%BD%E7%BA%A7%E5%88%AB%E6%98%AF%E4%BB%80%E4%B9%88%E6%84%8F%E6%80%9D%E2%86%96%E9%9C%80%E8%A6%81%E8%81%94%E7%B3%BBTG:@HHCH8%E6%92%9E%E5%BA%93%E6%95%B0%E6%8D%AE%E6%B8%97%E9%80%8F%E6%95%B0%E6%8D%AE%E6%B5%B7%E5%A4%96%E6%94%AF%E4%BB%98%E9%80%9A%E9%81%93%E2%86%97GB8r&vt=4
15.
https://www.cnblogs.com/zengzuo613/p/18684303

2025年1月,一家名不见经传的中国AI初创公司DeepSeek,凭借其最新发布的v3大模型,在全球科技圈掀起了一场轩然大波。这款仅用560万美元训练成本、2048个英伟达H800芯片就达到超越Llama 3性能的AI模型,不仅让英伟达市值蒸发3000亿美元,更让整个华尔街陷入恐慌。

01

技术突破:以1/11算力实现性能超越

DeepSeek-v3最引人注目的成就,是在仅用Llama 3十分之一算力的情况下,实现了性能的全面超越。这个拥有6710亿参数的MoE模型,通过14.8T高质量token的预训练,不仅在多项测评中达到开源SOTA(State of the Art,即当前最佳)水平,更在性价比上创造了新的纪录。

具体来看,DeepSeek-v3的训练成本仅为557.6万美元,而同等规模的AI模型训练成本通常要高出十倍以上。这种惊人的效率提升,主要得益于DeepSeek团队在算法层面的两大创新:MLA(Multi-head Latent Attention)和GRPO(Group Relative Policy Optimization)。

MLA是一种新型的多头注意力机制,能够显著减少计算量和推理显存占用。相比传统的MHA(Multi-Head Attention)架构,MLA将显存占用降低到了5%-13%。这一突破性创新,使得DeepSeek能够在有限的算力资源下完成更大规模的模型训练。

GRPO则是DeepSeek团队提出的基于PPO(Proximal Policy Optimization)的变体强化学习算法。通过放弃传统的critic模型,转而从群体得分中估算baseline,GRPO显著减少了训练资源的需求。这一算法创新,不仅优化了模型的训练效率,更降低了整体训练成本。

02

年轻团队:清北应届生撑起AI新星

DeepSeek的成功,很大程度上归功于其独特的团队构成。这支不到140人的团队,成员几乎全部来自中国顶尖高校,如清华大学和北京大学。团队中既有刚走出校园的应届毕业生,也有仍在校攻读学位的实习生,平均年龄远低于行业平均水平。

在这些年轻面孔中,不乏已经在学术界崭露头角的佼佼者。例如,来自清华大学的代达劢,2024年博士毕业于北京大学计算机学院计算语言所,曾获EMNLP 2023最佳长论文奖、CCL 2021最佳中文论文奖,在各大顶会发表学术论文20篇+。2024年中国中文信息学会“博士学位论文激励计划”共入选10篇来自中国大陆高校的博士毕业论文,其中就有他的《预训练语言模型知识记忆的机理分析及能力增强关键技术研究》。

来自北京大学的邵智宏,是清华交互式人工智能(CoAI)课题组博士生,师从黄民烈教授。他的研究领域包括自然语言处理、深度学习,特别对如何能构建一个稳健且可扩展的AI系统感兴趣,这个AI系统能利用多样化的技能整合异构信息,并能准确回答各种复杂的自然语言问题。邵智宏之前还曾在微软研究院工作过。DeepSeekMath之后,他还参与了DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等项目。

同样来自北大的朱琪豪,2024届博士毕业生,发表CCF-A类论文16篇,在ASE和ESEC/FSE上分别获得ACM SIGSOFT杰出论文奖一次,提名一次。一篇论文进入ESEC/FSE会议同年的引用前三名。在DeepSeek团队,朱琪豪还基于他的博士论文工作,主导开发了DeepSeek-Coder-V1。其博士论文《语言定义感知的深度代码学习技术及应用》也入选了2024CCF软件工程专业委员会博士学位论文激励计划。

值得注意的是,这些年轻人并非简单地执行既定任务,而是真正成为了技术创新的主导力量。MLA和GRPO两大核心创新,正是由这些年轻的团队成员提出并实现的。这种以年轻人为主导的创新模式,不仅展现了中国新一代AI人才的实力,也为整个行业注入了新的活力。

03

开源策略:重塑全球AI竞争格局

DeepSeek的崛起,正在悄然改变全球AI领域的竞争格局。与许多追求商业利益最大化的公司不同,DeepSeek选择了完全开源的策略,不仅公开了模型的训练细节,还提供了原生FP8权重和转换脚本。这种开放态度,使得全球开发者都能在DeepSeek的基础上进行二次开发和创新。

DeepSeek的低成本优势,更是对传统AI巨头构成了重大挑战。其API价格仅为Claude 3.5 Sonnet的9%,每百万输入tokens仅需0.5元(缓存命中)/ 2元(缓存未命中),每百万输出tokens 8元。这种价格优势,使得更多企业和开发者能够负担得起AI技术的应用,推动了AI技术的普及。

DeepSeek的出现,打破了美国在AI领域的技术垄断,挑战了美国的技术霸权。其开源技术和低成本算法使得AI技术更加普及和易用,这无疑削弱了美国对AI技术的控制权,进而对其全球经济主导地位构成了威胁。

04

未来展望:机遇与挑战并存

尽管DeepSeek目前取得了令人瞩目的成就,但其发展道路上仍面临诸多挑战。首先是技术层面,虽然MLA和GRPO等创新技术带来了显著的性能提升,但如何在更大规模的模型上保持这种优势,仍是一个需要解决的问题。此外,如何在开源策略下保持持续的创新动力,也是DeepSeek需要面对的考验。

其次是市场竞争。随着DeepSeek的崛起,越来越多的科技巨头开始关注并投入AI技术的研发。这种竞争加剧的环境,既是对DeepSeek的挑战,也是其发展的机遇。DeepSeek需要在保持技术领先的同时,不断拓展应用场景,形成良性发展的生态系统。

最后是全球化战略。虽然DeepSeek目前主要在中国市场运营,但其技术影响力已经扩散至全球。如何在保持本土优势的同时,开拓国际市场,是DeepSeek未来需要思考的重要课题。

DeepSeek的崛起,无疑是对全球科技竞争规则的一次深刻颠覆。它打破了美国在AI领域的垄断地位,挑战了美国的技术霸权,推动了全球科技的均衡发展。然而,我们也应看到DeepSeek崛起背后所隐藏的挑战和风险。首先,随着AI技术的普及和应用,数据安全和隐私保护问题将愈发凸显。如何在享受AI技术带来的便利的同时,保障个人隐私和数据安全将成为亟待解决的问题。其次,AI技术的快速发展也可能引发就业结构的变革和社会伦理的挑战。我们需要在推动AI技术发展的同时,加强相关法规和政策的建设,确保AI技术的规范化和可持续发展。

此外,我们还应看到DeepSeek等开源AI技术的局限性。虽然开源技术有助于降低AI技术的开发成本和提高算法效率,但也可能导致技术同质化和创新动力不足的问题。因此,在推动开源技术发展的同时,我们也需要鼓励和保护企业的自主创新能力,推动AI技术的多元化和差异化发展。只有这样,才能确保AI技术的健康发展,为人类社会带来更大的福祉。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号