问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

DeepSeek开源其AI模型:一场技术民主化的革命

创作时间:
作者:
@小白创作中心

DeepSeek开源其AI模型:一场技术民主化的革命

引用
观察者网
1.
https://www.guancha.cn/XiongJie3/2025_02_13_764932_2.shtml

DeepSeek开源其AI模型的决定,不仅体现了技术民主化的趋势,更折射出人工智能领域领导权的深刻变革。本文从技术突破、成本优势到地缘政治竞争等多个维度,深入剖析了DeepSeek现象背后的战略意义。

DEEPSEEK R1对强化学习的押注

“DeepSeek-R1-Zero选择了一条前所未有的路径,即‘纯’强化学习路径,完全放弃了预定义的思维链(CoT)模型和监督微调(SFT),仅依靠简单的奖励和惩罚信号来优化模型的行为。”[9]

在腾讯团队对DeepSeek R1模型的分析中,他们提出可能需要重新思考监督学习在AI发展中的作用。或许他们过于专注于让AI模仿人类的思维方式,而不是更多地押注于强化学习系统本身的解决问题能力[10]。在强化学习中,奖励和惩罚以数学方式表达在模型中。代理(可以是算法或系统)根据策略做出决策,该策略旨在最大化随时间累积的奖励。奖励是代理在环境给定状态下执行操作所获得的数值。

机器学习是人工智能的一个领域,它使计算机能够识别模式并根据数据做出决策,而无需明确编程[11]。机器学习依赖于从大量数据中提取模式并调整其参数以随时间提高预测能力的算法。这些算法可以分为三大类:监督学习(模型从标记数据中学习)、无监督学习(模型在没有预定义标签的情况下识别模式)和强化学习(模型通过试错学习,根据其行为获得奖励或惩罚)。深度学习是机器学习的一个子集,它使用具有多层的人工神经网络以分层和复杂的方式处理数据[12]。

由于这些创新,DeepSeek R1的训练成本大幅降低,仅为ChatGPT成本的1/10到1/20。当OpenAI的模型花费20美元时,DeepSeek仅用1美元就完成了相同的任务。2025年1月,DeepSeek模型的成本仅为每百万token 16元人民币,而ChatGPT的成本高达438元人民币——相差27倍![13] 这意味着组织可以以更低的成本使用DeepSeek的模型,同时实现更高的效率。


不同AI模型的Token输入/输出价格(美元/每百万Tokens),可以看到DeepSeek的价格远低于其他AI模型Reddit

计算能力与AI的地缘政治

英伟达和其他科技巨头股价的暴跌被许多人视为美国在AI领域领导地位的终结,这似乎并不准确。这家强大的GPU制造商的股价大幅下跌是由于在DeepSeek成功开发出成本仅为OpenAI 10%的大型语言模型的消息传出后,大量股票被抛售。这可能会改变AI的发展轨迹。对高处理能力芯片的依赖可能会发生变化。基于这种推理和恐惧,投机者趁机抛售了他们在英伟达和其他公司的股票。

然而,对尖端芯片的依赖并没有因为中国的创新而结束。小于2纳米的芯片代表了人工智能的关键进步,它们确保了更高的处理能力和更低的能耗。随着AI模型变得越来越复杂,需要数十亿甚至数万亿的参数,计算效率仍然是一个关键因素。更小的芯片允许更高的晶体管密度,提高计算速度和能源效率,降低运营成本和冷却需求。这一演进对于AI的大规模实施至关重要,从数据中心到移动设备,包括军事应用。

值得注意的是,纳米芯片扩展了设备中的嵌入式应用,并促进了它们在物联网、医疗保健、机器人和自动驾驶汽车中的使用。另一个承诺是,随着芯片变得更先进、体积更小,AI模型可以在本地运行,减少对云的依赖,并确保更快、更安全的响应。在地缘政治背景下,对更小芯片的竞争加剧了美国和中国等大国之间的技术争端,因为对这一技术的控制定义了数字经济和网络安全领域的竞争力。

美国通过技术主导、战略投资和供应链控制的结合,保持了在芯片和半导体开发和制造领域的领导地位。英伟达、英特尔、AMD和高通等美国公司引领着先进芯片的设计。美国政府通过补贴和激励措施(如《芯片与科学法案》[14])加强其地位,该法案拨款数十亿美元用于加强国内半导体生产,减少对亚洲的依赖。

除了技术优势外,美国还利用制裁和出口管制来限制战略竞争对手(如中国)获取关键技术。商务部对先进半导体制造设备(如ASML的机器和Cadence、Synopsys的芯片设计软件)的出口实施严格限制。这些限制使中国难以开发自己的先进芯片,并巩固了美国在该领域的地位。同时,华盛顿投资于战略联盟,如“芯片四方联盟”(与日本、韩国和中国台湾地区),确保其盟友遵循美国的指导方针,限制技术转让给被视为竞争对手的国家。这一综合战略使美国能够保持其在半导体行业的霸权,这对数字经济和国家安全至关重要。[15]

尽管美国正在尽一切努力限制中国获取先进芯片(7纳米以下)及其生产能力,但中国正在不断发展其独立制造这些高端芯片的能力。中芯国际(SMIC)已经展示了生产7纳米芯片的能力,并被认为很可能能够生产5纳米芯片[16]。上海微电子装备(SMEE)等公司正在积极开发极紫外(EUV)光刻技术,以取代ASML垄断的光刻机[17],这些光刻机已被限制向中国销售。

另一方面,在汽车和工业领域使用的成熟工艺芯片(技术并非最尖端但需求显著更高)方面,中国的芯片产业已经建立了大规模且完整的产业链。2024年,中国芯片出口总额超过1万亿元人民币(约合1390亿美元)[18]。可以预见,一旦中国公司在先进工艺上取得技术突破,其现有的供应链优势将显著降低高端芯片的价格。此外,芯片工艺受到物理极限的限制,无法无限改进。中国赶上美国只是时间问题。


美国前总统乔·拜登于2022年8月9日签署2022年《芯片法案》路透社

结论

“英伟达的领导地位不仅仅是一家公司努力的结果,而是整个西方技术社区和行业共同努力的结果。他们能够看到下一代技术趋势,并拥有路线图。中国的AI发展也需要这样的生态系统。许多国内芯片由于缺乏支持技术社区和二手信息而无法发展,因此中国需要站在技术前沿的人。”(梁文峰,2024)[19]

DeepSeek的创始人梁文峰表示:“我们面临的问题从来不是资金,而是对尖端芯片的禁令。”[20] 即使数据集中化和对计算能力需求(需要越来越复杂的芯片)的趋势发生变化并失去动力,国际资本主义似乎也不会改变其根本的不对称性。毫无疑问,中国的技术科学发展使技术依赖美国的国家能够构建有利于其发展的战略。拥有主权、可控的世界级大型语言模型曾经是美国和中国以外的国家——尤其是全球南方国家——无法企及的。现在,DeepSeek已经民主化了这项技术,为全球南方国家在这一领域开辟了新的可能性。同时,这也为这些国家的政府提出了新的任务和挑战。

DeepSeek现象所指向的是开源对于加强国际协作链的重要性,这种协作链可以减少不平等和巨大的知识不对称。然而,开源并不能解决建设主权基础设施的问题,这些基础设施对于地方和国家发展至关重要。因此,寻求改善其技术经济地位的国家需要减少科技巨头的权力,控制AI的基本输入——尤其是来自其人口的数据——并投资于减少自动化系统在资本主义国家中产生的环境影响和劳动力不稳定的解决方案。押注于青年优质教育需要鼓励技术多样性,并将各民族的文化活力转化为技术表达。

【本文葡萄牙语版收录于即将在巴西出版的《人工智能,社会与阶级》(AI, Society and Class)一书】

注释:

[1]Winner, L. (2020). The whale and the reactor: A search for limits in an age of high technology. University of Chicago Press.

[2]https://startups.com.br/negocios/inteligencia-artificial/stargate-trump-anuncia-investimento-de-us-500-bi-em-projeto-de-ia/

[3] Idem.

[4]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

[5]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

[6]Idem.

[7]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

[8]https://www.lowyinstitute.org/the-interpreter/deepseek-diplomacy-disruption-dominance-data

[9]郝博阳. (2025, 23 de janeiro). 一文读懂|DeepSeek新模型大揭秘,为何它能震动全球AI圈.腾讯科技.
Link:https://mp.weixin.qq.com/s/cp4rQx09wygE9uHBadI7RA

[10] Idem.

[11] Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.

[12] Idem.

[13]https://mp.weixin.qq.com/s/GG7l2P9ZveZjsHbS0AJ7Rg

[14]https://www.congress.gov/bill/117th-congress/house-bill/4346

[15] Sutter, K. M., Sargent Jr, J. F., & Singh, M. (2023). Semiconductors and the CHIPS Act: The Global Context. Congressional Research Service (CRS) Reports and Issue Briefs.

[16]https://www.dw.com/zh/%E7%BE%8E%E5%9B%BD%E5%88%B6%E8%A3%81%E4%B8%8B-%E5%8D%8E%E4%B8%BA%E7%AA%81%E5%9B%B4%E7%9A%84%E7%A7%98%E5%AF%86%E6%AD%A6%E5%99%A8%E6%98%AF%E4%BB%80%E4%B9%88/a-67530706

[17]https://www.dw.com/zh/%E7%94%B3%E8%AF%B7%E4%B8%93%E5%88%A9%E4%B8%AD%E5%9B%BD7%E7%BA%B3%E7%B1%B3%E8%8A%AF%E7%89%87%E5%85%89%E5%88%BB%E6%8A%80%E6%9C%AF%E5%8F%96%E5%BE%97%E7%AA%81%E7%A0%B4/a-70227975

[18] http://politics.people.com.cn/n1/2024/1205/c1001-40376144.html

[19]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg

[20] Idem.

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号