问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

DeepSeek为何影响英伟达股价?用大白话说DeepSeek

创作时间:
作者:
@小白创作中心

DeepSeek为何影响英伟达股价?用大白话说DeepSeek

引用
证券之星
1.
https://finance.stockstar.com/IG2025013100000672.shtml

DeepSeek的出现正在重塑AI行业的格局。从惊艳亮相到引发美国政府关注,DeepSeek不仅影响了英伟达的股价,更引发了整个AI产业的震动。本文将为您详细解析DeepSeek的技术突破、市场影响以及其对AI产业的深远影响。

美对DeepSeek下手了

DeepSeek热度居高不下!最近几天,DeepSeek从惊艳到惊吓,从被认可到被质疑,被威胁,比如:

  • 美国海军已要求人员避免以任何形式使用中国公司的DeepSeek模型
  • 多名官员也表示DeepSeek是“偷窃”,正对其影响开展国家安全调查
  • 同时,美新任白宫新闻秘书卡罗琳·莱维特表示:
  • 白宫正在努力确保美国人工智能的主导地位,美安全委员会正在调查DeepSeek带来的影响是什么,
  • 美公司“需要专注于竞争以赢得胜利”。

美国开放人工智能研究中心(OpenAI)首席执行官萨姆·奥尔特曼对DeepSeek-R1模型首次亮相表示欢迎,称“DeepSeek-R1是一款令人印象深刻的模型,尤其是考虑到它能够以这个价格提供(这样的产品)。”但是,28日,OpenAI发布最新声明称:

  • 其采取各种对策来保护知识产权
  • OpenAI相信与美国政府紧密合作以保护美国大模型技术非常重要

英伟达股价再度杀跌原因

事情处于不断的演化当中,再度迎来大消息。

  1. 微软CEO纳德拉在电话会上强调,DeepSeek R1模型目前已可通过微软的AI平台Azure AI Foundry和GitHub获取,并且很快就能在Copilot+电脑上运行。纳德拉称,DeepSeek“有一些真的创新”,AI成本下降是趋势:缩放定律在预训练、推理时间计算中不断积累。在推理方面,我们通常看到每一代硬件的性价比提高2倍以上,每一代模型的性价比提高10倍以上。

  2. 另外,专业人士分析称,DeepSeek的突破是通过实施大量细粒度优化,而不是Nvidia的CUDA来实现的。这是否是昨晚英伟达股价再度杀跌的主因,还有待考证。不过,“算力通缩”似乎正在成为流行词汇。有消息指出,美国商务部正在讨论禁售英伟达H20,这或许也是该股杀跌的原因之一。

冲击英伟达护城河?

目前,市场上还有一种说法:DeepSeek甚至绕过了CUDA,并因此冲击到了英伟达的护城河。韩国未来资产证券的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。变相绕过了硬件对通信速度的限制,这是一突破。这些修改远远超出了标准CUDA级开发的范围,但维护起来却非常困难。因此,这种级别的优化反映了DeepSeek工程师的卓越技能。

全球GPU短缺,加上美国的限制,迫使DeepSeek等公司采用创新解决方案,DeepSeek也取得了突破。不过,分析认为,DeepSeek做了PTX级别的优化,不意味着完全脱离了CUDA生态,但确实代表他们有优化其他GPU的能力。

人工智能股票大幅抛售

DeepSeek导致人工智能股票大幅抛售,因为人们担心模型不再需要那么多计算能力。扎克伯格试图打消人们对他在GPU上花费的数十亿美元将白费的担忧:

  • “我仍然认为,从长远来看,在资本支出和基础设施方面投入大量资金将是一种战略优势。”
  • 还指出Meta拥有“强大的商业模式”来支持其今年在人工智能方面投入的约600亿美元,而“其他公司不一定拥有可持续的商业模式来支持它”。

窃取?

  1. “有大量证据表明,DeepSeek将OpenAI的知识,通过蒸馏提炼到DeepSeek中”白宫人工智能、加密货币事务负责人表示。
  2. 人工智能副总裁Naveen Rao表示,在人工智能行业,向竞争对手学习是“理所当然的事”。当你拥有Mistral和Llama等开源模型时,模型提炼是不可能停止的。它们可供所有人使用。DeepSeek在最近的一篇研究论文中表示,它使用“蒸馏”技术从其最强大的模型R1中获取输出,以训练表现出类似推理能力的较小模型。

大白话说DeepSeek

幻方系模型的出圈不是第一次了,科技界和投资界的人应该颇有感受。此前DeepSeek-V3就以低成本、高通用性对大家进行了冲击,这次R1通过强化学习实现了专业领域的推理突破,并在开源生态中提供了灵活的蒸馏方案,再一次冲击了市场。这次R1的市场关注度显著高于V3。

  1. DeepSeek如此出圈的原因?
  • 能力出众、巨量下载、开源、性价比。
  1. 为什么DeepSeek能实现如此快速的赶超?
  • DeepSeek站在巨人的肩膀上,存在大量的知识蒸馏。如果没有对GPT 4o、o1的访问,DeepSeek可能无法展现现在的成果。“600万美元开支”,并不包括“前期研究和架构、算法和数据消融实验等相关的成本”,所以,单纯的比较DeepSeek-R1的投入、大厂对大模型的投入是不合理的。
  • R1更聚焦,区别于大厂更多的将注意力投入在多模态,R1集中在语言,让模型的速率、质量、成本有了进一步的改善。但这个行为本身并没有提高智能的边界,只是让智能更易得。同时R1局部的能力突出,也不能掩盖大厂多模态模型的整体性能。
  1. DeepSeek作为“算力屠夫”,对算力需求的影响如何?
  • DeepSeek通过工程化的技巧,在几个较大的scaling方向上,节约了硬件支出。这在短期对硬件需求确实会带来影响,但并不改变长期对算力的巨大需求,事实上各家大厂仍处于算力不够用的状态。
  • DeepSeek-R1站在巨人的肩膀上,展现了优异的表现,但不代表未来的训练成本会降低。
  • 蒸汽机的出现降低了单位煤耗,但大幅提升了煤炭用量。单位AI算力成本的大幅下降,也会带来算力需求的暴涨,进而带来整体市场空间的扩大。短期看,DeepSeek的技术路线可能引领大模型厂商降低算力需求,同在杭州的阿里已经借鉴DeepSeek推出了千问2.5Max,但长期而言,低成本模型必然推动推理需求大幅度增长,事实上,一个小小的应用场景即可创造大规模的推理需求,未来软硬件都有很大的发展机会。
  • 此前业界认为中国AI进展落后美国2年,DeepSeek的出现将差距缩短至1-3Q,但仍有差距,需要持续迭代改善,芯片也依旧是一个重要的发展点,不能因为DeepSeek的局部表现突出而盲目乐观。
  • 从二级市场的角度,投资人普遍认可DeepSeek对短期硬件个股的冲击,但基于长期的展望,下跌就是机会,AI的软硬侧都有布局机会,但“软”的A股标的仍然缺失。
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号