DeepSeek的突破对AI应用和能源行业意味着什么?
DeepSeek的突破对AI应用和能源行业意味着什么?
从2022年11月到2023年1月,1亿人开始使用OpenAI的ChatGPT。Instagram达到同样的里程碑用了两年半。自那以后,投资者就被AI应用的不同环节所吸引。
AI产业链的四个环节
- 第一环节——超大规模企业:提供大规模云计算技术的公司。
- 第二环节——数据中心计算和基础设施:生产硬件(芯片)和电气设备等输入产品,使数据中心得以运行的公司。
- 第三环节——电力和传输:供应和传输数据中心所需电力的公司。
- 第四环节——跨行业受益者:将AI纳入其中以提高生产力并获得收入好处的公司。
DeepSeek的技术突破
DeepSeek是一家成立于两年前的中国AI初创公司。特朗普就职前夕,DeepSeek推出了其完整的R1模型,这是一个开放推理大型语言模型(LLM)。R1模型在数学、编码和推理任务上的表现与o1(OpenAI的前沿推理LLM)相当。DeepSeek声称其模型使用了英伟达的H800芯片,这些芯片的内存带宽受到美国芯片出口管制的限制,不如更先进的H100芯片。此外,他们声称训练耗时2788000个图形处理单元(GPU)小时,成本为每GPU小时2美元。因此,最终训练运行的总成本仅为557.6万美元。Meta最新的Llama模型的最终训练运行成本是其10倍。
对AI应用格局的挑战
DeepSeek的突破挑战了推动AI应用的三个既有假设:
- 超大规模企业必须在先进AI芯片上花费数十亿美元:DeepSeek的低成本训练模式让投资者质疑英伟达预期的收入和利润率。
- AI的未来需要不断增加的电力和能源:DeepSeek的"混合专家"(MoE)系统设计降低了能源需求和总体成本。
- 美国在AI技术方面的领先地位:DeepSeek展示了在较弱硬件上取得显著成果的可能性,平衡了竞争格局。
对AI产业链各环节的影响
第一环节——超大规模企业
假设超大规模企业因成本和能源效率而削减资本支出计划。在最坏的情况下,超大规模企业的资本支出强度(资本支出/收入)可能会回落到2015年至2019年的水平。这可能导致这些公司的资本支出减少近24%。这显然对数据中心计算和基础设施公司的收入是不利的,但对超大规模企业股票可能是积极的。事实上,减少资本支出可以释放现金流以回馈股东,特别是如果假设AI创新继续以同样的速度发展。然而,这不是基本情况。最近微软和Meta报告了收益,并确认了继续支出的意图,主要集中在为推理而非训练建设数据中心,这与大多数AI投资用于推理的观点一致。话虽如此,随着支出转向专用集成电路(ASIC),将超大规模企业的知识产权与设计平台相结合,传统对GPU的依赖预计会减少。
第二环节——数据中心计算和基础设施
超大规模企业减少支出可能意味着数据中心参与者收入减少。分析师估计芯片制造商的数据中心收入到2028年将增长27%。我们估计,其中约375亿美元的收入受到不断变化的资本支出计划的影响。这可能转化为到2028年芯片制造商数据中心收入减少近七个百分点。然而,随着成本的降低,应用场景可能会增加(弹性),继续推动电力需求。事实上,我们的投资银行指出,x86虚拟化(一种在2000年代中期开发的技术,允许多个操作系统在单台物理机器上运行)提高了效率,但也刺激了对半导体芯片和内存的需求。云计算的转变同样提高了效率并推动了对半导体的需求。
第三环节——电力和传输
2023年,美国的电力需求约为4200太瓦时,其中数据中心占约200太瓦时。今年早些时候,美国能源部发布了数据中心电力需求的最新预测。预测的高端假设AI工作负载将推动未来几年26%的复合年增长率(CAGR)。按照这个速度,数据中心的电力需求大约每2.5年翻一番。如果DeepSeek的效率导致几乎没有增量增长,数据中心的电力需求将恢复到2014年至2023年期间经历的13%的增长率。我们的观点略为乐观,数据中心的电力需求将在该时间范围内以20%的复合年增长率增长。此外,AI并非推动电力需求的唯一因素。事实上,我们相信电动汽车和混合动力汽车、工业化和自动化以及非AI数据中心也将推动未来几年整体电力需求以2.5%的复合年增长率增长,而不是过去十年中微不足道的0.7%的复合年增长率。尽管对电力需求的最高估计似乎不太可能,我们仍然相信电力是一种可投资的趋势。
第四环节——跨行业受益者
最终,DeepSeek的突破可能对大多数行业中众多潜在的生产力和收入受益者最为正面。我们在价格走势中看到了这一点。近来生产力受益者的表现在平均上超过了第一到第三环节的公司7%。软件行业是一个显著的赢家,预计这种情况将继续。