英伟达背后的“诸神之争”
英伟达背后的“诸神之争”
2024年伊始,AI领域频频传来重磅消息:苹果转向生成式AI,OpenAI推出文生视频模型Sora,华为发布通信行业大模型……这些都预示着AI浪潮势不可挡。作为AI发展的底层基石,AI芯片市场迎来前所未有的发展机遇。据Gartner预测,2024年AI芯片市场规模将增长25.6%,达到671亿美元,到2027年更是有望突破1194亿美元。
图片来源@视觉中国
在这一轮AI芯片热潮中,英伟达无疑是最耀眼的明星。凭借高达80%的市场占有率,英伟达几乎垄断了AI芯片市场。2024财年第四季度,英伟达数据中心业务营收暴涨265%,市值一夜之间飙升2770亿美元,相当于阿里巴巴、百度和京东的总和。
然而,这位AI芯片领域的"霸主"正面临着前所未有的挑战。亚马逊、谷歌、微软、华为、百度等巨头纷纷推出自研芯片,寒武纪、摩尔线程、燧原科技等新锐力量也在快速崛起。英伟达在提交给美国证券交易委员会的文件中,首次将华为列为"最大竞争对手"。
英伟达:产能成最大瓶颈
英伟达CEO黄仁勋曾表示:"我们不需要假装公司处于危险之中,因为我们能感觉到公司确实一直处于危险之中。"这句话道出了英伟达当前面临的最大挑战——产能问题。
自去年以来,台积电在先进封装方面的产能持续紧张。英伟达的芯片生产依赖于台积电的CoWoS封装技术和65nm硅中介层工艺。虽然台积电计划将CoWoS封装产能翻倍,但这一计划要到2024年下半年才能见效。
为缓解产能压力,英伟达与英特尔达成代工合作意向。初步估算,英特尔每月可生产5000片晶圆,如果全部用于生产H100芯片,在理想情况下可获得30万颗芯片,有望进一步缩短英伟达高性能GPU的交货周期。
多方竞争加剧
除了产能问题,英伟达还面临着来自多个竞争对手的挑战。
AMD:去年12月发布的MI300系列芯片产品,据AMD首席执行官苏姿丰称,MI300X在训练大语言模型方面与英伟达的H100芯片相当,但在推理能力上更胜一筹。目前,MI300系列产品已经开始量产出货,上个季度推动AMD数据中心GPU总收入超过4亿美元。
英特尔:新一代的Gaudi 3采用先进的5nm制程工艺,配备最高达128GB的HBM3e内存,可对标英伟达的H200芯片。
微软:发布了首款定制化Maia 100 GPU和Azure Cobalt CPU100,以降低AI服务成本。
亚马逊和谷歌:已经使用自研芯片,并部分产品向客户提供。
OpenAI:启动了7万亿芯片计划。
孙正义:投资1000亿美元布局AI领域。
此外,MLIR、谷歌等都在转向"以Python语言为基础的编程层",以使AI训练更加开放,逐渐摆脱对英伟达CUDA生态的依赖。
中国市场受挫
受出口管制影响,英伟达在中国市场的收入大幅下滑。根据最新财报数据,2023年第四季度,中国区营收占比已降至个位数。在A800和H800被禁售后,英伟达推出的H20芯片性价比不高,性能仅为H100的四分之一。阿里巴巴、腾讯、百度等中国企业明确表示将大幅削减订单,英伟达在中国的营收前景不容乐观。
华为:从追赶者到挑战者
英伟达在提交给美国证券交易委员会的文件中,首次将华为列为最大竞争对手。近日,英伟达CEO黄仁勋在接受美国科技杂志《连线》采访时,再次表达了对华为的重视,称赞"华为尽管受到现有半导体处理技术的限制,仍然可以通过将许多芯片聚集在一起来构建非常强大的系统。"
申万宏源的研究报告显示,2023年上半年,华为AI服务器出货量已成为国产品牌第一,仅次于英伟达,且仍在快速增长。
华为在AI芯片领域的布局可以追溯到2017年,当年发布的麒麟970是全球首款移动端AI芯片,内置独立NPU,相比CPU获得了约50倍的能效优势和25倍的性能优势。麒麟980则凭借7nm制程工艺和双核NPU加持等特性,打破了多项世界第一。
2018年,华为提出全栈全场景AI解决方案,并推出了昇腾910和310两款AI芯片。昇腾910的半精度算力可达256TFLOPS,整数精度算力可达612TOPS。2023年最新发布的昇腾910B算力已达到英伟达A100的水平。
在生态建设方面,华为推出CANN框架对标英伟达的CUDA。虽然CANN起步较晚,但已经到了7.0版本,支持50+主流大模型,同时兼容主流加速库及开发套件,支持Pytorch、Tensorflow等主流框架。
国产AI芯片百花齐放
目前,国产AI芯片主要分为三类:大型科技企业自研、国资背景企业和创业型芯片公司。
华为:凭借完整的云技术生态和渠道销售能力,在各省级行政区建立代表处,派驻城市总经理的战略打法,一度被腾讯云和阿里云效仿。
阿里平头哥:2019年推出的含光800是第一款通用AI推理芯片,在业界标准的ResNet-50测试中,推理性能达到78563 IPS,比当时业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。含光800虽然不对外售卖,但可以通过阿里云对外输出AI算力。
海光信息:主要产品包括海光通用处理器(CPU)和海光协处理器(DCU)。"深算一号"广泛应用于数据中心、互联网企业,在大数据处理、人工智能、商业计算等领域商业化应用数十万片。2023年第三季度推出的"深算二号"性能翻倍,但仍与英伟达产品存在一定差距。
燧原科技:专注于人工智能云端算力产品,提供自主创新、全栈自研、具备完全自主知识产权的通用AI训练和推理产品。基于自主创新芯片架构,采用12nm工艺制造的新一代燧思AI推理芯片计算能力与业内7nmGPU相当。
伴随着大模型和生成式AI的兴起,缺芯正从一个行业季节性的常态,演变为全球各行各业的痛点,催促更多的国产AI芯片企业努力追赶甚至超越。
市场、企业、技术、产品都在变化,新的格局正在孕育当中,国产AI芯片亟需找准战略规划的前行方向,才能避免在这副生存角逐的棋局中被碾压踢出。
本文原文来自钛媒体