问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

从14核CPU到AI游戏,Arm新架构的技术细节全解析

创作时间:
作者:
@小白创作中心

从14核CPU到AI游戏,Arm新架构的技术细节全解析

引用
1
来源
1.
https://www.fromgeek.com/daily/1044-642303.html

Arm最新一代的CPU和GPU架构设计有哪些值得关注的技术细节?本文将为您详细解析Arm新架构的命名规则、CPU核心布局、GPU性能提升以及AI加速方案等关键信息。

从X4到X925:命名规则大改背后的逻辑

Arm最新一代产品线的命名规则发生了显著变化。过去,Arm的"超大核"采用独特的单位数命名方式,如Cortex-X1到X4。这种命名方式有两个好处:一是清晰表明架构代次,二是通过独特的命名方式突出超大核的特殊地位。

然而,新一代超大核被命名为Cortex-X925,这一变化引发了关注。Arm方面解释称,新的命名方式旨在体现其相对于以往X系列取得了有史以来最大的代际性能进步。尽管新的命名方式可能让超大核看起来不那么"特别",但Arm强调Cortex-X925依然是旗舰专属,不会成为通用产品。

此外,Cortex-X925的命名也考虑到了与新的Immortalis-G925旗舰GPU的搭配,便于Arm在推广旗舰组合时让客户和生态伙伴更容易理解。

智能手机CPU核心数量:为何突破8核?

目前,大多数智能手机SoC采用8核CPU布局,但这种布局是否必要值得探讨。实际上,很少有应用能够完全利用8个CPU线程,大多数场景下都是多个应用共享CPU资源。

Arm新发布的终端CSS(Compute Subsystem)支持高达14颗核心,最新的产品组合甚至可以支持12颗Cortex-X925搭配2颗Cortex-A725,组成14核CPU配置。

实际上,制约智能手机SoC核心数量的主要因素是芯片设计时的面积控制需求。为了给其他计算单元(如ISP或NPU)腾出空间,芯片厂商往往不敢突破8核心的限制。

Arm的终端CSS提供了灵活的市场解决方案。例如,Cortex-A725的面积优化实现可以在不降低IPC和能效的情况下缩小面积,鼓励SoC厂商采用更多大核或超大核配置。

GPU性能提升:重视光栅性能而非AI缩放

Arm新一代GPU包含三条产品线:Immortalis-G925、Mali-G725和Mali-G625。虽然Mali-G725在官方资料中没有标注光追支持,但实际上也可以配置为支持光追。

值得关注的是,Arm在GPU设计上选择了务实的路线。Immortalis-G925支持更多着色器数量,底层图块吞吐量和着色器作业分配速度显著提升。通过与Epic Games、Google和联发科的合作,Arm GPU现在可以支持桌面级虚幻5渲染器、Lumen光照解决方案以及安卓动态性能框架。

与PC显卡追求用AI缩放游戏画面不同,Arm选择了实打实地强化GPU的硬件光栅能力,这种做法值得肯定。

AI加速方案:Kleidi的独特优势

Arm的Kleidi软件库专注于提升CPU上的AI性能,不依赖GPU或NPU。这种方案具有以下特点:

  1. 广泛的兼容性:Kleidi可以在使用非Arm架构NPU或GPU的SoC上运行,且Arm CPU在移动平台上的普及率更高,易于触及更多设备。
  2. 良好的兼容性:支持从最新到Arm V8指令集的CPU,甚至可以使用NEON等老指令集实现AI加速。
  3. 易用性:直接与MediaPipe、LLAMA.cpp、PyTorch和TensorFlow Lite等主流AI框架集成,降低开发者的学习成本。
  4. 性能提升:通过代码优化,可以在现有机型上实现数十倍的AI生成速度提升。

Arm还与Unity合作开发端侧推理引擎Sentis,可以在所有支持Unity游戏引擎的设备上实现AI游戏体验,将游戏中的AI模型内存占用率降低72.5%,同时提升特定AI框架在游戏中的性能多达660%。

总结

Arm最新一代的CPU和GPU架构设计展现了其在移动计算领域的技术实力。从大胆的CPU核心布局到务实的GPU性能提升策略,再到独特的AI加速方案,Arm的新架构为未来的移动计算平台提供了更多可能性。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号