问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

ARMv9架构全面升级:性能、安全性、专用指令集的跃升

创作时间:
作者:
@小白创作中心

ARMv9架构全面升级:性能、安全性、专用指令集的跃升

引用
什么值得买
1.
https://post.smzdm.com/p/a4xd0de7/

ARMv9架构是ARM公司十年来最重要的架构升级,它在性能、安全性和专用指令集方面实现了全面跃升。本文将详细探讨ARMv9架构相较于ARMv8架构的进步和发展,结合实际应用案例和数据,分析其在性能、安全性和专用指令集等方面的增强之处。

ARMv8架构的基础

ARMv8架构于2011年面世,最大的创新在于引入了AArch64架构,这是ARM处理器首次支持64位计算。从架构上看,ARMv8分为两个主要的执行状态:AArch32和AArch64,分别支持32位和64位的指令集。AArch64模式带来了许多优点,如更大的地址空间支持、更高效的寄存器和指令集设计等。这为现代高性能计算应用提供了良好的基础。

在ARMv8中,基础指令集包括:

  1. 通用寄存器(General Purpose Registers),如X0-X30寄存器,这些寄存器被广泛用于储存操作数和指令的中间结果。
  2. 扩展的浮点和SIMD(Single Instruction Multiple Data)指令集,使得矢量计算得以大幅度优化。
    3.内存管理单元(MMU)的支持以及更高效的缓存管理架构,极大地提高了处理器的内存访问速度。

然而,近十年间,计算机和应用程序的需求发生了复杂而深远的变化。特别是AI和机器学习(ML)、虚拟现实(VR)和增强现实(AR)等新兴领域,对计算性能和数据处理的需求极具增长。ARMv8架构尽管性能优越,但面对这些新兴应用,也显得力不从心。

ARMv9架构的改进和新特性

性能提升

在ARMv9架构中,ARM公司进一步优化了指令集和处理器性能。基于业界广泛的需求,ARMv9引入了可伸缩矢量扩展2(SVE2)指令集,取代了原有的NEON技术。SVE2显著增强了处理器对矢量计算的支持,使其可以从128位扩展至2048位。对于AI和ML等需要大量矩阵运算的应用,SVE2的引入带来了性能的质的飞跃。根据实际测试,SVE2在矩阵乘法等大规模计算任务中的性能提升显著。

此外,ARMv9的整体IPC(Instructions Per Cycle,即每时钟周期指令数)也有所提升,预计提升幅度在30%-50%之间。例如,在AI训练任务中,与ARMv8架构相比,基于ARMv9架构的处理器可以更加高效地处理大规模数据集,显著缩短训练时间。

最近发布的ARM Neoverse N2平台实现了基于ARMv9指令集架构的首秀性能,整体性能暴涨40%。这种性能提升不仅仅是简单的频率增加,而是通过多方面的优化,包括更深的管道、更优秀的缓存管理以及更高效的分支预测等技术手段实现,提供了更好的功耗比和更高的计算性能。

安全性增强

互联网发展带来的信息安全问题越来越严峻,针对这一背景,ARMv9架构着重提升了安全性。ARMv9引入了全新的保密计算架构(Confidential Compute Architecture, CCA),通过一种称为“域”(realms)的新概念,实现了更高层次的运行环境隔离。

域可以看作是一个安全密室,即使拥有最高权限的管理员也不能随意进入。在域内的数据即便被操作系统或虚拟机管理程序访问,也不会泄露给外界,这有效防止了数据在传输和存储过程中的泄密风险。域的管理角色由“域管理器”(realm manager)承担,而域管理器的代码量仅为传统虚拟机管理程序代码量的1/10。这极大地提高了系统的安全性和透明性,同时减少了潜在漏洞。

此外,ARMv9还引入了内存标签(Memory Tagging)扩展,可以有效避免内存错误和安全漏洞。例如,内存标签可以帮助开发者检测和防范内存溢出和未经授权的内存访问,从而提升系统的整体安全性能。

专用指令集优化

为了满足现代应用的需求,ARMv9还专门优化了许多特定领域的指令集。比如SVE2不仅仅是普通矢量计算的提升,还包括对数字信号处理(DSP)任务的优化,如5G通信和图像处理等。

值得一提的是,SVE2的设计灵活多变操作数长度,使得其可以更加高效地进行不同规模的数据并行计算。特别是在VR和AR中,大量的矩阵变换操作需要高效的矢量计算,而SVE2可以以较小的时钟周期完成这些计算任务。

另一个亮点是ARMv9对机器学习任务的改善。以前基于ARMv8架构的处理器在运行ML任务时,往往需要借助外部加速器实现。而ARMv9架构下的处理器可以更好地在CPU上执行ML任务。这种改进不仅提升了执行效率,同时也减少了功耗和成本。

比如,华为的达芬奇架构采用3D Cube技术,通过优化的运算单元,大幅降低了矩阵运算的复杂度,使得AI运算速度得到了质的提升。而这种技术在ARMv9的SVE2内得到了更为灵活的实现,为AI和VR等领域打下了坚实的基础。

兼容性与未来展望

自ARM v8推出以来,ARM处理器逐步在市场上占据重要地位,广泛应用于手机、平板、服务器和物联网设备等领域。ARM v9延续了这一良好传统,全面兼容ARM v8。同时,ARMv9对AArch64基准指令集进行了扩展,使开发者能够更轻松地将现有的应用程序迁移到新的平台上。

从市场前景来看,ARM预期未来五年内ARM设备的出货量将超过1000亿台。预计到未来十年,包括移动设备、服务器和边缘运算的各类设备中,ARMv9将装备在3000亿颗芯片中。ARM的持续创新使其在计算领域的领导地位得以巩固。

为了更详细地理解ARMv9的技术细节,我们还需要关注其在不同应用场景中的实际表现,比如在智能家居和工业自动化中的应用。可以预见的是,随着时间的推移和技术的不断发展,ARMv9架构将不断优化和演进,为全球计算机技术的发展做出更大贡献。

总的来说,ARMv9架构在性能、安全性和特定应用场景指令集优化等方面相较于ARMv8有显著提升。SVE2、保密计算架构(CCA)和内存标签扩展等新特性,不仅满足了现代计算环境的需求,更为未来的计算技术奠定了坚实基础。

ARMv9的发展方向和特性,彰显了ARM公司应对市场需求、技术变革的卓越能力。可以预见的是,随着ARMv9架构的普及和进一步优化,其将在AI、ML、VR、AR等前沿领域中发挥不可替代的作用。通过持续的技术创新和市场拓展,ARM将继续引领全球计算机体系结构的发展潮流。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号