华为鲲鹏处理器架构详解:从基本概念到子系统解析
创作时间:
作者:
@小白创作中心
华为鲲鹏处理器架构详解:从基本概念到子系统解析
引用
1
来源
1.
https://cloud.tencent.com/developer/article/2478143
在当今这个信息爆炸的时代,计算技术已成为推动社会进步的核心动力。华为,作为中国的科技巨头,早已不仅仅满足于在通信领域的领先地位,更将目光投向了广阔的计算市场。其中,鲲鹏(Kunpeng)处理器便是华为在计算领域的杰出代表。
鲲鹏处理器概述
鲲鹏处理器是华为面向通用计算领域的处理器芯片,主要针对服务器市场。它基于ARM架构进行优化设计,提供了出色的计算性能,并在功耗控制方面达到了业界领先水平,非常适合数据中心、云服务以及企业级应用等场景。
除了处理器本身,华为还推出了基于鲲鹏处理器的泰山服务器和华为云服务,提供一站式的解决方案,帮助客户更高效地处理各种计算任务。
鲲鹏处理器架构详解
基本概念
- DIE:芯片的最小物理单元。Kunpeng 920封装了3个DIE,两个用来做计算,第三个用来做IO。
- Core:真正的计算单元,我们在操作系统侧看到的“核”。
- Cluster:若干个核(core)的集合。Kunpeng 920把4个core集合成为一个cluster,而一个DIE上有8个cluster。
- SoC:System on chip,例如,Kunpeng 920除了CPU外,还集成了RoCE 网卡、SAS控制器和南桥。
Kunpeng 920芯片架构
- 1片SoC上包含3个DIE,2个计算DIE,1个IO DIE。
- 1个计算DIE中8个Cluster。
- 1个Cluster中4个Core。
- 因此一个kunpeng 920芯片中包含482=64个核。
- 计算DIE上的每一个core具有自己的L1和L2级Cache,所有的core共享L3级Cache。
- IO DIE上集成有网络模块、PCle模块。
- 这些DIE在芯片内部通过高速内部总线进行连接。
系统安全与IMU
- 系统安全:支持安全启动,以及保证系统在可信环境内运行的一套软硬件方案。该方案由Secure Boot技术和ARM架构中的Trust Zone技术结合而成。
- IMU ( lntelligent Management Unit ):是Hi162x芯片内部的智能管理单元,完善ARM节点在数据中心的管理和控制,未来数据中心设备管理要求统一、智能和协同,遵循管理系统集中决策+节点执行监控,按照设备节点模型统一管理。
- IMU作为数据中心的管理末端,协同BMC,完成数据中心的节点执行监控。
- IMU可以覆盖的功能:RA5故障预处理以及错误记录上报、安全信任根、能效管理、芯片内部管理。
Kunpeng 920的其他子系统
- 鲲鹏处理器包含计算、存储、设备IO、中断以及虚拟化等子系统。
- 鲲鹏920含有两个CPU DIE、一个IO DIE、以及共8组DDR4channel,它们通过AMBA(Advanced MicrocontrollerBus Architecture)总线互联。
- 鲲鹏处理器和IO子系统通过IO DIE进行扩展,支持soC片上加速器,如100G网卡、SAS控制器等。
- 鲲鹏处理器同时支持基于PCle 4.0的设备扩展,可支持网卡、GPU等板卡。
Kunpeng 920的中断子系统
- 在兼容ARM GIC规范的基础上,实现了线中断、消息中断支持。
- GIC ( Generic Interrupt Controller)指Arm定义的通用中断控制器。也是当前的芯片系统基于GIC规范提出的一种全局中断管理架构,它主要包括如下功能:
- 使能、禁用、选择所有的SGI、PPI、SPI以及LPI。
- 支持将输入的中断路由到任一指定的CPU内核。
- 支持中断优先级配置。
- 支持Arm AArch64安全化扩展。
- 支持Arm AArch64虚拟化扩展。
- Gicv3中,引入了消息中断,并且为之支持了LPI。分配了大量的中断号,用于LPIo对于LPI的实现,有2种方式,一种是访问redistributor提供的寄存器,一种是使用ITS。
- ITS( Hyper Interrupt Translation Service)功能是提供LPI中断重定向服务,将LPI中断路由到不同的CPU内核,其中中断和CPU内核的路由关系支持动态配置。
- LPI(Locality-specific Peripheral Interrupt):基于message的中断。
- 鲲鹏处理器引入中断收集再分发的概念。
- 鲲鹏920上还实现了华为公司的MBIGEN(messagebased interruptgenerator)技术。
Kunpeng 920的网络子系统
- 网络子系统包括Network ICL和RoCE引擎两大部分。
- Network ICL包括多个1Gbps~100Gbps以太网控制器,二层DCB、MAC地址表,多播表,VLAN过滤表,流表,中断,PCle化,具有完整的NIC引擎,可以在RoCE引擎关闭的情况下单独工作。
- RoCE(RDMA over Converge Ethernet)是一种在以太网上采用RDMA(RemoteDirect Memory Access,远程直接内存访问)的网络互联技术。
- 华为鲲鹏920处理器使用的RoCE v2协议是由InfiniBand(IB)协议演进而来,既具有lnfiniBand网络的低时延、低CPU利用率等特点,又能够很好地兼容于Ethernet网络。
Kunpeng 920的SAS子系统
- 提供2个X8 SAS 3.0控制器
- SAS(Serial Attached SCSI)即串行SCSI技术,一种磁盘连接技术。SAS控制器用于磁盘与内存之间进行交互。
- SAS控制器主要通过总线与CPU和内存进行交互,同时通过SERDES与硬盘进行连接。
- SAS控制器与设备连接方式有两种:直连和Expander连接。
- 直连表示SAS控制器的PHY与设备直接连接,不经过中间转换或扩展;
- Expander连接表示SAS控制器与设备之间通过扩展器进行连接
- 支持SAS 3.0,向下兼容SAS2.0和SAS1.0;支持SATA3.0,向下兼容SATA2.0和SATA1.0;SAS支持12G/6G/3G/1.5G四种速率,SATA支持6G/3G/1.5G速率,同时可以实现速率的自协商;
- 可以直接不经过Expander最大连接8个SAS盘或者SATA盘,两者可以混插;
- 可以连接SAS Expander扩展更多磁盘。提供1个X2 SATA控制器;
- 支持SATA 3.0,向下兼容SATA 2.5;支持AHCI1.3,向下兼容AHCI 1.2;支持6G/3G/1.5G速率自协商;
- 支持直连两个SATA盘。
- 支持NOR Flash控制器,4个片选,NOR FLASH最大支持512K。
- 支持SPI Flash控制器,2个片选,SPI Flash最大支持32M。
- 支持NAND FLASH接口,4个片选。
Kunpeng 920的PCle子系统
- 支持PCle GEN1/2/3/4.0
Run at the 2.5G/5G/8G/16G。
x16 PCle控制器
嵌入式DMA引擎
PCle是一种高性能、通用的I/O互连接口,适用于各种计算和通信平台。鲲鹏920PCle子系统提供了实现PCle根联合体(Root Complex,RC)或端点(Endpoint,EP)应用程序的解决方案。 - 最多支持40个PCle Lane
3 PCle控制器
提供了实现PCIe根联合体或端点应用程序的解决方案 - 硬件特性:SRIS(Separate Refclk Independent ssc)支持SR-IOv
- 支持共享虚拟内存
- 支持CCIX
- 支持P2P(Peer to Peer)。不同控制器之间的对等流量
热门推荐
74岁的刘晓庆,正是该闯的年纪
为何禁止堂兄妹或表兄妹结婚?
PN结的电容效应——势垒电容和扩散电容
如何根据油价趋势进行合理的投资规划?油价波动对不同行业的影响有哪些?
泡普洱茶用盖碗还是紫砂壶?高手都是这么选择的!
多样化教学方法:幼儿园教案探索
便溏大便不成形吃什么中药效果好
加强后丢两个Q脆皮就受不了,极地大乱斗穿甲韦鲁斯强势回归!
正宗的美容养颜粥配方 美容养颜粥有哪些材料
如何查看电脑是否开了代理?4种简单有效方法
孕妇有脚气可以用酒消毒嘛
高铁为经济发展带来活力与机遇
【新手爸妈实用资讯】初生婴儿睡眠指南(适合准父母及育有0-3个月大婴儿的父母)
14部熬夜也要追的古装悬疑剧,《繁城之下》媲美《漫长的季节》
《道德经》最厉害8种思维,读完真的不一样
鸡蛋清是红色的怎么回事?能吃吗?
股市风向标 | 美联储政策与市场动态分析
壁挂炉出现E1故障怎么办?5个检查要点帮你轻松解决
深度剖析美国个人所得税:税率、优惠与应纳税额计算
香蕉雪碧为什么不能一起吃
会议组织全流程指南:从议题设定到会场布置
泽火革卦(革卦):顺天应人,革故鼎新
部门团队开会如何说话
中国合同法要约定义及其法律适用
会厌囊肿需要切除吗?医生这样说
运动后恢复身体能量的科学建议
胡椒粉的奇妙旅程:从厨房到健康的桥梁
什么是超买超卖?一文读懂KDJ
怎样才能祛痘不留痕?药师提醒不同类型痤疮,治疗方法不同
如何制定区域差异化的积极劳动力市场政策