问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

一文搞懂GPU硬件拓扑与传输速度

创作时间:

作者:

@小白创作中心

一文搞懂GPU硬件拓扑与传输速度

引用

1

来源

1.

https://juejin.cn/post/7436346966931865663

本文详细介绍了GPU硬件拓扑与传输速度的相关知识，包括PCIe、NVLink、RDMA等技术的解释，以及常见拓扑结构和数据传输瓶颈的分析。文章结构清晰，内容详实，配有相关图表，有助于读者理解GPU硬件架构和数据传输原理。

基本概念

PCIe

PCIe是Peripheral Component Interconnect Express的缩写，表示“外部设备互联（PCI）高速扩展总线”。它是一种高速串行计算机扩展总线标准，广泛用于计算机系统中连接各种外部设备，例如显卡、存储设备（SSD）、网络适配器等。

其传输带宽如下表所示：

注：Slot Width 表示通道数量，Full Duplex 表示全双工时的带宽，也即单向带宽，双向的话需要乘以2。

NVLink 与 NVLink Switch

NVLink是一种 GPU 之间的直接互连，双向互连速度达 1.8 TB/s，可扩展服务器内的多 GPU 输入/输出 (IO)。

NVLink 结构与传输速度

图中x86表示CPU，两个方框表示 GPU，方框之间的双向箭头表示一条 NVLink，每条 NVLink 的带宽是 50GB/s *

NVLink Switch可连接多个 NVLink，实现在单个机架内和多个机架间以 NVLink 能够达到的最高速度进行多对多 GPU 通信。

在一台主机内，NVLink Switch又可以叫做NVSwitch。

RDMA、RoCEv2、InfiBand

RDMA(RemoteDirect Memory Access)技术全称远程直接内存访问，是为了解决网络传输中服务器端数据处理的延迟而产生的。

RoCEv2和InfiniBand均为数据中心及高性能计算环境而设计，旨在提供高速、低延迟的通信解决方案。

RoCEv2与InfiBand的对比如下：

简单来说，RoCEv2依托于现有的以太网，兼容性更好，目前绝大多数数据中心均采用此种方式；InfiBand使用专用硬件，速度更快、价格更高。

两者的具体差别可以参考这篇文章——深度解读RoCE v2网络技术。

带宽单位

网络带宽习惯用bits/second (b/s)表示之外，并且一般说的都是单向（TX/RX）；

其他模块带宽基本用byte/sedond (B/s)或transactions/second (T/s)表示，并且一般都是双向总带宽。

常见拓扑与数据传输瓶颈

数据传输路径

一种常见的单机8卡拓扑如下：

单机 8 卡 A100 GPU 主机带宽瓶颈分析

同主机 GPU 之间走 NVLink，双向 600GB/s，单向 300GB/s
同主机 GPU 和自己的网卡之间走 PCIe，常见的是 PCIe Gen4 Switch 芯片，双向 64GB/s，单向 32GB/s
跨主机 GPU 之间需要通过网卡收发数据，这个就看网卡带宽了，目前国内 A100/A800 机型配套的主流带宽是（单向） 100Gbps=12.5GB/s。所以跨机通信相比主机内通信性能要下降很多

其他说明：

若采用 200Gbps 的网络带宽，折合 25GB/s ，已经接近 PCIe Gen4 的单向带宽
若采用 400Gbps 的网络带宽，折合 50GB/s ，就超过了 PCIe Gen4 的单向带宽
使用PCIe4时采用 400Gbps 网卡作用不大，400Gbps 需要 PCIe Gen5 性能才能发挥出来

热门推荐

汽车故障自诊断系统：你的私人修车助手

汽车故障自诊断系统：你的私人修车助手

高金吉院士揭秘：故障自愈流程新突破！

高金吉院士揭秘：故障自愈流程新突破！

三十岁职场人必看的职业规划秘籍

三十岁职场人必看的职业规划秘籍

《三十而已》教你如何在30岁逆袭人生

《三十而已》教你如何在30岁逆袭人生

香港中文大学（深圳）：一条绿色轴线串起的生态校园

香港中文大学（深圳）：一条绿色轴线串起的生态校园

双十一抢购神器：Tomcat服务器最佳配置揭秘

双十一抢购神器：Tomcat服务器最佳配置揭秘

Tomcat性能优化：V哥教你搞定高并发！

Tomcat性能优化：V哥教你搞定高并发！

香港中文大学（深圳）2025年硕士申请全攻略

香港中文大学（深圳）2025年硕士申请全攻略

香港中文大学（深圳）奖学金大揭秘：学霸们快来领钱啦！

香港中文大学（深圳）奖学金大揭秘：学霸们快来领钱啦！

港中大（深圳）新增AI和大数据专业，你真的适合吗？

港中大（深圳）新增AI和大数据专业，你真的适合吗？

港中深2024届毕业生就业率95.13%，平均年薪17.08万元

港中深2024届毕业生就业率95.13%，平均年薪17.08万元

清内源、减外源、扩生态……江苏治太摸索出一条有效路径，共护碧波万顷

清内源、减外源、扩生态……江苏治太摸索出一条有效路径，共护碧波万顷

泉州当地的交通方式有哪些？

泉州当地的交通方式有哪些？

哪吒3新剧情曝光！奇幻冒险开启

哪吒3新剧情曝光！奇幻冒险开启

哪吒新形象引爆春节档！

哪吒新形象引爆春节档！

拉罗替尼治癌效果如何

拉罗替尼治癌效果如何

南宁老友粉：从地方小吃到百亿产业

南宁老友粉：从地方小吃到百亿产业

南宁老友粉：从“无标可依”到品牌化运营，这碗粉正走向全国

南宁老友粉：从“无标可依”到品牌化运营，这碗粉正走向全国

罗素与怀特海的经典证明：为什么1加1等于2？

罗素与怀特海的经典证明：为什么1加1等于2？

双十一护肤产品选购指南：科学护肤，理性消费

双十一护肤产品选购指南：科学护肤，理性消费

酒店投资回报具体要怎么算？

酒店投资回报具体要怎么算？

中国工程院发布最新铝合金技术趋势：航空航天与交通领域应用前景广阔

中国工程院发布最新铝合金技术趋势：航空航天与交通领域应用前景广阔

乐清打造15分钟文明实践服务圈

乐清打造15分钟文明实践服务圈

如何防范心脑血管疾病的“袭击”？远离9个元凶，守护心脑健康

如何防范心脑血管疾病的“袭击”？远离9个元凶，守护心脑健康

如何在生活中进行有效的自我定位与目标设定指南

如何在生活中进行有效的自我定位与目标设定指南

睡眠时身体抖动：原因、风险与解决方案

睡眠时身体抖动：原因、风险与解决方案

避开人潮，玩转西班牙：马德里和巴塞罗那深度游攻略

避开人潮，玩转西班牙：马德里和巴塞罗那深度游攻略

春游塞维利亚：圣周与四月节的双重体验

春游塞维利亚：圣周与四月节的双重体验

圣乔治节：西班牙最浪漫的文化盛宴

圣乔治节：西班牙最浪漫的文化盛宴

西班牙旅游攻略：四季穿搭大揭秘！

西班牙旅游攻略：四季穿搭大揭秘！

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号