常见GPU算力对比:5090与5090D的技术解析
创作时间:
作者:
@小白创作中心
常见GPU算力对比:5090与5090D的技术解析
引用
CSDN
1.
https://blog.csdn.net/qq_45351564/article/details/145422580
本文详细介绍了5090和5090D两款GPU的硬件参数和算力表现,包括核心架构、CUDA核心数量、显存规格等关键指标,并对比了两款GPU在不同数据类型下的计算能力。
硬件参数
参数 | 5090 | 5090D |
|---|---|---|
核心 | GB202-300 | GB202-250 |
架构 | Blackwell | Blackwell |
SM | 170 | 170 |
CUDA Cores / SM | 128 | 128 |
CUDA Cores / GPU | 21760 | 21760 |
Tensor Cores / SM | 4 (5th Gen) | 4 (5th Gen) |
Tensor Cores / GPU | 680 (5th Gen) | 680 (5th Gen) |
GPU 加速频率 | 2407 MHz | 2407 MHz |
显存 | 32 GB (GDDR7) | 32 GB (GDDR7) |
显存位宽 | 512 bit | 512 bit |
显存速率 | 28 Gbps | 28 Gbps |
显存带宽 | 1792 GBps | 1792 GBps |
一缓 | 128 KB (per SM) | 128 KB (per SM) |
二缓 | 96 MB | 96 MB |
TGP | 575 W | 575 W |
制程 | TSMC 4N (5nm) | TSMC 4N (5nm) |
注:完整 GB202 核心有 12 组 GPC,每组 GPC 包含 8 组 TPC(4090 的 AD102 中是 6 组),单个 TPC 中含有两个 SM 单元,因此完整 GB202 核心共有 192 个 SM 单元,但 GB202-300 和 GB202-250 只开启其中的 170 个。每个 SM 单元中有 128 个 CUDA 计算单元,这 128 个 CUDA 都可以计算 FP32 或 INT32(4090 的 AD102 中 64 个 CUDA 可以计算 FP32 或 INT32,另外 64 个只能计算 INT32)。
注:每个 SM 单元中有 4 个 Tensor Core,因此 GB202-300 和 GB202-250 总共含有 680 个 Tensor Core。支持的数据类型有 FP8、FP16、BF16、TF32、INT8、INT4、FP6、FP4,不支持 FP64。和 AD102 相比,新增支持 FP6 和 FP4,且采用第二代 FP8 Transformer 引擎。
算力
1. CUDA Core 算力
数据类型 | 5090 | 5090D |
|---|---|---|
FP32 | 104.8 TFLOPS | 104.8 TFLOPS |
FP16 | 104.8 TFLOPS | 104.8 TFLOPS |
FP64 | 1.64 TFLOPS | 1.64 TFLOPS |
BF16 | 104.8 TFLOPS | 104.8 TFLOPS |
INT32 | 104.8 TIOPS | 104.8 TIOPS |
2. Tensor Core 算力
数据类型 | 5090 | 5090D |
|---|---|---|
FP4 | 1676 / 3352 TFLOPS | NA / 2375 TFLOPS |
FP8 | 838 / 1676 TFLOPS | NA / NA |
FP16 | 419 / 838 TFLOPS | NA / NA |
BF16 | 209.5 / 419 TFLOPS | NA / NA |
TF32 | 104.8 / 209.5 TFLOPS | NA / NA |
INT8 | 838 / 1676 TFLOPS | NA / NA |
INT4 | 1676 / 3352 TFLOPS | NA / NA |
注:5090D 的 Tensor Core 算力有待考证
热门推荐
如何计算纯利率并理解其意义?这种意义在实际应用中有哪些体现?
李白“最皮”的一首诗,调侃杜甫减肥,读来使人发笑
酒驾、醉驾的定性及应承担的法律责任
这个餐桌上的“小透明”,切“戊”掉以轻心
云南红河百年米轨老站台驶出文旅新动能
听力检查项目
电脑截屏技巧详解:Windows与Mac系统的截图方法与工具
饮水机耗电吗?24小时开着用多少电?
金属面膨胀型防火涂料,能够在高温下保持稳定
五款烧脑解谜游戏推荐:从《海龟汤》到《迷城探案录》
空心陶瓷微球应用前景广阔 我国技术水平有望提升
如何全面评估股票的业绩表现?这些关键指标和注意事项不容忽视
DIY手工香薰蜡烛制作教程:新手也能轻松上手的蜡烛制作技巧大公开!
小儿消化不良时,这些益生菌或可帮助改善
铝镁加混悬液和铝碳酸镁一样吗
外用炎症用药指南:选对药,炎症消
空腹血糖5.7!如何通过饮食和运动保持健康血糖水平?
饮水机耗电量及省电方法解析(通过合理使用饮水机)
健康饮食减肥计划:打造完美身材的必经之路
补签劳动合同的效力及认定
淘米水发酵多久浇花最好?淘米水变废为宝
嗓子痛流鼻涕吃什么药最好效果
债务爆发是什么感受?如何应对?
天津蚝油生菜:鲜美海鲜香,脆嫩绿意浓
《宿建德江》古诗配画绘制教程
数据库的数据模型有哪些类型
团队如何发放奖励通知
萍乡出发:贵州小七孔深度游攻略全方位探索自然与文化之美
沪深股市今日盘点:股价起伏引领市场新趋势
学会使用刻录机,轻松刻录光盘(详细教程)