常见GPU算力对比:RTX 4090与4090D的硬件参数与性能解析
创作时间:
作者:
@小白创作中心
常见GPU算力对比:RTX 4090与4090D的硬件参数与性能解析
引用
CSDN
1.
https://blog.csdn.net/qq_45351564/article/details/145413438
NVIDIA GeForce RTX 4090和4090D是目前市场上性能最强的两款显卡,它们基于相同的Ada Lovelace架构,但在核心数量和算力上有所差异。本文将详细介绍这两款显卡的硬件参数和算力表现,帮助读者更好地了解它们的性能特点。
硬件参数
参数 | 4090 | 4090D |
|---|---|---|
核心 | AD102-300 | AD102-250 |
架构 | Ada Lovelace | Ada Lovelace |
SM | 128 | 114 |
CUDA Cores / SM | 128 | 128 |
CUDA Cores / GPU | 16384 | 14592 |
Tensor Cores / SM | 4 (4th Gen) | 4 (4th Gen) |
Tensor Cores / GPU | 512 (4th Gen) | 456 (4th Gen) |
GPU 加速频率 | 2520 MHz | 2520 MHz |
显存 | 24 GB (GDDR6X) | 24 GB (GDDR6X) |
显存位宽 | 384 bit | 384 bit |
显存速率 | 21 Gbps | 21 Gbps |
显存带宽 | 1008 GBps | 1008 GBps |
一缓 | 128 KB (per SM) | 128 KB (per SM) |
二缓 | 72 MB | 72 MB |
TGP | 450 W | 425 W |
制程 | TSMC 4N (5nm) | TSMC 4N (5nm) |
值得注意的是,完整的AD102核心包含12组GPC(图形处理集群),每组GPC包含6组TPC(纹理处理集群),每个TPC中包含两个SM(流式多处理器)单元,因此完整的AD102核心共有144个SM单元。但是,AD102-300只启用了其中的128个SM单元,而AD102-250只启用了114个SM单元。每个SM单元中有128个CUDA计算单元,其中64个CUDA可以计算FP32或INT32,另外64个只能计算INT32。
每个SM单元中有4个Tensor Core,因此AD102-300总共含有512个Tensor Core,AD102-250总共含有456个Tensor Core。支持的数据类型包括FP8、FP16、BF16、TF32、INT8、INT4,但不支持FP64。对于FP16数据,每个Tensor Core每周期可以完成64次FMA(乘加)操作,相当于128个FP16 FLOPs;对于INT8数据,每个Tensor Core每周期能完成128次运算;对于INT4数据,每周期则能完成256次运算。启用稀疏计算(2:4模式)加速后,在神经网络权重中,强制每4个连续元素中至少2个为零,Tensor Core硬件自动跳过零值计算,有效吞吐量翻倍。
算力
CUDA Core 算力
数据类型 | 4090 | 4090D |
|---|---|---|
FP32 | 82.6 TFLOPS | 73.5 TFLOPS |
FP16 | 82.6 TFLOPS | 73.5 TFLOPS |
FP64 | 1.29 TFLOPS | 1.149 TFLOPS |
BF16 | 82.6 TFLOPS | 73.5 TFLOPS |
INT32 | 41.3 TIOPS | 36.8 TIOPS |
Tensor Core 算力
数据类型 | 稠密 | 稀疏 |
|---|---|---|
FP8 | 660.6 TFLOPS | 1321.2 TFLOPS |
FP16 | 330.3 TFLOPS | 660.6 TFLOPS |
BF16 | 165.2 TFLOPS | 330.4 TFLOPS |
TF32 | 82.6 TFLOPS | 165.2 TFLOPS |
INT8 | 660.6 TIOPS | 1321.2 TIOPS |
INT4 | 1321.2 TIOPS | 2642.4 TIOPS |
热门推荐
PISA 2018数据集:全球教育评估的权威参考
肺活量不足有什么影响 正确锻炼帮助提升肺功能
详细解析牙冠佩戴全过程:从准备到佩戴的每个步骤及注意事项
多方联系巧沟通 庭前调解化纠纷
财经热搜索,解读市场趋势与投资机会
深度解析沪深300指数:投资潜力与策略全攻略
预防流感,你正确洗手了吗?
同样是鸭蛋,“白皮”和“青皮”哪个更好!区别很大,别再乱买了
蜥蜴王组队出装攻略:打造最强阵容的全方位解析
男生烫完头发怎么护理
黑龙庙与古镇街:碛口古镇的两大必游之地
Excel数据去重完全指南:6种实用方法详解
支付个人劳务费如何写会计分录?
电子税局中的发票入账标识功能详解
“乙巳蛇年”还是“已巳蛇年”?追溯干支历法,周口有“迹”可循
如何通过MBTI气质类型理解不同性格
巧克力锅包肉:东北传统与创新的完美结合
法律文书写作评判标准与实践指南
如何知道自己适合从事什么工作?有什么方式方法?
详解ArcGIS 水文分析模型构建
已记录高等植物353种、脊椎动物238种!走进生物天堂云桥湿地
探索视频 CDN:优化视频流媒体体验的关键技术
祭祀的深意与文化传承:为什么我们如此重视祭祖
懒人减重,轻松健康
《逆转裁判5》:无聊的游戏千千万,能让我睡着的游戏却是独一份
港股新股分配机制详解:从公开发售到主动回拨
揭秘支付安全:为什么你的交易无法被篡改
“动”出降压奇迹:高血压患者的运动指南
癌症患者化疗后肿瘤指标不断升高,是病情恶化的表现吗?
腊梅的养殖和养护(易爱又好养——了解腊梅的养殖方法和养护要点)