常见GPU算力对比:RTX 4090与4090D的硬件参数与性能解析
创作时间:
作者:
@小白创作中心
常见GPU算力对比:RTX 4090与4090D的硬件参数与性能解析
引用
CSDN
1.
https://blog.csdn.net/qq_45351564/article/details/145413438
硬件参数
特性 | 4090 | 4090D |
|---|---|---|
核心 | AD102-300 | AD102-250 |
架构 | Ada Lovelace | Ada Lovelace |
SM | 128 | 114 |
CUDA Cores / SM | 128 | 128 |
CUDA Cores / GPU | 16384 | 14592 |
Tensor Cores / SM | 4 (4th Gen) | 4 (4th Gen) |
Tensor Cores / GPU | 512 (4th Gen) | 456 (4th Gen) |
GPU 加速频率 | 2520 MHz | 2520 MHz |
显存 | 24 GB (GDDR6X) | 24 GB (GDDR6X) |
显存位宽 | 384 bit | 384 bit |
显存速率 | 21 Gbps | 21 Gbps |
显存带宽 | 1008 GBps | 1008 GBps |
一缓 | 128 KB (per SM) | 128 KB (per SM) |
二缓 | 72 MB | 72 MB |
TGP | 450 W | 425 W |
制程 | TSMC 4N (5nm) | TSMC 4N (5nm) |
值得注意的是,完整的AD102核心包含12组GPC,每组GPC包含6组TPC,每个TPC中含有两个SM单元,因此完整的AD102核心共有144个SM单元。然而,AD102-300仅启用其中的128个SM单元,而AD102-250则只启用114个。每个SM单元中有128个CUDA计算单元,其中64个CUDA可以计算FP32或INT32,另外64个只能计算INT32。
每个SM单元中有4个Tensor Core,因此AD102-300总共含有512个Tensor Core,AD102-250总共含有456个Tensor Core。支持的数据类型包括FP8、FP16、BF16、TF32、INT8、INT4,但不支持FP64。对于FP16数据,每个Tensor Core每周期可以完成64次FMA(乘加)操作,相当于128个FP16 FLOPs;对于INT8数据,每个Tensor Core每周期能完成128次运算;对于INT4数据,每周期则能完成256次运算。启用稀疏计算(2:4模式)加速后,在神经网络权重中,强制每4个连续元素中至少2个为零,Tensor Core硬件自动跳过零值计算,有效吞吐量翻倍。
算力
CUDA Core 算力
特性 | 4090 | 4090D |
|---|---|---|
FP32 | 82.6 | 73.5 |
FP16 | 82.6 | 73.5 |
FP64 | 1.29 | 1.149 |
BF16 | 82.6 | 73.5 |
INT32 | 41.3 | 36.8 |
Tensor Core 算力
特性 | 4090 | 4090D |
|---|---|---|
FP8 | 660.6 / 1321.2 | 588.4 / 1176.8 |
FP16 | 330.3 / 660.6 | 294.2 / 588.4 |
BF16 | 165.2 / 330.4 | 147.1 / 294.2 |
TF32 | 82.6 / 165.2 | 73.5 / 147.1 |
INT8 | 660.6 / 1321.2 | 588.4 / 1176.8 |
INT4 | 1321.2 / 2642.4 | 1176.8 / 2353.6 |
热门推荐
阴阳八字命理:如何解读个人命运
南阳台适合种什么植物?室内南向阳台适合栽的花
家里养乌龟,原来有这么多好处,那么多人竟然还不知道?
去丽江旅行的省钱攻略:住宿、交通、美食全方位省钱指南
女娲星座第三批卫星发射成功,在轨雷达卫星数量创我国商业新高
内分泌失调是怎么引起的
铜排安装要点 提升配电柜性能与安全性
孩子爱打人的原因及对策
汽车胎压监测系统:工作原理、分类与发展趋势
科学家研究了5万人后证实,啥都不用干也不用花钱,就能延长寿命
新手父母身陷母婴消费困局
接口文档责任人:如何确保API文档的准确性与一致性?
巴厘岛小纹身:讲故事的细节
口腔溃疡的形成3D动画:揭示疾病背后的原因和治疗方法
盘点NBA历史上最好的五位二当家,科比上榜,第一辅佐乔丹封神
沉香手串的保养知识,沉香最怕什么?
河南省应对人口老龄化:构建普惠型养老服务体系的实践与探索
在线质谱仪的组成部分及其作用
长期用电脑眼睛干涩疼怎么办
温泉景观设计的本土化:融入当地文化特色
征地补偿款发放指南:流程、影响因素及赔偿标准详解
超详细的项目复盘!附7种常用方法
如何选择好消化的外卖饭菜
河北工业大学专业设置及学校简介
APP插件开发,如何确保APP插件跨版本兼容
抖音知识科普无人问津?掌握爆款文案公式,助你逆风翻盘
马赫数的概念及其在航空航天领域的重要性与应用解析
速算扣除数详解:个税计算中的关键概念与应用
如何深入理解市场波动并制定合理投资策略?
明英宗朱祁镇二次登基:南宫复辟始末