NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南

创作时间:

作者:

@小白创作中心

NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南

引用

CSDN

https://blog.csdn.net/byxdaz/article/details/146133963

在AI和高性能计算领域，NVIDIA的显卡及相关软件栈（如CUDA、cuDNN和TensorRT）的版本匹配是一个常见且重要的问题。本文将详细讲解显卡驱动、CUDA、cuDNN和TensorRT之间的版本兼容关系，并提供具体的查询方法和推荐版本组合，帮助读者快速掌握这些关键组件的安装和配置要点。

一、驱动安装

下载驱动
前往NVIDIA驱动下载页，输入显卡型号和操作系统类型，选择≥目标CUDA版本要求的驱动版本。
安装驱动

Windows：双击安装包按向导操作。
Linux：建议使用apt或官方.run文件安装。

验证
运行nvidia-smi，检查驱动版本是否满足要求。

二、核心匹配原则

1. 显卡驱动与CUDA版本兼容性

1）NVIDIA 显卡驱动需满足 CUDA 工具包的最低要求，例如 CUDA 11.8 需驱动版本 ≥515.43.04，CUDA 12.x 需驱动 ≥535.54.03。
显卡驱动查询方法：输入命令：nvidia-smi，输出右上角显示 CUDA Version: 12.5 即最高支持的 CUDA 版本。
2）CUDA版本所需的最低驱动版本。
访问NVIDIA官方文档，进入CUDA Toolkit Release Notes，查找目标CUDA版本对应的驱动版本要求。

注意：驱动是向下兼容的，其决定了可安装的CUDA Toolkit的最高版本。

2. GPU 算力与 CUDA 版本对应关系

显卡算力与CUDA版本的关系主要体现在显卡的Compute Capability（算力）决定了支持的CUDA版本。
NVIDIA显卡的算力是通过Compute Capability（CC）来衡量的，不同的显卡有不同的CC值。例如，NVIDIA的RTX A2000显卡的算力为8.6，即CC为8.6。CUDA版本需要支持显卡的CC值，否则会出现兼容性问题。

1）查显卡算力（两种方式）
1.1）通过以下网址查询算力
https://developer.nvidia.com/cuda-gpus#compute
比如：GeForce RTX 3080 算力8.6

1.2）通过CUDA安装目录（比如：CUDA\v11.8\extras\demo_suite）的deviceQuery.exe查询算力。
运行deviceQuery.exe后，查找以下字段：

CUDA Capability Major/Minor version number:    X.Y

X.Y即为 GPU 的计算能力（Compute Capability），例如8.6表示 Turing 架构的算力级别。

2）通过NVIDIA Datacenter Drivers :: NVIDIA Data Center GPU Driver Documentation查询算力对应CUDA版本。

3. CUDA 与 cuDNN 的对应关系

CUDA 与 cuDNN需严格匹配，例如 CUDA 11.8 对应 cuDNN 8.6.0，CUDA 12.2 对应 cuDNN 8.9.0。
官方版本对应表可参考cuDNN Archive | NVIDIA Developer

4. TensorRT与CUDA、cuDNN 的对应关系

TensorRT 依赖必须与 CUDA、cuDNN 版本一致（如 TensorRT 8.5.3.1 需 CUDA 11.8 + cuDNN 8.6.0）。

1）打开TensorRT官网说明文档，查看各版本支持的计算能力。
Documentation Archives :: NVIDIA Deep Learning TensorRT Documentation
从上面列表中，点击打开一个链接，有该TensorRT版本适配CUDA版本和cuDNN版本。比如：NVIDIA TensorRT 8.6.1 打开后选择“Support Matrix”链接。
点击打开链接后，搜索“Supported Features per Platform”，里面就有CUDA、cuDNN版本。

搜索“Software Versions Per Platform”，查看一些软件版本。

三、推荐版本组合

显卡系列	驱动版本	CUDA 版本	cuDNN 版本	TensorRT 版本
RTX 40 系	≥535.54.03	12.2	8.9.0	10.0.0.1
RTX 30 系	≥515.43.04	11.8	8.6.0	8.5.3.1
通用兼容方案	≥545.84	12.3	8.9.7(适配 12.x)	8.6.1
Titan V/RTX 20系	≥470.82	11.1	8.2.1	8.2.4.2