问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Windows 10下CUDA和cuDNN环境配置指南

创作时间:
作者:
@小白创作中心

Windows 10下CUDA和cuDNN环境配置指南

引用
CSDN
1.
https://blog.csdn.net/IT_ORACLE/article/details/145452867

本文将详细介绍在Windows 10下安装和配置CUDA及cuDNN环境的完整步骤,包括安装CUDA Toolkit、cuDNN以及配置深度学习框架(如TensorFlow和PyTorch)的方法。

1. 准备工作

检查GPU型号

  • 确认你的GPU型号
  • 确保你的GPU支持CUDA。可以在NVIDIA CUDA GPU列表中查找你的GPU是否支持CUDA。
  • 例如,NVIDIA GeForce GTX 750 Ti支持CUDA计算能力5.0。

更新NVIDIA驱动

下载CUDA Toolkit

  • 访问NVIDIA CUDA Toolkit下载页面,选择适合Windows 10的CUDA版本。例如,如果显卡最高可以适配CUDA 10.2,需要从Archive Previous CUDA Releases中查找。

下载cuDNN



2. 安装CUDA Toolkit

运行安装程序

  • 双击下载的CUDA安装包(如cuda_10.2.89_441.22_win10.exe)。
  • 选择精简模式或者选择“自定义安装”,确保勾选以下组件:
  • CUDA Toolkit(核心组件)
  • CUDA Samples(可选,用于测试)
  • NVIDIA GPU驱动(如果未安装最新驱动)。

配置环境变量

  • 安装完成后,CUDA会自动添加环境变量。如果没有,请手动添加:
  • 右键点击“此电脑” -> “属性” -> “高级系统设置” -> “环境变量”。
  • 在Path中添加以下路径:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\libnvvp

验证安装

  • 打开命令提示符(CMD),输入以下命令:
nvcc --version

如果显示CUDA版本信息,则安装成功。

3. 安装cuDNN

解压cuDNN文件

  • 下载的cuDNN是一个压缩包(如cudnn-10.2-windows10-x64-v7.6.5.32.zip),解压后会得到以下文件夹:
  • bin
  • include
  • lib

复制文件到CUDA安装目录

  • 将cuDNN的文件复制到CUDA安装目录(默认路径为C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2):
  • 将bin文件夹中的文件复制到CUDA\v10.2\bin。
  • 将include文件夹中的文件复制到CUDA\v10.2\include。
  • 将lib文件夹中的文件复制到CUDA\v10.2\lib。

验证cuDNN安装

  • 打开命令提示符,输入以下命令:
nvcc -V

如果显示CUDA版本信息,则cuDNN安装成功。

4. 测试CUDA安装

编译并运行CUDA Samples

  • 进入CUDA Samples目录(默认路径为C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.2)。
  • 打开Samples_vs2019.sln(如果使用Visual Studio 2019)。
  • 编译Samples(选择Release和x64配置)。
  • 运行测试程序(如deviceQuery):
  • 进入bin\u0064\Release目录,双击deviceQuery.exe。
  • 如果显示GPU信息,则CUDA安装成功。

5. 配置深度学习框架

TensorFlow

  1. 安装支持GPU的TensorFlow
  • 打开命令提示符,运行以下命令(不同版本的TensorFlow需要不同的CUDA版本支持。根据TensorFlow官方文档,TensorFlow 2.3.0和2.4.0支持CUDA 10.1,而官方并未直接支持CUDA 10.2。但你可以尝试让TensorFlow 2.3.0在CUDA 10.2环境下运行,通常是可行的。):
pip install tensorflow-gpu==2.3.0
  1. 验证GPU是否可用
  • 打开Python解释器,运行以下代码:
import tensorflow as tf
print(tf.config.list_physical_devices('GPU'))

如果显示GPU设备信息,则TensorFlow已成功配置为使用GPU。

[PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]
  1. 遇到的常见问题

问题 1:Could not load dynamic library 'cudart64_101.dll'

错误信息:

Could not load dynamic library 'cudart64_101.dll'; dlerror: cudart64_101.dll not found

原因:

  • TensorFlow 2.3.0需要CUDA 10.1,而你安装的是CUDA 10.2。

解决方案:

  • 方法 1(推荐):安装CUDA 10.1并使用TensorFlow 2.3.0。
  • 方法 2:尝试TensorFlow 2.5+(但需要更高版本的CUDA)。
  • 方法 3:如果坚持用CUDA 10.2,可以手动下载cudart64_101.dll并放入C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin。
  • 方法4:如果坚持用CUDA 10.2,可以将C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin下的cudart64_102.dll改名为cudart64_101.dll。

PyTorch

  1. 安装支持GPU的PyTorch
  • PyTorch各个版本对CUDA版本的支持可以在PyTorch官网查询。打开命令提示符,运行以下命令:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu102
  1. 验证GPU是否可用
  • 打开Python解释器,运行以下代码:
import torch
if torch.cuda.is_available():
    print(f"GPU is available: {torch.cuda.get_device_name(0)}")
    print(f"CUDA version: {torch.version.cuda}")
else:
    print("GPU is not available.")

如果输出显示GPU可用,并且CUDA版本正确,就说明PyTorch已成功配置GPU加速。

GPU is available: GeForce GTX 750 Ti
CUDA version: 10.2

6. 常见问题

  1. 驱动冲突
  • 确保安装的NVIDIA驱动与CUDA版本兼容。
  1. 环境变量未生效
  • 检查环境变量配置是否正确,并确保重新加载配置文件。
  1. 显存不足
  • 如果显存不足,可以尝试减少批量大小(batch size)或使用模型量化技术。
  1. nvidia-smi命令不可用
  • 将C:\Program Files\NVIDIA Corporation\NVSMI添加到环境变量的Path变量中。

通过以上步骤,你应该能够在Windows 10企业版下成功安装和配置CUDA框架,并开始使用GPU加速深度学习任务。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号