问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Windows 10下CUDA和cuDNN环境配置指南

创作时间:
作者:
@小白创作中心

Windows 10下CUDA和cuDNN环境配置指南

引用
CSDN
1.
https://blog.csdn.net/IT_ORACLE/article/details/145452867

CUDA(Compute Unified Device Architecture)和cuDNN(CUDA Deep Neural Network library)是NVIDIA开发的用于GPU加速计算的重要工具库,它们在深度学习领域有着广泛的应用。本文将详细介绍如何在Windows 10系统下安装和配置CUDA及cuDNN环境,并配置TensorFlow和PyTorch两个主流深度学习框架,以实现GPU加速。

1. 准备工作

检查 GPU 型号

  • 确认你的GPU型号
  • 确保你的 GPU 支持 CUDA。可以在 NVIDIA CUDA GPU 列表 中查找你的 GPU 是否支持 CUDA。
  • 例如,NVIDIA GeForce GTX 750 Ti 支持 CUDA 计算能力 5.0。

更新 NVIDIA 驱动

下载 CUDA Toolkit

  • 访问 NVIDIA CUDA Toolkit 下载页面,选择适合 Windows 10 的 CUDA 版本。例如,如果显卡最高可以适配CUDA 10.2,需要从Archive Previous CUDA Releases中查找。

下载cuDNN



2. 安装 CUDA Toolkit

运行安装程序

  • 双击下载的 CUDA 安装包(如 cuda_10.2.89_441.22_win10.exe)。
  • 选择精简模式或者选择“自定义安装”,确保勾选以下组件:
  • CUDA Toolkit(核心组件)
  • CUDA Samples(可选,用于测试)
  • NVIDIA GPU 驱动(如果未安装最新驱动)。

配置环境变量

  • 安装完成后,CUDA 会自动添加环境变量。如果没有,请手动添加:
  • 右键点击“此电脑” -> “属性” -> “高级系统设置” -> “环境变量”。
  • Path 中添加以下路径:
    C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin
    C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\libnvvp
    

验证安装

  • 打开命令提示符(CMD),输入以下命令:
    nvcc --version
    

如果显示 CUDA 版本信息,则安装成功。

3. 安装 cuDNN

解压 cuDNN 文件

  • 下载的 cuDNN 是一个压缩包(如 cudnn-10.2-windows10-x64-v7.6.5.32.zip),解压后会得到以下文件夹:
  • bin
  • include
  • lib

复制文件到 CUDA 安装目录

  • 将 cuDNN 的文件复制到 CUDA 安装目录(默认路径为 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2):
  • bin 文件夹中的文件复制到 CUDA\v10.2\bin
  • include 文件夹中的文件复制到 CUDA\v10.2\include
  • lib 文件夹中的文件复制到 CUDA\v10.2\lib

验证 cuDNN 安装

  • 打开命令提示符,输入以下命令:
    nvcc -V
    

如果显示 CUDA 版本信息,则 cuDNN 安装成功。

4. 测试 CUDA 安装

编译并运行 CUDA Samples

  • 进入 CUDA Samples 目录(默认路径为 C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.2)。
  • 打开 Samples_vs2019.sln(如果使用 Visual Studio 2019)。
  • 编译 Samples(选择 Releasex64 配置)。
  • 运行测试程序(如 deviceQuery):
  • 进入 bin\u0064\Release 目录,双击 deviceQuery.exe
  • 如果显示 GPU 信息,则 CUDA 安装成功。

5. 配置深度学习框架

TensorFlow

  1. 安装支持 GPU 的 TensorFlow
  • 打开命令提示符,运行以下命令(不同版本的 TensorFlow 需要不同的 CUDA 版本支持。根据 TensorFlow 官方文档,TensorFlow 2.3.0 和 2.4.0支持CUDA 10.1,而官方并未直接支持 CUDA 10.2。但你可以尝试让TensorFlow 2.3.0 在 CUDA 10.2 环境下运行,通常是可行的。):
    pip install tensorflow-gpu==2.3.0
    
  1. 验证 GPU 是否可用
  • 打开 Python 解释器,运行以下代码:
    import tensorflow as tf
    print(tf.config.list_physical_devices('GPU'))
    
    如果显示 GPU 设备信息,则 TensorFlow 已成功配置为使用 GPU。
    [PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]
    
  1. 遇到的常见问题
  • 问题 1:Could not load dynamic library 'cudart64_101.dll'
    错误信息:
    Could not load dynamic library 'cudart64_101.dll'; dlerror: cudart64_101.dll not found
    
    原因:
  • TensorFlow 2.3.0 需要CUDA 10.1,而你安装的是CUDA 10.2。
    解决方案:
  • 方法 1(推荐):安装 CUDA 10.1 并使用 TensorFlow 2.3.0。
  • 方法 2:尝试 TensorFlow 2.5+(但需要更高版本的 CUDA)。
  • 方法 3:如果坚持用 CUDA 10.2,可以手动下载cudart64_101.dll并放入C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin
  • 方法4:如果坚持用 CUDA 10.2,可以将C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\bin下的cudart64_102.dll改名为cudart64_101.dll

PyTorch

  1. 安装支持 GPU 的 PyTorch
  • PyTorch 各个版本对 CUDA 版本的支持可以在官网 PyTorch 官网 查询。打开命令提示符,运行以下命令:
    pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu102
    
  1. 验证 GPU 是否可用
  • 打开 Python 解释器,运行以下代码:
    import torch
    if torch.cuda.is_available():
        print(f"GPU is available: {torch.cuda.get_device_name(0)}")
        print(f"CUDA version: {torch.version.cuda}")
    else:
        print("GPU is not available.")
    
    如果输出显示 GPU 可用,并且 CUDA 版本正确,就说明 PyTorch 已成功配置 GPU 加速。
    GPU is available: GeForce GTX 750 Ti
    CUDA version: 10.2
    

6. 常见问题

  1. 驱动冲突
  • 确保安装的 NVIDIA 驱动与 CUDA 版本兼容。
  1. 环境变量未生效
  • 检查环境变量配置是否正确,并确保重新加载配置文件。
  1. 显存不足
  • 如果显存不足,可以尝试减少批量大小(batch size)或使用模型量化技术。
  1. nvidia-smi命令不可用
  • C:\Program Files\NVIDIA Corporation\NVSMI添加到环境变量的Path变量中。

通过以上步骤,你应该能够在Windows 10 企业版下成功安装和配置 CUDA 框架,并开始使用 GPU 加速深度学习任务。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号