Ubuntu Server 20.04中安装与配置 CUDA 环境
Ubuntu Server 20.04中安装与配置 CUDA 环境
CUDA(Compute Unified Device Architecture)是NVIDIA推出的通用并行计算架构,通过该架构,开发人员可以使用C语言来为GPU编写程序,从而实现通用的GPU计算。在进行深度学习时,CUDA环境是必不可少的。本文将详细介绍在Ubuntu Server 20.04中安装和配置CUDA环境的全过程,包括安装前的准备、安装NVIDIA驱动、安装CUDA以及环境配置和验证等步骤。
一、安装前的准备
1.查看版本信息
分别输入
uname -a
以及
cat /etc/lsb-release
查看自己Ubuntu的版本信息
2.检查显卡信息
分别输入
lspci | grep VGA
以及
sudo lshw -C video
可以看到自己显卡的参数
二、安装 NVIDIA
检查NVIDIA是否安装,安装了可跳过
查看显卡信息
nvidia-smi
要先安装NVIDIA以后才能安装CUDA
1.检查 nouveau 是否禁用
nouveau是第三方开发的开源显卡驱动,安装NVIDIA官方的显卡驱动之前,需要先禁用它。
输入
lsmod | grep nouveau
没有输入代表已禁用,有输出需要前去禁用
禁用方式:
编辑vim /etc/modprobe.d/blacklist.conf文件,末尾添加如下代码
blacklist nouveau
options nouveau modeset=0
执行更新
sudo update-initramfs -u
重启
reboot
重启后通过以下命令验证,没有任何输出结果则代表禁用成功
lsmod | grep nouveau
2. 安装 NVIDIA
2.1 安装依赖
2.1.1 gcc安装
输入查看gcc是否安装
gcc -v
若没有安装,则输入下面的命令,直接把包括gcc在内很多开发工具包一同安装
sudo apt-get install build-essential
2.1.2 添加 NVIDIA 驱动程序 PPA
可以通过 apt 命令检查已添加的 PPA 列表,看看是否有 NVIDIA 的 PPA 存在。运行以下命令:
grep -r "graphics-drivers" /etc/apt/sources.list*
如果已经添加了 graphics-drivers PPA,会看到类似于下面的输出(路径可能不同):
/etc/apt/sources.list.d/graphics-drivers-ubuntu-ppa-focal.list:deb http://ppa.launchpad.net/graphics-drivers/ppa/ubuntu focal main
则可以跳过此步直接安装 NVIDIA
输入下面命令安装 PPA:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
添加之后,运行以下命令确认 PPA 是否添加成功:
apt-cache search nvidia-driver
如果成功,应该能够列出相关的 NVIDIA 驱动程序版本。
2.2 安装 NVIDIA
检查可安装驱动
ubuntu-drivers devices
如果你在运行 ubuntu-drivers devices 时遇到 “Command ‘ubuntu-drivers’ not found” 的错误,说明你需要先安装 ubuntu-drivers-common 包。这个包包含了一些自动化工具,可以帮助你识别和安装适合你硬件的 NVIDIA 驱动程序
可以直接运行以下代码直接安装你想安装的版本
sudo apt install nvidia-driver-XXX
也可以安装这个包进行自动化安装,命令为:
sudo ubuntu-drivers autoinstall
如果没有遇到报错,说明安装成功,此时调用nvidia-smi指令可能还是看不到显卡信息,不要担心,重启系统之后就能看到了。
三、查看 Ubuntu 版本支持 CUDA并安装
1.官网查看 CUDA 官方文档
在官方文档(https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html)中可以查看到不同版本的Ubuntu兼容CUDA的版本
对比官方文档查看自己的Ubuntu能安装那个版本的CUDA
2.安装 CUDA(本文是下载使用 CUDA 11.3)
前往NVIDIA 官方网站下载 CUDA 11.3 的安装包,或者你也可以通过以下步骤直接添加存储库并安装。(版本号要和上面下载的 NVIDIA 版本要一致)
wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
使安装脚本具有执行权限:
chmod +x cuda_11.3.0_465.19.01_linux.run
运行安装脚本,按照提示进行安装:
sudo ./cuda_11.3.0_465.19.01_linux.run
在安装过程中,你将看到多个选项:
选择是否安装 NVIDIA 驱动程序。如果你已经安装了兼容的 NVIDIA 驱动,可以选择跳过驱动安装,直接安装 CUDA。
其他组件可以根据需求选择是否安装。
这是 CUDA 工具包安装过程中的许可协议界面,系统要求你接受 End User License Agreement (EULA) 才能继续安装。
下图界面可以看出,当前安装程序正在配置 CUDA 组件
如果你需要全部组件(驱动、工具包、示例、演示和文档),直接选择 Install 并回车即可开始安装。
如果只需要部分组件,比如不安装 CUDA Samples 或 Documentation,可以通过方向键移动到相应的选项,按空格键取消勾选。
如果需要更多安装选项,可以按 A 进入高级选项。
四、环境配置
安装完成后,需要设置环境变量,以便在命令行中使用 CUDA 工具。打开或创建 ~/.bashrc 文件并添加以下内容:
export PATH=/usr/local/cuda-11.3/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH
使更改生效:
source ~/.bashrc
五、验证安装
安装完成后,你可以通过运行以下命令来验证 CUDA 是否安装成功:
nvcc --version
这应该会显示 CUDA 的版本信息,确认 11.3 已成功安装。
参考文献
1.nouveau禁用方法参考:Ubuntu Server 20.04安装NVIDIA驱动
2.安装NVIDIA参考:Ubuntu 20.04安装CUDA & CUDNN 手把手带你撸