问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

手把手教你搭建实验室深度学习服务器

创作时间:
作者:
@小白创作中心

手把手教你搭建实验室深度学习服务器

引用
CSDN
1.
https://m.blog.csdn.net/m0_57307642/article/details/144734921

随着深度学习的快速发展,越来越多的实验室开始搭建自己的服务器来支持相关项目的运行。但是,对于很多初学者来说,服务器的搭建和配置可能是一个比较复杂的任务。本文将从零开始,详细介绍如何搭建一台适合深度学习的服务器,包括系统安装、环境配置、远程访问等多个方面的内容。

一、制作U盘启动盘

在开始之前,我们需要准备一个U盘启动盘来安装系统。具体步骤如下:

  1. 准备一个32G以上的U盘
  2. 下载Rufuse镜像烧录软件(https://cn.ultraiso.net/xiazai.html)
  3. 下载Ubuntu系统镜像(https://ubuntu.com/download/alternative-downloads)

制作过程:

  1. 打开Rufuse,选择U盘设备和ISO镜像文件
  2. 点击开始,等待制作完成

二、使用U盘给服务器安装系统

  1. 将U盘插入服务器,启动电脑并进入BIOS模式
  2. 选择U盘的Ubuntu系统进行安装
  3. 根据引导提示完成系统安装

三、安装显卡相关

显卡驱动

  1. 选择软件和更新,选择附加驱动
  2. 选择第一个驱动并应用更改
  3. 在终端输入以下命令完成驱动安装:
sudo apt-get install -f

CUDA

  1. 查看CUDA版本:nvidia-smi
  2. 下载对应版本的CUDA
  3. 安装CUDA:
wget https://developer.download.nvidia.com/compute/cuda/12.4.0/local_installers/cuda_12.4.0_550.54.14_linux.run
sudo sh cuda_12.4.0_550.54.14_linux.run

cuDNN

  1. 下载对应版本的cuDNN
  2. 解压并复制相关文件到CUDA目录:
tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz
cd cudnn-linux-x86_64-8.9.7.29_cuda12-archive
sudo cp ./include/cudnn*.h /usr/local/cuda/include
sudo cp -p ./lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda-12.4/include/cudnn.h /usr/local/cuda-12.4/lib64/libcudnn*

四、Anaconda安装

  1. 下载Anaconda安装包
  2. 安装Anaconda:
bash Anaconda3-2024.10-1-Linux-x86_64.sh
  1. 设置环境变量:
sudo vim /etc/profile
export ANACONDA_HOME=/usr/local/anaconda3
export PATH=$ANACONDA_HOME/bin:$PATH
source /etc/profile
  1. 授权所有用户使用:
vim /etc/skel/.bashrc

五、Anaconda的简单使用

  1. 创建虚拟环境:
conda create -n env_name python==3.8
  1. 查看所有虚拟环境列表:
conda env list
  1. 激活虚拟环境:
conda activate env_name
  1. 退出虚拟环境:
conda deactivate
  1. 删除虚拟环境:
conda remove --name env_name --all
  1. 导出虚拟环境:
conda env export --name myenv > myenv.yml
conda env create -f myenv.yml
  1. 依赖包管理:
conda list
conda install numpy
conda uninstall package_name
  1. 换源(中科大源):
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.ustc.edu.cn/anaconda/cloud/menpo/
conda config --set show_channel_urls yes

六、配置SSH

  1. 升级apt-get:
sudo apt-get update
sudo apt-get upgrade
  1. 安装SSH服务器和客户端:
sudo apt install openssh-server
sudo apt install openssh-client
  1. 配置SSH:
sudo vi /etc/ssh/ssh_config
  1. 配置SSHd:
sudo vi /etc/ssh/sshd_config
  1. 开启防火墙并允许SSH服务:
sudo ufw enable
sudo ufw allow ssh
sudo ufw allow 22/tcp

七、SSH的简单使用

  1. 启动SSH:
/etc/init.d/ssh start
sudo service ssh start
  1. 重启SSH:
sudo systemctl restart ssh
sudo systemctl enable --now ssh
  1. 关闭SSH:
sudo systemctl disable --now ssh
  1. 开启SSH端口:
sudo ufw allow ssh
  1. 查看SSH状态:
sudo systemctl status ssh
  1. 允许SSH自启动:
sudo systemctl enable ssh

八、路由器端口转发

  1. 查看服务器IP地址:
sudo apt install net_tools
ifconfig
  1. 路由器端口转发设置:
  • 服务名:自定义
  • 设备:服务器
  • 主机IP:服务器IP
  • 内部端口:22
  • 外部端口:10000以上
  1. 远程连接:
ssh 用户名@路由器IP地址 -p 外部端口号

九、服务器远程使用

  1. 激活root用户:
sudo passwd root
  1. 切换root用户:
su root
  1. 创建新用户:
useradd -m xiaoming
passwd xiaoming
  1. 退出root用户:
exit
  1. 远程连接:
ssh xiaoming@10.60.166.55 -p 22222

通过以上步骤,你就可以成功搭建一台适合深度学习的服务器,并实现远程访问和使用。希望本文对你有所帮助!

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号