我的Linux系统背景:
-
系统和驱动都已安装。
-
系统是centos 8。查看自己操作系统的版本信息:
cat /etc/issue
或者是cat /etc/lsb-release
-
用
nvidia-smi
可以看到显卡驱动和可支持的最高cuda版本,我的是12.2。驱动版本是535.129.03
首先,检查是否安装了CUDA:ls -l /usr/local | grep cuda
http:// https://developer.nvidia.com/cuda-toolkit-archive 如下截图, 选择自己系统对应的 CUDA
版本,
若第1步提示Existing package manager installation of the driver found. It is strongly recommended that you remove this before continuing.,选择continue,继续操作
Do you accept the above EULA? (accept/decline/quit):
│ accept #输入accept
│─────────────────────────────────────────────────────
#安装选项,由于我已经安装有Driver: 535.54.03,所以没有选择。
│ CUDA Installer
│ - [ ] Driver
│ [ ] 535.54.03
│ + [X] CUDA Toolkit 10.2
│ [ ] CUDA Samples 10.2
│ [ ] CUDA Demo Suite 10.2
│ [ ] CUDA Documentation 10.2
│ Options
│ Install #[ ]不选择,带X的是需要安装的部分,之后选择 Install
————————————————
安装好后显示
输入 ll /usr/local/
可以看到 /usr/local/
目录下已经有 cuda -> /usr/local/cuda-10.2//
软链接。
添加环境变量
打开 ~/.bashrc
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
验证安装成功
最后输入命令 nvcc -V
有如下输出,说明已安装成功。
最后这步有问题在打开 ~/.bashrc中重写下面三行
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda/lib64
nvcc -V
cuDNN的安装与检测
3.1. cuDNN的安装
从NVIDIA官网的cudnn下载页面上下载与安装CUDA对应的cudnn,网址为Log in | NVIDIA Developer。选择Ubuntu2
cudnn-linux-x86_64-8.8.0.121_cuda12-archive.tar.xz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
参考:https://blog.csdn.net/wohu1104/article/details/107041387