需求:
- inux 下安装 cuda
进程:
- 先查看一下系统版本 uname -a
- 查看能支持什么版本的cuda
- cuda toolkit 下载
wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run
sudo sh cuda_11.1.0_455.23.05_linux.run
- 安装的时候运行失败
- 查看了一下源码发现需要tar ,但我这个是一个干净的docker 环境所以失败了,需要先安装 tar
yum install tar
- 再次启动会有一个安装界面,按需安装,我这边在宿主机上已经安装了驱动等工具就只需勾选 toolkit 就行了
- 安装完成之后需要配置path ,
export PATH="/usr/local/cuda-11.1/bin:$PATH"
- 安装好cuda 之后还需要在装一个cudnn
- cudnn 需要你注册对应的账号,cudnn 下载
- 注册好之后下载linux x86_64 的tar 文件就行
- 解压之后拷贝文件到指定目录
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.1/lib64/ -d
sudo cp cuda/include/cudnn.h /usr/local/cuda-11.1/include/
- 拷贝完成之后需要在运行以下
ldconfig
刷新一下服务的引用 - 尝试使用python 引入tensorflow 验证是否已经安装完成
nvcc --version
查看cuda 的信息
使用tensorflow 校验是不是已经安装完成
import tensorflow as tf
tf.version
tf.test.is_gpu_available()
tf.config.experimental.list_physical_devices(‘GPU’)