学习目标:
Ubuntu20.04下装好torch、paddle深度学习环境。
选择的版本环境是 :最新的nvidia驱动、cuda 11.1 、cudnn v8.1.1,下面会说为啥这么选。
学习内容:
1. Ubuntu20.04仓库换源
本节参考Ubuntu 20.04 Linux更换源教程
2. Anaconda安装以及conda、pip换国内源
这个步骤可以放在后面进行
2.1 Anaconda安装
详情参考Anaconda安装,具体不再列出
要注意的一点是,anaconda安装完成后,要先关闭那个命令行,再重新打开一个命令行,才可以进行conda操作
2.2 conda、pip换国内源
3. Nvidia驱动安装
3.1 安装步骤
- 进入nvidia官网,下 载 NVIDIA 驱 动 安 装 包 ( .run 格 式 ),型号别选错了
2. 然后你自己找个地方建立一个文件夹,把这个文件放进去,看着不乱。你的可能不叫这个名字,因为我给它改过名了
3. 禁用nouveau
4. 安装驱动
步骤中,遇到32bit的选项,选no,其他都yes(PS我踩的坑:下的nvidia驱动版本太低,默认的gcc版本是9.4.0,那个驱动要gcc 9.3.0才能装。千万别折腾gcc,会疯的!!!换个高版本驱动,最新的,就不会出问题)
3.2 说明
这里简单说明一下驱动、cuda toolkits 、cudnn的一个关系,建议你看一下,虽然我也是外行
nvidia驱动版本可以通过 nvidia-smi命令查看,我们可以看到驱动版本是515.48.07,这代表,他最高支持的CUDA版本是11.7,这是这个驱动支持CUDA工具包版本的上限。现在我想要安装Paddle深度学习框架
因此我根据自己的配置,要选CUDA 11.1工具包以及cuDNN v8.1.1工具包,所以这里不要瞎配置
即使是Torch也是有要求的,下面是11.3,其实也有11.1的,找找历史版本就行。为了保证这两个框架我都能装上,选择了以下配置(30系显卡,一定要选择CUDA 11以上的版本)
4. CUDA 11.1 安装
进入官网,选择11.1.1版本
选择离线runfile安装,下面有命令
只选第二个就行,啥都不选会报错。安装不上
安装成功,尝试nvcc -V,看到cuda 11.1就算成功了
5. CUDNN v8.1.1安装
进入官网,选择版本cudnn8.1.1 cuda11.1
下好,解压文件夹,执行命令,其实就完成了
6. Torch与Paddle安装
创建环境
按照官网给定信息,进行安装
安装paddle2.3会有问题protobuf package to 3.20.x or lower.,按照提示解决即可
对应解决方案
最后: 本期文参考 七月的和弦 博主