一文搞定cuda版本、显卡驱动及多CUDA版本管理

安装cuda是每个AI从业人员必经之路。网上关于cuda、显卡驱动已经相关命令很多都解释不清楚,于是本文梳理一下,既方便自己记忆,也方便小白学习。

CUDA

首先,CUDA版本,一般指cuda-toolkit,即cuda开发工具包,我们一般安装上层软件如pytorch等,都需要对应的toolkit版本就是指的CUDA版本。本机的CUDA版本,该怎么查询呢?

nvcc -V

这个命令,查到的就是本机正在用的cuda开发工具包的版本。注意,"nvidia-smi"查到的未必是最准确的本机cuda版本,后面我会给解释。

经过老黄团队的不懈努力,现在的cuda安装变得异常简单,有手就行。以cuda 11.3安装为例子,只需要简单搜索即可:

google search
我们很容易得到这个:

wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/cuda_11.3.0_465.19.01_linux.run
sudo sh cuda_11.3.0_465.19.01_linux.run

当然,还有一个很方便的途径来获得下载链接:
https://developer.nvidia.com/cuda-toolkit-archive

注意:通过这个方法一键安装cuda时,会有一个选项可以选择是否安装对应的显卡驱动。如果你本地有多个CUDA的时候,这个显卡驱动慎选。
CUDA Installer
安装完驱动以后,才可以使用"nvidia-smi",这个命令查询的是本机显卡驱动所对应的cuda版本,未必是现在用的cuda工具包的版本。于是,经常出现"nvidia-smi"和"nvcc -V"版本不一致的情况。

知识点
1, 一台机器可以有多个CUDA版本,多个CUDA版本可以通过软连接进行管理;
2,一台机器通常只能安装一个显卡驱动;
3,对于严格要求显卡驱动版本的项目(涉及底层编译),需要重新安装对应的显卡驱动以支持对应cuda版本;
4,对于不严格要求显卡驱动版本的项目,我们简单修改CUDA软连接即可切换CUDA版本,这个情况下"nvidia-smi"和"nvcc -V"版本不一致也不会影响项目的运行。

现在写一下具体操作:
所有的cuda默认安装路径是:“/usr/local/”
我们定一个软链接目标地址:“/usr/local/cuda”,将我们需要切换的cuda版本链接到这个目标地址即可。
我们需要在~/.bashrc(有的是"~/.zshrc")加入对应的软链接目标地址:

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

注意:这里不要加入版本号(如PATH=/usr/local/cuda-11.3/bin:$PATH),不然不好做多版本CUDA管理。
我们source一下,就能激活这两句命令:(zsh用户自动切换成zshrc)

source ~/.bashrc

完成这一步,就可以:

nvcc -V

可以看到准确的cuda开发工具包的版本了,我们pytorch等的安装参照这个版本对应即可。

如何切换CUDA版本呢?

cd /usr/local/
sudo rm cuda
sudo ln -s cuda-11.8 cuda
ll #查看是否切换成功
# cuda -> cuda-11.8

然后看一下nvcc -V,你就会发现,CUDA版本已经切换。不过,你用"nvidia-smi"时,会发现cuda version还是没变。

如何改变"nvidia-smi"中显示的cuda version呢? 答:重新显卡安装驱动。这里实在要注意的是:显卡驱动会影响本机显示器的显示,如果是带图形界面的linux需要先关闭图形界面。
关闭图形界面:

sudo service lightdm stop

卸载当前版本的显卡驱动:《卸载nvidia显卡驱动》

结论:我们在做多CUDA版本管理时,需要将多个CUDA版本安装到"/usr/local/"下,通过软链接切换。在涉及显卡驱动的更换时,我们需要将多个对应的显卡驱动安装文件,放到本地,随时准备安装这个版本的驱动。

如何获得对应CUDA版本的显卡驱动?答:直接运行CUDA runfile(即上文提到的cuda_11.3.0_465.19.01_linux.run),我们可以看到对应的nvidia驱动版本,然后到网上search对应的NVIDIA-Linux-x86_64-xxxx.run运行即可。当然,这一步也需要研究一下本机显卡的是否支持这个版本的驱动。
操作过程如下:

sudo chmod a+x NVIDIA-Linux-x86_64-465.19.01.run # 变成可执行文件
sudo ./NVIDIA-Linux-x86_64-465.19.01.run  --no-opengl-files # 执行安装

有一种说法(ChatGPT也这么说):

新版本的驱动会兼容老版本的CUDA。所以理论上我们安装一个最新的nvidia driver,就可以通过软链接来切换CUDA使用。我目前用这种方法,没出现太大的问题,仅供参考~

本文全部由本人整理,转发请询得同意,有问题欢迎留言交流~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/16947.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

XShell免费版的安装配置

官网下载 https://www.xshell.com/zh/free-for-home-school/ 下载地址 通过邮箱验证 新建会话 通过ssh登录树莓派 填写主机IP 点击用户身份验证 成功连接

hadoop基础之MapReduce的学习

hadoop基础之MapReduce的学习 MapReduce的执行步骤: 1.Map package com.shujia.mr.worcount;import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapp…

24校招总结

个人背景 本科:三本通信专业 硕士:B区双非计算机硕 今年2月签了东南沿海二线城市某公司C游戏服务端开发 我同学大部分都是去电网,大专老师,气象局事业编……就我这个是纯牛马了。 离收到Offer3个月了,前段时间参加…

高项案例分析知识点总结

文章目录 纠错题计算题进度估算成本管理立项管理版本管理组合管理知识产权信息技术计算题运筹学 纠错题 人:人员经验、能力、数量、缺少培训;自己一个人完成需求和计划不正确流程:先做什么,后做什么,流程是否正确。是…

前端基础入门三大核心之JS篇:掌握数字魔法 ——「累加器与累乘器」的奥秘籍【含样例代码】

前端基础入门三大核心之JS篇:掌握数字魔法 ——「累加器与累乘器」的奥秘籍 🧙‍♂️ 基础概念:数字的魔杖与炼金术累加器(Accumulator)累乘器(Multiplier) 📚 实战演练:…

c++ (命名空间 字符串)

思维导图&#xff1a; 定义自己得命名空间myspace,在myspace中定义string类型变量s1,再定义一个函数完成字符串逆置 #include <iostream> #include <cstring> //定义自己得命名空间myspace,在myspace中定义string类型变量s1,再定义一个函数完成字符串逆置 using n…

抽屉网关停,Digg类网站退出互联网舞台

关注卢松松&#xff0c;会经常给你分享一些我的经验和观点。 别人我不清楚&#xff0c;至少在松松我心中&#xff1a;抽屉网是世界著名的网站&#xff0c;而近期抽屉新热榜突然宣布关站了&#xff0c;我内心充满遗憾。因为抽屉网站收集的内容&#xff0c;让我看到了更大的世界…

【算法】合并k个已排序的链表

✨题目链接&#xff1a; NC51 合并k个已排序的链表 ✨题目描述 合并 k 个升序的链表并将结果作为一个升序的链表返回其头节点。 数据范围&#xff1a;节点总数 0≤&#x1d45b;≤50000≤n≤5000&#xff0c;每个节点的val满足 ∣&#x1d463;&#x1d44e;&#x1d459;∣&…

【学习记录】服务器转发使用tensorboard

场景 代码在服务器上运行&#xff0c;想使用tensorboard查看训练的过程。 但是服务器上不能直接访问地址&#xff0c;所以要转发端口到本地&#xff0c;从而在本地网页中能够打开tensorboard。 参考&#xff1a;https://zhuanlan.zhihu.com/p/680596384 这时我们需要建立本地…

C++ 函数模板与模板函数

一 代码重用技术 函数 类与对象 继承与派生 多态&#xff08;函数重载、运算符重载、虚函数、纯虚函数与抽象类&#xff09; 泛型程序设计 通用的代码需要补受数据类型的影响&#xff0c;并且可以自动适应数据类型的变化&#xff0c;这种程序设计类型称为泛型程序设计。 二 模…

Logstash笔记

目录​​​​​​​ 一、简介 二、单个输入和输出插件 三、多个输入和输出插件 四、pipeline结构 五、队列和数据弹性 六、内存队列 七、持久化队列 八、死信队列 (DLQ) 九、输入插件 1)、beats 2)、dead_letter_queue 3)、elasticsearch 4)、file 5)、redis 十、…

字符串和字符串函数(1)

前言&#xff1a; 字符串在C语言中比较特别&#xff0c;没有单另的字符串类型&#xff0c;想要初始化字符串必须用字符变量的数组初始化&#xff0c;但是在C语言标准库函数中提供了大量能对字符串进行修改的函数&#xff0c;比如说可以实现字符串的的拷贝&#xff0c;字符串的追…

经常碰到的20个等待事件

经常碰到的20个等待事件 oracle等待事件简介 DBA团队维护的部分应用运行在oracle数据库平台&#xff0c;为及时了解数据库的运行情况&#xff0c;需要建立涵盖各个维度的监控体系&#xff0c;包括实例状态、空间使用率、ORA错误等数十项监控指标。这其中有一个有效判断数据库…

PY32F002A单片机 us 延时,非常惊讶

先说结论&#xff0c;这个型号&#xff0c;运算速度 慢&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01; 测试1 volatile uint32_t delay 1000;/* 初始化所有外设&#xff0c;Flash接口&#xff0c;SysTick *…

Nodejs+Websocket+uniapp完成聊天

前言 最近想做一个聊天&#xff0c;但是网上的很多都是不能实现的&#xff0c;要么就是缺少代码片段很难实现websocket的链接&#xff0c;更别说聊天了。自己研究了一番之后实现了这个功能。值得注意的是&#xff0c;我想在小程序中使用socket.io&#xff0c;不好使&#xff0…

从0.1nm到1mm:显微测量仪在抛光至粗糙表面测量中的技术突破

显微测量仪是纳米级精度的表面粗糙度测量技术。它利用光学、电子或机械原理对微小尺寸或表面特征进行测量&#xff0c;能够提供纳米级甚至更高级别的测量精度&#xff0c;这对于许多科学和工业应用至关重要。 在抛光至粗糙表面测量中&#xff0c;显微测量仪器具有从0.1nm到1mm…

java:程序包javax. servLet不存在

一.原因 1.项目Tomcat 服务器依赖未导入 2.项目的 SDK 版本选择错误 二.解决方法 方案一&#xff1a; 1.选择项目结构选项 2.导入Tomcat依赖 把tomcat里面的【jsp-api.jar】和【servlet-api.jar】这两个包导入 方案二&#xff1a; 1.选择项目结构选项 2.选择自己的jdk版本…

Kubernates-dashbord-安装

生成证书 openssl req -x509 -nodes -days 365 -newkey rsa:2048 -keyout kube-dashboard.key -out kube-dashboard.crt -subj "/CNdashboard.kube.com/Okubernetes.dashboard.domain.com" kubectl create secret tls dashboard-tls --key kube-dashboard.key --cert…

Golang | Leetcode Golang题解之第108题将有序数组转换为二叉搜索树

题目&#xff1a; 题解&#xff1a; func sortedArrayToBST(nums []int) *TreeNode {rand.Seed(time.Now().UnixNano())return helper(nums, 0, len(nums) - 1) }func helper(nums []int, left, right int) *TreeNode {if left > right {return nil}// 选择任意一个中间位置…

「动态规划」删除并获得点数

力扣原题链接&#xff0c;点击跳转。 给你一个整数数组nums。每次操作&#xff0c;可以删除任意一个值n&#xff0c;接着获得点数n&#xff0c;并同时删除所有的n-1和n1。你最多能获取多少点数&#xff1f; 这个问题的解法相当巧妙。我们可以把问题先转化一下。用类似计数排序…