CentOS安装NVIDIA驱动、CUDA以及nvidia-container-toolkit

0.提前准备
0.1.更新yum源(以阿里为例)
0.1.1 备份当前的yum源

mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup

0.1.2 下载新的CentOS-Base.repo 到/etc/yum.repos.d/

CentOS 5

wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-5.repo
或者
curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-5.repo

CentOS 6

wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-6.repo
或者
curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-6.repo

CentOS 7 

wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
或者
curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo

0.1.3 清空并生成缓存    

yum clean all
yum makecache

备注:
yum 会把下载的软件包和header存储在cache中(默认路径/var/cache/yum/),而不自动删除。如果觉得占用磁盘空间,可以使用yum clean指令进行清除,更精确 的用法是yum clean headers清除header,yum clean packages清除下载的rpm包,yum clean all全部清除。
———————————————————————————————————————————

1.安装依赖项

yum -y install gcc pciutils
yum -y install gcc
yum -y install gcc-c++
yum -y install make

2.查看内核版本

uname -a

3.查看显卡版本

lspci | grep -i nvidia

4.屏蔽系统自带的nouveau

(1)查看nouveau
lsmod | grep nouveau 
(2)打开blacklist.nf文件,按i或insert键进入修改模式
vi /lib/modprobe.d/dist-blacklist.conf   
(3)将nvidiafb注释掉:
#blacklist nvidiafb
(4)添加以下两句在blacklist.conf  文件中, :回到文件最底部,:w保存文件,:q退出文件
blacklist nouveau
options nouveau modeset=0

5.重建initramfs image步骤

(1)删除
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
(2)重建
dracut /boot/initramfs-$(uname -r).img $(uname -r)

6.修改运行级别为文本模式

systemctl set-default multi-user.target

7.重新启动

reboot

8.下载显卡驱动和cuda


打开链接:https://www.nvidia.cn/drivers/lookup/
下载完后,进入下载后的文件夹,在终端输入安装指令:

根据自己的显卡型号下载对应驱动,然后安装:
sudo sh NVIDIA-Linux-x86_64-550.120.run

cuda的下载,可以用wget,也可以window端下载后传入服务器:
wget https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo sh cuda_10.2.89_440.33.01_linux.run

输入accept后:
CUDA Installer
-[X] Driver
    [X] 450.51.06
+[X] CUDA Toolkit 11.0
 [X] CUDA Samples 11.0
 [X] CUDA Demo Suite 11.0
 [X] CUDA Documentation 11.0
Options
Install
直接选择install

报错:CentOS安装nvidia-container-toolkit报错:没有可用软件包

1、设置 docker-ce 存储库:

sudo yum-config-manager --add-repo=https://download.docker.com/linux/centos/docker-ce.repo

2、安装 containerd.io 包: 

sudo yum install -y https://download.docker.com/linux/centos/7/x86_64/stable/Packages/containerd.io-1.4.3-3.1.el7.x86_64.rpm


3、安装 docker-ce 软件包:

sudo yum install docker-ce -y
使用以下命令确保 Docker 服务正在运行:
sudo systemctl --now enable docker


4、设置 nvidia-container-toolkit 存储库和 GPG 密钥:

distribution=$(. /etc/os-release;echo $ID$VERSION_ID) && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
将experimental分支添加到存储库列表中:
yum-config-manager --enable libnvidia-container-experimental


5、更新包列表后安装nvidia-container-toolkit包:

sudo yum clean expire-cache
sudo yum install -y nvidia-container-toolkit

配置 Docker 守护进程以识别 NVIDIA 容器运行时:
sudo nvidia-ctk runtime configure --runtime=docker
设置默认运行时后重启Docker守护进程完成安装:
sudo systemctl restart docker

6、验证

docker run -it -d -v /home/data/jt/:/data/jt -v /etc/localtime:/etc/localtime:ro --restart always --net host --name EventDetectorV3 --gpus all jt20240711_gongsi
docker ps
docker exec -it  EventDetectorV3 bash

进入容器后:
nvidia-smi

 

备份指令记录(供参考): 

  488  mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup
  490  cd yum.repos.d/
  493  wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
  495  yum clean all
  496  yum makecache
  497  yum -y install gcc pciutils
  498  yum -y install gcc
  499  yum -y install gcc-c++
  500  yum -y install make
  501  uname -a
  502  lsmod | grep nouveau 
  503  vi /lib/modprobe.d/dist-blacklist.conf
  504  mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
  505  dracut /boot/initramfs-$(uname -r).img $(uname -r)
  506  systemctl set-default multi-user.target
  507  reboot
  508  set +o history;
  509  sh NVIDIA-Linux-x86_64-550.120.run 
  510  nvidia-smi
  511  docker
  512  docker ps
  513  ll
  514  cd jt20240731/
  515  ll
  516    cat x* >test.tar
  517  docker load -i test.tar 
  518  docker images
  519  docker ps
  534  wget https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
  535  sh cuda_10.2.89_440.33.01_linux.run 
  537  nvcc --version
  538  vi /etc/profile
  539  source /etc/profile
  540  nvcc --version
  541  yum install nvidia-container-runtime
  542  yum update
  543  yum install nvidia-container-runtime
  544  sudo yum-config-manager --add-repo=https://download.docker.com/linux/centos/docker-ce.repo
  545  sudo yum install -y https://download.docker.com/linux/centos/7/x86_64/stable/Packages/containerd.io-1.4.3-3.1.el7.x86_64.rpm
  546  sudo yum install docker-ce -y
  547  sudo systemctl --now enable docker
  548  sudo docker run --rm hello-world
  549  distribution=$(. /etc/os-release;echo $ID$VERSION_ID) && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
  550  yum-config-manager --enable libnvidia-container-experimental
  551  sudo yum clean expire-cache
  552  sudo yum install -y nvidia-container-toolkit
  553  sudo nvidia-ctk runtime configure --runtime=docker
  554  sudo systemctl restart docker
  555  docker ps
  556  docker ps -a
  557  docker rm  EventDetectorV3
  558  ll
  559  cd jt20240731/
  560  ll
  561  docker images
  562  history
  563  docker run -it -d -v /home/data/jt/:/data/jt -v /etc/localtime:/etc/localtime:ro --restart always --net host --name EventDetectorV3 --gpus all jt20240711_gongsi
  564  docker ps
  565  docker exec -it  EventDetectorV3 bash

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/881769.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ORM框架简介

什么是ORM? ORM(Object-Relational Mapping,对象关系映射)是一种编程技术,用于在关系数据库和对象程序语言之间转换数据。ORM框架允许开发者以面向对象的方式来操作数据库,而不需要编写复杂的SQL语句。简单…

【Linux】命令行下的增删查改之“查看”

致谢:Linux常用命令大全(手册) – 真正好用的Linux命令在线查询网站 提供的命令查询 头部内容获取(head) head命令的功能是显示文件开头的内容,默认值为前10行。 指令参数: -n 定义显示行数 -c 指定显示头部内容的字符数 -v 总是显示文件名的头信…

告别手动计数:智能统计模型用量,释放设计潜力

添加HanTop-MKT,免费获取统计零件数量模型 非标设备行业的设计BOM因为涉及物料采购与装配数量要求,往往面临着需要数据准确性的严格要求,在缺乏自动化工具情况下,手动统计零件用量变得更加困难,且数据准确性得不到保障…

【uniapp】设置公共样式,实现公共背景等

目录 1、 全局渐变背景色 2.1 创建common目录 2.2 在common下新建style和images等目录 2.3 在style下新建common-style.scss 2.4 common-style输入全局渐变颜色 2.5 引入样式 2.6 业务页面引入 2.7 展示 2、全局字体颜色 2.1 新建base-style.scss文件 2.2 设置base-…

07 django管理系统 - 部门管理 - 搜索部门

在dept_list.html中&#xff0c;添加搜索框 <div class"container-fluid"><div style"margin-bottom: 10px" class"clearfix"><div class"panel panel-default"><!-- Default panel contents --><div clas…

Redis 其他类型 渐进式遍历

我们之前已经学过了Redis最常用的五个类型了&#xff0c;然而Redis还有一些在特定场景下比较好用的类型 Redis最关键的五个数据类型&#xff1a; 上面的类型是非常常用&#xff0c;很重要的类型。 除此之外的其他类型不常用&#xff0c;只是在特定的场景能够发挥用处&#…

无极低码课程【java(jdk)windows下安装及环境变量配置】

在Windows环境中安装JDK 7教程 Java Development Kit (JDK) 是开发Java应用程序所必需的工具包。本教程将指导您在Windows操作系统上安装JDK 7。 准备工作 下载JDK 7安装包 访问 Oracle官方网站 下载JDK 8的安装包。选择适合您操作系统的安装包(例如 jdk-7u80-windows-x64.ex…

vmware虚拟机 报错:客户机操作系统已禁用 CPU,请关闭或重置虚拟机 的解决方法

打开cpu虚拟化全部进行勾选 ctrl e 进行关机 勾选上打开就好了 如果没有那个选项 关机>打开虚拟机>管理>更改硬件兼容性> 往小处改改> >更改此虚拟机

[LeetCode] 515. 在每个树行中找最大值

题目描述&#xff1a; 给定一棵二叉树的根节点 root &#xff0c;请找出该二叉树中每一层的最大值。 示例1&#xff1a; 输入: root [1,3,2,5,3,null,9] 输出: [1,3,9]示例2&#xff1a; 输入: root [1,2,3] 输出: [1,3]提示&#xff1a; 二叉树的节点个数的范围是 [0,10…

基于SpringBoot的个性化健康建议平台

1系统概述 1.1 研究背景 随着计算机技术的发展以及计算机网络的逐渐普及&#xff0c;互联网成为人们查找信息的重要场所&#xff0c;二十一世纪是信息的时代&#xff0c;所以信息的管理显得特别重要。因此&#xff0c;使用计算机来管理基于智能推荐的卫生健康系统的相关信息成为…

OpenTrans

比较的方法Cat-Seg不好复现

Spring 实现 3 种异步流式接口,干掉接口超时烦恼

大家好&#xff0c;我是小富&#xff5e; 如何处理比较耗时的接口&#xff1f; 这题我熟&#xff0c;直接上异步接口&#xff0c;使用 Callable、WebAsyncTask 和 DeferredResult、CompletableFuture等均可实现。 但这些方法有局限性&#xff0c;处理结果仅返回单个值。在某…

幸运7游戏模拟 python

题目&#xff1a; 幸运"7"游戏,用计算机模拟掷骰子的过程&#xff0c;测算两个骰子点数之和为7的概率。 游戏规则是你丢两个骰子&#xff0c;如果其点数之和为7你就赢4元&#xff0c;不是7你就输1元。 假设你刚开始有10元&#xff0c;当全部输掉为0元的时候游戏结…

【网络安全】1,600$:Auth0 错误配置

未经许可,不得转载。 文章目录 前言正文漏洞案例修复建议前言 Auth0 是一个广泛用于网站和应用程序的身份验证平台,负责管理用户身份并确保其服务的安全访问。该平台提供了多种工作流程,以无缝集成登录和注册流程。 在 Auth0 中创建新应用时,注册选项默认启用。当系统禁用…

Android 无Bug版 多语言设计方案!

出海业务为什么要做多语言&#xff1f; 1.市场扩大与本地化需求&#xff1a; 通过支持多种语言&#xff0c;出海项目可以触及更广泛的国际用户群体&#xff0c;进而扩大其市场份额。 本地化是吸引国际用户的重要策略之一&#xff0c;而语言本地化是其中的核心。使用用户的母语…

c语言字符函数

1&#xff0c;字符分类函数&#xff1a; 例如&#xff1a;写一个代码将字符串中的小写字母转化成大写字母 就可以用到上述islower函数判断字符是否是小写 2.字符转换函数 c语言提供了两个字符转换函数 1.int tolower (int c); //将输入进去的大写字母转化成小写 2,int …

IRP默认最小流程

IRP是Windows内核中的一种非常重要的数据结构。上层应用程序与底层驱动程序通信时&#xff0c;应用程序会发出I/O请求&#xff0c;操作系统将相应的I/O请求转换成相应的IRP&#xff0c;不同的IRP会根据类型被分派到不同的派遣例程中进行处理。 irp相当于R3下的消息&#xff0c…

rtsp协议:rtsp协议参数介绍

目的&#xff1a; 实时流协议&#xff08;RTSP&#xff09;用于建立和控制单个或多个时间同步的连续媒体流&#xff0c;例如音频和视频。RTSP 通常不负责实际传输这些连续的媒体流&#xff0c;但可以将连续媒体流与控制流进行交错传输&#xff08;参见第 10.12 节&#xff09;。…

学习Redisson实现分布式锁

官网&#xff1a;https://redisson.org/ 官方文档&#xff1a;https://redisson.org/docs/getting-started/ 官方中文文档&#xff1a;https://github.com/redisson/redisson/wiki/%E7%9B%AE%E5%BD%95 1、引入依赖 <!--redisson--> <dependency><groupId>or…

金融大数据平台总体技术

目录 金融大数据平台应用场景风险管理 场景描述解决方案​​​​​​​市场营销 ​​​​​​​场景描述解决方案​​​​​​​金融大数据信息价值链​​​​​​​金融大数据平台总体目标金融大数据平台功能技术要求​​​​​​​ ​​​​​​​概述数据接入功能要求 ​​…