在Centos上为Tesla T4显卡安装NVIDIA驱动以及cuda和cudnn

前期准备:

升级gcc编译环境:

查看gcc版本:

gcc -v        (centos默认好像是4.8.5版本)

升级gcc:

yum install centos-release-scl
yum install devtoolset-9-gcc*

备份旧链接创建新链接:

mv /usr/bin/gcc /usr/bin/gcc-4.8.5
mv /usr/bin/g++ /usr/bin/g++-4.8.5
ln -s /opt/rh/devtoolset-9/root/usr/bin/gcc /usr/bin/gcc
ln -s /opt/rh/devtoolset-9/root/usr/bin/g++ /usr/bin/g++
mv /usr/bin/cc /usr/bin/cc-4.8.5
mv /usr/bin/c++ /usr/bin/c++-4.8.5
ln -s /usr/bin/gcc /usr/bin/cc
ln -s /usr/bin/g++ /usr/bin/c++

安装完再看一下版本,打印:

安装与内核版本一致的kernel-devel:

查看内核版本:

uname -a

yum list | grep kernel-

如果不一致,则安装与内核版本一致的kernel-devel:

yum install "kernel-devel-uname-r == $(uname -r)"

安装完可以看到

(通常会安装在/usr/src/kernels里,里面可能有多个,后面安装显卡驱动的时候如果找不到可以指定)

重启系统:reboot

屏蔽系统自带的nouveau:

查看是否屏蔽:

lsmod | grep nouveau

如果没有输出则说明已经屏蔽,否则需要手动屏蔽;

编辑dist-blacklist.conf文件:

vi /lib/modprobe.d/dist-blacklist.conf

用#注释掉nvidiafb:#blacklist nvidiafb

添加两条:

blacklist nouveau
options nouveau modeset=0

(如果没有该文件可以直接新建一个/etc/modprobe.d/blacklist-nouveau.conf,添加这两条)

重建initramfs image:

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

dracut /boot/initramfs-$(uname -r).img $(uname -r)

重启系统 reboot

如果使用的界面centos,安装驱动时要切到使用文本模式:

查看使用模式:

systemctl get-default

关闭GUI,使用文本模式:

systemctl set-default multi-user.target

(等安装完驱动可以systemctl set-default graphical.target切回GUI)

重启系统 reboot

安装NVIDIA显卡驱动:

查看系统显卡:

lspci | grep -E "NVIDIA|VGA"

lshw -numeric -C display

查看是否安装驱动:nvidia-smi

去官网下载驱动:官方驱动 | NVIDIA

选择自己的显卡驱动:

可以查看是否支持自己的显卡,然后下载:

为驱动添加执行权限:chmod a+x NVIDIA-Linux-x86_64-550.54.15.run

安装驱动:

./NVIDIA-Linux-x86_64-550.54.15.run -no-x-check -no-nouveau-check -no-opengl-files

(不添加执行权限也可以sh NVIDIA-Linux-x86_64-550.54.15.run -no-x-check -no-nouveau-check -no-opengl-files)

如果找不到之前安装的内核可以使用参数指定:--kernel-source-path

我的/usr/src/kernels下有两个

指定参数:./NVIDIA-Linux-x86_64-550.54.15.run -no-x-check -no-nouveau-check -no-opengl-files --kernel-source-path=/usr/src/kernels/3.10.0-1160.118.1.el7.x86_64

(提示安装32位的可以自己选择安不安装)

安装完查看结果:nvidia-smi

(卸载驱动使用:./NVIDIA-Linux-x86_64-550.54.15.run --uninstall)

安装合适版本的cuda:

驱动版本和cuda版本对应关系:CUDA 12.5 Release Notes (nvidia.com)

下载对应版本的cuda:CUDA Toolkit Archive | NVIDIA Developer

选择自己的系统版本,可以下载rpm或者runfile的,看自己喜好选一个安装方法,选完系统下面自动有安装方法,照着执行就可:

还是run简单些,下载好run文件安装:

./cuda_12.4.1_550.54.15_linux.run

需要等待一会,然后显示,输入accept,然后选择install,安装;

等待安装结果,输出像下面这样:

===========
= Summary =
===========Driver:   Installed
Toolkit:  Installed in /usr/local/cuda-12.4/Please make sure that-   PATH includes /usr/local/cuda-12.4/bin-   LD_LIBRARY_PATH includes /usr/local/cuda-12.4/lib64, or, add /usr/local/cuda-12.4/lib64 to /etc/ld.so.conf and run ldconfig as rootTo uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-12.4/bin
To uninstall the NVIDIA Driver, run nvidia-uninstall
Logfile is /var/log/cuda-installer.log

通常是安装在/usr/local/cuda-12.4下,记下安装目录配置环境变量:

编辑环境变量:vi /etc/profile

添加四行:

PATH=$PATH:/usr/local/cuda-12.4/bin/
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-12.4/lib64
export PATH
export LD_LIBRARY_PATH

使配置生效:source /etc/profile

查看cuda信息:

nvcc --version

(卸载cuda,run安装的在/usr/local/cuda/bin目录下有个uninstall自带卸载程序)

安装cuDNN加速:

官网选择合适版本下载:cuDNN Archive | NVIDIA Developer

(需要申请个NVIDIA的账号下载)

下载好后,解压:tar -Jxvf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz

将解压后的include文件夹里全部文件复制到cuda目录的include里,将lib文件夹里全部文件复制到cuda的lib64里:

cp cudnn目录/include/* /usr/local/cuda-版本号/include
cp cudnn目录/lib/* /usr/local/cuda-版本号/lib64

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/21384.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

压测工具sysbench

一、安装 yum install gcc gcc-c autoconf automake make libtool bzr mysql-devel mysql libaio-devel yum remove mariadb.x86_64 mariadb-devel.x86_64 sh install-mysql.sh --installmysql --innodbbufferpoolsize2G --datadir/mysql/data --password123321 --binlogdir…

----JAVA 继承----

引言 再java中你能创造出很多的类,但如果这些类中的成员再另一个类中也要使用,那么就要用到继承来实现指定类中成员的使用了 那么也就可以写出这样的代码 再类Cat中使用了类Animal的成员,这里我们称Cat叫子类,Animal叫父类 概念…

Ubuntu22.04嵌入开发环境之NFS文件系统

近期我把Ubuntu18.04开发环境改成了22.04写一上安装过程与问题。 1.安装NFS sudo apt install nfs-kernel-server systemctl status nfs-kernel-server systemctl emable nfs-kernel-server2.创建共享目录 sudo mkdir /home/share/ sudo chmod 775 -R /home/share/3.配置NFS…

AIGC笔记--MoE模型的简单实现

1--MoE模型 MoE模型全称是混合专家模型(Mixture of Experts, MoE),其主要将多个专家神经网络模型组合成一个更大的模型。 MoE模型的核心组成有两部分:第一部分是多个专家网络模型,每个专家网络模型往往是独立的&#x…

【UE+GIS】UE5GIS CAD或shp构建3D地形

贴合地形的矢量图形实现方法 一、灰度图的制作和拉伸换算1、基于高程点集实现2、基于等高线实现3、拉伸计算 二、生成地形模型的实现方案1、3Dmax导入灰度图2、使用ArcMap/Arcpro/FME等GIS数据处理工具3、UE导入灰度图 三、地形上叠加地形渲染效果的实现方案1、贴花2、数据渲染…

日志管理:Slf4j、Log4j、LogBack与ELK实战指南

1.现代软件开发中日志的重要性 在软件开发和运维的世界里,日志管理是一项至关重要的技术。正确地记录、管理和分析日志数据,能为系统的可靠性、可维护性和安全性带来显著的好处。 1.1 日志在故障排查中的作用 日志是系统活动的详细记录。当系统发生故…

Z字形变换 ---- 模拟

题目链接 题目: 分析: 题意如图所示:如果我们按照题意, 真的实现一个矩阵, 这样做的时间和空间复杂度很高, 所以我们可以试试看找规律, 优化一下我们观察他们的下标: 如果找到下标的规律, 那么我们就不用创建矩阵, 就能找到最终结果的下一个字符是什么特殊情况, 当numRows 1…

读AI未来进行式笔记01深度学习

1. AI 1.1. AI已经发展成一门涵盖许多子领域的重要学科 1.2. 机器学习是迄今为止AI应用最成功的子领域 1.2.1. 在这个领域中,最大的技术突破就是深度学习 1.3. “人工智能”“机器学习”和“深度学习”的时候&#xff…

C语言编程技巧:深度挖掘与高效实践

C语言编程技巧:深度挖掘与高效实践 在编程的世界里,C语言以其高效、灵活和底层控制能力强等特点,一直备受开发者们的青睐。然而,要想真正掌握C语言的精髓,并编写出高效、健壮的代码,却并非易事。本文将从四…

基于STM32与TB6600的机械臂项目

基于STM32与TB6600的机械臂项目是一个涉及硬件设计、软件开发和控制算法实现的综合项目。以下是对该项目的一个简要介绍,以及一些基础的代码示例。 项目概述 1. 系统组成 STM32微控制器:作为系统的主控制器,负责处理传感器数据和控制机械臂…

Pointnet学习以及对代码的实现

由于点云不是常规数据格式,通常将此类数据转换为规则的 3D 体素网格或图像集合,然后再用神经网络进行处理。数据表示转换使生成的数据过于庞大。 PointNet是第一个直接处理原始点云的方法。只有全连接层和最大池化层,PointNet网络在推理速度…

Android串口调试ADB

在Android设备上,通过串口(通常指的是ADB,即Android Debug Bridge)来执行dumpsys命令来检查某个包(例如com.android.bluetooth)是否支持某个服务(如A2dpSinkService)是开发者或高级用…

深入理解 Python 迭代器与生成器:详细指南

迭代器和生成器是 Python 中强大的特性,用于简化代码和提高效率。它们允许我们在需要时逐步计算结果,避免一次性加载所有数据到内存中。本文将详细介绍 Python 迭代器和生成器的基本语法、命令、示例、应用场景、注意事项,并进行总结。 迭代…

Android在不同层面增加应用

1 App 应用代码一般在开发者的项目目录下,packages/apps/YourApp/,比如app/src/main/java目录下 对于系统应用,源代码可能位于packages/apps/目录下,例如packages/apps/Settings。 用户安装的应用(从Google Play或其…

代码随想录--哈希表--两数之和

题目 给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。 你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。 示例: 给定 nums [2, 7, 11, 15], t…

李廉洋:6.3黄金原油下周一开盘行情价格涨跌趋势分析及最新操作建议多空布局

黄金消息面分析:上周黄金市场的走势受到了PCE通胀数据和美联储政策预期的显着影响。尽管市场对黄金的长期看涨情绪依然存在,但短期内金价的波动性预计将持续。4月份的PCE通胀数据显示价格压力有所降温,这一结果与分析师预期一致,但…

2024年6月2日 (周日) 叶子游戏新闻

中医百科中药: 中医百科中药是一款非常强大的中药知识科普软件,该应用提供500多味中草药的文献资料,强大的搜索功能可根据功效、特点和关键词来快速查找中药,而且每味中药的图片、功效、主治、炮制方法等百科知识,可以很好的帮助你…

Pycharm SSH远程连接时出现报错,测试 SFTP 连接,连接到 ‘connect.westb.seetacloud.com‘ 失败

问题由来 很离谱!今天本来打算租借AutoDL的显卡完成一项深度学习的任务,很离谱的是同步文件夹的时候报了标题说的错。 就很莫名奇妙,一天都在网上找解决办法,结果都不对头。 其他报错 最后摸索着,在使用pycharm远程登…

SpringBoot 定时任务+Quartz

1、分部解释2、整体代码 前言: 1、定时任务技术: JDK 的 Timer, 定义多个定时任务,其中某个任务出现异常,当时整个定时任务终止。Spring Task , 不支持 持久化与分布式部署,所有任务是单线程执行…

Prism 入门01,基础

Prism 框架是支持多平台的一种MVVM框架(Model-View-ViewModel) 除了具备一些基础的属性通知绑定,命令操作,消息聚合器等功能外。还具备一些强大的功能:例如,区域,导航,会话服务,模块注入等特性。 一.如何在WPF 项目中使用Prism 框架 1.打开Visual Studio 2022,选择创…