文本模式下成功。ubuntu P104成功。

https://www.nvidia.com/en-us/drivers/details/226760/

你下载的 NVIDIA-Linux-x86_64-470.256.02.run 是 NVIDIA 提供的二进制驱动程序安装文件。以下是详细的步骤,帮助你正确安装这个驱动程序。

1. 备份现有驱动(可选)

在安装新驱动之前,建议备份现有的 NVIDIA 驱动程序配置:

sudo cp -r /etc/modprobe.d/nvidia* /etc/modprobe.d/nvidia-backup/
sudo cp -r /lib/firmware/nvidia* /lib/firmware/nvidia-backup/

2. 禁用 Nouveau 驱动

Nouveau 是 Linux 的开源 NVIDIA 显卡驱动,默认情况下可能会与专有的 NVIDIA 驱动冲突。禁用 Nouveau 可以避免冲突。

创建或编辑 /etc/modprobe.d/blacklist-nouveau.conf 文件:
echo "blacklist nouveau" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf
echo "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf
更新 initramfs:
sudo update-initramfs -u

3. 停止图形界面(如果需要)

如果你正在使用图形界面(如 GNOME、KDE 等),建议切换到文本模式以避免安装过程中出现问题。你可以通过以下命令切换到文本模式:

sudo systemctl set-default multi-user.target
sudo reboot

重启后,系统将启动到文本模式。你可以通过 Ctrl + Alt + F2Ctrl + Alt + F6 切换到其他 TTY。

4. 下载并验证驱动文件

确保你已经下载了 NVIDIA-Linux-x86_64-470.256.02.run 文件,并且它位于当前目录中。你可以使用 sha256summd5sum 来验证文件完整性(如果有提供校验和)。

5. 安装驱动程序

.run 文件执行权限,并运行安装脚本:

chmod +x NVIDIA-Linux-x86_64-470.256.02.run
sudo ./NVIDIA-Linux-x86_64-470.256.02.run

在安装过程中,你会看到一个基于文本的安装向导。按照提示进行操作:

  • 接受许可协议:按 Tab 键选择 Accept 并按回车键。
  • 是否安装 32 位兼容库:根据需要选择(通常选择 Yes)。
  • 是否安装符号链接:选择 Yes
  • 是否注册 DKMS 模块:选择 Yes(如果支持)。
  • 是否安装 CUDA 工具包:根据需要选择(通常选择 No,除非你需要 CUDA)。

6. 完成安装

安装完成后,重启计算机以使更改生效:

sudo reboot

7. 验证安装

重启后,验证 NVIDIA 驱动是否正确安装并加载:

nvidia-smi

你应该会看到类似以下的输出,表明驱动已成功安装:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.256.02   Driver Version: 470.256.02   CUDA Version: 12.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   37C    P8     9W /  N/A |      0MiB /  8192MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

8. 检查 PyTorch 和 CUDA 版本匹配

确保 PyTorch 和 CUDA 版本匹配。你可以通过以下命令检查 PyTorch 是否能检测到 GPU:

import torch
print(f"PyTorch version: {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")
print(f"CUDA version: {torch.version.cuda}")

如果 CUDA available 返回 True,则说明问题已经解决。

总结

通过以上步骤,你应该能够成功安装 NVIDIA-Linux-x86_64-470.256.02.run 驱动程序,并确保其正常工作。如果遇到任何问题,请查阅 NVIDIA 的官方文档或社区论坛获取更多帮助。

根据你提供的信息,NVIDIA 安装程序检测到内核模块 nvidia-drm 已经加载,这可能是由于某些程序正在使用 GPU,或者内核配置不支持模块卸载。以下是解决此问题的步骤:

1. 停止使用 GPU 的服务和进程

确保没有程序或服务在使用 GPU。常见的服务包括 X 服务器、CUDA 程序、NVIDIA Persistence Daemon 等。

停止 X 服务器(图形界面)

如果你正在使用图形界面,可以切换到文本模式并停止 X 服务器:

sudo systemctl set-default multi-user.target
sudo systemctl isolate multi-user.target

或者直接重启到文本模式:

sudo reboot

重启后,系统将启动到文本模式。你可以通过 Ctrl + Alt + F2Ctrl + Alt + F6 切换到其他 TTY。

停止 NVIDIA Persistence Daemon

如果 Persistence Daemon 正在运行,停止它:

sudo systemctl stop nvidia-persistenced
查找并终止其他 CUDA 或 GPU 进程

查找并终止所有可能使用 GPU 的进程:

fuser -v /dev/nvidia*

如果有任何进程正在使用 GPU,终止它们:

sudo killall -9 <process_name>

例如:

sudo killall -9 Xorg
sudo killall -9 nvidia-smi

2. 卸载现有驱动

确保现有驱动已完全卸载:

sudo apt-get purge nvidia*

清理残留配置:

sudo rm /etc/modprobe.d/blacklist-nouveau.conf
sudo update-initramfs -u

3. 禁用 Nouveau 驱动

禁用 Nouveau 可以避免冲突。

创建或编辑 /etc/modprobe.d/blacklist-nouveau.conf 文件:
echo "blacklist nouveau" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf
echo "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf

更新 initramfs:

sudo update-initramfs -u

4. 强制卸载内核模块

有时需要强制卸载内核模块。你可以尝试以下命令:

sudo modprobe -r nvidia_drm
sudo modprobe -r nvidia_modeset
sudo modprobe -r nvidia_uvm
sudo modprobe -r nvidia

如果这些命令失败,说明模块正在被使用或内核不支持卸载。

5. 重启计算机

如果上述方法无法解决问题,最简单的办法是重启计算机:

sudo reboot

重启后,再次尝试安装 NVIDIA 驱动程序。

6. 使用 --uninstall 选项重新安装

在重启后,使用 --uninstall 选项重新安装驱动程序,以确保旧版本完全清除:

sudo ./NVIDIA-Linux-x86_64-470.256.02.run --uninstall
sudo ./NVIDIA-Linux-x86_64-470.256.02.run

7. 检查安装结果

安装完成后,验证 NVIDIA 驱动是否正确安装并加载:

nvidia-smi

你应该会看到类似以下的输出,表明驱动已成功安装:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.256.02   Driver Version: 470.256.02   CUDA Version: 12.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   37C    P8     9W /  N/A |      0MiB /  8192MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

总结

通过以上步骤,你应该能够解决 nvidia-drm 内核模块已经加载的问题,并成功安装新的 NVIDIA 驱动程序。如果问题仍然存在,请查阅 NVIDIA 的官方文档或社区论坛获取更多帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/64994.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

把riscv32位系统弄懂1:riscv32 CPU指令学习

Riscv手册 首先下载手册&#xff1a;文件下载----中国开放指令生态(RISC-V)联盟 从这个页面下载riscv-spec-v2.1中文版 也可以下载中科大的这本&#xff1a;RISC-V手册 Riscv32指令集包括基础指令集和一些扩展指令集&#xff0c;比如在ESP32C3技术手册中&#xff0c;写到E…

全国消费水平系统|Java|SSM|JSP|

【技术栈】 1⃣️&#xff1a;架构: B/S、MVC 2⃣️&#xff1a;系统环境&#xff1a;Windowsh/Mac 3⃣️&#xff1a;开发环境&#xff1a;IDEA、JDK1.8、Maven、Mysql5.7 4⃣️&#xff1a;技术栈&#xff1a;Java、Mysql、SSM、Mybatis-Plus、JSP、jquery,html 5⃣️数据库可…

达梦数据库-读写分离集群部署

读写分离集群部署 读写分离集群由一个主库以及一个或者多个(最多可以配置 8 个)实时备库组成&#xff0c;基于实时归档实现的高性能数据库集群&#xff0c;不但提供数据保护、容灾等数据守护基本功能&#xff0c;还具有读写操作自动分离、负载均衡等特性。同时可以配置确认监视…

【ALGC】探秘 ALGC—— 卓越数据处理能力的科技瑰宝

我的个人主页 我的领域&#xff1a;人工智能篇&#xff0c;希望能帮助到大家&#xff01;&#xff01;&#xff01;&#x1f44d;点赞 收藏❤ 在大数据时代&#xff0c;如何高效地处理和分析海量数据是一个核心挑战。ALGC&#xff08;Advanced Learning and Generalized Comp…

docker仓库用户认证

保证实验环境纯净删除启动的docker 1.安装建立认证文件的工具包 [rootlocalhost ~]# yum install httpd-tools -y 2.创建目录存放认证文件 [rootlocalhost ~]# mkdir auth [rootlocalhost ~]# htpasswd -Bc auth/.htpasswd lee #-B 强制使用最安全加密方式&#xff0c;默认用m…

(OCPP服务器)SteVe编译搭建全过程

注意&#xff1a;建议使用3.6.0&#xff0c;我升级到3.7.1&#xff0c;并没有多什么新功能&#xff0c;反而电表的实时数据只能看到累计电能了&#xff0c;我回退了就正常&#xff0c;数据库是兼容的&#xff0c;java版本换位java11&#xff0c;其他不变就好 背景&#xff1a;…

【IMU:视觉惯性SLAM系统】

视觉惯性SLAM系统简介 相机&#xff08;单目/双目/RGBD)与IMU结合起来就是视觉惯性&#xff0c;通常以单目/双目IMU为主。 IMU里面有个小芯片可以测量角速度与加速度&#xff0c;可分为6轴(6个自由度)和9轴&#xff08;9个自由度&#xff09;IMU&#xff0c;具体的关于IMU的介…

Linux 基本使用和程序部署

1. Linux 环境搭建 1.1 环境搭建方式 主要有 4 种&#xff1a; 直接安装在物理机上。但是Linux桌面使用起来非常不友好&#xff0c;所以不建议。[不推荐]。使用虚拟机软件&#xff0c;将Linux搭建在虚拟机上。但是由于当前的虚拟机软件(如VMWare之类的)存在一些bug&#xff…

c++------------------函数

函数定义 语法格式 函数定义包括函数头和函数体。函数头包含返回类型、函数名和参数列表。函数体是用花括号{}括起来的代码块&#xff0c;用于实现函数的功能。例如&#xff0c;定义一个计算两个整数之和的函数&#xff1a; int add(int a, int b) {return a b; }这里int是返回…

如何在centos系统上挂载U盘

在CentOS上挂载NTFS格式的U盘,需要执行一系列步骤,包括识别U盘设备、安装必要的软件、创建挂载点,并最终挂载U盘。以下是在CentOS上挂载NTFS格式U盘的详细步骤: 一、准备工作 确认CentOS版本: 确保你的CentOS系统已经安装并正常运行。不同版本的CentOS在命令和工具方面可能…

不同路径

不同路径 一个机器人位于一个 m x n 网格的左上角 &#xff08;起始点在下图中标记为 “Start” &#xff09;。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角&#xff08;在下图中标记为 “Finish” &#xff09;。 问总共有多少条不同的路径&#xff…

C++打造局域网聊天室第十课: 客户端编程及数据发送

文章目录 前言一、补充内容&#xff0c;设置显示框换行二、客户端编程三、封装消息发送函数四、所处的身份状态总结 前言 C打造局域网聊天室第十课&#xff1a; 客户端编程及数据发送 一、补充内容&#xff0c;设置显示框换行 编辑框的显示内容默认是不会换行的&#xff0c;这…

理解神经网络

神经网络是一种模拟人类大脑工作方式的计算模型&#xff0c;是深度学习和机器学习领域的基础。 基本原理 神经网络的基本原理是模拟人脑神经系统的功能&#xff0c;通过多个节点&#xff08;也叫神经元&#xff09;的连接和计算&#xff0c;实现非线性模型的组合和输出。每个…

记Fastjson2的一个报ConcurrentModificationException的bug

错误背景&#xff1a;fastjson2的parseObject方法&#xff0c;在spring webflux项目中被调用&#xff0c;有时会报java.util.ConcurrentModificationException错误。报错处的代码如下图&#xff1a; 改了半天与并发安全相关的代码&#xff0c;还是会报此错误。后来改变思路搜…

智慧仓储可视化视频监控智能监管系统解决方案

一、背景与需求 对于现在很多大型工厂或者物流基地来说&#xff0c;仓库无疑是存放物品的重点场所。仓储存放着大量货物&#xff0c;同时存在大量的辅助设备&#xff0c;需要进行全方位的监管&#xff0c;以避免发生安全事故&#xff0c;造成财产损失。原有的人工巡检方式已无法…

信息安全管理与评估赛题第9套

全国职业院校技能大赛 高等职业教育组 信息安全管理与评估 赛题九 模块一 网络平台搭建与设备安全防护 1 赛项时间 共计180分钟。 2 赛项信息 竞赛阶段 任务阶段 竞赛任务 竞赛时间 分值 第一阶段 网络平台搭建与设备安全防护 任务1 网络平台搭建 XX:XX- XX:XX 50 任务2…

五分钟学会如何在GitHub上自动化部署个人博客(hugo框架 + stack主题)

上一篇文章&#xff1a; 10分钟学会免费搭建个人博客&#xff08;Hugo框架 stack主题&#xff09; 前言 首先&#xff0c;想要实现这个功能的小伙伴需要完成几个前置条件&#xff1a; 有一个GitHub账号安装了git&#xff0c;并可以通过git推送commit到GitHub上完成第一篇文章…

各种电机原理介绍

1&#xff0c;直流电机 &#xff08;1&#xff09;基本原理 直流电动机由直流电驱动电池或外部电源为其供电。在最简单的直流电动机中&#xff0c;定子为永磁体(即红蓝磁体外壳)&#xff0c;转子是一个电磁体(即线圈)&#xff0c;电流通过碳刷和一个换向器作用于转动的线圈。…

Etcd注册中心基本实现

Etcd入门 什么是Etcd GitHub&#xff1a;https://github.com/etcd-io/etcd Etcd数据结构与特性 键值对格式&#xff0c;类似文件层次结构。 Etcd如何保证数据一致性&#xff1f; 表面来看&#xff0c;Etcd支持事务操作&#xff0c;能够保证数据一致性。 底层来看&#xff0…

【数据结构练习题】栈与队列

栈与队列 选择题括号匹配逆波兰表达式求值出栈入栈次序匹配最小栈设计循环队列面试题1. 用队列实现栈。[OJ链接](https://leetcode.cn/problems/implement-stack-using-queues/solutions/)2. 用栈实现队列。[OJ链接](https://leetcode.cn/problems/implement-queue-using-stack…