NVidia 的 gpu 开源 Linux Kernel Module Driver 编译 安装 使用

 见面礼,动态查看gpu使用情况,每隔2秒钟自动执行一次 nvidia-smi

$ watch -n 2 nvidia-smi

1,找一台nv kmd列表中支持的 GPU 的电脑,安装ubuntu22.04

列表见 github of the kmd source code。

因为 cuda sdk 12.3支持最高到 ubuntu 22.04,故

下载 ubuntu 22.04...iso

rufus 刷U盘

重启电脑,F2F8F10F12一起按

进入 setup,修改启动顺序,选U盘第一

一步步安装好,

reboot

修改apt 国内源
为编译Linux kernel 安装软件:

sudo apt updatesudo apt upgradesudo apt install build-essential
sudo apt-get update && sudo apt-get install libncurses-dev && sudo apt-get install build-essential  && sudo apt-get install flex bison && sudo apt-get install libssl-dev && sudo apt-get install binutils && sudo apt-get install libelf-dev && sudo apt-get install openssh-server && sudo apt-get install vim && sudo apt-get install bc && sudo apt-get install dwarves && sudo apt-get install zstd
  sudo apt-get updatesudo apt-get install libssl-devsudo apt-get install binutilssudo apt-get install libelf-devsudo apt-get install dwarves

2,重新编译安装Linux kernel

sudo apt install linux-source-6.5.0

sudo apt install linux-source-6.5.0 
ls
mkdir ex_kernel_linux_debug
cd ex_kernel_linux_debug/
ls
cp /usr/src/linux-source-6.5.0.tar.bz2 ./
tar -xvjf linux-source-6.5.0.tar.bz2 
cd linux-source-6.5.0/cp /boot/config-6.5.0-44-generic ./.config
make oldconfig

编译 kernel :

$ make -j

安装 kernel :

  $ sudo make modules_install$ sudo make install$ sudo reboot

3, 安装 cuda sdk 12.3 但保留最后两步

按照nv官方步骤,先执行step1的安装

3.1 安装之前需要设置黑名单,官方指导

https://docs.nvidia.com/cuda/cuda-installation-guide-linux/#removing-cuda-toolkit-and-driver

具体操作:

复制如下:

 8.3.6. UbuntuCreate a file at /etc/modprobe.d/blacklist-nouveau.conf with the following contents:blacklist nouveauoptions nouveau modeset=0Regenerate the kernel initramfs:sudo update-initramfs -u

3.2 安装 cuda sdk step 1

操作链接:

https://developer.nvidia.com/cuda-12-3-0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=22.04&target_type=deb_local
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pinsudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600wget https://developer.download.nvidia.com/compute/cuda/12.3.0/local_installers/cuda-repo-ubuntu2204-12-3-local_12.3.0-545.23.06-1_amd64.debsudo dpkg -i cuda-repo-ubuntu2204-12-3-local_12.3.0-545.23.06-1_amd64.debsudo cp /var/cuda-repo-ubuntu2204-12-3-local/cuda-*-keyring.gpg /usr/share/keyrings/sudo apt-get updatesudo apt-get -y install cuda-toolkit-12-3

4, 使用开源代码替代step2

4.1 下载编译 NV gpu 的开源 kmd

下载:

https://github.com/NVIDIA/open-gpu-kernel-modules

git clone https://github.com/NVIDIA/open-gpu-kernel-modules.gitcd open-gpu-kernel-modulesgit checkout 545.23.06git branch

有时候下载会失败,下载下来后做好备份。或者 fork 到自己的github 账号后再clone

4.2 编译安装

make clean
make -j12
sudo make modules_install
sudo make install
sudo reboot

5,执行step 3 安装 cuda

sudo apt-get install -y cuda-drivers-545

测试:

$ nvidia-smi

$ ./vectorAdd

6,怎么验证这个kmd是从 源码安装的呢?

在开源代码中 加点printk等代码看看:

重新编译安装

$ make modules -j

$ make modules_install -j

重启电脑

$ sudo reboot

然后执行:

$ sudo dmesg

这名加载的是开源代码的ko文件。

运行APP:

备忘个链接:

Index of /XFree86/FreeBSD-x86_64/520.56.06

https://images.nvidia.com/content/pdf/nvswitch-technical-overview.pdf

https://www.amax.com/unleashing-next-level-gpu-performance-with-nvidia-nvlink/
https://www.nvidia.com/en-us/data-center/nvlink/

https://hc34.hotchips.org/assets/program/conference/day2/Network%20and%20Switches/NVSwitch%20HotChips%202022%20r5.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/48798.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

双向链表<数据结构 C版>

目录 关于链表的分类 双向链表结构体 初始化 尾插 头插 打印 判断是否为空 尾删 头删 查找 指定位置之后的插入 指定位置的删除 销毁 关于链表的分类 根据链表的三大特性,单向or双向、带头or不带头、循环or不循环,可将链表分为2*2*2&#xf…

《昇思25天学习打卡营第23天|RNN实现情感分类》

使用RNN进行情感分类:基于IMDB数据集的LSTM应用 引言 情感分析是自然语言处理(NLP)中的一个重要应用,广泛用于电影评论、社交媒体等文本数据的情感分类任务。本文将介绍如何使用递归神经网络(RNN)实现情感…

人工智能与社交变革:探索Facebook如何领导智能化社交平台

在过去十年中,人工智能(AI)技术迅猛发展,彻底改变了我们与数字世界互动的方式。Facebook作为全球最大的社交媒体平台之一,充分利用AI技术,不断推动社交平台的智能化,提升用户体验。本文将深入探…

昇思25天学习打卡营第02天|张量Tensor

这节学习的张量(Tensor)的内容进行总结 : 1、张量的概念:张量是一种多线性函数,可以表示矢量、标量和其他张量之间的线性关系。张量是MindSpore网络运算中的基本数据结构,类似于数组和矩阵。 2、可以通过直…

基于SpringBoot+Vue的校园疫情防控系统(带1w+文档)

基于SpringBootVue的校园疫情防控系统(带1w文档) 基于SpringBootVue的校园疫情防控系统(带1w文档) 主要对首页、个人中心、学生管理、疫情动态管理、知识信息管理、防疫教育管理、健康打卡管理、请假申请管理、出校登记管理、入校登记管理、核酸报告管理、交流论坛、系统管理的…

PHP 高性能框架 Workerman 凭什么能硬刚 Swoole ?

大家好,我是码农先森。 一次偶然看到了国外某机构针对 PHP 周边生态框架及扩展的性能测试排行榜,看到 Workerman 竟遥遥领先 Swoole。在我们 PHP 程序员现有的认知里,Swoole 作为一个基于 C/C 语言编写的扩展程序,性能居然落后了…

MySQL:库表操作

MySQL:库表操作 库操作查看创建字符编码集 删除修改备份 表操作创建查看删除修改 库操作 查看 查看存在哪些数据库: show databases;示例: 查看自己当前处于哪一个数据库: select database();示例: 此处由于我不处于任…

全国区块链职业技能大赛国赛考题前端功能开发

任务3-1:区块链应用前端功能开发 1.请基于前端系统的开发模板,在登录组件login.js、组件管理文件components.js中添加对应的逻辑代码,实现对前端的角色选择功能,并测试功能完整性,示例页面如下: 具体要求如下: (1)有明确的提示,提示用户选择角色; (2)用户可看…

图像分类算法概述:深度学习方法

图像分类算法概述:深度学习方法 图像分类是计算机视觉中的一个基本任务,近年来随着深度学习的发展,图像分类算法取得了巨大的进步。本文将概述主要的深度学习图像分类算法。 #mermaid-svg-hRUH32Xj8pn0L9ug {font-family:"trebuchet ms…

【MySQL-20】关于触发器,你需要知道这些——>定义(创建&查看&删除) 触发器,将变更日志插入日志表中

前言 大家好吖,欢迎来到 YY 滴MySQL系列 ,热烈欢迎! 本章主要内容面向接触过C的老铁 主要内容含: 欢迎订阅 YY滴C专栏!更多干货持续更新!以下是传送门! YY的《C》专栏YY的《C11》专栏YY的《Lin…

记录一下在Hyper-v中动态磁盘在Ubuntu中不完全用到的问题(扩展根目录)

在之前给hyper虚拟机的Ubuntu分配磁盘有20G; 后来在Ubuntu中查看磁盘发现有一个分区没用到: 贴的图片是完成扩展后的 之前这里是10G,然后有个dev/sda4的分区,也是10G,Type是Microsoft Basic Data; …

植物神经紊乱?别担心,跟我一起轻松锻炼放松吧!

🌼哈喽,小伙伴们!最近我遇到了一个小问题,就是植物神经紊乱,搞得我整个人都不好了😣。但是,我可是个爱生活、爱自己的小太阳,怎么可能轻易被打败呢?🌞 &#…

私家车位共享系统小程序的设计

管理员账户功能包括:系统首页,个人中心,用户管理,车辆信息管理,车辆类型管理,车位信息管理,订单信息管理,系统管理 微信端账号功能包括:系统首页,车辆信息&a…

分享 2 个 .NET EF 6 只更新某些字段的方法

前言 EF 更新数据时,通常情况下,是更新全部字段的,但实际业务中,更新全部字段的情况其实很少,一般都是修改其中某些字段,所以为了实现这个目标,很多程序员通常会这样作: 先从数据库…

NFT革命:数字资产的确权、营销与元宇宙的未来

目录 1、NFT:数字社会的数据确权制度 2、基于低成本及永久产权的文化发现 3、PFP:从“小图片”到“身份表达”,再到社区筛选 4、透明表达:NFT 在数字化营销中的商业价值 5、可编程性:赋予 NFT 无限可能的应用 5.…

【Vue3】组合式 API

【Vue3】组合式 API 背景简介开发环境开发步骤及源码setup 语法糖setup 扩展组件总结 背景 随着年龄的增长,很多曾经烂熟于心的技术原理已被岁月摩擦得愈发模糊起来,技术出身的人总是很难放下一些执念,遂将这些知识整理成文,以纪…

HCIP笔记[第4章-重发布+路由策略]

重发布 作用: 在两种路由协议之间,或者一个协议的不同进程之间,借助ASBR(同时工作在两种协议或者协议的不同进程中)学习到两个网络的路由信息,并且通过重发布进行路由共享,最终实现全网可达。 …

PYTHON学习笔记(四、pyhton数据结构--列表)

(1)list列表 列表的含义是指:(1)一系列的按特定顺序排列的元素组成。(2)python中内置的可变序列。(3)在python中使用[]定义列表,元素与元素之间使用英文的逗…

NNOM训练环境搭建(Windows)

目录 一、安装Anaconda 二、安装nnom编译环境 1. 创建并激活虚拟环境 2. 统一安装所有安装包 三、编译NNOM 一、安装Anaconda windows版本:Anaconda3-2019.10-Windows-x86_64.exe 勾选添加进系统环境变量,其他使用默认选项进行安装。 二、安装nnom…

pycharm报错:No module named pip/No module named pytest

1、问题概述? 今天在执行一个python脚本的时候,控制台提示:No module named pytest,就是没有pytest模块,于是我使用pip命令进行安装,命令如下; pip install pytest 结果又提示No module named pip,说我没有pip模块,没办法,再安装pip 2、安装pip-方式1 在pycharm的T…