linux支持vGPU方案

1,查询gpu型号:lspci | grep "NVIDIA\|VGA"

PCI Devices

2,下载驱动

官方驱动 | NVIDIA

3,安装

sudo sh NVIDIA-Linux-x86_64-440.118.02.run -no-x-check -no-nouveau-check -no-opengl-files

参数说明:

-no-x-check   #安装驱动时关闭X服务

-no-nouveau-check   #安装驱动时禁用nouveau

-no-opengl-files   #只安装驱动文件,不安装OpenGL文件

4,查询GPU信息:nvidia-smi

5,nvidia-docker2安装

5.1 centos 在线安装
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \&& curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
yum install -y nvidia-docker2
5.2 ubuntu 在线安装
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update && sudo apt-get install -y nvidia-docker25.3 离线安装
安装包位置:base/nvidia-docker2.tar.gz5.3 配置/etc/docker/daemon.json【注意IP配置】

{
"runtimes": {
"nvidia": {
"path": "nvidia-container-runtime",
"runtimeArgs": []
}
},
"default-runtime": "nvidia",
"insecure-registries": ["IP:5000"],
"registry-mirrors": ["USTC Open Source Software Mirror"]
}

5.4  重启docker:systemctl restart docker

6,vgpu插件安装【单张GPU跳过此步骤】

6.1 helm repo add vgpu-charts https://4paradigm.github.io/k8s-vgpu-scheduler
6.2 helm install vgpu vgpu-charts/vgpu --set scheduler.kubeScheduler.imageTag=v1.19.9 -n kube-system 

6.3 查看插件 
kubectl get pods -n kube-system

7,其他相关配置

7.1 节点添加lable

问题处理:nvidia部分模块已经加载内核中的问题

ERROR: An NVIDIA kernel module ‘nvidia-uvm‘ appears to already be loaded in your kernel_an nvidia kernel module 'nvidia-uvm' appears to al-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/3988.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

面试:finalize

一、概述 将资源释放和清理放在finalize方法中非常不好,非常影响性能,严重时甚至会引起OOM(Out Of Memory),从Java9开始就被标注为Deprecated,不建议被使用了。 二、两个重要的队列 1、unfinalized 队列 当…

面向对象开发技术(第三周)

回顾 上一堂课主要学习了面向对象编程与非面向对象编程(面向功能、过程编程),本节课就重点来看看面向对象编程中的一个具体思想——抽象 面向对象编程的特性:1、封装性 2、继承性 3、多态性 封装:意味着提供服务接口…

基于自注意力机制的长短期记忆神经网络(LSTM-SelfAttention)的回归预测

提示:MATLAB版本需要R2023a以上 基于自注意力机制的长短期记忆神经网络(LSTM-SelfAttention)是一种用于时序数据预测的模型。这个模型结合了两个不同的结构,即长短期记忆网络(LSTM)和自注意力机制&#xff…

备考2024年小学生古诗文大会:做做10道历年真题和知识点(持续)

根据往年的安排,2024年上海市小学生古诗文大会预计还有一个月就将启动。我们继续来随机看10道往年的上海小学生古诗文大会真题,这些题目来自我去重、合并后的1700在线题库,每道题我都提供了参考答案和独家解析。 根据往期的经验,只…

docker使用,安装go和centos7

一、安装docker 二、使用docker 1、下载镜像centos docker pull centos:7.2.1511 2、查看容器 docker ps -a 3、创建容器,创建后 状态:CREATE docker create -it centos:7.2.1511 /bin/bash 4、启动容器 (先查看容器id启动 CONTAINER…

【C++】类和对象⑤(static成员 | 友元 | 内部类 | 匿名对象)

🔥个人主页:Forcible Bug Maker 🔥专栏:C 目录 前言 static静态成员 友元 友元函数 友元类 内部类 匿名对象 结语 前言 本篇主要内容:类和对象的一些知识点补充,包括static静态成员,友…

HashSet的源码剖析和static,final的作用

一、HashSet源码简析 HashSet 是 Java 集合框架中的一个重要类,它实现了 Set 接口,用于存储不重复的元素。HashSet 内部实际上是通过 HashMap 来实现的,其中每个元素都是 HashMap 的一个键,而值则是一个固定的对象(通…

STM32的Flash读写保护

参考链接 STM32的Flash读写保护,SWD引脚锁的各种解决办法汇总(2020-03-10)-腾讯云开发者社区-腾讯云 (tencent.com)https://cloud.tencent.com/developer/article/1597959 STM32系列芯片Flash解除写保护的办法 - 知乎 (zhihu.com)https://zh…

调度问题变形的贪心算法分析与实现

调度问题变形的贪心算法分析与实现 一、问题背景与算法描述二、算法正确性证明三、算法实现与分析四、结论 一、问题背景与算法描述 带截止时间和惩罚的单位时间任务调度问题是一个典型的贪心算法应用场景。该问题的目标是最小化超过截止时间导致的惩罚总和。给定一组单位时间…

通过idea插件一键将jar包发布到阿里云服务器部署

通过idea插件一键将jar包发布到阿里云服务器部署_idea发包工具-CSDN博客

【AIGC调研系列】大型语言模型如何减少幻觉生成

在解读大型语言模型(LLMs)中的长格式事实性问题时,我们首先需要认识到这些模型在生成内容时可能会产生与既定事实不一致的情况,这种情况通常被称为“幻觉”[2][3]。这种现象不仅可能导致信息的误传,还可能对社会造成误…

责任链模式的应用

设计模式责任链模式 责任链模式介绍 概述 责任链模式是一种行为型模式。责任链模式里,很多对象由每一个对象对其下家的引用而连接起来形成一条链。请求在这个链上传递,直到链上的某一个对象决定处理此请求。发出这个请求的客户端并不知道链上的哪一个对象最终处理这个请求…

使用nssm把批处理(.bat)文件设置为Windows 服务

本文以canal为例 使用nssm把批处理(.bat)文件设置为Windows 服务 下载 nssm: 前往 nssm 官方网站 下载适用于系统的 nssm 工具。 安装 nssm: 将下载的 nssm 压缩文件解压缩到一个合适的位置,如 D:\nlc\6.Canal-1.1.5\nssm-2.24\win64\nss…

【每日一题】补档 CF1065 C. Make It Equal | 思维 | 中等

题目内容 原题链接 给定一个长度为 n n n 的数组 a a a ,每次操作可以选择一个数 x x x ,将所有大于 x x x 的数都下降为 x x x ,一次操作的下降总代价为 s s s ,要求 s ≤ k s\leq k s≤k ,问需要多少次操作使…

深度学习运算:CUDA 编程简介

一、说明 如今,当我们谈论深度学习时,通常会将其实现与利用 GPU 来提高性能联系起来。GPU(图形处理单元)最初设计用于加速图像、2D 和 3D 图形的渲染。然而,由于它们能够执行许多并行操作,因此它们的实用性…

kafka启动报错(kafka.common.InconsistentClusterIdException)

文章目录 前言kafka启动报错(kafka.common.InconsistentClusterIdException)1. 查找日志2. 定位问题/解决 前言 如果您觉得有用的话,记得给博主点个赞,评论,收藏一键三连啊,写作不易啊^ _ ^。   而且听说点赞的人每天的运气都不…

SpringCloud系列(17)--将服务消费者Consumer注册进Zookeeper

前言:在上一章节中我们把服务提供者Provider注册进了Zookeeper,而本章节则是关于如何将服务消费者Consumer注册进Zookeeper 1、再次创建一个服务提供者模块,命名为consumerzk-order80 (1)在父工程下新建模块 (2)选择模块的项目类型为Maven并…

稳态视觉诱发电位 (SSVEP) 分类学习系列 (4) :Temporal-Spatial Transformer

稳态视觉诱发电位分类学习系列:Temporal-Spatial Transformer 0. 引言1. 主要贡献2. 提出的方法2.1 解码的主要步骤2.2 网络的主要结构 3. 结果和讨论3.1 在两个数据集下的分类效果3.2 与基线模型的比较3.3 消融实验3.4 t-SNE 可视化 4. 总结欢迎来稿 论文地址:http…

【后端学习笔记·Golang】手机短信验证

文章目录 手机号码验证前置准备开通阿里云sms服务获取AccessKey并下载sdk 生成随机验证码将验证码发送到用户手机接口发送验证码校验验证码 手机号码验证 流程: 接收用户请求后生成随机验证码,并将验证码存入Redis中,并设置TTL通过阿里云sd…

Qt : 实现串口的同步和异步读写消息

一、同步/异步 在串口通信中,同步和异步读写消息是两种常见的通信模式。下面简要介绍它们的区别和示例: 同步读写消息 同步读写:在同步通信中,发送方发送数据后会等待接收方的响应,直到接收到响应后才继续执行后续操…