大模型系列课程学习-基于2080TI-22G魔改卡搭建双卡大模型训练平台(双系统)

1.选择合适的硬件配置

再配置电脑之前,需要确认自己需要的显存大小、主板、内存条、电源、散热等核心配件。经过前期调研,选择的硬件配置如下:
(1)主板:华南X99_F8D(DDR4主板),因为需要支持双卡,综合价格等多种因素,选择了该主板,
在这里插入图片描述

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/3ebd4a0df02c4571b0fbc33e50d19274.png
(2)CPU:E5-2680V42(线程28个)价格便宜,且线程多
在这里插入图片描述
(3)内存条:16G
4 (DDR4),这里面选三星或者国产内存条均可
(4)显卡: 2080ti-22G魔改卡 *2【显卡之间nvlink连接】,一般情况,单卡全卡功耗在250W左右
在这里插入图片描述
(5)散热:散热器 4铜管 或 6铜管
(6)电源:选择了1250W的模块化电源【CPU:240W+GPU:500W+主板、散热器、风扇等,留有余量,选择大点的】
(7)电脑机箱:这里一定要根据主板和显卡大小选择,我选择的是宙斯盾的,稍微贵了一些,之前选的坦克机箱和航佳机箱都没货了。
(8)存储:NVME固态+SATA固态(分别安装windows和ubuntu系统)

2.硬件组装- X99主板安装基础硬件设施

x99主板的硬件外围图如下:
在这里插入图片描述
实物图如下:
在这里插入图片描述

2.1 CPU安装:

CPU的安装、散热器的安装可以移步至x99主板安装视频
在这里插入图片描述

2.2 显卡安装

显卡安装需要注意,建议一张一张卡的安装,先把系统点亮后再安装另一个显卡,因为显卡厚度原因,建议PCIE显卡安装为主如下图所示
在这里插入图片描述
在这里插入图片描述
显卡安装实物图如下(建议先安装一个卡,系统正常运行后再逐步添加卡):
在这里插入图片描述

2.3 电源安装(这里使用的是全模组电源,主要是方便)

在这里插入图片描述
接线示意图如下
在这里插入图片描述

3.电脑系统安装(Windows11 + ubuntu系统)

3.1windows电脑系统安装

windows系统安装比较简单,大概的步骤就是弄一个U盘,然后使用大白菜弄个启动盘,然后安装系统即可,可以参考windows系统U盘安装教程,一般购买硬盘,店家都会给你预装,想省事的话可以让店家把你预装一个,然后再自己去官网下载个系统盘,直接执行安装即可windows11安装系统
因为windows系统大家都比较熟悉,安装的时候记得自己安装在哪个硬盘即可
在这里插入图片描述
需要注意,window显卡驱动需要单独从官网下载安装,此外,因为本次使用的显卡为涡轮卡,需要设置显卡风扇速度,避免显卡过热(可以通过bios或者NVIDIA Inspector 进行设置)链接

3.2 Ubuntu系统安装

ubuntu系统安装同winodows比较类似,唯一不同的是这里的显卡驱动在安装系统时可以选择自动安装,我这里面参考的教程如下ubuntu系统安装
过程中遇到不少问题:
a.ERROR:BIOS/LEGACY BOOT OF UEFI-ONLY MEDIA
在这里插入图片描述

原因:启动盘的引导项是用于uefi模式启动,但是服务器的引导启动方式为legacy ,所以导致报错。
解决方案:重新弄启动U盘,或者查找系统安装位置是否正确,可以参考链接
b.界面无显示,系统之前已经成功,但是无显示(可能是显卡驱动安装不对)
c.主板液晶屏显示报错,相关报错码如下:
在这里插入图片描述
在这里插入图片描述
系统安装完毕后,再次安装另一个显卡和nvlink

3.3 显卡及NVLINK的设置(以ubuntu系统为例)

(1)在上述安装完双系统后,需要对显卡和nvlink的配置进行设置,确保显卡散热正常
(2)一般windows系统中NVIDIA Inspector设置风扇速度这块为灰色,无法设置,建议使用ubuntu进行设置,一般情况下代码在linux的环境下,使用更为方便
(3)显卡风扇配置
a. sudo nvidia-settings
在这里插入图片描述
b.安装完毕后打开软件,设置风扇速度为最大
在这里插入图片描述

(4)打开命令行界面,首先查看显卡是否正常:nvidia-smi
在这里插入图片描述
(5)查看nvlink连接是否正常:nvidia-smi topo -m
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/38189.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python: PyCharm 2023.1 调试

1.设断点 (行号对应的红色点,在需要设置断点的代码行与行号之间鼠标点击即可以设置) 2.shiftF9,或 altshiftf9 选择文件 或是在菜单 Run->debug "main" 或是在菜单Run->debug 选择文件 (鼠标光标放在设置第一个…

DDD学习笔记四

领域模型的构建 基础领域模型的基本组成有名称、属性、关联、职责、事件和异常 发掘领域概念3种策略: 1)学习已有系统,重用已有模型 2)使用分类标签。分类标签来源于领域,需要我们研究一些资料并做一些提炼。从采用5W…

基于elastic stack的docker-compose部署的ELK与LDAP集成

说明: ldap信息配置到es配置文件上,然后kibana读取es的配置信息 用户与角色的关系通过role_mapping.yml文件配置获取 角色与权限的关系通过elastic stack提供的DevTools或API进行维护 一、前置条件: 1.1 es已开启xpack(已开启…

DIY智能音箱:基于STM32的低成本解决方案 (附详细教程)

摘要: 本文详细介绍了基于STM32的智能音箱的设计与实现过程,包括硬件设计、软件架构、语音识别、音乐播放等关键技术。通过图文并茂的方式,结合Mermaid流程图和代码示例,帮助读者深入理解智能音箱的工作原理,并提供实际操作指导。…

汇川CodeSysPLC教程03-2-10 如何组态

大家好,我是阿凡工控分享,本期我们将调整教程的顺序,和粉丝朋友们讨论后,后续我将优先出绿旗标注的部分,便于小白水平的你循序渐进,其他水平的朋友有些需求可能要稍后了,如果有问题请见谅&#…

【Spring成神之路】一次SpringIOC源码之旅,女朋友也成为了Spring大神!

文章目录 一、前言二、前置准备三、IOC容器的使用四、Spring IOC源码解读1. prepareRefresh源码解读2. obtainFreshBeanFactory源码解读2.1 refreshBeanFactory源码解读 3. prepareBeanFactory源码解读4. postProcessBeanFactory源码解读5. invokeBeanFactoryPostProcessors源码…

计算机Java项目|基于SpringBoot的作业管理系统设计与实现

作者主页:编程指南针 作者简介:Java领域优质创作者、CSDN博客专家 、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、腾讯课堂常驻讲师 主要内容:Java项目、Python项目、前端项目、人工智能与大数据、简…

Lumos学习王佩丰Excel第三讲:查找替换定位

一、查找和替换 1、按值查找 2、按格式查找 将红色的单元格替换成黄色的单元格,其他格式同理处理。 3、是否开启单元格匹配 若不打开选项卡直接全部替换,会出现“苏州市市”的情况;加入单元格匹配的规则,检索时会以整个单元格内…

运维.Linux下执行定时任务(上:Cron简介与用法解析)

运维专题 Linux下执行定时任务(上:Cron简介与用法解析) - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite:http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAd…

AI陪伴产品的情感设计:从孤独感到恋爱感评分:9/10

本文主要阐述三个话题: 1. 市面上有哪些AI陪伴产品? 2. 我们团队要怎么做? 3. 为什么要做? 市面上有哪些陪伴类产品? Role-play(角色扮演) 在当前市场上,有不少以角色扮演为核心的…

灵魂拷问,如何应对平行志愿的天坑?

高考填报志愿实行平行志愿,关于这个概念这里不重复说,不了解平行志愿的可以百度补课,这里只说平行志愿的坑挖得实在太大了,以至于很多同学都入坑了,怎么办? ( 欢迎 评论区 咨询 and 交流....&am…

淀山湖之行随笔

我们仰望清新,但又不得不被世俗所伴。 近日上海开始进入梅雨季节,每天大大小小的雨水不断,整个环境也格外的潮湿,不过已经逐渐习惯这种气候,所谓的见怪不怪。 今日是周日,思绪好久,准备去淀山湖…

前端优化:首屏加载速度的实践

目录 目录 前言 多图片的懒加载 避免用户多次点击请求 骨架屏原理 结束语 前言 随着互联网技术的飞速发展,前端网页逐渐取代了传统客户端成为用户获取信息、进行交互的重要渠道,但是网页也有常见的弊端,比如网页首屏加载速度的快慢直接…

vant 图片放大预览(vue3)

最近在写移动端的时候要实现图片放大预览的功能,当时用的是vant,原本想的是直接用vant里面的组件来实现放大预览,后面仔细找了一下发现没有找到这个功能(可能是我没找到),后面想到了用遮罩层来实现放大预览…

捕获野生的登录页,暴改Vue3

1.实现效果 2.Vue组件 <script setup> import {onMounted} from "vue";onMounted(()>{// getAllData() }) </script><template><div class"login"><div class"form-cont"><div class"form-top"&…

全面解析自然语言处理(NLP):基础、挑战及应用前景

自然语言处理 (NLP) 简介与应用前景 自然语言处理&#xff08;NLP&#xff09;是人工智能和计算语言学的一个分支&#xff0c;致力于使计算机能够理解、解释和生成人类语言。这篇博文将深入探讨自然语言处理的基础知识、挑战、典型任务及其广泛的应用前景。 一、自然语言处理的…

Linux服务器上安装CUDA11.2和对应的cuDNN 8.4.0

一、检查 检查本机是否有CUDA工具包&#xff0c;输入nvcc -V: 如图所示&#xff0c;服务器上有CUDA&#xff0c;但版本为9.1.85&#xff0c;版本过低&#xff0c;因此博主要重装一个新的。 二、安装CUDA 1.查看服务器最高支持的CUDA版本 在命令行输入nvidia-smi查看显卡驱动…

秋招季的策略与行动指南:提前布局,高效备战,精准出击

6月即将进入尾声&#xff0c;一年一度的秋季招聘季正在热火进行中。对于即将毕业的学生和寻求职业发展的职场人士来说&#xff0c;秋招是一个不容错过的黄金时期。 秋招的序幕通常在6月至9月间拉开&#xff0c;名企们纷纷开启网申的大门。在此期间&#xff0c;求职备战是一个系…

【ai】 梳理一下yolov4及 trition部署的心路历程

yolov4是darknetv5开始逐渐采用pytorchjetson上部署darknet比较直接因此这里采用的是yolov4 版本。isarsoft/yolov4-triton-tensorrt1. 2024-06-20 : 2.17.0 在jetson4.6 上可以跑 2.17版本server 在 jetson 运行 ./tritonserver --model-repository=…/docs/examples/model_r…

2.linux操作系统CPU使用率和平均负载区别

目录 概述cpu使用率区别 结束 概述 linux操作系统CPU 使用率 和 平均负载 区别 负载高并不一定使用率高&#xff0c;有可能 cpu 被占用&#xff0c;但不干活。 cpu使用率 cpu使用率&#xff1a;cpu非空闲态运行的时间占比&#xff0c;反映cpu的繁忙程度&#xff0c;和平均负载…