大模型系列课程学习-基于2080TI-22G魔改卡搭建双卡大模型训练平台(双系统)

1.选择合适的硬件配置

再配置电脑之前,需要确认自己需要的显存大小、主板、内存条、电源、散热等核心配件。经过前期调研,选择的硬件配置如下:
(1)主板:华南X99_F8D(DDR4主板),因为需要支持双卡,综合价格等多种因素,选择了该主板,
在这里插入图片描述

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/3ebd4a0df02c4571b0fbc33e50d19274.png
(2)CPU:E5-2680V42(线程28个)价格便宜,且线程多
在这里插入图片描述
(3)内存条:16G
4 (DDR4),这里面选三星或者国产内存条均可
(4)显卡: 2080ti-22G魔改卡 *2【显卡之间nvlink连接】,一般情况,单卡全卡功耗在250W左右
在这里插入图片描述
(5)散热:散热器 4铜管 或 6铜管
(6)电源:选择了1250W的模块化电源【CPU:240W+GPU:500W+主板、散热器、风扇等,留有余量,选择大点的】
(7)电脑机箱:这里一定要根据主板和显卡大小选择,我选择的是宙斯盾的,稍微贵了一些,之前选的坦克机箱和航佳机箱都没货了。
(8)存储:NVME固态+SATA固态(分别安装windows和ubuntu系统)

2.硬件组装- X99主板安装基础硬件设施

x99主板的硬件外围图如下:
在这里插入图片描述
实物图如下:
在这里插入图片描述

2.1 CPU安装:

CPU的安装、散热器的安装可以移步至x99主板安装视频
在这里插入图片描述

2.2 显卡安装

显卡安装需要注意,建议一张一张卡的安装,先把系统点亮后再安装另一个显卡,因为显卡厚度原因,建议PCIE显卡安装为主如下图所示
在这里插入图片描述
在这里插入图片描述
显卡安装实物图如下(建议先安装一个卡,系统正常运行后再逐步添加卡):
在这里插入图片描述

2.3 电源安装(这里使用的是全模组电源,主要是方便)

在这里插入图片描述
接线示意图如下
在这里插入图片描述

3.电脑系统安装(Windows11 + ubuntu系统)

3.1windows电脑系统安装

windows系统安装比较简单,大概的步骤就是弄一个U盘,然后使用大白菜弄个启动盘,然后安装系统即可,可以参考windows系统U盘安装教程,一般购买硬盘,店家都会给你预装,想省事的话可以让店家把你预装一个,然后再自己去官网下载个系统盘,直接执行安装即可windows11安装系统
因为windows系统大家都比较熟悉,安装的时候记得自己安装在哪个硬盘即可
在这里插入图片描述
需要注意,window显卡驱动需要单独从官网下载安装,此外,因为本次使用的显卡为涡轮卡,需要设置显卡风扇速度,避免显卡过热(可以通过bios或者NVIDIA Inspector 进行设置)链接

3.2 Ubuntu系统安装

ubuntu系统安装同winodows比较类似,唯一不同的是这里的显卡驱动在安装系统时可以选择自动安装,我这里面参考的教程如下ubuntu系统安装
过程中遇到不少问题:
a.ERROR:BIOS/LEGACY BOOT OF UEFI-ONLY MEDIA
在这里插入图片描述

原因:启动盘的引导项是用于uefi模式启动,但是服务器的引导启动方式为legacy ,所以导致报错。
解决方案:重新弄启动U盘,或者查找系统安装位置是否正确,可以参考链接
b.界面无显示,系统之前已经成功,但是无显示(可能是显卡驱动安装不对)
c.主板液晶屏显示报错,相关报错码如下:
在这里插入图片描述
在这里插入图片描述
系统安装完毕后,再次安装另一个显卡和nvlink

3.3 显卡及NVLINK的设置(以ubuntu系统为例)

(1)在上述安装完双系统后,需要对显卡和nvlink的配置进行设置,确保显卡散热正常
(2)一般windows系统中NVIDIA Inspector设置风扇速度这块为灰色,无法设置,建议使用ubuntu进行设置,一般情况下代码在linux的环境下,使用更为方便
(3)显卡风扇配置
a. sudo nvidia-settings
在这里插入图片描述
b.安装完毕后打开软件,设置风扇速度为最大
在这里插入图片描述

(4)打开命令行界面,首先查看显卡是否正常:nvidia-smi
在这里插入图片描述
(5)查看nvlink连接是否正常:nvidia-smi topo -m
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/38189.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python: PyCharm 2023.1 调试

1.设断点 (行号对应的红色点,在需要设置断点的代码行与行号之间鼠标点击即可以设置) 2.shiftF9,或 altshiftf9 选择文件 或是在菜单 Run->debug "main" 或是在菜单Run->debug 选择文件 (鼠标光标放在设置第一个…

DDD学习笔记四

领域模型的构建 基础领域模型的基本组成有名称、属性、关联、职责、事件和异常 发掘领域概念3种策略: 1)学习已有系统,重用已有模型 2)使用分类标签。分类标签来源于领域,需要我们研究一些资料并做一些提炼。从采用5W…

深入解析scikit-learn中的交叉验证方法

交叉验证是机器学习中用于评估模型性能的重要技术,它可以帮助我们理解模型在未知数据上的泛化能力。scikit-learn(简称sklearn)是一个广泛使用的Python机器学习库,提供了多种交叉验证方法。本文将详细介绍scikit-learn中提供的交叉…

基于elastic stack的docker-compose部署的ELK与LDAP集成

说明: ldap信息配置到es配置文件上,然后kibana读取es的配置信息 用户与角色的关系通过role_mapping.yml文件配置获取 角色与权限的关系通过elastic stack提供的DevTools或API进行维护 一、前置条件: 1.1 es已开启xpack(已开启…

centos误删yum和python

在下载pkdg时,因为yum报错坏的解释器,然后误删了yum和python。 在下载各种版本,创建各种软连接,修改yum文件都不好使后,发现了这样一个方法:Centos: 完美解决python升级导致的yum报错问题(相信…

DIY智能音箱:基于STM32的低成本解决方案 (附详细教程)

摘要: 本文详细介绍了基于STM32的智能音箱的设计与实现过程,包括硬件设计、软件架构、语音识别、音乐播放等关键技术。通过图文并茂的方式,结合Mermaid流程图和代码示例,帮助读者深入理解智能音箱的工作原理,并提供实际操作指导。…

《每天5分钟用Flask搭建一个管理系统》第9章:API设计

第9章:API设计 9.1 RESTful API的概念 RESTful API是一种基于HTTP协议的网络服务接口设计方法,它使用标准的HTTP方法,如GET、POST、PUT、DELETE等,来执行资源的操作。 9.2 Flask-RESTful扩展的使用 Flask-RESTful是一个Flask扩…

利用队列Queue或栈Stack解决字符数组转换运算题

一、题目 给定包含特殊运算符号,$ ,转换规则如下 xy2xy3 x$y 3x2y1 其中x,y都是非负整数且优先级高于 $。 相同的特殊运算符,从左到右顺序计算。用例保证,$,左右一定存在数字,且数字不存在前导…

汇川CodeSysPLC教程03-2-10 如何组态

大家好,我是阿凡工控分享,本期我们将调整教程的顺序,和粉丝朋友们讨论后,后续我将优先出绿旗标注的部分,便于小白水平的你循序渐进,其他水平的朋友有些需求可能要稍后了,如果有问题请见谅&#…

Batch文件中的goto命令:控制流程的艺术

Batch文件,也称为批处理脚本,是Windows操作系统中用于自动化任务的一种脚本文件。在Batch脚本中,goto命令是一个至关重要的控制结构,它允许脚本跳转到指定的标签位置,从而实现循环、条件分支等复杂的控制流程。本文将详…

【Spring成神之路】一次SpringIOC源码之旅,女朋友也成为了Spring大神!

文章目录 一、前言二、前置准备三、IOC容器的使用四、Spring IOC源码解读1. prepareRefresh源码解读2. obtainFreshBeanFactory源码解读2.1 refreshBeanFactory源码解读 3. prepareBeanFactory源码解读4. postProcessBeanFactory源码解读5. invokeBeanFactoryPostProcessors源码…

Linux-C/C++开发环境常用软件安装

安装/升级 LLVM(包含clang) 安装/升级 GCC 安装/升级CMake 安装/升级 Python 升级Linux内核 安装/升级 OpenSSL

计算机Java项目|基于SpringBoot的作业管理系统设计与实现

作者主页:编程指南针 作者简介:Java领域优质创作者、CSDN博客专家 、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、腾讯课堂常驻讲师 主要内容:Java项目、Python项目、前端项目、人工智能与大数据、简…

Batch文件中使用tasklist命令:深入掌握进程监控与分析

在Windows操作系统中,tasklist命令是一个强大的工具,它允许用户查看当前运行的进程和它们的详细信息。在自动化脚本和批处理文件(Batch文件)中使用tasklist可以极大地增强对系统状态的监控能力。本文将详细介绍如何在Batch文件中使…

Lumos学习王佩丰Excel第三讲:查找替换定位

一、查找和替换 1、按值查找 2、按格式查找 将红色的单元格替换成黄色的单元格,其他格式同理处理。 3、是否开启单元格匹配 若不打开选项卡直接全部替换,会出现“苏州市市”的情况;加入单元格匹配的规则,检索时会以整个单元格内…

运维.Linux下执行定时任务(上:Cron简介与用法解析)

运维专题 Linux下执行定时任务(上:Cron简介与用法解析) - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite:http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAd…

无线通信技术在物联网中的优劣势分析

无线通信技术在物联网数据采集中的应用具有多方面的优势和局限性。 1. 优点: TPUNB: TPUNB技术以其低功耗、长距离传输和强抗干扰能力而著称,非常适合于需要远距离监控和数据采集的场景。   TPUNB支持大范围的设备部署,适用于广…

AI陪伴产品的情感设计:从孤独感到恋爱感评分:9/10

本文主要阐述三个话题: 1. 市面上有哪些AI陪伴产品? 2. 我们团队要怎么做? 3. 为什么要做? 市面上有哪些陪伴类产品? Role-play(角色扮演) 在当前市场上,有不少以角色扮演为核心的…

灵魂拷问,如何应对平行志愿的天坑?

高考填报志愿实行平行志愿,关于这个概念这里不重复说,不了解平行志愿的可以百度补课,这里只说平行志愿的坑挖得实在太大了,以至于很多同学都入坑了,怎么办? ( 欢迎 评论区 咨询 and 交流....&am…

淀山湖之行随笔

我们仰望清新,但又不得不被世俗所伴。 近日上海开始进入梅雨季节,每天大大小小的雨水不断,整个环境也格外的潮湿,不过已经逐渐习惯这种气候,所谓的见怪不怪。 今日是周日,思绪好久,准备去淀山湖…