服务器五大关键组件拆解分析

132426165daa6ea5f10a8f8a8e3a0b0c.jpeg

 拆解服务器五大关键组件

   

1d1f7767fc851367f1892f48f54c7033.jpeg

"AI服务器五大硬件揭秘:深入剖析PCB构造,揭示内部真实面貌。本文通过一步步拆解PCB,为读者呈现了一台服务器的内部世界,力求让您对服务器升级的潜在价值有更深的理解和把握。"

1、五大硬件部分可归纳为——GPU 板组、CPU 母板组、配件

英伟达DGX A100和DGX H100是两款具有标杆性产品力的产品。由于H100发布时间较短、资料详尽度不够,我们首先从DGX A100出发来观测具有产品力的AI服务器的基本架构。英伟达DGX A100外形类似于常见的家用主机,通过对部件构成进行深度分解,我们认为DGX A100大体上可以分为五个硬件板块。

1ee0b92b1ca965925d20f744fcde5d36.jpeg

优化后的文章如下:

从前部(Front)入手,首先映入眼帘的是风扇模组板块。DGX A100的风扇模组由8个高效风扇组成,这一设计巧妙地与传统服务器8U规格保持一致,为您的计算环境带来更强大的散热性能。

DGX A100 的硬盘和前控制台板被巧妙地安放在机箱的前部风扇模组板块下方,这款AI加速器拥有8块3.84TB的硬盘,为用户提供了高达30TB的超大内部存储空间。

您好,AI 服务器的 GPU 板组是整个服务器最为核心的组件组装区域之一,也是 AI 服务器区别于普通服务器的关键。从 DGXA100 的架构来看,GPU 板组主要包含 GPU 组件、模组板、NVSwitch 三块,这三块都会涉及到不同类型的 PCB 产品。

CPU 母板组是所有服务器的核心部件之一,其中包含 CPU 母板、系统内存、网卡、PCIE Switch 等部件。CPU 母板、系统内存、网卡是主要涉及到 PCB 用量的部分。

AI服务器的PCB价值量计算可归纳为三大部分:1. 核心GPU板组,2. 必备CPU母板组,3. 风扇、硬盘、电源等配件组。本文将详细解析这三大模块。

14f92660cfc7a8c0267c237160fb6f8a.jpeg

7e31147e6ef8f046da4bdd9d912d6d15.jpeg

2、GPU 板组:单机价值量 1.2 万,载板占比 52%、PCB 板占 48%

GPU 板组的 PCB 主要由 4 个部分组成,GPU 载板、NVSwitch、OAM、UBB。其中,GPU 载板是英伟达 A100 的 GPU 和 DRAM 采用 2.5/3D 先进封装工艺,用于承载的板材采用 70*70mm~100*100mm、14~16 层的 FCBGA 载板,数量上与 GPU 数量存在一一对应关系,按照 DGX A100 搭载 8 颗 GPU 的数量来看,1 台 AI 服务器需要用到 8 颗 GPU 载板;根据产业链调研,单颗价值量约为 100 美元,即 650 元人民币/颗,由此对应单机 GPU 载板价值量为 5200 元 。

0c8a4d9e336c265b69c5aaf4bf2bdb1f.jpeg

1) GPU 载板,英伟达 A100 的 GPU 和 DRAM 采用 2.5/3D 先进封装工艺,用于承载的板材采用 70*70mm~100*100mm、14~16 层的 FCBGA 载板,数量上与 GPU 数量存在一一对应关系,按照 DGX A100 搭载 8 颗 GPU 的数量来看,1 台 AI 服务器需要用到 8 颗 GPU 载板;根据产业链调研,单颗价值量约为 100 美元,即 650 元人民币/颗,由此对应单机 GPU 载板价值量为 5200 元。

2a9ef6c2013af60718556f985d593a32.jpeg

NVSwitch,一种基于NVLink标准的GPU间通信基础模组,其载体为载板式产品。加工性要求简单,关键在于承担大量高速数据传输任务。据产业链调研,单颗NVSwitch的价值约为30美元,即195元/颗。若A100搭载6颗NVSwitch,则单机价值量可达1170元。

38aa989a19fc65e16e674022229496ae.jpeg

3) OAM,OCP Accelerator Module,中文简称 GPU 加速卡,是用于承载 GPU 芯片的板卡,数量上看 OAM 与 GPU 存在一一对应的关系,以 DGX A100 搭载 8 个 GPU 的数量来看,1台 AI 服务器需要用到8块 OAM;面积上来看,借鉴 PCIE 版本 267.7mm*111.15mm的尺寸规格(内部 PCB 规格与外壳规格基本一致),可测算出 OAM 的面积尺寸约为0.03 平方米;

PCB 板型上来看,由于 OAM 涉及到 GPU 高速多线路信号传递,根据产业链调研,DGX A100 OAM 的 SXM 版本需要用到 20 层、Ultra Low Loss 等级 CCL 材料、4 阶 HDI 工艺,对应产品单价为 12000 元/平方米,DGX A100 OAM 的 PCIE 版本相对规格较低,只需要用到 14 层、Ultra Low Loss 和高 Tg FR4 等级 CCL 材料混压、1 阶 HDI 工艺,对应产品单价 7000 元/平方米。综合来看,如果按照 DGX A100 机型配置,高端 AI 服务器的 OAM 单价价值量将达到 2880 元。

8faf136051a0a9169a53151d45fb0502.jpeg

UBB,即Unit Baseboard,是专为搭载GPU平台设计的PCB板。每台AI服务器将配备一块UBB,据DGX A100整机底面规格和产业链调研显示,预估UBB的面积约为0.30平方米,需使用26层通孔PCB板。采用Ultra Low Loss CCL材料,单价约为10000元/平方米,对应单机价值量为3000元。

英伟达DGX A100 GPU板组包括GPU载板、NVSwitch、GPU加速卡和GPU模组板四部分,总单机PCB面积达0.624平方米,对应单机价值量为12,250元。其中,载板级别的产品占52%,单机价值量为6,370元;PCB级别的产品占48%,单机价值量为5,880元。

5f8bcba7a70b4dcdf403fc43c82cd06b.jpeg

3、CPU母板组:单机价值量2845元,载板占46%、主板占40%

CPU母板组包括:CPU载板、主板和配板。其中,功能性配板如系统内存卡、网卡、拓展卡和存储操作系统驱动板。

670be5ae9cc5f0683311597312fe6f57.jpeg

CPU载板与GPU载板规格相近,单颗CPU载板价值量100美元。若DGX搭载2颗CPU,则单机价值量约为1300元。

2)CPU 主板,主要用于承载 CPU 芯片、PCIE Switch 芯片、TPM 模组及各种功能性配板卡,该类 PCB 板的规格主要由 CPU 平台设计和总线标准,按照 DGX A100 的方案主要采用 64 核 AMD Rome 的 CPU 芯片、总线标准仍然为 PCIE 4.0,因此 CPU 主板仍然采用 10~12 层、Low Loss 等级 CCL 材料、通孔板的设计,根据产业链调研,单价约为3000 元/平方米;按照 DGX A100 的尺寸规格设计,估测 CPU 主板面积为 0.38 平方米,由此可计算 CPU 主板单机价值量为 1140 元。

根据产业链调研,功能性配板通常采用8-10层板、Mid Loss等级CCL,单价约为1500元/平方米。若参照DGX A100,面积和数量可参考该规格。

  • 英伟达DGX A100服务器配备了Mellanox ConnectX系列产品,其中包括X-7和X-6型号。标配的网卡数量为10张,包括8个单端口200Gb/s的IB和2个双端口200Gb/s以太网。据英伟达官网披露,Mellanox ConnectX-7的尺寸为68.90mm x 167.65mm。通过计算,我们可以得出单块网卡板的面积约为0.012平方米/张。
  • 在DGX A100服务器中,为了充分利用板卡摆放设计,需要添加一些拓展卡来扩展PCIe接口。由于该服务器配备了一张横置的Storage networking网卡,因此需要一张专门的拓展卡。据产业链调研显示,每张拓展卡的面积约为0.01平方米。
  • DGX A100的存储操作系统驱动板,拥有2个1.92TB M.2 NVMe系统驱动器,巧妙地设计在一张PCB板上的两面。这样独特的布局,让系统驱动板仅有1块,面积约为0.01平方米/张,实现了高性能与紧凑设计的完美结合。


上述四部分合计,功能性配板单机面积为0.27平方米,对应单机价值量约为405元。

经过综合分析,英伟达DGX A100 CPU母板组PCB用量总面积约为0.662平方米,单机价值约2845元。其中,载板级产品占46%,主板产品占40%,配板产品占14%。

7bcdcc7d0d3d868c67af92ef83c40724.jpeg

4、其他配件:单机价值量合计 226 元

除了GPU板组和CPU模板组,其他配件还包括电源、硬盘、前控制台板等。根据产业链调研,这类产品主要采用6~10层、FR4/Mid Loss等级CCL的规格,单价约为1000~1500元/平方米不等。参照DGX A100规格对用量和面积进行计算,可得出相应的成本。

DGX A100配置了6个电源,与台达电2200W服务器电源DPS-2200-AB-2型号相似。根据其73.5*265.0mm的规格,我们估计每个电源所需的PCB板面积约为0.019平方米。

dc02e2735efa54d6d896818e391f1f83.jpeg

2)DGX A100搭配8个硬盘,根据行业标准3.5英寸盘,估测单块硬盘PCB面积为0.008平方米。

3) 前控制台板:用于控制外接设备,置于8个硬盘间的一块PCB板。据产业链调研,估测面积约为0.010平方米。

经过综合分析,我们预测DGX A100整机的PCB用量面积约为1.474平方米,单机价值量为15321元。其中,GPU板组单机价值量最高,达到1.2万元,占比达80%;CPU母板组单机价值量为2845元,占比19%;其他配件单机价值量为226元,占比1%。从板级分类来看,载板级别单机价值量为7670元,占比50.1%;PCB板级单机价值量为7651元,占比49.9%。


-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/877729.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自定义开屏启动广告页

自定义开屏启动广告页 文章目录 自定义开屏启动广告页效果图简单版轮播方式css 效果图 简单版 图片 倒计时 <template><view class"guide fcc" :style"{ background: url(${ imgUrl }) no-repeat}"><view class"skip_btn" cli…

黑神话悟空,高清壁纸、原画,游戏截图

黑神话悟空&#xff0c;高清壁纸、原画&#xff0c;游戏截图&#xff1a; 链接&#xff1a;https://pan.quark.cn/s/cd17c05c4f33

c++每日练习记录4-(递归思想)

题解1迭代&#xff1a; 利用利用两个新的指针&#xff0c;一个用于保存输出的初始节点&#xff0c;另外一个用于地址的迭代指向。 ListNode *mergeTwoLists(ListNode *list1, ListNode *list2){ListNode *list_node new ListNode(0);ListNode *list_node1 list_node;while (l…

springboot中后缀匹配模式useSuffixPatternMatch、useTrailingSlashMatch的源码匹配分析

背景&#xff1a; 上篇文章&#xff0c;已经说了&#xff0c;如果我们直接debug调试没法找到源码中具体的代码&#xff0c;那么就可以通过jd-gui反编译的方式通过搜关键词的方式来找到源码中具体的位置&#xff0c;这次简单说下spring中的两种后缀匹配模式useSuffixPatternMat…

进外包,对简历是否有影响?

hello 大家好 今天来跟大家聊聊外包&#xff0c;主要是最近很多朋友私信问我&#xff0c;去外包公司会不会去自己的简历产生影响。 外包类型 我们先来聊聊外包类型&#xff1b;第一种类型&#xff0c;人头外包&#xff0c;也就是你入职的公司是没有开发岗位&#xff0c;只是把你…

机器人学——逆向运动学(机械臂)

正/逆运动学对比 求解 求解目标 Reachable workspace 与 Dexterous workspace Subspace 解的数目 多重解 解的选择 求解方法 栗子一 x,y,fai已知&#xff0c;求解theta(1,2,3)的具体数值 几何法 余弦定理定义&#xff1a;对于任意三角形ABC&#xff0c;设其三个内角分别为…

设计模式---简单工厂模式

简单工厂模式&#xff08;Simple Factory Pattern&#xff09; 是一种创建型设计模式&#xff0c;它定义了一个工厂类&#xff0c;通过这个工厂类可以创建不同类型的对象。简单工厂模式的主要目的是将对象的创建逻辑集中在一个地方&#xff0c;简化客户端的代码&#xff0c;使得…

黑神话 悟空 配置 Mac玩游戏

兄弟们&#xff0c;这次《黑神话&#xff1a;悟空》真的是全网吹爆了&#xff01;我提前开香槟拿个年度游戏好吧&#xff01;Mac玩家也不用担心&#xff0c;系统兼容工具CrossOver也在第一时间支持了《黑神话&#xff1a;悟空》&#xff0c;现在你可以直接在Mac上玩《黑神话&am…

World of Warcraft [CLASSIC] the Eye of Eternity [EOE] P1-P2

World of Warcraft [CLASSIC] the Eye of Eternity [EOE] 永恒之眼&#xff08;蓝龙&#xff09; 第一阶段 第二阶段 第三阶段 载具1-6技能介绍 World of Warcraft [CLASSIC] the Eye of Eternity [EOE]_永恒之眼 eoe-CSDN博客 永恒之眼怎么出副本呢&#xff0c;战斗结束&am…

嵌入式学习----网络通信之TCP协议通信

TCP&#xff08;即传输控制协议&#xff09;&#xff1a;是一种面向连接的传输层协议&#xff0c;它能提供高可靠性通信(即数 据无误、数据无丢失、数据无失序、数据无重复到达的通信) 适用情况&#xff1a; 1. 适合于对传输质量要求较高&#xff0c;以及传输大量数据 的通信。…

【Kubernetes】k8s集群图形化管理工具之rancher

目录 一.Rancher概述 1.Rancher简介 2.Rancher与k8s的关系及区别 3.Rancher具有的优势 二.Rancher的安装部署 1.实验准备 2.安装 rancher 3.rancher的浏览器使用 一.Rancher概述 1.Rancher简介 Rancher 是一个开源的企业级多集群 Kubernetes 管理平台&#xff0c;实…

ES+FileBeat+Kibana日志采集搭建体验

1.环境准备 需要linux操作系统&#xff0c;并安装了docker环境 此处使用虚拟机演示。&#xff08;虚拟机和docker看参考我之前写的文章&#xff09; VirtualBox安装Oracle Linux 7.9全流程-CSDN博客 VirtualBox上的Oracle Linux虚拟机安装Docker全流程-CSDN博客 简单演示搭建ES…

SpringBoot教程(二十二) | SpringBoot实现分布式定时任务之elastic-job

SpringBoot教程&#xff08;二十二&#xff09; | SpringBoot实现分布式定时任务之elastic-job 简介前置条件&#xff1a;需要ZooKeeper配合1、引入相关依赖2、application.yml中配置注册中心和作业调度巨坑&#xff08;配置修改无效&#xff09;3、job实例4、ElasticJob-UI监控…

git-20240822

目录 初始化仓库 Git init Git init project --bare 查看提交的记录 git log --prettyoneline 查看当前git远程库地址 git remote -v 查看详细提交记录 git log 撤出暂存区的文件 git reset HEAD file(.代表全部文件&#xff09; 提交数据到远程仓库 git config --global push.…

TCP+UDP通信

一、UDP协议 1.1、recvfrom() 参数说明 int sockfd, //socket 的fd void *buf, // 保存数据的一块空间的地址 size_t len, //这块空间的大小 int flags,// 0 默认的接收方式 -----阻塞方式 默认行为是阻塞 MSG_DONTWAIT 不阻塞方式&#xff0c;用他的话代表读的时候是非…

使用dockerDesktop下载x86,amd64,arm64镜像

开启梯子 注意dockerDesktop不需要登录账号密码&#xff0c;不然拉取镜像会提醒账号或者密码错误 修改dockerDesktop配置&#xff0c;将experimental的值设置成 true&#xff0c;意思是&#xff1a;开启manifest实验特性 重启docker后下载镜像 –platform后面就是架构版本&a…

华为账号“一键登录”能力让美团用户尽享安全便捷的登录体验

背景 随着全场景智能生态的日益完善&#xff0c;用户面临着众多应用与服务的登录需求&#xff0c; 而繁琐的注册登录流程通常是用户转化的隐形障碍&#xff0c;用户可能因为步骤繁琐、记忆密码困难而中途放弃&#xff0c;导致应用错失潜在用户。其次&#xff0c;高门槛的登录方…

4.6算法之贪心_702:Crossing River

题目 702:Crossing River 总时间限制: 1000ms 内存限制: 65536kB 描述 A group of N people wishes to go across a river with only one boat, which can at most carry two persons. Therefore some sort of shuttle arrangement must be arranged in order to row the boat…

【C++】深入解析C/C++内存管理:new与delete的使用及原理

C语法相关知识点可以通过点击以下链接进行学习一起加油&#xff01;命名空间缺省参数与函数重载C相关特性类和对象-上篇类和对象-中篇类和对象-下篇日期类 本章将分享C为何放弃malloc/free系列&#xff0c;选择新系列new/delete去管理内存。深度探索new/delete的使用及其原理,m…

聚星文社——绘唐科技Ai推文软件

聚星文社——绘唐科技Ai推文软件 聚星文社--绘唐科技Ai推文软件https://iimenvrieak.feishu.cn/docx/ZhRNdEWT6oGdCwxdhOPcdds7nof AI推文软件是一种利用人工智能技术帮助用户自动生成推文内容的工具。 该软件会分析用户提供的相关信息和目标群体&#xff0c; 然后使用机器学习…