一文读懂AI时代GPU的内存新宠-HBM

ba2c196b746acc3646b58a1605dbd6bc.jpeg 

一文读懂GPU最强辅助:HBM

   

HBM,即高带宽内存,是一项领先的3D堆叠DRAM技术,专为高性能计算和图形处理单元(GPU)设计,满足其对内存带宽和容量的极致需求。该技术由AMD与海力士携手研发,并于2013年问世,为行业带来革命性突破。

42bbb5d059699ebe54ad991647ed60d6.jpeg

随着计算需求的不断增长,传统的内存技术已经难以满足高性能计算(HPC)和图形处理单元(GPU)对内存带宽和容量的日益增长的需求。在这样的背景下,高带宽内存(HBM)技术应运而生,为解决这一问题提供了创新性的解决方案。
f6d8d28c624ee8fc3b0c00f908278f71.jpegHBM是一种3D堆叠DRAM技术,它通过将多个DRAM芯片层叠在一起,并使用高密度的硅通孔(TSV)和微凸点(microbumps)技术,实现与处理器或GPU的垂直互连。这种设计大幅提高了内存的带宽和容量,同时减小了内存模块的物理尺寸。与传统的GDDR5内存相比,HBM由于其紧凑的设计和高效的数据传输,通常具有更低的功耗。

99d5c73564ea4d632d76da766d898757.jpeg

HBM产品系列已进化至第五代HBM3E,作为HBM3的扩展版,持续引领技术前沿。GPU现普遍支持2至8颗堆叠,最大堆叠层数达12层,展现了卓越的集成与性能优势。

4d25013fd9e0d728f1b13e9134121c4b.jpeg

美光科技于2月26日宣布批量生产HBM3E高带宽内存,其24GB 8H产品将供货给英伟达,并用于H200 Tensor Core GPU。这款内存拥有24GB大容量,引脚速度突破9.2Gb/s,提供高达1.2TB/s的内存带宽,为AI加速器、超级计算机等数据应用带来前所未有的闪电速度。美光HBM3E,引领内存技术新篇章。

0e11f03d5771b4a37964143b74daefbe.jpeg

英伟达H200 GPU搭载6颗美光HBM3E 24GB高速显存,理论上内存容量应为144GB,带宽达7.2TB/s。然而,量产考量下,英伟达官网显示其显存为141GB,带宽为4.8TB/s。这一调整旨在通过保留冗余空间,提升产品良品率,确保用户获得稳定高效的AI训练体验。

390044eb91a8d586cf5a5f3e92638b75.jpeg

HBM 不断迭代,迭代方向为增加容量和带宽,目前最高层数为12层。海力士 2014 年推出全世界第一颗 HBM,2018 年推出 HBM2,后续每隔两年推出新一代HBM,目前最新量产的是HBM3e,原厂加速研发,HBM4 可能采用16层堆 叠。从 I/O 数量看(总线位宽),HBM1到HBM3e均保持在1024bit, 而数据的传输速率从HBM1的1Gb/s 提升到 HBM3e的9.2Gb/s,最终实现带宽从HBM1的128GB/s 提升至 HBM3e的1.2TB/s。

HBM4的标准目前未确定,目前普遍预期HBM4最高16层堆叠,2048bit总线位宽。

d33289ad799d61fafb67ed05542936c1.jpeg

HBM市场主要由三大存储巨头所主导:

SK海力士,HBM技术的领军者,从早期开发到技术迭代如HBM2、HBM2E至HBM3,均保持领先地位。其卓越的创新和量产能力,使其成为伟达AI芯片HBM的首选供应商,市场份额遥遥领先,彰显技术实力与行业地位。

6f90dd0006783fc59649aff6d5df9e3d.jpeg

三星电子:三星电子是全球领先的半导体公司之一,在HBM技术方面也具有强大的研发和生产能力。三星电子不仅在HBM的研发上投入巨大,还积极扩大产能以满足市场需求。三星电子在HBM技术上的进展,包括开发更高密度和更大容量的产品,对提升其在高性能计算和AI领域的竞争力起到了关键作用。三星着重满足其他云端服务业者的订单,在客户加单下,预计在 HBM3 与海力士的市占率差距会大幅缩小,

2023~2024 年三星和海力士市占率预估相当,合计拥 HBM 市场约 95%的市占率

美光科技虽在HBM市场起步晚于SK海力士和三星,但凭借直接从HBM3E切入并快速增强技术实力,正逐步挑战市场格局。尽管市场份额尚低,但英伟达在H200中选用美光产品,展现了对其的高度认可,美光正在迅速追赶中。


-对此,您有什么看法见解?-

-欢迎在评论区留言探讨和分享。-

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/24144.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Apache安装教程

目录 一、Apache知识点 Apache服务简介 Apache下载网址 Apache的主要特点 二、Apache服务的搭建 1. 关闭防火墙 2. 安装依赖环境以及编译工具 3. 将apache安装包拖入xshell内 4. 解压压缩包 5. 进入httpd主包 6. 指定安装路径,启用字符集支持等 7. 优化执…

重庆工商大学社会工作专业试题及答案,分享几个实用搜题和学习工具 #媒体#学习方法#知识分享

搜题软件一般都是通过识别题目内容搜索出问题的答案,当识别内容不正确或搜索不到答案时,又得重新到其他软件进行重复的操作,很是麻烦。所以我们可以使用专业的识别工具,对题目内容进行识别,然后把提取出来的内容单独保…

流量录制学习

AREX Cloud | AREX (arextest.com) 流量录制学习,比vivo的moonbox要好用

【数据结构】平衡二叉树左旋右旋与红黑树

平衡二叉树左旋右旋与红黑树 平衡二叉树 定义 平衡二叉树是二叉搜索树的一种特殊形式。二叉搜索树(Binary Search Tree,BST)是一种具有以下性质的二叉树: 对于树中的每个节点,其左子树中的所有节点都小于该节点的值…

【vector模拟实现】附加代码讲解

vector模拟实现 一、看源代码简单实现1. push_backcapacity(容量)sizereserve(扩容)operator[ ] (元素访问) 2. pop_back3. itorator(迭代器)4.insert & erase (头插…

哈夫曼树的创建

要了解哈夫曼树,可以先了解一下哈夫曼编码,假设我们有几个字母,他们的出现频率是A: 1 B: 2 C: 3 D: 4 E: 5 F: 6 G: 7。那么如果想要压缩数据的同时让访问更加快捷,就要让频率高的字母离根节点比较进,容易访问&#xf…

立创·天空星开发板-GD32F407VE-GPIO

本文以 立创天空星开发板-GD32F407VET6-青春版 作为学习的板子,记录学习笔记。 立创天空星开发板-GD32F407VE-GPIO 基础概念三极管MOS管 GPIO输出模式输出线与GPIO输入模式GPIO点灯 基础概念 GPIO,全称为“通用输入/输出”(General Purpose …

算法金 | 这次终于能把张量(Tensor)搞清楚了!

大侠幸会,在下全网同名[算法金] 0 基础转 AI 上岸,多个算法赛 Top [日更万日,让更多人享受智能乐趣] 1. 张量(Tensor)基础概念 1.1 张量的定义与重要性 张量是深度学习中用于表示数据的核心结构,它可以视…

《帝国时代 III:决定版》秘籍 怎么在苹果电脑上玩《帝国时代 III:决定版》

《帝国时代 III:决定版》是一款让玩家沉浸于历史长河体验从大航海时代到工业革命时期的游戏。下面我们来看看《帝国时代 III:决定版》是什么类型的游戏,《帝国时代 III:决定版》Mac安装教程的相关内容。 一、《帝国时代 III&…

【BOM02】本地存储

一:什么是本地存储 数据存储在用户浏览器中,用户设置、读取方便,同时页面刷新时不会丢失数据。存储在浏览器中数据约5M,分为sessionStorage和localStorage两种存储方式 二:localStorage存储 作用 将数据永久存储在…

opencv实战小结-银行卡号识别

实战1-银行卡号识别 项目来源:opencv入门 项目目的:识别传入的银行卡照片中的卡号 难点:银行卡上会有一些干扰项,如何排除这些干扰项,并且打印正确的号码是一个问题 最终效果如上图 实现这样的功能需要以下几个步骤…

算法导论实战(三)(算法导论习题第二十四章)

🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀算法启示录 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 目录 前言 第二十四章 24.1-3 24.1-4 2…

【Week-R2】使用LSTM实现火灾预测(tf版本)

【Week-R2】使用LSTM实现火灾预测(tf版本) 一、 前期准备1.1 设置GPU1.2 导入数据1.3 数据可视化 二、数据预处理(构建数据集)2.1 设置x、y2.2 归一化2.3 划分数据集 三、模型创建、编译、训练、得到训练结果3.1 构建模型3.2 编译模型3.3 训练模型3.4 模…

超详细的java Comparable,Comparator接口解析

前言 Hello大家好呀,在java中我们常常涉及到对象的比较,不同于基本数据类型,对于我们的自定义对象,需要我们自己去建立比较标准,例如我们自定义一个People类,这个类有name和age两个属性,那么问…

[数据集][图像分类]蘑菇分类数据集3122张215类别

数据集类型:图像分类用,不可用于目标检测无标注文件 数据集格式:仅仅包含jpg图片,每个类别文件夹下面存放着对应图片 图片数量(jpg文件个数):3122 分类类别数:215 类别名称:[“almond_mushroom”,“amanita…

实验笔记之——DPVO(Deep Patch Visual Odometry)

本博文记录本文测试DPVO的过程,本博文仅供本人学习记录用~ 《Deep Patch Visual Odometry》 代码链接:GitHub - princeton-vl/DPVO: Deep Patch Visual Odometry 目录 配置过程 测试记录 参考资料 配置过程 首先下载代码以及创建conda环境 git clo…

有待挖掘的金矿:大模型的幻觉之境

人工智能正在迅速变得无处不在,在科学和学术研究中,自回归的大型语言模型(LLM)走在了前列。自从LLM的概念被整合到自然语言处理(NLP)的讨论中以来,LLM中的幻觉现象一直被广泛视为一个显著的社会…

Oracle EBS AP发票创建会计科目提示:APP-SQLAP-10710:无法联机创建会计分录

系统版本 RDBMS : 12.1.0.2.0 Oracle Applications : 12.2.6 问题症状: 提交“创建会计科目”请求提示错误信息如下: APP-SQLAP-10710:无法联机创建会计分录。 请提交应付款管理系统会计流程,而不要为此事务处理创建会计分录解决方法 数据修复SQL脚本: UPDATE ap_invoi…

LabVIEW阀性能试验台测控系统

本项目开发的阀性能试验台测控系统是为满足国家和企业相关标准而设计的,主要用于汽车气压制动系统控制装置和调节装置等产品的综合性能测试。系统采用工控机控制,配置电器控制柜,实现运动控制、开关量控制及传感器信号采集,具备数…

算法-分治策略

概念 分治算法(Divide and Conquer)是一种解决问题的策略,它将一个问题分解成若干个规模较小的相同问题,然后递归地解决这些子问题,最后合并子问题的解得到原问题的解。分治算法的基本思想是将复杂问题分解成若干个较…