HBM 发展史与前景(持续更新)

主页: 元存储博客

文章目录

    • 前言
    • 1. JEDEC 规范
    • 2. HBM 发展历程
    • 3. HBM 应用场景
    • 4. HBM 市场前景
    • 5. 发展挑战

翻译自: https://namu.wiki/w/HBM

前言

在这里插入图片描述
NVIDIA H2 上的 HBM100e。

1. JEDEC 规范

在这里插入图片描述

2. HBM 发展历程

HBM技术曾被视为一种噱头,因为它与GDDR相比没有明显的优势。当第一代HBM问世时,与12384位的GDDR相比,四个4096位的HBM在带宽和容量方面的差异并不大,但价格昂贵。此外,市场没有太多需要大量图形内存的游戏,并且HBM主要用于大学或公司的人工智能实验室,因此需求比普通的GDDR少。因此,三星电子2019年认为无法销售HBM,并暂时退出了该业务。

然而,随着性能的提升,GDDRHBM之间的技术差距也越来越大。尤其是在GDDR方面,由于故障限制导致改进速度缓慢,而HBM的技术发展相对较快,因为通过良好堆叠内存芯片,容量和带宽可以翻倍。此外,超大规模人工智能领域的需求激增,对内存要求高,为了充分利用这些需求,几乎必须采用HBM。这是因为容量很重要,但对于在短时间内处理大量模型数据也很重要。

由于基本结构的差异,HBM在带宽方面远优于GDDR20202月,三星开始量产Flashbolt HBM2E,支持最高8-Hi3.2 GT/s的速度,每个堆叠总共16GB,带宽为410GB/sSK海力士也开发了HBM2E,支持最高8-Hi3.6 GT/s的速度,总容量为16GB,从20207月开始量产。20201116日,NVIDIA宣布推出升级版的A100 80GB计算卡,HBM2E的速度为3.2 Gbps,总带宽为2 TB/s

2021年,SK海力士宣布开发HBM3,并于2022127日发布JEDECHBM3标准规范。每个堆叠的最大速度为819GB/s,在双堆栈配置中约为1.6TB/s,而384位配置的GDDR6X SGRAM 21 Gbps规格仅超过1TB/s,因此,如果HBM3驱动的产品没有延迟交付,它们将暂时具有带宽优势。

尽管三星电子2019年暂时退出了开发,但在2022年成功开发了第四代HBM,命名为HBM3 "Icebolt"。然而,由于比SK海力士晚一年开始开发,因此很难将其交付给NVIDIA。预计三星将在2023年底至20241月之间开始量产HBM3

截至2023年,HBM在存储半导体市场的容量份额还不到1%,但销售额已达到存储市场的10%,使其成为高附加值存储器之一。随着对人工智能芯片的需求迅速增加,对于与之相匹配的处理速度的需求也在增加,HBM市场正在蓬勃发展。

HBM市场份额
在这里插入图片描述
数据来源:TrendForce

截至2023年,SK海力士三星合计占据市场份额的90%,其中SK海力士53%三星38%,剩余10%由美光控制。特别是在最新的HBM3情况下,SK海力士几乎占据市场的主导地位,预计在2024年占据90%的市场份额。英伟达在通用AI芯片市场上占据80%的市场份额,在销售与其GPU配套的产品方面具有显著优势,因为它正在与SK海力士合作。

20238月,SK海力士成功研发了HBM3E

20235月,据报道,三星的下一代HBM将被命名为HBM3P "Snowbolt"。同年9月,宣布公司已同意向NVIDIA供应HBM3。然而,据了解,收到HBM3样品的NVIDIA担心产量问题,因此在没有达成最终合同的情况下签署了有条件的临时合同。特别是,由于NVIDIA已决定将其下一代HBM内存命名为"HBM3E",据报道,三星电子已要求更改名称为"HBM3P"

202310月,三星电子宣布成功开发了HBM3E,也被称为"Shinebolt"

202311月,NVIDIA宣布配备HBM3EH200B100将于2024年第二季度上市。AMD英特尔也分别发布了配备HBM350MI3Gaudí 3

2023年,HBM市场总规模估计为40亿美元,预计到2024年将增长两倍,达到120亿美元。预计SK海力士2023年的HBM收入将达到20亿美元。

3. HBM 应用场景

高端AI服务器GPU搭载HBM芯片已成为主流趋势,还可应用于高性能计算(HPC)、超级计算机、大型数据中心、云计算等领域。

4. HBM 市场前景

随着生成式人工智能(AI)的持续火爆,市场对于高性能AI芯片的需求,也带动了此类AI芯片内部所集成的高带宽内存(HBM)的需求爆发。预计市场规模将从2022年到2026年前增长10倍(4年复合年增长率77%),从2022年的23亿美元增长至2026年的230亿美元。

HBM市场规模增长情况
在这里插入图片描述
美银还指出,这种对DRAM晶圆产能的增加需求可能会导致2025年非HBM用的常规DRAM出现供应短缺[1]。

“HBM3E芯片的尺寸大约是同等容量DDR5的两倍。HBM产品包括逻辑接口芯片,并且具有更加复杂的封装堆栈,这会影响良品率。因此,HBM3和3E需求将吸收行业晶圆供应的很大一部分。”

5. 发展挑战

5.1. 热挑战

“最大的挑战是热” 格林伯格说。“HBM 的位置靠近 CPU 和 GPU 会加剧发热, 它开始忘记85°C左右的东西,并且在125°C左右完全心不在焉。 [2]。

Ansys产品经理Marc Swinnen说。“功率可能是集成可实现的首要限制因素。任何人都可以设计一堆芯片并将它们全部连接起来,所有这些都可以完美地工作,但你将无法冷却它。"

5.2. HBM 和 AI
AI/ML 中存储和检索数万亿次计算需要内存。事实上,在某种程度上,添加更多的 CPU 并不能提高系统性能,因为内存带宽无法支持它们。这就是臭名昭著的“记忆墙”瓶颈。

5.3. 降低成本
人工智能客正在 LPDDR5X 接口和 HBM 接口之间做出重大的基本权衡。他们真的很想去 HBM。就技术而言,这是他们内心的愿望。唯一阻碍他们的是成本。

“降低HBM成本将是一个挑战,”Objective Analysis首席分析师Jim Handy说。“由于在晶圆上放置TSV的成本很高,因此处理成本已经明显高于标准DRAM。这阻止了它拥有与标准 DRAM 一样大的市场。“ 由于市场规模较小, 像设计成本和光罩成本无法通过规模量产摊低,导致单片成本更加高。

5.4. 制造问题
“HBM 领域的很多领域实际上更多的是关于制造问题,而不是知识产权问题,”Cadence 知识产权集团产品营销总监 Marc Greenberg 说。你需要弄清楚如何构建一个带有硅中介层的系统。


参考文献
[1] HBM需求有多强?美银:抢产能可能导致DRAM供应短缺

[2] https://semiengineering.com/hbms-future-necessary-but-expensive/

[3] https://semiengineering.com/choosing-the-correct-high-bandwidth-memory/

声明
本文仅为学习交流目的。
文中部分文字和图片来源于互联网,列在参考的文献,但可能有遗漏。如有侵权,请告知我删除。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/948.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PSAvatar:一种基于点的可变形形状模型,用于3D高斯溅射的实时头部化身创建

PSAvatar: A Point-based Morphable Shape Model for Real-Time Head Avatar Creation with 3D Gaussian Splatting PSAvatar:一种基于点的可变形形状模型,用于3D高斯溅射的实时头部化身创建 Zhongyuan Zhao1,2, Zhenyu Bao1,2, Qing Li1, Guoping Qiu3,…

工时管理软件全攻略,8大关键因素一网打尽!

工时管理往往与项目管理与人力资源结合起来,考察每位员工的绩效指标。可以说,工时管理软件至关重要。什么叫工时管理?考虑到工时管理软件的八个关键要素包含:功能、使用体验、集成能力、扩展性、成本效率、安全隐私、技术支持、用…

javaWeb项目-智慧餐厅点餐管理系统功能介绍

项目关键技术 开发工具:IDEA 、Eclipse 编程语言: Java 数据库: MySQL5.7 框架:ssm、Springboot 前端:Vue、ElementUI 关键技术:springboot、SSM、vue、MYSQL、MAVEN 数据库工具:Navicat、SQLyog 1、JavaScript Java…

【漏洞复现】泛微e-cology ProcessOverRequestByXml接口存在任意文件读取漏洞

漏洞描述 泛微e-cology依托全新的设计理念,全新的管理思想。 为中大型组织创建全新的高效协同办公环境。 智能语音办公,简化软件操作界面。 身份认证、电子签名、电子签章、数据存证让合同全程数字化。泛微e-cology ProcessOverRequestByXml接口存在任意文件读取漏洞 免责声…

虚拟机磁盘剩余空间不足

VMware 弹出提示: 对文件“E:\Virtual Machine\CentOS 7 1810 的克隆 (2)\CentOS 7 1810-cl1.vmdk”的操作失败。 如果该文件位于远程文件系统上,请确保网络连接以及该磁盘所在的服务器正常工作。如果该文件位于可移动介质中,请重新连接该介…

从零自制docker-11-【pivotRoot切换实现文件系统隔离】

文章目录 busyboxdocker run -d busybox topcontainerId(docker ps --filter "ancestorbusybox:latest"|grep -v IMAGE|awk {print $1})docker export -o busybox.tar $containerId or sudo docker export 09bbf421d93f > ./busybox.tar tar -xvf busybox.tar -C …

nvm下载的node没有npm

nvm下载的node没有npm 相信大家最近可能发现自己使用的nvm下载nodejs没有npm了。 会出现这种情况: C:\Users\89121>nvm install 15 Downloading node.js version 15.14.0 (64-bit)... Complete Downloading npm version 7.7.6... Download failed. Rolling Bac…

如何查找一篇英文文献的源代码?(论文中没有源代码链接时)如何查找一篇论文的实现代码从而复现论文?

有两个网址,从这两个网址里面能找到论文相关代码,但不确定是不是人家论文里的源代码,但是根据论文实在找不到的情况下,只能试试这两个网址了 1. https://paperswithcode.com/ 2. https://www.catalyzex.com/

【QT进阶】Qt Web混合编程之CMake VS2019编译并使用QCefView(图文并茂超详细版本)

往期回顾 【QT进阶】Qt Web混合编程之CEF、QCefView简单介绍-CSDN博客 【QT进阶】Qt Web混合编程之VS2019 CEF的编译与使用(图文并茂超详细介绍)-CSDN博客【QT进阶】Qt Web混合编程之QWebEngineView基本用法-CSDN博客【QT进阶】Qt Web混合编程之VS2019 C…

Geoserver的RESTful接口使用

概述 GeoServer提供了一个RESTful接口,客户端可以通过该接口获取有关实例的信息并进行配置更改。REST接口使用简单的HTTP调用,通过客户端就可以配置GeoServer,而无需使用Web管理接口。 Geoserver中的关系 工作区、数据源、图层、图层组以及…

随身WiFi真实测评推荐!格行vs新讯随身wifi对比,公认最好的随身WiFi格行随身wifi有什么优势?

在当前移动网络高度发达的时代,随身 WiFi 已成为人们出差、旅行等场景中不可或缺的工具。格行和新讯是目前比较受欢迎的无线随身wifi。本次评测将对比分析这两款产品的区别,做为随身WiFi推荐第一名的格行随身wifi到底有什么优势呢? 品牌对比&…

手写Java设计模式之工厂模式,附源码解读

工厂模式(Factory Pattern)是 Java 中最常用的设计模式之一,这种类型的设计模式属于创建型模式,它提供了一种创建对象的最佳方式。 工厂模式提供了一种创建对象的方式,而无需指定要创建的具体类。 工厂模式属于创建型…

网络流问题详解

1. 网络最大流 1.1 容量网络和网络最大流 1.1.1 容量网络 设 G(V, E)是一个有向网络,在 V 中指定了一个顶点,称为源点(记为 Vs),以及另一个顶点,称为汇点(记为 Vt);对…

基于java+springboot+vue实现的校园一卡通系统(文末源码+Lw+ppt)23-26

摘 要 近些年来,随着科技的飞速发展,互联网的普及逐渐延伸到各行各业中,给人们生活带来了十分的便利,校园一卡通利用计算机网络实现信息化管理,使整个校园一卡通管理的发展和服务水平有显著提升。 本文拟采用java技…

Aws Nat Gateway

要点 NAT网关要能访问外网,所以需要部署在有互联网网关的Public子网中。 关键: NAT网关创建是选择子网,一定要选择公有子网(有互联网网关子网) 特别注意: 新建nat网关的时候,选择的子网一定…

【C++】哈希结构

目录 一,哈希结构的认识 1-1,哈希思想 1-2,哈希函数 1-3,哈希冲突 1-3-1,闭散列 1-3-2,开散列 二,哈希结构的封装实现 2-1,闭散列封装实现 ​编辑 2-2,开散列封…

genetic algorithm

genetic algorithm 遗传算法

C++入门5.内联函数,auto关键字,基于范围的for循环(C++11),指针空值nullptr(C++11)

本篇是C过度C初始的最后一篇,快快对入门须知的知识有个印象后,就可以顺顺利利的学习C的类了。 目录 内联函数: 内联函数的特性: auto关键字(C11): auto简介: 使用细则: auto不能推导的场…

基于java+springboot+vue实现的物业管理系统(文末源码+Lw+ppt)23-23

摘 要 快速发展的社会中,人们的生活水平都在提高,生活节奏也在逐渐加快。为了节省时间和提高工作效率,越来越多的人选择利用互联网进行线上打理各种事务,通过线上物业管理系统也就相继涌现。与此同时,人们开始接受方…

K8S基础概念

一、MASTER Kubernetes里的Master指的是集群控制节点,在每个Kubernetes集群里都需要有一个Master来负责整个集 群的管理和控制,基本上 Kubernetes的所有控制命令都发给它,它负责具体的执行过程,我们后 面执行的所有命 令基本都…