【Chiplet】技术总结

  • Chiplet基本知识点汇总
    • 1. Wafer, die, chip, cell的区分
    • 2. MCM, SiP, SoC, Chiplet的区别
    • 4. Chiplets的先进封装
    • 5. Chiplet发展阶段

Chiplet基本知识点汇总

1. Wafer, die, chip, cell的区分

  • Wafer: 晶圆,指一整个晶圆硅片。
    在这里插入图片描述

  • Die: 从晶圆上切分下来的小方格,一个晶圆上的每个die的设计内容都是一样的,重复单元。

    • Die的大小会影响良率,Die越小,良率一般越高(不绝对)。
      在这里插入图片描述

    • wafer本身会有制造的缺陷点,当Die很大的时候,大面积的Die都会因为缺陷点儿报废,当Die很小的时候,这种损耗就大大降低了。

  • Chip: 通常指集成电路,将多个电子元件集成到一块半导体材料上。

  • Cell: 是数字电路设计的标准单元,晶体管和连线组成,具有最基本的布尔逻辑或触发功能。

2. MCM, SiP, SoC, Chiplet的区别

1. IP核(Intellectual Property core)

  • 早期的电路设计是全定制的,设计非常耗时。考虑到CPU有很多相似的模块,那能不能将这些相似的东西模块化,于是有了IP核。
  • IP核是指芯片中具有独立功能的电路模块的成熟设计。六大核心处理器IP,分别为图形处理器(GPU)IP、神经网络处理器(NPU)IP、视频处理器(VPU)IP、数字信号处理器(DSP)IP、图像信号处理器(ISP)IP和显示处理器IP。
  • IP核在EDA上有非常重要的地位。
  • IP核可分为三类:
    • 软核:verilog行为描述代码
    • 固核:门级网表形式的代码
    • 硬核:GDSII版图文件,不能修改

2. MCM(multi-chip module, MCM):一种封装技术,将多个芯片封装在一个模块中

  • 多个裸片(die)和其它元器件组装在同一块多层高密度**互连基板/衬底(substrate)**上进行互连接, 然后进行封装。
  • 特征是通过基板电路进行互连,比较可靠,但集成密度低。
  • 相比于技术本身,MCM更多的表现了一种趋势和导向,比如芯片IP化、异构集成、异质集成等,这也是Chiplet的发展方向。
  • Die to Die通过基板电路直接进行互连,比较可靠,成本较低,但集成密度低,latency相对较大。
    1. 2D MCM
    • 多芯片模块(multi-chip module, MCM)技术的想法和商业用途已经存在了数十年。single-chip module单芯片模块

    • MCM采用逻辑上一个大型芯片或片上系统(SoC)的功能,然后将设计划分为多个较小的芯片。由于芯片尺寸和产率之间存在非线性关系,重新集成多个较小的芯片比构建单个SoC更具成本效益。

    • AMD EPYC(霄龙)处理器
      在这里插入图片描述

      • 32-core CPU 分成4个8-core die,这种设计要比单芯片的实现节省约40%的成本。
        在这里插入图片描述
    • die2die通信需要经过封装基板(substrate),与片上相比发送数据的带宽延迟和功耗较差。具有硬件中可以清晰划分并由软件管理的逻辑块的SoC可以减少此影响。

3. SiP(System in Package): 一种制造技术,将多个芯片集成到一个小型包装中

  • SiP是MCM封装技术进一步发展的产物,即系统级封装,首先强调的是系统,其次是封装
  • 对于某些 IP,无需自己做设计和生产,只需买别人实现好的硅片,然后在一个封装里集成起来,形成一个 SiP
  • 在实现多芯片封装过程中,其目标是在适当扩展面积的基础上,尽可能实现同等功能的 SoC 芯片功能
  • SiP能将处理器、存储器、传感器、射频收发器等部件搭载于同一个封装体内,形成一个系统或者子系统的封装技术
  1. SoC(System on Chip): 片上系统,台式机的存储器、电源模块、功耗管理模块是分开的,而SoC是讲这些围绕CPU的关键模块集成在一个芯片上,笔记本手机上使用较多。
    在这里插入图片描述

  2. Chiplets

  • Chiplet技术就是像搭积木一样,把一些预先生产好的实现特定功能的芯片裸片(die)通过先进的集成技术(比如3D integration)集成封装在一起形成一个系统芯片。而这些基本的裸片就是Chiplet。从这个意义上来说,Chiplet就是一个新的IP重用模式
  • 2D Chiplets
    • 虽然经典的MCM将SoC划分为多个更小的且更具成本效益的组件,但AMD的chiplet方法更进一步,在不同工艺上实现不同的芯片,以更好地匹配每个chiplet的要求和约束。
      在这里插入图片描述

    • AMD 第二代 EPYC CPU,八个Chiplet都在7nm工艺下实现了8个CPU内核,中间较大的芯片是IO芯片,包含内存控制器,IO接口和其他系统组件。因为IO的迭代周期很长,使用先进技术节点的收益不大,因此IO Die使用较为成熟的、更具成本效益的技术节点12nm实现。

    • 和MCM也面临同样的问题,chiplet之间的通信可能会受到基板级的路由限制,因此将SoC有效划分为Chiplet架构设计是非常重要的。

3. Chiplets的先进封装

1. 2.5 Silicon Interposer 硅中介层

  • 2D MCM和2D chiplet设计中封装基板上的芯片间通信链路通常限制在几十GB/s。主要限制是有机基板上可以实现的金属布线的宽度/密度。对于某些应用如将内存直接集成到封装中,无法提供100GB/s的带宽满足需求。
    在这里插入图片描述

  • 而silicon interposer硅中介层实质上是实现多个chip之间互连的一个芯片。

  • 这通常称为2.5D堆叠,虽然芯片以三D的方式堆叠在中介层顶部,但各个芯片之间仍处于2D状态。

  • interposer可以在相对较小的区域内提供数百GB/s的带宽。硅中介层也可以通过TSV(through-silicon vias)来提供从各个芯片到封装外部IO、电源和接地连接。
    在这里插入图片描述

  • 如AMD Instinct MI100加速器,将基于GPU的计算芯片(较大的芯片)和四个封装内的DRAM模块相结合,全部堆叠在interposer上并进行互连,支持理论峰值带宽1.2TB/s.

2. 2.5 Silicon Bridges 硅桥

  • 但中介层有一定的限制,中介层必须足够大以容纳要堆叠的所有的2.5D芯片。这样的非常大的中介层会增加系统的成本,如果甚至超过了掩膜版的限制(800-900mm^2),也会产生额外的成本去支持缝合技术以构建更大的interposer.

  • 而硅桥可以替代interposer,去使用更小的硅片同时提供硅级别的导线密度。下图a展示了AMD的elevated fanout bridge高架扇出桥(EFB)技术的横截面图。

  • 与硅中介层很类似但是硅桥要小的多,只需要覆盖连接在一起的两个芯片的连接接口即可。在硅桥占据的区域以外传统的铜柱技术copper pillar可以直接向芯片提供IO、电源和接地信号。同时也不需要额外制造TSV,更具成本效益。
    在这里插入图片描述

  • 图b显示了AMD Instinct MI200 加速器,由两个GPU大芯片和八个封装内内存模块。每个内存模块通过EFB连接到GPU芯片。图c也展示了EFB的横截面显微照片。

3. 3D Stacking: Microbumps

  • 先前提到的技术将所有有源组件彼此相邻放置,而3D堆叠可以直接将一个或多个有源芯片彼此堆叠,进一步提高集成密度和芯片间带宽。

  • Microbumps 微凸块是非常小的焊接连接。图a显示了用微凸块连接连个该芯片的图片,可以重复堆叠构建具有多个管芯的堆叠,图b显示了一个3D内存堆栈,其中包含8层DRAM芯片,所有芯片均通过TSV和微凸块互连。
    在这里插入图片描述

  • 这样的连接大大增加了可以集成到给处理器封装区域的内存量。

  • 但也有一定的问题:更高的热阻,额外高度,互连密度也受到微凸块尺寸限制,微凸块的尺寸和间距很难缩放到很小的尺寸。

4. 3D Stacking: Hybrid Bonding 混合键合

  • 混合键合 最新的 3D 堆叠技术使用两相混合键合工艺。

  • 芯片不是通过微凸块将两个芯片上的金属焊盘连接在一起,而是直接熔合在一起。第一阶段包括在两个芯片各自表面的氧化物之间形成共价键。第二阶段包括高温铜-铜接合工艺,使每个芯片上的金属焊盘直接熔合在一起。通过完全消除微凸块,混合键合可以支持更高的互连密度(例如,从微凸块的数十微米间距到混合键合的个位数微米)
    在这里插入图片描述

  • 图a显示了混合粘合在 CPU 芯片顶部的高速缓存芯片的横截面图。底部芯片上的 TSV 连接到混合键合界面处的金属键合焊盘。顶部芯片上的接合焊盘通过接合焊盘通孔连接到顶部高速缓存芯片的普通金属堆叠。图b显示了 AMD V-CacheTM 技术的图形渲染,该技术将缓存芯片堆叠在 CPU 小芯片之上。这使得能够在全带宽下将 CPU 的 L3 缓存容量增加三倍。

  • 在此实现中,额外的无源填充硅(如图中浮动的灰色块所示)堆叠在 CPU 计算逻辑的顶部,以帮助将热量从处理器管道传导到封装的冷却解决方案(未显示)。与基于微凸块的 3D 堆叠相比,没有微凸块或底部填充的直接芯片间接口提供了优越的散热路径。

4. Chiplet发展阶段

  • 具体来说,chiplet的发展阶段可分为三个:
    在这里插入图片描述

    • Chiplet初级形式:SiP。可以基于已经封好的芯片、也可以基于裸片去做封装,可以更加紧凑,比较简单,互连可能也只是一些低速IO
    • Chiplet中级形式:高性能合封扩展。同构的方式实现更好的良率和芯片,提供一定的扩展性。
    • Chiplet高级形式:自顶向下的架构拆分:完整大芯片的拆解和组装,之前的工作都是同构扩展,而高级形式可以使用不同的技术节点的Die, 异构的一些Die进行组装,提供更好的一个性价比。那么就可以在完整大芯片的基础上进行异构的拆分,不同组件使用不同的技术节点。
  • Chiplet的拆分、互连、封装三个阶段 拆拼封的优势:
    在这里插入图片描述

References:
[1] G. H. Loh and R. Swaminathan, “The Next Era for Chiplet Innovation,” in 2023 Design, Automation & Test in Europe Conference & Exhibition (DATE), Antwerp, Belgium: IEEE, Apr. 2023, pp. 1–6. doi: 10.23919/DATE56975.2023.10137172.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/783843.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue3+.NET6前后端分离式管理后台实战(十)

1,Vue3.NET6前后端分离式管理后台实战(十)已经在订阅号发布有兴趣的可以关注一下! 感兴趣请关注订阅号谢谢! 代码已经上传gitee

C++--内联函数

当调用一个函数时,程序就会跳转到该函数,函数执行完毕后,程序又返回到原来调用该函数的位置的下一句。 函数的调用也需要花时间,C中对于功能简单、规模小、使用频繁的函数,可以将其设置为内联函数。 内联函数&#xff…

【SQL】1667. 修复表中的名字(UPPER()、LOWER()、SUBSTRING()、CONCAT())

前述 SQL中字符串截取函数(SUBSTRING) SQL 字母大小写转换函数UPPER()、UCASE()、LOWER()和LCASE() 题目描述 leetcode题目:1667. 修复表中的名字 Code select user_id, concat(upper(substring(name, 1, 1)),lower(substring(name, 2)) ) as name from Users o…

基于springboot+vue+Mysql的篮球论坛系统

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…

K8S之Configmap的介绍和使用

Configmap Configmap概述Configmap的简介Configmap能解决的问题Configmap应用场景局限性 Configmap创建方法通过命令行直接创建通过文件创建指定目录创建编写Configmap资源清单Yaml文件 Configmap的使用案例通过环境变量引入:使用configMapKeyRef通过环境变量引入&a…

零刻sei12 windows10 限制cpu最高频率,降低cpu功耗,调整风扇转速

为什么要降低cpu功耗 虽然风扇声音本身不大,但是我想在自习室用电脑,突然的风扇声音还是会影响到他人. 由于迷你主机集成度比较高不太可能换散热器,所以只能降低cpu功耗. 我的系统 版本 Windows 10 IoT 企业版 LTSC 版本号 21H2 安装日期 ‎2023/‎12/‎18 操作系统…

数据分析之Tebleau 的度量名称和度量值

度量名称 包含所有的维度 度量值 包含所有的度量 度量名称包含上面所有的维度,度量值包含上面所有的度量 当同时创建两个或两个以上度量或维度时,会自动创建度量名称和度量值 拖入省份为行(这会是还没有值的) 可以直接将销售金额拖到数值这里 或者将销售…

Android笔记(三十):PorterDuffXfermode实现旋转进度View

背景 核心原理是使用PorterDuffXfermode Path来绘制进度,并实现圆角 效果图 Android笔记(三十)效果演示 进度条绘制步骤 将ImageView矩形七个点的坐标存储起来(configNodes) 他们对应着7个不同的刻度,每个刻度的值 i * &#…

JAVAEE之网络编程

1.网络编程 网络编程,指网络上的主机,通过不同的进程,以编程的方式实现网络通信(或称为网络数据传输)。 当然,我们只要满足进程不同就行; 所以即便是同一个主机,只要是不同进程&am…

【MATLAB源码-第173期】基于matlab的RS编码的2FSK通信系统误码率仿真,通过AWGN信道输出误码率曲线。

操作环境: MATLAB 2022a 1、算法描述 通信系统的基本框架 在现代通信系统中,数据的传输通常涉及四个基本步骤:源编码、信道编码、调制和传输。源编码主要负责压缩数据,减少传输的数据量。信道编码则通过添加冗余信息来提高传输…

扫雷(蓝桥杯)

题目描述 小明最近迷上了一款名为《扫雷》的游戏。其中有一个关卡的任务如下, 在一个二维平面上放置着 n 个炸雷,第 i 个炸雷 (xi , yi ,ri) 表示在坐标 (xi , yi) 处存在一个炸雷,它的爆炸范围是以半径为 ri 的一个圆。 为了顺利通过这片土…

HANA中的内存及磁盘使用统计

1. 引言 在实际使用中,通过HANA的admin控制台,确实可以得到很多重要的信息。但有的时候不如人愿,你需要提供相应的SQL语句得到具体的信息。 比如,我要得到所有的行表的内存及磁盘占用信息;我需要得到所有列表的内存及…

AiEditor AI富文本编辑器

AI 时代,AIGC 正在蓬勃发展。作为一家 CMS 厂商,我们也正在积极寻求下一代 CMS 的迭代方向,以适应即将到来的新时代。 CMS 的一个核心能力是对 C(Content) 的编辑能力,它是通过 "编辑器" 来体现的…

基于springboot实现房屋租赁系统项目【项目源码+论文说明】

基于springboot实现房屋租赁系统演示 摘要 社会的发展和科学技术的进步,互联网技术越来越受欢迎。网络计算机的生活方式逐渐受到广大人民群众的喜爱,也逐渐进入了每个用户的使用。互联网具有便利性,速度快,效率高,成本…

AWS创建IAM用户,以及通过IAM用户登录

基本概念: IAM Identity Center(AWS SSO) 跨账户访问:IAM Identity Center允许用户使用他们自己的单一登录凭证来访问多个AWS账户和应用程序。这意味着你可以拥有一个账户和密码,通过IAM Identity Center的用户门户&…

基于STM32的武警哨位联动报警系统设计,支持以太网和WIFI通信

1.功能 本文提出的武警报警信息系统终端,可实现报警和联动响应,支持以太网和WIFI两种通信模式,可实现移动哨位报警和固定哨位报警,语音和显示报警信息用户可自行定制。 本终端主要由STM32F103处理器模块和C8051F340处理器模块构…

路径规划——搜索算法详解(五):Dynamic A Star(D*)算法详解与Matlab代码

昨天休息了一天,今天继续学习搜索算法!前几天已经分别介绍了Dijkstra算法、Floyd算法、RRT算法、A*算法,无独有偶,上述算法都只适用于静态环境下两点规划的场景,但是大部分场景是实时变化的,这对规划算法提…

【应用笔记】LAT1413+快速开关蓝牙导致设备无广播

1. 问题背景 客户使用 BlueNRG-345MC 开发了一个 BLE 外设,和手机连接。在测试中发现,手机连接上外设之后,不断地在手机上点击蓝牙的开关按钮,造成设备不断地断开、重连;少则几次,多则几十次。点击之后&am…

乐乐音乐鸿蒙版-支持krc歌词(动感歌词、翻译和音译歌词)

简介 乐乐音乐主要是基于HarmonyOS开发的音乐播放器,它支持lrc歌词和动感歌词(ksc歌词、krc歌词和hrc歌词等)、多种格式歌词转换器及制作动感歌词、翻译歌词和音译歌词。 开发环境 ArkTS、Stage模型、SDK3.1、 API 9 注:没试过在真机条件下调试。 功…

LLM大模型可视化-以nano-gpt为例

内容整理自:LLM 可视化 --- LLM Visualization (bbycroft.net)https://bbycroft.net/llm Introduction 介绍 Welcome to the walkthrough of the GPT large language model! Here well explore the model nano-gpt, with a mere 85,000 parameters. 欢迎来到 GPT 大…