3D-IC——超越平面 SoC 芯片的前沿技术

“3D-IC”,顾名思义是“立体搭建的集成电路”,相比于传统平面SoC,3D-IC引入垂直堆叠芯片裸片(die)和使用硅通孔(TSV)等先进封装技术,再提高性能、降低功耗和增加集成度方面展现了巨大的潜力。

一、3D-IC技术的背景及优势

3D-IC架构可以在垂直尺度上将多个同质和异质的小芯片/裸片整合在同一设计中,这样就可以使芯片在更小的区域面积下添加更多功能、提高单位性能、提升设计灵活性并降低开发成本。在如今摩尔定律逐渐逼近物理极限的情况下,3D-IC被认为具有“超越摩尔定律”的潜力,有望成为后摩时代下突破SoC集成度、性能等方面瓶颈的关键技术[1]。

图1 (左)chatgpt想象3D-IC示意图;(右)实际3D-IC剖面示意图

从上世纪60-70年代起,就有研究人员探索如何通过堆叠芯片来提升集成电路的性能和密度,虽然当时多层印刷电路板(PCB)已广泛使用,但芯片堆叠技术还在理论阶段,技术工艺尚不成熟。上世纪80年代,2.5D芯片——多芯片模块(MCM)被提出,并为后来的3D-IC铺平了道路。90年代末,层叠封装技术(PoP)开始逐渐应用,但仍属于2.5D-IC阶段。2000年初期,随着硅通孔(TSV)技术的成熟,3D-IC技术进入实际应用阶段,许多学术机构和实验室开始研究如何将TSV应用于芯片堆叠,以提高带宽、降低功耗和增加集成度。这一时期的研究奠定了现代3D-IC技术的基础。2010年代,三星、SK海力士推出了3D-IC的高带宽内存(HBM)和Wide I/O内存,显著提升了芯片带宽和性能[2]。如今,苹果、三星等公司开始在移动设备逐渐加入3D-IC技术,未来,3D-IC有望在更多消费电子、通信和高性能AI计算等领域得到应用,并进一步推动整个集成电路行业的发展。

二、3D-IC的设计流程及其需求与挑战

3D-IC设计流程一般包含系统架构设计、芯片层面设计、TSV规划、热管理设计、先进布局布线、封装和堆叠、仿真验证等设计步骤,虽然目前有多种单一工具可以用来设计3D-IC,但要依靠每个设计团队开发自己的方法来整合流程。因此,如今的3D-IC设计依旧是一项相当大的挑战。当从单一SoC转向多芯片(晶粒)/小芯片架构时,会出现以下四大挑战[1]:

  1. 顶层/系统级的异质设计整合、规划和优化;

3D-IC设计要求整合来自不同功能领域的芯片(例如逻辑、存储器、模拟和射频等),这使得顶层的规划与优化成为设计过程中的一大挑战。设计团队需要从系统级层面考虑如何将这些异质芯片整合,并确保其在功能、功耗和性能方面得到最佳平衡。此外,3D堆叠带来的散热和功耗管理问题更加复杂,要求在设计早期阶段进行全面的系统级优化。由于没有统一的标准工具,设计者通常需要定制开发整合工具来满足不同的设计需求。

图2 系统级 3D 设计整合、规划和优化[1]

  1. 数字、模拟和射频领域的裸片、晶粒、封装和 PCB 的协同设计和协同分析;

3D-IC设计的复杂性在于其需要多领域的协同工作,包括数字、模拟和射频电路的集成。各领域之间的设计需求存在显著差异,例如模拟电路对噪声敏感,而数字电路则注重速度与功耗控制。3D-IC设计要求各个领域的设计团队协同工作,以优化裸片、封装和PCB之间的互连设计。设计人员不仅要考虑每一层芯片的独立设计,还需要跨层面分析信号完整性、时序、功耗等问题。

  1. 设计早期在版图设计前进行热分析;

3D-IC的堆叠结构显著增加了设计中的散热挑战。由于多个芯片层叠加在一起,热量容易在芯片内积累,导致局部过热问题。因此,热管理设计需要在设计的早期阶段就纳入考虑,并且在版图设计之前,必须通过热仿真和分析工具进行准确的温度预测,以确保不会因为过热影响芯片的性能和寿命。如何在不影响设计精度的前提下,在早期阶段实现有效的热分析,是3D-IC面临的一个重要挑战。

(4)一个能将这些技术无缝整合在一起的通用平台。

3D-IC涉及多层次的设计工作,包括芯片、封装和PCB,需要跨越多个EDA工具和流程进行设计和验证。由于工具和流程之间的互操作性较差,设计团队往往需要自定义开发流程来弥合不同设计阶段的差距,导致效率低下并增加设计复杂性。一个能够支持从系统级到制造级全流程整合的平台,将大幅提高3D-IC设计的效率和成功率。

三、3D-IC的现有市场及发展前景

尽管3D-IC设计具有极大的挑战性,但是由于其特有优势和潜力,许多高校和企业纷纷展开相关研究。例如,清华大学集成电路学院在2024 ACM/IEEE第51届年度计算机体系结构国际研讨会(ISCA)上发表了国际首款面向视觉AI大模型的三维DRAM存算一体架构,可大幅突破存储墙瓶颈,并基于三维集成架构特点,实现相似性感知计算,进一步提高AI大模型的计算效率[3]。如图3所示,阿里巴巴达摩院提出了一种具有成熟芯片制造和键合工艺的3D混合键合近存计算实用架构,研发了全球首款基于DRAM的3D键合堆叠存算一体AI芯片,可突破冯·诺依曼架构的性能瓶颈,满足人工智能等场景对高带宽、高容量内存和极致算力的需求。在特定AI场景中,该芯片性能提升10倍以上,能效比提升高达300倍。该工作也被收录于2022年的国际固态电路会议(ISSCC)中[4]。知存科技作为国内存内计算芯片领域的领先企业,量产WTM-8系列移动设备计算芯片,实现了第二代3D存内计算架构,达到更高算力上限,让终端+人工智能生成内容(AIGC)照入现实。

图3 3D堆叠芯片图示、封装交叉图、DRAM 阵列布局和逻辑芯片上的设计块[3]

3D-IC技术是集成电路行业的一个主新兴研究方向,在许多应用领域展现了令人信服的功耗、性能和形状参数优势,并有助于遏制SoC开发成本的攀升,期待未来3D-IC技术可以正式走入我们的生活。

参考文献:

[1]3D-IC设计的挑战和需求,John Park - Cadence白皮书. 

  1. 半导体“高带宽内存(HBM)”芯片技术详解-知乎(zhihu.com).(https://zhuanlan.zhihu.com/p/715041179).
  2. 清华团队发布3D DRAM存算一体架构!-全球半导体观察 (dramx.com).
  3. Niu D, Li S, Wang Y, et al. 184QPS/W 64Mb/mm 2 3D logic-to-DRAM hybrid bonding with process-near-memory engine for recommendation system[C]//2022 IEEE International Solid-State Circuits Conference (ISSCC). IEEE, 2022, 65: 1-3.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/57688.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

同世界,共北斗|遨游通讯亮相第三届北斗规模应用国际峰会!

10月24日,第三届北斗规模应用国际峰会在湖南省株洲市隆重开幕,此次峰会以“同世界,共北斗”为主题,旨在加速北斗系统的市场化进程、促进其产业化布局及国际化拓展。全国政协副主席、农工党中央常务副主席杨震讲话并宣布开幕&#…

window7虚拟机VMware与主机共享文件

文件管理器》计算机网络右键》属性》高级共享设置——全部启用 新建文件夹》右键》属性》共享》选择可以共享的用户——我这里选的是所有用户 点击高级共享》权限》保存设置——设置文件权限 文件管理器》计算机网络》右键》属性》————查看虚拟机计算机名称 主机访问 主机…

构建安全基石:网络安全等级保护定级指南

在数字化时代,网络安全已成为企业与个人不可忽视的重要课题。网络安全等级保护定级指南,作为国家指导网络安全保护的重要文件,为各类机构提供了精准的安全防护蓝图。本文旨在深度解析网络安全等级保护定级指南的精髓,助力建构全面…

HarmonyOS 5.0应用开发——Navigation实现页面路由

【高心星出品】 文章目录 Navigation实现页面路由完整的Navigation入口页面子页面 页面跳转路由拦截其他的 Navigation实现页面路由 Navigation:路由导航的根视图容器,一般作为页面(Entry)的根容器去使用,包括单页面&…

基于FPGA的以太网设计(五)

之前简单介绍并实现了ARP协议,今天简单介绍一下IP协议和ICMP协议。 1.IP协议 IP协议即Internet Protocol,是网络层的协议。 IP协议是TCP/IP协议族的核心协议,其主要包含两个方面: IP头部信息。IP头部信息出现在每个IP数据报中…

将 el-date-picker获取的时间数据转换成时间戳

在Vue.js中使用Element UI的el-date-picker组件时,你可以获取用户选择的日期并将其转换为时间戳。el-date-picker通常返回的是一个Date对象或一个格式化后的字符串(取决于你如何配置它)。下面是一个示例,展示了如何将el-date-pick…

Spring Cloud OAuth认证中心

在微服务架构中,由于不同的业务会拆分成不同的微服务,传统的单体项目一般是通过过滤器进行拦截校验,而微服务显然不可能分发到各个服务进行用户认证,这就需要由一个统一的地方来管理所有服务的认证信息,实现只登录一次…

松脂醇-落叶松脂素还原酶(pinoresinol-lariciresinol reductase, PLR)克隆与鉴定-文献精读71

菘蓝中松脂醇-落叶松脂素还原酶编码基因IiPLR2的克隆与功能分析 摘要 松脂醇-落叶松脂素还原酶(pinoresinol-lariciresinol reductase, PLR)是植物中木脂素生物合成的关键酶,能连续催化两步反应分别生成落叶松脂素和开环异落叶松脂素。落叶松脂素等木脂素类成分是…

Unity SpriteEditor 中的图集处理功能

本文仅作笔记学习和分享,不用做任何商业用途 本文包括但不限于unity官方手册,unity唐老狮等教程知识,如有不足还请斧正 因为unity不只能做3d,还有2d游戏需要大量编辑处理图片素材,所以需要了解Sprite(精灵&…

KPaaS 集成平台低代码在跨境电商行业的应用

在全球化的经济浪潮中,跨境电商行业蓬勃发展,机遇与挑战并存。随着业务规模的不断扩大和市场竞争的日益激烈,跨境电商企业面临着诸多复杂的业务管理和技术难题。KPaaS 业务集成扩展平台以其低代码的创新特性,为跨境电商行业带来了…

头歌——人工智能(机器学习 --- 决策树2)

文章目录 第5关:基尼系数代码 第6关:预剪枝与后剪枝代码 第7关:鸢尾花识别代码 第5关:基尼系数 基尼系数 在ID3算法中我们使用了信息增益来选择特征,信息增益大的优先选择。在C4.5算法中,采用了信息增益率…

银河麒麟相关

最近安装了银河麒麟server版本,整理下遇到的一些小问题 1、vmware安装Kylin-Server-V10-SP3-General-Release-2303-X86_64虚拟机完成后,桌面窗口很小,安装vmwaretools后解决,下载地址http://softwareupdate.vmware.com/cds/vmw-de…

leetcode-71-简化路径

题解: 1、以"/"作为分隔符对字符串进行分割得到数组names; 2、初始化一个栈stack(python中的栈使用列表实现); 3、遍历数组names;如果当前元素为".."且栈不为空,则将弹出栈顶元素&a…

网络安全行业10大副业汇总,总有一个适合你

网络安全行业这10大副业汇总 总有一个适合你 引言 在当今的网络安全行业中,除了全职工作外,许多师傅还通过副业来增加收入、不断拓展自身技能,并积累更多实际操作经验,为职业发展增添了无限可能。 本文提供了10种适合各种类型…

Android13关于获取外部存储文件的相关问题及解决方案记录

Android的学习路上... 测试设备:vivo X90s安卓版本: Android13开发环境:AndroidStudio FlamingoSDK:33 最近我在Android13的环境下尝试写一个文件选择器,以便日后的开发使用。但是我们知道,从Android13 (A…

django restful API

文章目录 项目地址一、django环境安装以及初识restful1.1 安装python 3.10的虚拟环境1.2 创建django工程文件1.3 创建一个book app1.4 序列化(Django JsonResponse)1.4.1创建一个Models1.4.2 创建django的超级用户admin1.4.3 添加serializers.py生成序列化器1.5 FBV创建视图1…

用docker Desktop 下载使用thingsboard/tb-gateway

1、因为正常的docker pull thingsboard/tb-gateway 国内不行了,所以需要其它工具来下载 2、在win下用powershell管理员下运行 docker search thingsboard/tb-gateway 可以访问到了 docker pull thingsboard/tb-gateway就可以下载了 3、docker Desktop就可以看到…

ComfyUI初体验

ComfyUI 我就不过多介绍了,安装和基础使用可以看下面大佬的视频,感觉自己靠图文描述的效果不一定好,大家看视频比较方便。 ComfyUI全球爆红,AI绘画进入“工作流时代”?做最好懂的Comfy UI入门教程:Stable D…

分布式ID生成策略

文章目录 分布式ID必要性1.UUID2.基于DB的自增主键方案3.数据库多主模式4.号段模式5.Redis6.Zookeeper7.ETCD8.雪花算法9.百度(Uidgenerator)10.美团(Leaf)11.滴滴(TinyID) 分布式ID必要性 业务量小于500W的时候单独一个mysql即可提供服务,再大点的时候就进行读写分…

nuScenes数据集使用的相机的外参和内参

因为需要用不同数据集测试对比效果,而一般的模型代码里实现的检测结果可视化都是使用open3d的Visualizer在点云上画的3d框,展示出来的可视化效果很差,可能是偷懒,没有实现将检测结果投影到各相机的图像上,所以检测效果…