存内架构IR-DROP问题详解-电容电导补偿

一、总述

电容、电导补偿作为大规模数字电路的关键设计理念,是 CIM 架构优化的核心技术。在 CIM 中,平衡电容或电导并实现计算的精准映射,对能效提升和计算精度保障具有关键作用。本文基于近期文献探讨电容、电导补偿在 CIM 中的具体补偿策略,同时展望未来发展方向,包括如何进一步优化补偿方法以适应更复杂的计算需求,提高 CIM 系统的整体性能,为相关研究和技术发展提供理论分析和参考。

二、计算架构电容、电导补偿的优化背景

CIM技术凭借其在突破冯诺依曼瓶颈、降低数据移动能耗和提升计算并行性等方面的优势,已经成为高效计算的优质解决方案。在这种背景下,如何平衡CIM芯片计算精度与能效之间的矛盾,以及如何在电路中补偿电容或电导不均匀所带来的误差,成为了存内计算架构优化中的关键问题之一。

在存算一体架构中,电容补偿和电导补偿技术是作为解决非线性和信号失真问题的有效方法。非线性和信号失真问题主要源于电路中存在的寄生电容和电导的不匹配,导致了计算精度的损失和信号处理的不稳定性。电容和电导的不均匀性会引起线上的信号幅度差异,从而在计算中产生误差,影响最终结果的精度。电容补偿的核心思想是通过在存储单元中引入补偿电容,使得存储阵列中不同列或行的电容总和相等,从而减少因电容不匹配导致的计算误差。类似地,电导补偿通过引入补偿电导,使得在基于RRAM的存内计算中,正负输入端的负载导电值保持平衡,从而消除不匹配导致的非线性误差。

电容、电导补偿技术的应用使得存算一体电路在面对高精度需求时可以显著降低因不匹配而引起的信号失真,从而提升整体计算精度。电容、电导补偿的提出和应用为存算一体技术在实际应用中的可靠性提供了重要保障。

三、电容补偿(CapCom)

以基于SRAM的存算一体设计为例,电容补偿(Capacitance Compensation, CapCom)是一种常见的用于实现多位或有符号乘累加操作的技术。CapCom的基本原理是通过引入补偿电容,使得存储阵列中不同列或行的电容总和相等,从而消除因电容不匹配引起的误差。

图1 SRAM的字选择线和数据线会受寄生电容影响

具体来说,常规的基于SRAM的存算一体设计在SRAM阵列中使用多个带有不同权重的电容与比特线相连,以实现部分MAC结果的累加。在这种设计中,通常通过预充电和放电的方式来完成MAC运算,而补偿电容的加入则确保了每一列上的电容负载相等,从而提高了运算精度。电容不匹配会对计算结果产生显著影响,例如导致线上的信号幅度差异,进而影响到后续计算的准确性。常用的电容补偿方法有:

  • 成对电容补偿:通过匹配电容大小以减小误差。这种方法确保每个比特线上的电容负载相等,从而减少了由于电容不匹配而导致的信号失真问题。
  • 整体电容补偿:在芯片设计阶段进行电容阵列的优化,确保在设计过程中就考虑到所有电容之间的匹配性,以最大程度减少电路中的非线性误差。
  • 图2 某CIM设计的ADC采样模块的补偿电容器

某些设计中还会使用双通道(even-odd dual-channel, EODC)模式,通过在不同模式下激活偶数或奇数列,以增加带宽并确保信号的稳定性。此外,CapCom还被用于一些更为复杂的模拟计算芯片设计中,例如融合了光学计算与电子模拟计算的ACCEL芯片。该芯片通过光电二极管将光信号转换为电信号,并利用补偿电容来实现符号二进制的MAC运算,从而有效提高了计算的能效和精度。电容补偿技术的优势在于可以显著提高计算的线性度和一致性,使得在模拟计算中能够实现较高的精度。然而,其局限性也不容忽视,主要体现在电路设计的复杂性增加,以及在高密度集成电路中难以实现完全精确的补偿。

四、电导补偿(ConCom)

在数据密集型应用(如神经网络)中,矩阵向量乘法(MVM)是核心计算操作,关键在于基于电阻式随机存取存储器(RRAM)等的交叉点存储阵列技术,它能使计算在存储单元内直接进行,CIM避免了传统架构中数据在存储与计算单元间频繁传输带来的延迟和能耗,有效提升计算性能。

以丝状 RRAM 为例,其为金属 - 绝缘体 - 金属(MIM)堆叠结构,如图3经形成操作进入低阻态(LRS),之后可通过复位和置位操作切换电阻状态。置位操作时,可通过合规电流调节电导来精确控制电阻,也可利用基于电压的电阻调谐以适应不同计算需求。

图3(a) RRAM 器件由夹在金属顶部电极和底部电极之间的介电层组成。(b) 经过成形操作后,器件切换到低阻态(LRS)。(c) 在施加复位脉冲后,可以恢复到高阻态(HRS)

图4 整体电导变化的离散程度相对稳定

通过增量门脉冲编程(IGPP)技术实验如图4,RRAM 循环编程时电导中位数渐增,但各单元个体特性随机变化,电导分布标准差近乎恒定。除 IGPP 外,也可控制复位转换时最大顶电极电压调制电导,不过从实验和应用看(如图5),控制置位操作电导在精确电阻控制上更优,能提高计算准确性和稳定性。

图5 在 IRPP 过程中,电导随脉冲次数的变化轨迹,以及中值(蓝色)

在 4kb 的 RRAM 阵列等大规模测试中,编程算法会影响电导分布,其标准差大于循环间变化,导致不同器件间电导离散程度大、一致性差。多电平编程时相邻电导分布重叠,严重影响 RRAM 存储和计算精确性,降低数据存储读取准确性及计算系统整体性能。此外,高温退火会使 RRAM 导电丝原子扩散,微观结构改变,使得RRAM导电性能下降且电阻值不确定性增加。在CIM的应用中,作为存储器的RRAM 主要用于存储权重等关键信息,其电导变化直接影响推理精度,因不准确电导值使计算结果偏差,推理中偏差累积,最终可能致神经网络输出错误结果。

图6 在一个1 kB存储阵列的HfO2 RRAM中,4个已编程LRS电平和1个HRS电平的读取电流分布 (a) 通过ISPVA(编程后电流分布的标准化技术)获得的分布。(b) 在125°C退火1小时后的分布。

成对电补偿:ConCom原理首先应用于实值矩阵的矩阵向量乘法(MVM)电路,通过在运算放大器(OPA)的输入节点配置补偿电导,使电路能够在不使用模拟反相器的情况下实现实值矩阵计算。该方法还适用于实值矩阵求逆电路和特征向量电路,通过建立全局负反馈回路,根据电路的矩阵方程配置补偿电导,实现相应的计算功能。对于更复杂的电路,如广义逆电路,ConCom 方法同样适用,通过在左右阵列中进行行和列的电导补偿,实现电路输入节点的负载平衡,从而解决线性方程组问题。

图7 基于CONCOM的MVM电路。RRAM设备的最左列用于confom。

整体电补偿:ConCom 的概念也可扩展到整个阵列,为实现一步矩阵 - 矩阵 - 向量乘法(MMVM)电路奠定基础。在 MMVM 电路中,通过确定补偿电导的值,使每个位线(BL)的电阻负载相等,可使电路可作为构建模块用于解决更复杂的问题,如基于局部竞争算法(LCA)的压缩感知(CS)恢复电路,通过将 MMVM 电路与模拟反相器、跨阻放大器(TIA)和软阈值模块相结合,实现从压缩输入信号中重建原始信号的功能。

图8 基于ConCom的Gram矩阵向量乘法(MVM)电路。交叉点阻变存储阵列由两份矩阵  和补偿RRAM器件组成。

在基于电阻式存储器的 CIM 中,电导补偿方法具有提高导通电流一致性的优势,成对电导补偿法在多种实值矩阵相关电路中通过合理配置补偿电导平衡电导差异、确保电流稳定传输和计算准确,整体电导补偿法在 MMVM 电路中使各 BL 电阻负载相等、保证电流均匀分布;然而,这些方法也存在局限性,它们对制造工艺要求更高,需要精确控制电阻式存储器的电导特性,制造过程中任何偏差都可能影响电导值准确性、导通电流均匀性和计算精度,还可能导致成本上升与生产效率降低等问题。

五、发展方向

在未来的存内计算系统中,电容、电导补偿需从电路与架构协同出发。在电路层面,可以优化存储单元的周边电路,例如设计读写电路与选通电路,降低信号干扰,提升传输效率;在架构层面,针对三维堆叠存内计算架构,深入研究层间电容耦合与电导分布,制定适配补偿策略。为满足复杂计算需求,。电容、电导补偿精度可以通过深入探究存储器件的物理特性从而构建复杂数学模型以开发动态补偿算法,使其可以依据存储单元的实时状态,如电阻变化受温度影响的规律,精确计算补偿参数。另一方面,可以将算法映射至硬件并设计专用硬件电路,融合数字信号处理、模拟前端及可编程逻辑器件功能。

在工具链领域,EDA工具机器学习将在补偿策略探索中发挥关键作用。EDA对存内计算架构全面建模与仿真,涵盖存储单元、补偿电路及周边电路。设计人员可在EDA环境中设置不同策略参数,快速评估对系统性能的影响。同时,如果可以收集存储单元在多工况下的数据,训练机器学习模型预测性能变化并运用强化学习优化电路拓扑结构,搭载人工智能技术的EDA工具可以模拟更多电路结构性能,找到最优布局与参数组合,增强补偿电路适应性。

另外,考虑到RRAM和PCM等新型存储器在存内计算潜力巨大,针对新型存储器的电容、电导补偿应用同样前景广阔。RRAM 电阻变化复杂,受离子迁移等因素影响,可以通过在其单元中引入电容补偿结构,稳定编程电压,减小电阻变化误差;PCM在相变时电学特性改变显著,补偿技术可优化能量传递与信号检测,同时调整补偿参数可以确保相变过程中数据的准确读写。

七、总结

电容、电导补偿技术对存内计算意义非凡,它不仅能有效克服存储单元的非理想特性,还提升计算精度、速度与稳定性。当前补偿技术的研究方向聚焦于技术深度优化和新材料器件应用刚面,这不仅能突破现有瓶颈,还能释放存内计算的巨大潜力。此外,电容、电导补偿技术与CIM技术的深度融合,将引领计算架构优化进入新阶段,从而为实现高效、智能、低功耗的计算提供坚实支撑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/888867.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HDR视频技术之六:色调映射

图像显示技术的最终目的就是使得显示的图像效果尽量接近人们在自然界中观察到的对应的场景。 HDR 图像与视频有着更高的亮度、更深的位深、更广的色域,因此它无法在常见的普通显示器上显示。 入门级的显示器与播放设备(例如普通人家使用的电视&#xff0…

隐式神经网络实现低光照图像增强

✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨ 🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢,在这里我会分享我的知识和经验。&am…

深入浅出:SOME/IP-SD的工作原理与应用

目录 往期推荐 相关缩略语 SOME/IP 协议概述 协议介绍 SOME/IP TP 模块概述和 BSW 模块依赖性 原始 SOME/IP 消息的Header格式 SOME/IP-SD 模块概述 模块介绍 BSW modules依赖 客户端-服务器通信示例 Message 结构 用于SD服务的BSWM状态处理 往期推荐 ETAS工具…

【Docker】Linux与Windows系统安装Docker+Docker上简单安装MySQL

一、Windows安装Docker 由于我在许多平台搜索Windows下安装Docker的方法,都提到了Win10家庭版无法直接安装Docker。个人电脑就是Win10家庭版,本着实践出真知的想法,个人在本机Win10家庭版实验结果为需要采用下述传统手动安装的办法&#xff…

关于springBoot+vue项目中配置SSL证书问题

前端可以通过https进行访问 1.前端在访问后端接口时,使用https进行访问,在request.js配置文件中,这个文件是配置axios的基本请求的,在基础请求地址中改为https方式 2.需要在Linux中的nginx中配置ssl证书,具体请参考&…

rk3568之mpp开发笔记mpp移植到开发板

前言: 大家好,今天给大家介绍的内容是rk平台的mpp编解码这块的内容,在rk目前看到有三套框架涉及到编解码内容: 1、rkmedia 2、rockit 3、mpp 这三种不同形式的编解码方式,后面再做详细的框架对比,今天我…

如何利用Java爬虫获得商品类目

在当今数字化时代,数据已成为企业最宝贵的资产之一。获取和分析数据的能力对于任何希望在市场上保持竞争力的企业来说都是至关重要的。对于电子商务平台和市场研究公司而言,获取商品类目数据尤为重要,因为这些数据可以帮助他们更好地理解市场…

Scratch教学作品 | 3D飞行模拟器——体验飞行的无限乐趣! ✈️

今天为大家推荐一款令人惊叹的Scratch作品——《3D飞行模拟器》!由BamBozzle制作,这款游戏完全用Scratch构建,带你体验开放世界飞行的自由与乐趣。从起飞到降落,每一步都需要你的精准操作!更棒的是,这款游戏…

堆排序(建堆用向上还是向下?)、topK问题

目录 1.堆排序 思考:建堆用向上调整建堆还是向下调整建堆?调堆用向上调整还是向下调整? 1.3总结:升序用大堆,降序用小堆。用向下调整建堆。 2.topK 2.3总结:要前k大,建小堆。要前k小&#…

Spring Boot配置文件敏感信息加密

一,背景 Spring Boot应用中的数据库、Redis、Nacos、MQ等的用户名、连接地址、密码在配置文件中一般都是明文存储,如果系统被系统攻破或者配置文件所在的目录读权限被破解,又或者是动态配置文件被窃取,内部人员或者黑客很容易通过…

学生信息管理系统(简化版)

前端部分&#xff08;vue2&#xff09; &#xff01;&#xff01;前端采用vue2框架&#xff0c;下面只写出必要的代码文件&#xff0c;想要使用需自行先创建vue项目 部分截图 下面是目录结构 下面是public文件夹里面的html文件 <!DOCTYPE html> <html lang"&q…

【密码学】分组密码的工作模式

1.电码本模式&#xff08;ECB&#xff09; 优点: 每个数据块独立加密&#xff0c;可并行加密&#xff0c;实现简单。 缺点: 相同明文会产生相同密文&#xff0c;不具备数据完整保护性。 适用于短消息的加密传输 (如一个加密密钥)。 工作流程&#xff1a;用相同的密钥分别对…

Redis探秘Sentinel(哨兵模式)

概述 Redis的高可用机制有持久化、复制、哨兵和集群。其主要的作用和解决的问题分别是&#xff1a; 持久化&#xff1a;持久化是最简单的高可用方法(有时甚至不被归为高可用的手段)&#xff0c;主要作用是数据备份&#xff0c;即将数据存储在硬盘&#xff0c;保证数据不会因进程…

mysql的索引分类和索引优化

索引介绍 索引是帮助MySQL高效获取数据的排好序的数据结构&#xff1b;存储的内容是指向表中数据的指针 mysql有多种索引&#xff0c;Btree索引&#xff0c;全文索引&#xff0c;哈希索引、空间索引。其中以BTree索引应用最为广泛 假设从0到1000中&#xff0c;猜一个数字。结…

短视频矩阵系统开发|技术源代码部署

短视频矩阵系统通过多账号运营管理、多平台视频智能分发等功能&#xff0c;助力企业实现视频引流、粉丝沉淀和转化。 短视频矩阵系统是一种创新的营销工具&#xff0c;它整合了多账号管理、视频智能分发、数据可视化等多种功能&#xff0c;为企业在短视频领域的发展提供了强大…

计算机网络研究实训室建设方案

一、概述 本方案旨在规划并实施一个先进的计算机网络研究实训室&#xff0c;旨在为学生提供一个深入学习、实践和研究网络技术的平台。实训室将集教学、实验、研究于一体&#xff0c;覆盖网络基础、网络架构、网络安全、网络管理等多个领域&#xff0c;以培养具备扎实理论基础…

【开源免费】基于SpringBoot+Vue.JS中小型医院网站(JAVA毕业设计)

博主说明&#xff1a;本文项目编号 T 078 &#xff0c;文末自助获取源码 \color{red}{T078&#xff0c;文末自助获取源码} T078&#xff0c;文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析…

Wireshark数据抓包分析之传输层协议(TCP协议)

根据实验环境&#xff0c;本实验的步骤如下&#xff1a; 1.在测试环境使用发包工具和Wireshark抓取TCP三次握手和四次断开的数据包。 2.详细分析TCP协议的三次握手以及四次断开。 任务描述&#xff1a;安装发包工具&#xff0c;并配置TCP客户端&#xff0c;服务端&#xff0…

【目标检测】【反无人机目标检测】使用SEB-YOLOv8s实时检测未经授权的无人机

Real-Time Detection of Unauthorized Unmanned Aerial Vehicles Using SEB-YOLOv8s 使用SEB-YOLOv8s实时检测未经授权的无人机 论文链接 0.论文摘要 摘要&#xff1a;针对无人机的实时检测&#xff0c;复杂背景下无人机小目标容易漏检、难以检测的问题。为了在降低内存和计算…

Flume基础概念

目录 作用组件构成ClientFlowAgentSourceSinkEvent 和Log4j的区别与定位事务传出流程输入到sourcesource端输入Channel 接收输入到SinkSink输出 作用 Flume可以从各种来源&#xff08;如日志文件、消息队列、网络数据、文件系统、数据库等&#xff09;收集数据&#xff0c;并将…