光子深度学习:编码到光波上的机器学习模型的组件

编辑 | 萝卜皮

a18746fa6932e085d2d20d9298a2242e.png

由于功率、处理和内存的限制,高级机器学习模型目前无法在智能传感器和无人机等边缘设备上运行。

麻省理工学院的研究人员介绍了一种基于跨网络的离域模拟处理的机器学习推理方法。在这种被称为 Netcast 的方法中,基于云的「智能收发器」将重量数据流式传输到边缘设备,从而实现超高效的光子推理。

该团队以 98.8%(93%)的分类准确度展示了图像识别在 40 焦耳/倍(<1 个光子/倍)的超低光能下。研究人员在波士顿地区的现场试验中重现了这一性能,该试验超过 86 公里已部署的光纤,波长多路复用超过 3 太赫兹的光带宽。Netcast 允许具有最少内存和处理能力的毫瓦级边缘设备以保留给高功率(>100 瓦)云计算机的 teraFLOPS 速率进行计算。

该研究以「Delocalized photonic deep learning on the internet’s edge」为题,于 2022 年 10 月 20 日发布在《Science》。

c3d2455f5d2141dd33a332e9b345c99b.png

深度神经网络(DNN)的进步正在改变科学技术。然而,最强大的 DNN 日益增长的计算需求限制了在智能手机和传感器等低功耗设备上的部署,而同时向物联网(IoT)设备的发展加速了这一趋势。许多努力正在降低功耗,但由于矩阵代数中的能量消耗,一个基本的瓶颈仍然存在,即使对于包括神经形态、模拟存储器和光子网格在内的模拟方法也是如此。

在所有这些方法中,内存访问和乘法累加(MAC)函数仍然是每个 MAC 接近 1 pJ 的顽固瓶颈。边缘设备通常使用芯片级传感器,占用毫米级尺寸,并消耗毫瓦级功率。它们的小尺寸和低功耗预算意味着性能受到设备上集成的计算系统的尺寸、重量和功率(SWaP)的限制

为了使高级 DNN 在低功耗设备上完全可行,业界已将计算量大的 DNN 推理卸载到云服务器上。例如,智能家居设备可以将语音查询作为向量 U 发送到云服务器,云服务器将推理结果 V 返回给客户端(图 1)。这种卸载架构为语音命令增加了约 200 毫秒的延迟,这使得自动驾驶等服务变得不可能。此外,卸载在边缘和云中都带来了安全风险:客户端数据通信(向量 U)的黑客攻击导致了私有数据的安全漏洞。

c8ad098fcebf144490ef2aceff119b54.png

图 1:Netcast 概念。(来源:论文)

为了解决这些问题,麻省理工学院的研究团队引入了一种名为 Netcast 的光子边缘计算架构,以最大限度地减少大型线性代数运算(例如,通用矩阵向量乘法 [GEMV])的能量和延迟。

在 Netcast 架构中,云服务器以模拟格式将 DNN 权重数据(W)流式传输到边缘设备,以实现超高效的光学 GEMV,从而消除了所有本地权重内存访问。

包含「智能收发器」的服务器会定期将常用 DNN 的权重(W)广播到边缘设备,使用波分复用(WDM)来利用本地接入层可用的大频谱。

具体来说,一个 DNN 层的(M,N)大小的权重矩阵可以通过幅度调制场ed9718710523f12461c47f25af9519d3.png在时频基础上进行编码,其中,频率 Wn 和时间步长 j 处的光幅度 wnj 表示权重矩阵的第 n 行,δ 是脉冲响应函数。

现在假设图 1 中的相机需要对图像 X 进行推断。为此,它等待服务器传输「图像识别」 DNN 权重,它使用宽带光学调制器与30793c019a3c73a9573907abb66c0221.png进行调制,随后将波长分离到 N 个时间积分检测器以产生矢量-矢量点积68b169a857be329d25b22ca0289fbc9e.png。这种架构最大限度地减少了客户端的有源组件,只需要一个光调制器、数模转换器 (DAC) 和模数转换器(ADC)。

6c165c7f8f9d700e0944d45f560d079a.png

图 2:Netcast 系统的实验演示。(来源:论文)

此处显示的系统级演示是 Netcast 实现的一个示例。基于云的智能收发器可以驻留在现有的网络硬件中,例如网络交换机、服务器或边缘节点。研究人员的想法是,可以扩展到用户数据通过带有智能收发器的可编程网络交换机流式传输的情况,从而实现网络内光学推理。

现代网络交换机,例如英特尔的 Tofino 交换机,是商业开发 Netcast 的理想平台,由于它们是可编程的,因此能够以线速(100 Gbps)部署多个权重流,并且可以支持 64 GB 的内存,达到现代神经网络的存储要求。

02bfeb0cb445b6cedce776c3d7be05b4.png

图 3:Netcast 系统的计算精度。(来源:论文)

先前的工作已经证明了使用可编程开关通过智能收发器执行逐层推理的可行性。这些网络交换机的大数据存储使得可以存储和查询多个模型。客户端设备可以使用其宽带调制器允许反射模式通信返回到服务器,客户端调制接收到的光并沿光纤链路将其发送回进行通信。这种查询通信可能很慢且有损,因为请求发送新模型只需要几个位。

新兴的光子技术,例如低功率静态移相器和高速移相器,可以将接收器电能消耗降低到每 MAC 约 10 aJ。通过使用无接收器检测器、光子 DAC 和光子 ADC 等技术,晶体管和光子在硅中的紧密集成可以进一步降低这种能量。诸如雪崩探测器之类的探测器可以与时间积分器结合,以提高接收器的光学灵敏度,但代价是增加了电能消耗。通过使用相干检测可以进一步提高光学灵敏度,该检测使用强大的本地振荡器增强接收到的信号。

faed4b43d7ba67c01fc755016b99a788.png

图 4:热噪声限制了 Netcast 系统的光学灵敏度。(来源:论文)

许多公司设计了具有减少 SWaP 的定制边缘计算专用集成电路(ASIC),但这些 ASIC 受到与较大 CMOS 处理器相同的能量和带宽限制的阻碍。与电子同类产品相比,忆阻交叉阵列和光子干涉仪网格等模拟加速器有望降低神经网络的功耗,但现有的商业演示仍然消耗瓦特的功率。

在传统光通信系统中缩放带宽的一个障碍是光纤中的色散。对于单个智能收发器和客户端,波长相关延迟等技术可以补偿智能收发器的色散。但是,在将权重从一个具有不同光纤长度的智能收发器部署到多个客户端的系统中,不能使用这种技术。研究人员在论文中讨论了色散的影响,并表明可以利用光学 O 波段在超过 10 公里的光纤上以每波长 10 GHz 的时钟速率实现太赫兹带宽。

8c9dc435b52d2a32fff6ad74237e3014.png

图 5:Netcast 的前瞻性表现。(来源:论文)

这种边缘计算架构利用光子学和电子学的优势,在能效和光学灵敏度方面比现有数字电子学提高了几个数量级。研究人员展示了使用 WDM 的可扩展光子边缘计算、时间积分接收器、可扩展至毫瓦级功耗、<1 photon-per-MAC 接收器灵敏度,以及使用 3 THz 带宽在已部署光纤上进行计算。在图像分类任务中,他们展示了 98.8% 的准确图像分类。

论文中展示的硬件很容易在现有的 CMOS 代工厂大规模生产,从而可以对日常生活产生短期影响。同时,该方法消除了边缘计算的基本瓶颈,在部署的传感器和无人机上实现高速计算。

论文链接:https://www.science.org/doi/10.1126/science.abq8271

相关报道:https://techxplore.com/news/2022-10-deep-components-machine-encoded.html

人工智能 × [ 生物 神经科学 数学 物理 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展

欢迎注标星,并点击右下角点赞在看

点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481461.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【实体对齐·综述】A Benchmarking Study of Embedding-based Entity Alignment for Knowledge Graphs

文章目录模板的简述简述1.Introduction2. preliminatries2.1 literature review2.1.1 knowledge graph embedding2.1.2 Conventional Entity Alignment2.1.3 embedding-based entity alignment2.2 Categorization of Techniques2.2.1 Embedding Module2.2.1.1 关系嵌入2.2.1.2 …

深度学习优化背后包含哪些数学知识?

来源&#xff1a;图灵人工智能深度学习中的优化是一项极度复杂的任务&#xff0c;本文是一份基础指南&#xff0c;旨在从数学的角度深入解读优化器。深度学习中的优化是一项极度复杂的任务&#xff0c;本文是一份基础指南&#xff0c;旨在从数学的角度深入解读优化器。一般而言…

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

来源&#xff1a;FUTURE远见选编&#xff1a;FUTURE | 远见 闵青云 文&#xff1a;AI科技评论 近日&#xff0c;剑桥大学的2022年 AI 全景报告&#xff08;《State of AI Report 》&#xff09;出炉&#xff01;报告汇总和聚焦了过去一年里 AI 行业中炙手可热的事件&#xff0c…

实体对齐汇总

文章目录1.综述2.技术论文3.汇总3.1定义定义统一EA3.2 评价指标3.3 数据集3.4 数据预处理技术3.5 索引3.6 对齐3.6.1 按属性相似度/文本相似度做&#xff1a;成对实体对齐3.6.2 协同对齐&#xff1a;考虑不同实体间的关联3.6.2.1 局部实体对齐3.6.2.2 全局实体对齐3.6.3 基于em…

博后出站即任985教授!他致力于寻找人类五感世界的最后一块拼图

来源&#xff1a;iNature两年前&#xff0c;闫致强从底蕴深厚的复旦大学生命科学学院“跳”到尚处于新生期的深圳湾实验室&#xff0c;“蜗居”在一栋商业大楼里&#xff0c;和团队在这里寻找人类感知世界的最后一块拼图。在亚里士多德定义的五种感官中&#xff0c;介导嗅觉、味…

【实体对齐·BootEA】Bootstrapping Entity Alignment with Knowledge Graph Embedding

文章目录0.总结1.动机2. 贡献方法3.应用场景4.其他模型5.数据集6.效果以下的是组内比较BootEA: “Bootstrapping Entity Alignment with Knowledge Graph Embedding”.Zequn Sun, Wei Hu, Qingheng Zhang, Yuzhong Qu. (IJCAI 2018) [ paper][ code]0.总结 BootEA笔记 BootE…

一项人工智能、化学和分子机器人的交叉研究,加速创新和药物发现,并简化复杂的化学过程自动化...

编辑 | 萝卜皮深入了解各类化学物质的最佳一般反应条件&#xff0c;可以加速创新和药物发现&#xff0c;并使复杂的化学过程自动化且易于使用&#xff0c;对生物医药、材料研究具有重要意义。然而&#xff0c;有机反应的一般条件很重要但很少见&#xff0c;以往识别它们的研究通…

【实体对齐·综述】An Experimental Study of State-of-the-Art Entity Alignment Approaches

文章目录0.总结1.Introduction2.Preliminaries2.2 Scope and Related work2.2.1 Entity Linkingentity disambiguation2.2.2 Entity resolutionentity matchingdeduplicationrecord linkage2.2.3 Entity resolution on KGs2.2.4 EA3.general框架3.1 Embedding Learning Module3…

汽车生产线上的工业机器人是如何工作的?

来源&#xff1a;宝石部落 责任编辑&#xff1a;朱光明 审核人&#xff1a;王颖十年来&#xff0c;随着机器人在制造业的普遍应用&#xff0c;我国工业机器人产业规模快速增长。2021年&#xff0c;我国工业机器人产量达36.6万台&#xff0c;比2015年增长了10倍&#xff0c;市场…

【实体对齐·HGCN】Jointly Learning Entity and Relation Representations for Entity Alignment

文章目录1.动机2.输入输出3.相关工作4.模型4.1 GCN4.2 approximating relation representations4.3 joint entity and relation alignmentHGCN: “Jointly Learning Entity and Relation Representations for Entity Alignment”. Yuting Wu, Xiao Liu, Yansong Feng, Zheng Wa…

Science:海马中如何实现选择性地招募神经元来巩固记忆?

来源&#xff1a;brainnews作者&#xff1a;brainnews创作团队神经元网络活性的标志是选择性地将神经元招募到活跃的集合中&#xff0c;形成暂时稳定的活动模式。在哺乳动物的海马体中这种神经元集合在ripples&#xff08;~200Hz&#xff09;振荡期间反复激活&#xff0c;支持空…

往年笔试题

文章目录1 概率1.1 条件概率.每天9点到10点&#xff0c;小明和小红在同一个车站乘坐公交车上班。小明坐101路公交车&#xff0c;每5分钟一班{9:00, 9:05, 9:10, …}&#xff1b;小红坐102路公交车&#xff0c;每10分钟一班{9:00, 9:10, 9:20, …}&#xff0c;问小明和小红每天相…

量子生物学的未来:量子理论如何帮助理解生命?

导语2022年诺贝尔物理学奖授予了关于量子信息科学的基础性研究。一百多年前&#xff0c;量子革命为我们带来了晶体管和激光&#xff0c;今天&#xff0c;基于量子信息的新技术正在让我们进入一个新的量子信息时代。事实上&#xff0c;已有研究表明&#xff0c;在生命过程中也存…

【量化投资1】

文章目录0.相关包及常识1.股票买卖收益分析2.双均线策略2.1 均线2.2 双均线2.2.1 金叉死叉的获取量化投资0.相关包及常识 股票的买入卖出&#xff1a;最少为一手&#xff0c;100股 tushare open:开盘价格&#xff0c;close:收盘价格 1.股票买卖收益分析 每次至少买入1手最后…

超高效人工光电神经元成真?速度比自然神经元快3万倍,研究登Nature子刊

来源&#xff1a;悦智网作者&#xff1a;Charles Q. Choi翻译&#xff1a;机器之心原文链接&#xff1a;https://spectrum.ieee.org/neuromorphic-computing-superconducting-synapseAI系统越来越受限于为实现其功能的硬件。现在&#xff0c;一种新的超导光子电路问世&#xff…

2022年工业机器人的5大应用行业

来源&#xff1a;工业机器人前言截止至2022年&#xff0c;在中国60&#xff05;的工业机器人应用于汽车制造业&#xff0c;其中50&#xff05;以上为焊接机器人&#xff1b;在发达国家&#xff0c;汽车工业机器人占机器人总保有量的53&#xff05;以上。‍本文梳理了五大应用行…

【java spring学习1】IOC理论,spring用DI实现IOC

狂神说java spring:让java 开发更容易 IOC&#xff1a;控制反转 AOP&#xff1a;面向切面编程&#xff08;业务面&#xff09; 2. spring组成和扩展 2.1spring 组成 Sprint AOP ORM:对象关系映射 Context:UI界面、邮件验证等 2.4 拓展 学习路线&#xff1a; spring boot:构…

深度学习以最佳纳米尺度分辨率解决重叠单个分子的3D方向和2D位置,生成蛋白质图片...

编辑 | 萝卜皮偶极扩散函数 (DSF) 工程重塑了显微镜的图像&#xff0c;可以最大限度地提高测量偶极状发射器 3D 方向的灵敏度。然而&#xff0c;严重的泊松散粒噪声、重叠图像以及同时拟合高维信息&#xff08;包括方向和位置&#xff09;使单分子定向定位显微镜&#xff08;SM…

【大数据学习-hadoop1】大数据如何处理

文章目录1. 大数据启蒙1.1 意义1.1.1 查找元素1.1.2 单机处理大数据问题1.2 历史1.3 hadoop1. 大数据启蒙 学习视频 大数据多&#xff0c;复杂度很重要&#xff0c; 内存不够&#xff0c;分治处理IO仍成为瓶颈&#xff0c;多机器并行多机器间通信也可以并行&#xff0c;但仍是…

自动驾驶数据之争,走向合规

报道数字经济 定义转型中国撰文 | 泰伯网 编辑 | 鹿野2015年12月&#xff0c;一辆百度无人车从京新高速到五环进行了最高时速达100公里的全自动行驶&#xff0c;将国内自动驾驶推向大众视野。当自动驾驶产业随时间沉淀驶入商业落地的下半场&#xff0c;百度对这场自动驾驶持久…