AI 硬件加速的重大飞跃!可训练机器学习硬件的光学芯片

编辑 | 绿萝

根据麦肯锡(McKinsey)最近的一份报告,机器学习应用每年飙升至 1650 亿美元。但在机器能够执行诸如识别图像细节等智能任务之前,必须先对其进行训练。训练现代人工智能 (AI) 系统(如特斯拉的自动驾驶仪)需要数百万美元的电力消耗,并且需要类似超级计算机的基础设施。

这种激增的 AI 「需求」,使得计算机硬件与 AI 需求之间的差距越来越大。光子集成电路(或简称为光学芯片),已成为提供更高计算性能的可能解决方案。然而,尽管他们已经证明改进了用于数据分类的机器智能的核心操作,但光子芯片尚未改进实际的前端学习和机器训练过程。

来自来自乔治华盛顿大学、女王大学、不列颠哥伦比亚大学和普林斯顿大学的一个多机构研究团队开发了一种可以训练机器学习硬件的光学芯片。提出了由 CMOS 兼容的硅光子架构支持的神经网络片上训练,以利用大规模并行、高效和快速数据操作的潜力。该高效、超快的神经网络训练方法展示了光子学作为执行 AI 应用程序的有前途的平台。

该研究以「Silicon photonic architecture for training deep neural networks with direct feedback alignment」为题,于 2022 年 11 月 23 日发布在《Optica》上。

6cd5a652f6920558f9964c6bc919be46.png

论文链接:https://doi.org/10.1364/OPTICA.475493

受深度学习最新进展的推动,AI 和神经形态计算领域在过去十年中经历了复兴。随着摩尔定律接近饱和,并且随着对高级机器学习算法的需求呈指数级增长,神经形态计算作为标准电子技术的替代品重新引起了人们的兴趣数字计算机体系结构。

由于硅光子学与成熟的硅集成电路行业的兼容性以及高质量的绝缘体上硅(SOI)晶圆的可用性,它已被证明是发展神经形态系统的一个有前途的平台。与用于神经形态应用的电子对应物相比,光子系统具有低延迟、高带宽密度和波特率、低成本通信以及使用光复用的固有并行性。

机器学习的一个领域将受益于光子学带来的低功耗和高信息处理带宽,那就是大型神经网络的训练。目前,基于模拟硬件的神经网络主要是离线训练,使用在数字平台上实现的训练算法模拟系统,然后将优化的网络参数映射到硬件平台进行推断。然而,这些模型可能无法捕获物理神经元及其互连的所有制造缺陷和变化。此外,与原位训练相比,准确模拟物理系统所需的计算开销可能导致执行时间变慢。

f454c437a4b07d320393274ce34ce062.png

图 1:离线和原位训练光子神经网络。(来源:论文)

最近提出的直接反馈对齐 (DFA) 监督学习算法作为流行的反向传播训练算法的生物合理替代方案引起了人们的兴趣。DFA 算法是一种监督学习算法,在反向传播过程中,通过固定的随机反馈连接将误差直接从输出层传播到隐藏层。该算法成为使用光子学进行高效并行化的合适候选者。

56090baf496c12d27f0d53c0e8a9ce3c.png

图 2. DFA 算法示意图。(来源:论文)

在这项工作中,研究人员提出了:(1)一种在片上实现训练算法 (DFA) 的硅光子架构;(2) 表明 DFA 非常适合光子实现,因为所有网络层都可以在反向传递期间并行更新;(3) 证明使用 DFA 进行的原位训练对噪声具有稳健性,因为固有地考虑了硬件的非理想性。

所提出的硅光子架构使用电光电路来原位计算每个隐藏层的梯度向量,这是在向后传递期间执行的计算量最大的操作。所提出的架构利用光子学的速度和能量优势来确定单个操作周期中每个隐藏层的梯度向量。本文的范围仅限于 DFA 算法反向传递的实现。在反向传播过程中,来自网络推理步骤的错误被编码在多通道光学输入上。然后电光电路计算每个隐藏层的梯度向量,用于使用外部数字控制系统更新存储在内存中的网络参数。

8042dbe089ff753e40df661805b8ee74.png

图 3:光子 DFA 架构示意图。(来源:论文)

研究人员还演示了使用实验性片上结果在 MNIST 数据集上训练前馈神经网络来验证光子架构。

研究人员使用两个相似的电路(具有固有不同的噪声)进行了两组光子内积操作测量,以验证所提出的架构。然后,使用这些结果在 Python 模拟中的 MNIST 数据集上训练前馈神经网络。

ad20ca201d4164f25857b24efacba502.png

图 4:使用具有不同特征噪声的两个光子电路在 MNIST 数据集上进行神经网络训练的实验演示。(来源:论文)

片外光电探测电路实验内积运算的误差标准差为0.098(4.35位),均值为0.003,而集成 BPD 电路的标准差较大,为0.202(有效分辨率3.31位),平均值为 0.003。

使用片外和片上 BPD 电路的仿真分别实现了 97.41±0.15% 和 96.33±0.16% 的测试精度,而在没有注入噪声的情况下实现了 98.10±0.13% 的测试精度。

这些仿真结果表明 DFA 算法对噪声和低精度计算具有显著的稳健性。神经网络在推理和训练过程中对加性和乘性噪声失真的显著稳健性使模拟光子硬件成为执行原位训练的有前途的平台。

「这种新颖的硬件将加速机器学习系统的训练,并充分利用光子学和电子芯片所提供的优势。这是人工智能硬件加速的重大飞跃。正如最近通过的《芯片法案》(CHIPS Act)所强调的,这些都是我们在半导体行业所需要的进步。」乔治华盛顿大学电气和计算机工程教授、初创公司 Optelligence 的创始人 Volker Sorger 说。

「AI 系统的训练会消耗大量的能源和碳足迹。例如,单个 AI transformer 所消耗的二氧化碳大约是一辆汽油车一生消耗的五倍。我们在光子芯片上的训练将有助于减少这种开销。」女王大学物理系助理教授 Bhavin Shastri 补充道。

参考内容:https://techxplore.com/news/2022-11-optical-chip-machine-hardware.html

人工智能 × [ 生物 神经科学 数学 物理 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展

欢迎注标星,并点击右下角点赞在看

点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481361.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器人自己造自己,究竟是怎么办到的?

来源:AI科技大本营整理:杨阳说起自我创生,首先想到的就是克隆。或许你已经听说过欧洲的小龙虾灾难,因为一只大理石纹螯虾的突发变异,导致的孤雌生殖在极短时间内就能克隆出成千上万只龙虾。虽然说是吃货福音&#xff0…

量子计算和人工智能:应该知道的10件事

来源:中国机器人网近年来,新兴技术变得突出。其中,量子计算具有改变我们世界的独特潜力。量子计算已经显示出有希望的证据,以令人难以置信的方式加速启发式计算。因此,在复杂的解决方案中应用量子计算来解决药物和材料…

用量子计算机创造史上首个虫洞 加州理工学院团队发Nature封面文章

来源:FUTURE远见选编:FUTURE | 远见 闵青云 日前,来自美国加州理工学院的Maria Spiropulu领导的团队使用谷歌的量子计算机对全息虫洞进行量子「模拟」。据称,该研究团队创造了有史以来第一个虫洞。论文作者表示,他们的…

Science Bulletin | 从“网络神经科学”到“网络神经外科”

随着科技进步,人类对大脑的认识不断深入。2004年脑的大尺度网络论述初步形成,2005年脑连接组学的概念首次提出,到2017年Sporns等在Nature neuroscience撰文系统论述,并提出了Network neuroscience的概念。与此同时,欧美…

科幻电影里的机器人假肢已经照进现实

来源:机器人大讲堂编辑:Jack排版:麦子20日晚,在卡塔尔世界杯开幕式上,一个身有严重残疾,胸部以下几乎缺失的卡塔尔人一亮相就赢得全场欢呼。一直以来,人们对坚强不屈的肢体残障人士都深怀敬意&a…

马斯克脑机接口最新演示:猴子学会意念打字,预计6个月内人体试验

来源:文章转载自机器之心(ID:almosthuman2014)在迟到半个多小时之后,马斯克在今日的 Neuralink Show & Tell 演示活动中展示了脑机接口的最新进展。在脑机接口领域,马斯克创办的Neuralink一直走在前列。…

Science:DeepMind又一突破,AI玩转了西洋陆军棋,跻身历史top3

对棋类游戏的掌握程度,一直是判断人工智能(AI)是否真正智能的依据之一,因为这类游戏可以被用来评估 AI 代理在受控环境下自主开发和执行策略的能力。如今,AI 在此前尚未掌握的经典棋类游戏 Stratego(西洋陆…

算法、图灵机、哥德尔定理与知识的不确定性

来源:人机与认知实验室作者:王荣江摘要:知识论一直在寻求对知识的确定性作一般算法式的逻辑证明的辩护。然而,即使在处理抽象的数量概念的数学基础研究中,也不能达到最终逻辑证明的确定性。图灵对停机问题的算法步骤的…

科学家建立邻近细胞遗传学技术揭示体内细胞间相互作用

来源:中国科学院分子细胞科学卓越创新中心12月2日,《科学》(Science)以Research Article的形式,在线发表了中国科学院分子细胞科学卓越创新中心(生物化学与细胞生物学研究所)周斌研究组的最新成…

三院士漫谈:未来机器人:目标、路径和挑战

来源: 机器人大讲堂从阿西莫夫提出机器人三定律已经过去70多年了。现在,科技巨头试水机器人的新闻也密集起来。比如8月里,小米发布了全尺寸人形仿生机器人“CyberOne”,别号“铁蛋”。特斯拉宣布将在今年9月30日推出人形机器人Opt…

整个元素周期表通用,AI 即时预测材料结构与特性

编辑 | 绿萝材料的性质由其原子排列决定。然而,现有的获得这种排列的方法要么过于昂贵,要么对许多元素无效。现在,加州大学圣地亚哥分校纳米工程系的研究人员开发了一种人工智能算法,可以几乎即时地预测任何材料(无论是…

Trends Cogn Sci 封面综述| 北师大毕彦超教授:人脑知识的双重编码理论

来源:brainnews编译作者:(嗯铃、洛文 brainnews创作团队)校审:(洛文、Freya brainnews编辑部)我们的大脑是如何编码有关世界的各种各样知识?我们与日益强大的AI有着怎样的不同&a…

亚马逊 CTO Werner Vogels:2023年及未来五大技术趋势预测

来源:亚马逊云科技近年来,几次全球性危机占据了我们的日常生活,因此看看我们是否可以利用技术来解决这些棘手的人类问题。如今,我们可以从很多互联设备获取数据,例如:可穿戴设备、医疗设备、环境传感器、视…

深度学习如何集成领域知识?IBM研究等《知识增强深度学习》综述,全面阐述科学与经验知识增强的深度学习...

来源:专知尽管在过去的几年里,深度学习模型在许多不同的领域取得了巨大的成功,但通常数据匮乏,在不可见的样本上表现不佳,而且缺乏可解释性。目标领域往往存在各种先验知识,利用这些先验知识可以弥补深度学…

不确定因果:当因果遇到量子

导语2022年诺贝尔物理学奖授予“用纠缠光子实验验证量子力学违反贝尔不等式”,确认了被称为“鬼魅般的超距作用”的量子纠缠现象。量子的世界常常超出人类的直觉,当我们将因果关系从经典世界外推到量子世界,会发生什么?研究发现&a…

脑机接口深度报告!四大关键技术让科幻走进现实|智东西内参

来源:智东西脑科学问题是人类社会面临的基础科学问题之一,是人类理解自然和理解人类本身的待深入探索领域,而脑机接口是有效探索手段之一。在国家战略的积极推动下,在科技创新不断更迭促进下,在人民大众期待关注下&…

写代码调 Bug,OpenAI 发布最强 AI 对话系统 ChatGPT!

来源:CSDN(ID:CSDNnews)整理:苏宓GPT-3 发布的两年后,我们没等来它的亲弟弟 GPT-4,而是在今天亲眼见证了 OpenAI 带来了一种全新的 AI 聊天机器人——ChatGPT,也可以称之为是 GPT-3 …

AI 大模型开源之困:垄断、围墙与算力之殇

从新兴技术转变为AI基础设施,大模型开源很重要,但也很难。来源:AI科技评论作者:李梅编辑:陈彩娴2020年6月,OpenAI发布GPT-3,其千亿参数的规模和惊人的语言处理能力曾给国内AI界带来极大的震动。…

神经符号 AI,或为下一代 AIoT 的新解法

来源:AI科技评论作者:黄楠编辑:陈彩娴11 月 22 日,2023 年度 IEEE Fellow 名单公布,入选者约1/3为华人学者。IEEE Fellow 被称为全球电子电气工程领域的最高荣誉,每年当选人数不足整个 IEEE 协会的千分之一…

ChatGPT会取代搜索引擎吗

来源:AI科技大本营作者:张俊林本文经作者授权发布,原文地址:https://zhuanlan.zhihu.com/p/589533490作为智能对话系统,ChatGPT最近两天爆火,都火出技术圈了,网上到处都在转ChatGPT相关的内容和…