斯坦福证明神经网络能直接在光学芯片上训练

640?wx_fmt=jpeg

来源:全球人工智能

摘要:据报道,美国斯坦福大学的研究人员已经证明,可以直接在光学芯片上训练人工神经网络。


据报道,美国斯坦福大学的研究人员已经证明,可以直接在光学芯片上训练人工神经网络。这一重大突破表明,光学电路可以实现基于电子的人工神经网络的关键功能,进而可以以更便宜、更快速和更节能的方式执行语音识别、图像识别等复杂任务。


“相比使用数字计算机,使用光学芯片进行神经网络计算更有效,能够解决更复杂的问题,”斯坦福大学研究团队的负责人范汕洄(Shanhui Fan)说:“这将增强人工神经网络的能力,例如,使其能够执行自动驾驶汽车所要求的任务,或者能够对口头问题做出适当的回答。这将以我们现在无法想象的方式改善我们的生活。”


人工神经网络是人工智能的一种,它使用连接的单元,以类似大脑处理信息的方式来处理信息。使用人工神经网络执行复杂的任务,例如语音识别,需要训练算法对输入进行分类,比如对不同的单词进行分类。


虽然光学人工神经网络最近已经得到实验证明,但此前的研究是在传统的数字计算机上使用一个模型进行训练步骤,然后将最终的设置导入光学电路。在最新Optica期刊上,斯坦福大学的研究人员报告了一种新方法,通过实现“反向传播”算法(这是训练传统神经网络的标准方法)的光学模拟,直接在设备中训练人工神经网络。


640?wx_fmt=png

图:研究人员已经证明,神经网络可以通过光学电路(图中蓝色矩形)进行训练。在整个网络中,有若干个这样的电路连接在一起。激光输入(绿色)的编码信息由光波导(黑色)通过芯片。芯片使用可调波束分离器(光波导中弯曲的部分)执行对人工神经网络至关重要的操作。分离器将两个相邻的波导连接在一起,并可通过调整光学移相器(红色和蓝色发光物体)的设置进行调整。分离器的作用就像“旋钮”,可以在特定任务的训练过程中进行调整。Credit: Tyler W. Hughes, Stanford University


该论文的第一作者说:“使用物理设备而不是计算机模型进行训练,可以使训练过程更精确。”“而且,由于训练步骤是神经网络实现中非常耗费计算力的部分,因此,在光学电路上执行这个步骤,对于改进人工神经网络的计算效率、速度和功耗都是至关重要的。”


基于光的网络


虽然神经网络处理通常使用传统的计算机进行,但仍有大量的工作要专门设计针对神经网络计算优化的硬件。基于光学的设备非常吸引人,因为它们可以并行地执行计算,同时比电子设备消耗的能量更少。


在这项新研究中,研究人员通过设计一种光学芯片来复制传统计算机训练神经网络的方式,克服了实现全光学神经网络(all-optical neural network)的一个重大挑战。


人工神经网络可以被视为一个带有许多旋钮的黑盒。在训练期间,每个旋钮都要转动一点,然后测试系统,查看算法的性能是否得到改善。


“我们的方法不仅可以帮助预测旋钮转动的方向,还可以预测每个旋钮转动的方向,从而更接近预期的性能。”Hughes说,“我们的方法大大加快了训练速度,特别是对于大型网络,因为可以并行地获得每个旋钮的信息。”


片上训练


新的训练协议在具有可调谐光束分离器的光学电路运行,通过改变光学移相器的设置进行调整。具体来说,该方法是将编码有待处理信息的激光束发射到光学电路中,由光波导通过光束分离器进行传输,像旋钮一样进行调整,以训练神经网络算法。


640?wx_fmt=gif


在新的训练协议中,激光首先通过光学电路输入。退出设备后,计算出与预期结果的差值。然后,这些信息被用来产生一个新的光信号,这个信号通过光网络以相反的方向发送回来。


640?wx_fmt=gif


通过测量此过程中每个分束器周围的光强度,研究人员展示了如何并行地检测神经网络的性能随着每个分束器设置而变化的情况。移相器的设置可以根据这些信息进行更改,这个过程可以重复,直到神经网络产生期望的结果。


研究人员用光学模拟测试了他们的训练技术,方法是教算法执行复杂的任务,比如在一组点中找出复杂的特征。他们发现光学实现与传统计算机的执行类似。


该研究的负责人说:“我们的研究表明,你可以利用物理定律来实现计算机科学算法。”“通过在光学领域对这些网络进行训练,证明光学神经网络系统可以利用光学器件来实现某些功能。”


研究人员计划进一步优化这个系统,并希望用它来实现神经网络任务的实际应用。他们设计的通用方法可用于各种神经网络架构,也可以用于其他应用。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/494953.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蘑菇阵(动态规划)

题目: 现在有两个好友甲和B,住在一片长有蘑菇的由n * m个个方格组成的草地,A在(1,1),B在(N,M)。现在甲想要拜访B,由于她只想去乙的家,所以每次她只…

用Keil-MDK开发TQ2440裸机程序入门教程——LED流水灯实现

觉得此编文章很详实,故转载之,来自http://www.amobbs.com/thread-5281512-1-1.html 开发板也差不多买了半年了, 以前照着教程用的是软件是ADS,在win7下老是崩溃, 后来才知道ADS早就不提供支持了, ADS的公司怎样怎样了...(此处省略300..) 然后我就捣鼓着怎…

关于量子计算,你应该知道的七个事实

来源:资本实验室摘要:在很多人眼中,量子计算机被认为能够完成经典计算机所不能完成的任务。聚焦前沿科技创新与传统产业升级在很多人眼中,量子计算机被认为能够完成经典计算机所不能完成的任务。事实上,如果量子计算机…

幸运袋子(详解)

题目分析 一个袋子里面有n个球,每个球上面都有一个号码(拥有相同号码的球是无区别的)。如果一个袋子是幸运的当且仅当所有球的号码的和大于所有球的号码的积。 例如:如果袋子里面的球的号码是{1, 1, 2, 3},这个袋子就是幸运的,因为…

wcf 例子

开发环境是vs2005 (需要安装对wcf和wpf的扩展支持)。1建立控制台应用程序作为服务端。///这是接口[ServiceContract(Namespace "http://Microsoft.ServiceModel.Samples")]public interface ICalculator{[OperationContract]double Add(doubl…

机器学习帮助人类找到最硬的过渡金属氮化物

来源:中国科学杂志社摘要:南京大学物理学院孙建教授和王慧田教授领导的研究团队发展了机器学习加速晶体结构搜索的方法,并用其预测了一种超硬的钨氮化合物。机器学习算法在很多领域取得了令人瞩目的进步,从而广受人们关注&#xf…

WEB攻防实战篇,思维导图

转载于:https://www.cnblogs.com/sin4/archive/2012/06/16/2551603.html

二维数组按行和按列遍历的效率

按行遍历的效率大概是是按列遍历的0.5倍 在c语言中,数组在内存中是按行存储的,按行遍历时可以由指向数组第一个数的指针一直向后遍历,由于二维数组的内存地址是连续的,当前行的尾与下一行的头相邻,所以可以直接到下一行…

解读《自适应机器人交互白皮书》:机器人交互需要突破性技术

来源:机器人创新生态摘要:7月11日雷克大会,英特尔中国研究院机器人交互实验室研发总监任海兵在演讲时,就白皮书中的内容进行了重点解读。个人服务机器人在近年来随着人工智能的快速发展开始得到不少关注。个人服务机器人是否真正能…

最长升序子串1231

题目与解析 给定n个数字,在这n个数字中找出最长上升子序列。 那么什么是上升子序列呢? 上升子序列就是在一个数列中递增的部分,不一定是连续的,比如说 图中的24678和24679都是数列24635798的上升子序列 解题思路 就按图上2 4 …

php使用接口实现工厂设计模式

php实现工厂设计模式,使用接口实现,表面上接口没有什么用,因为php是类型自动转换的。实现上使用接口可以约束类的定义,从而实现一致的访问。 接口在php只能起到约束类的定义作用,虽不像c#/java那么直观,但基…

大数据生态圈常用组件(一):数据库、查询引擎、ETL工具、调度工具等

你的闺蜜在减肥,隔壁老王在练腰,你还不赶紧来学习 整理了当年使用过的一些,大数据生态圈组件的特性和使用场景,若有不当之处,请留言斧正,一起学习成长。 组件名属性标签特性使用场景价格成本Mysql 关系型数…

科学革命与科学教科书

来源:《出版科学》2018年第4期摘要:借助科学哲学的反思,加上科学家和出版人的创新实践,一定能够出现既能促进常规科学研究、又能为科学革命做出某些准备的新型科学教科书。《科学革命的结构》托马斯 • 库恩著,金吾伦、…

barcode4j

Barcode4J由Java语言编写而成,可以灵活的生成条形码。它采用Apache License V2.0许可,这使得它很容易在商业中被使用。它可以让您生成各种流行的一维和二维条码,包括DataMatrix 和 PDF417。以各种格式输出,包括SVG, EPS, bitmaps和…

浅析段错误和栈溢出

什么段 我们在学习微机原理的时候就遇到过段,它代表在一个可执行文件中各种的类型信息存放的地方。   正文段:text用于存储指令;   数据段:data用于存储已初始化的全局变量;   bss段:用来存放程序中未…

大数据生态圈常用组件(二):概括介绍、功能特性、适用场景

三更灯火五更鸡,正是男儿读书时。 小编整理了一些常用的大数据组件,使用场景及功能特性,希望对后浪有所帮助。 分类名称简介功能特点使用场景大数据存储HDFSHDFS是一个分布式的文件系统,它具有高度的容错,高吞吐量&am…

物联网可应用于十大行业嘛?

来源:亿欧智库摘要:近些年来,全球经济增长乏力,物联网已变成了各国经济发展的新动力。基于此,亿欧智库近日将发布一份新的报告《2018物联网行业应用研究报告》,报告总结出了物联网的十大应用行业&#xff0…

ubuntu下查看window下文本文件乱码的解决方法

在Ubuntu中,在英文的locate下面查看一些从window系统生成的文本文件,有可能用gedit打开时出现的都是乱码,今天用gedit -h看了一下,里面有一个选项是--encoding,于是在终端中运行 gedit --encodinggbk打开gedit&#xf…

浅析死锁

什么是死锁? 死锁就是两个或多个进程在执行的过程中,由于竞争资源或者由于彼此通信而造成的一种阻塞现象,当进程处于这种状态时,如果没有外力的作用,这些进程都无法继续向前进行。这是操作系统层面的一个错误&#xff…

一篇文章搞懂数据仓库:三范式与反范式

少年易老学难成,一寸光阴不可轻。 目录 一、第一范式 二、第二范式 三、第三范式 四、反范式化 五、范式化设计和反范式化设计的优缺点 5.1 范式化 (时间换空间) 5.2 反范式化(空间换时间) 六、OLAP和OLTP中范…