登上Science子刊,神经科学再次启发DNN设计!中科院揭秘介观自组织反向传播机制...

203a63e70c563e8d4adb86b0ba17d0e3.png

来源:AI科技评论

作者:张铁林,徐波

论文标题:A Mesoscale Plasticity for Efficient AI Learning

在人工智能领域,目前人工神经网络中被广泛使用的反向传播算法(Backpropagation,BP)采用全局优化策略,这种端到端的学习方法性能卓越,但学习过程能量消耗大,且缺乏灵活性。中科院脑智卓越中心徐波、蒲慕明联合研究团队近期借助生物网络中发现的介观尺度自组织反向传播机制(Self-backpropagation,SBP),在更具效率和灵活性的类脑局部学习方法方面取得了重要进展。

SBP的发现最早可以追溯到1997年。蒲慕明团队在Nature杂志上撰文发现海马体内的神经元可以将长时程抑制(Long-term depression,LTD)可塑性自组织地传播到三个方向,分别是突触前侧向传播(Presynaptic lateral spread)、突触后侧向传播(Postsynaptic lateral spread)、反向传播(Backpropagation)[1],这个发现就是自组织反向传播神经可塑性机制(SBP)。后续研究证实,SBP现象具有普遍性,不仅覆盖更多的神经区域如视网膜-顶盖系统[2],还覆盖更多的可塑性类型[3],如长时程增强(Long-term potentiation,LTP)。该机制的发生归结于生物神经元内分子调制信号的天然逆向传递,被认为是可能导致生物神经网络高效反馈学习的关键[4]。

研究团队受到该机制的启发,对SBP的反向传播方向(第三个方向)单独构建数学模型(图1A),重点描述了神经元输出突触的可塑性可以反向传播到输入突触中(图1B),可塑性的发生可以通过时序依赖突触可塑性(Spike timing-dependent plasticity,STDP),也可以通过人工局部梯度调节。在标准三层脉冲神经网络(Spiking neural network,SNN)的学习过程中,SBP机制可以自组织地完成前一层网络权重的学习,且可以结合短时突触可塑性(Short-term plasticity,STP)、膜电位平衡(Homeo-static membrane potential)等,形成更强大的SNN组合学习方法(图1C)。

在一类人工神经网络(Artificial neural network,ANN)如受限玻尔兹曼机网络(Restricted Boltzmann machine,RBM)的学习中(图2A),SBP机制也可以替换迭代过程中部分BP机制,实现交替的协作优化(图2B-E)。针对SNN和RBM的不同,团队又分别设置了两种不同的能量函数约束,来保证训练过程中网络参数学习的平稳性。此外,研究团队针对性地提出了一种统计训练过程中能量消耗的新方法(图3)。在图片分类(MNIST)、语音识别(NETtalk)、动态手势识别(DvsGesture)等多类标准数据集上,SBP机制通过组合其它可塑性机制,实现了更低能耗和更高精度的SNN局部学习(图4)。在ANN-RBM的学习中,SBP机制也可以大量的替换BP机制实现全局和局部交叉学习,在降低计算能耗同时却不损失精度(图5)。

研究人员认为,SBP是一类介观尺度的特殊生物可塑性机制,该机制同时在SNN和ANN中获得了广泛的组合优化优势,对进一步深入探索类脑局部计算具有很大的启示性。生物智能计算的本质,很可能就是灵活融合多类微观、介观等可塑性机制的自组织局部学习,结合遗传演化赋予的远程投射网络结构,实现高效的全局优化学习效果。该工作可以进一步引导生物和人工网络的深度融合,最终实现能效比高、可解释性强、灵活度高的新一代人工智能模型。

相关工作(Self-backpropagation of synaptic modifications elevates the efficiency of spiking and artificial neural networks)于2021年10月20日(美东时间)在线发表于《科学》子刊《Science Advances》上。中国科学院自动化研究所类脑智能研究中心张铁林副研究员为第一作者,徐波研究员为通讯作者,程翔(博士生)、贾顺程(博士生)、蒲慕明研究员和曾毅研究员为共同作者。相关研究工作得到了国家自然科学基金委、先导B等项目的资助。

相关论文地址见:https://www.science.org/doi/10.1126/sciadv.abh0146

654b07422ca368057a9dcb32b93d8e9a.png

915f58061dc9825f577e0104f0c9ae53.png

图1:SBP在SNN中的应用。

(A),SBP可塑性机制。(B),SBP在SNN中的局部反向传播。(C),SBP和其它可塑性机制在SNN中的组合优化。

24026ecedf54bb97556d3c76ec10200d.png

图2:SBP在RBM中的应用。

(A),SBP和BP在RBM中的组合优化。(B),SBP和BP的交替协作流程。(C),RBM中的标准Sleep Phase。(D),含有SBP的Wake Phase。(E),含有BP的Wake Phase。

7f1c668815595bab1eb890e46979287b.png

图3:训练能量消耗的计算方法。

(A),平均迭代次数。(B),每次迭代中的算法复杂度。

76e8ac737ef174f6aa06f4aa31956046.png

图4:在MNIST、NETtalk、DvsGesture三个数据集上的性能对比。

(A,C,E),SBP分别取得了基于梯度和基于可塑性方法的SNN最优性能。(B,D,F),SBP分别取得了基于梯度和基于可塑性方法的SNN最低能耗。

b6990a58b52a44f4600c67f2be2b54fb.png

图5:SBP有助于RBM提升精度和降低能耗。

(A-C),在MNIST数据集中,SBP可以少量降低RBM的训练误差(A),可以同时平衡精度和能耗得到最优的Wake Phase次数(B),且可以显著降低训练能耗(C)。(D-I),在NETtalk和DvsGesture数据集中,SBP得到了和在MNIST中类似的结论。

参考文献:

[1] Fitzsimonds, R. M., Song, H. J. & Poo, M. M. Propagation of activity-dependent synaptic depression in simple neural networks. Nature 388, 439-448, (1997).

[2] Du, J. L. & Poo, M. M. Rapid BDNF-induced retrograde synaptic modification in a developing retinotectal system. Nature 429, 878-883, (2004).

[3] Du, J. L., Wei, H. P., Wang, Z. R., Wong, S. T. & Poo, M. M. Long-range retrograde spread of LTP and LTD from optic tectum to retina. Proceedings of the National Academy of Sciences of the United States of America 106, 18890-18896, (2009).

[4] Bi, G. & Poo, M. Synaptic modification by correlated activity: Hebb's postulate revisited. Annual Review of Neuroscience, 24, 139-166, (2001).

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

bfa4f8c9a47fd4d9cf50fa8dbe60b2d6.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483504.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【计算机网络复习 数据链路层】3.5.1 信道划分介质访问控制

信道划分介质访问控制一、传输数据使用的两种链路二、介质访问控制2.1 频分多路复用 FDM2.2 时分多路复用 TDM2.3 统计时分复用 STDM2.4 波分多路复用 WDM2.5 码分多路复用 CDM一、传输数据使用的两种链路 点对点链路:两个相邻节点通过一个链路相连,没有…

Nature:初步探索限制饮食如何影响肿瘤生长

来源:生物通近年来,有一些证据表明,饮食干预有助于减缓肿瘤的生长。麻省理工学院的一项新研究分析了小鼠的两种不同饮食,揭示了这些饮食是如何影响癌细胞的,并为为什么限制卡路里可以减缓肿瘤生长提供了解释。该研究检…

【计算机网络复习 数据链路层】3.5.2 ALOHA协议

一、纯ALOHA协议 纯ALOHA协议思想: 不监听信道,不按时间槽发送,随机重发。想发就发。 二、时隙ALOHA协议 时隙ALOHA协议的思想: 把时间分成若干个相同的时间片,所有用户在时间片开始时刻同步接入网络信道&#xff0c…

说好的「机器人出租车」和「自动驾驶汽车」,到底在哪? 原创 我爱至尊宝 科技行者 昨天...

来源:TheNexWeb编译整理:科技行者再有几周就到万圣节了,今年让人害怕的东西可不止是鬼怪、还有更多晦暗不明的新难题。 就拿自动驾驶汽车来说,技术人员直到现在也不清楚怎么才能在完全无需人类介入的情况下实现自主行驶。哪怕是代…

在Windows平台下使用Gitblit搭建Git服务器图文解说

Windows平台下Git服务器搭建 一.java环境变量的设置 下载jdk并配置jdk的环境变量,JAVA_HOME,CLASSPATH以及PATH,最后在DOS窗口输入java -version检验是否配置成功。这里参见jdk环境变量配置相关教程。 二.下载新版Gitblit.下载地址:http://ww…

“厌氧动物”出现,科学家不清楚代谢方式,或颠覆对生命的认知

来源:科学杂志众所周知,动物的生存的基本条件就是氧气。日常生活中,我们不会感到氧气的存在,因为它是无色无味且无处不在的。可以说,地球上能孕育生命的原因除了有水资源以外,氧气的存在也是重中之重。可当…

【计算机网络复习 数据链路层】3.5.4 CSMA-CD协议

CSMA-CD协议3.5.4 CSMA/CD协议一、CSMA/CD协议二、传播时延对载波监听的影响三、截断二进制指数规避算法四、最小帧长问题3.5.4 CSMA/CD协议 一、CSMA/CD协议 载波监听多点接入/碰撞检测 CSMA/CD(carrier sense multiple access with collision detection&#xf…

6G网络智能内生的思考

来源:6G俱乐部作者:李琴,李唯源,孙晓文,胡玉双:中国移动通信有限公司研究院研究员。孙滔:中国移动通信有限公司研究院主任研究员、网络创新实验室技术经理。面向6G时代,网络将迎来新…

实验四3

#include "stdafx.h" #include "stdio.h"int main(int argc, char* argv[]) {char a[81];int i;int num0,word0;char c;gets(a);for(i0;(ca[i])!\0;i)if(c )word0;else if(word0){word1;num;}printf("%d\n",num);return 0; } 转载于:https://www…

3 个问题:MIT专家论述关于阻碍AutoML发展的障碍

来源:ScienceAI编译:萝卜皮研究人员希望更多用户友好的机器学习系统将使非专家能够分析大数据——但这样的系统能完全自主吗?麻省理工学院计算机科学家 Kalyan Veeramachaneni 分享了他对自动化机器学习 (AutoML)现状、…

【计算机网络复习 数据链路层】3.6.1 局域网

局域网基本概念和体系结构局域网基本概念和体系结构一、局域网二、局域网拓扑结构三、局域网介质访问控制方法四、局域网的分类五、MAC子层和LLC子层局域网基本概念和体系结构 一、局域网 局域网 (Local Area Network):简称LAN,…

佐治亚理工学院发文:不要迷信可解释性,小心被误导

来源:AI科技评论编译:王晔校对: 琰琰可解释性对人工智能发展来说至关重要,但在可解释系统的可信度方面,理解其可能带来的负面效应亦同等重要。近日,佐治亚理工学院研究团队发表最新研究,重点讨论了可解释人工智能系统&…

【计算机网络复习 数据链路层】3.6.2 以太网

以太网一、以太网概述二、以太网提供无连接、不可靠的服务三、以太网传输介质与拓扑结构的发展四、10BASE-T以太网五、适配器与MAC地址六、以太网MAC帧七、高速以太网一、以太网概述 以太网(Ethernet)指的是由Xerox公司创建并由Xerox、Intel和DEC公司联…

软件开发冲刺1

站立会议: 分配好任务,在队长的带领下开始了为期十天的软件开发冲刺,我们做的是一款聊天无课表软件有了目标就有了动力。我们先对我们的产品做了一个详细的规划,指定每天的任务量,调试好开发环境,做好一切准…

一文了解机器人伺服系统

来源:传感器技术工业机器人有4大组成部分,分别为本体、伺服、减速器和控制器。而其中,工业机器人电动伺服系统的一般结构为三个闭环控制,即电流环、速度环和位置环。一般情况下,对于交流伺服驱动器,可通过对…

【计算机网络复习 数据链路层】3.6.5 PPP、HDLC

PPP协议和HDLC协议PPP协议和HDLC协议一、广域网二、PPP协议2.1 PPP协议的特点2.2 PPP协议应满足的要求2.3 PPP协议无需满足的要求2.4 PPP协议的三个组成部分2.5 PPP协议的帧格式三、HDLC协议3.1 HDLC的站3.2 HDLC的帧格式四、PPP协议 & HDLC协议PPP协议和HDLC协议 一、广域…

李彦宏:用“工程思维”做自动驾驶

来源:央广网10月23日,北京大学新工科国际论坛正式召开,大会以“新时代、新挑战、新工科”为主题,旨在进一步推动新工科建设,深化全球交流,推进国际合作。百度创始人、董事长兼CEO李彦宏受邀出席并发表题为“…

爬取Github Web API 并存入Mysql数据库

写在前面 本文内容为爬取GitHub的Web API并存入mysql数据库,内容为华为鸿蒙OS相关的代码。 WEB API Web API是网络应用程序接口。它包含了广泛的功能,网络应用通过API接口,可以实现存储服务、消息服务、计算服务等能力。Web API最主要的功能…

Facebook 正在研究新型 AI 系统,以自我视角与世界进行交互

来源:AI科技大本营(ID:rgznai100)编译:禾木木你是否能想象 AI 以第一人称视角来理解世界是什么样的呢?未来,以第一人称视角理解世界的 AI 可以开启沉浸式体验的新时代。增强现实(AR)…

王道计算机网络 数据链路层整理 超详细版

数据链路层的基本概念 结点:主机、路由器 链路:网络中两个结点之间的物理通道,链路的传输介质主要有双绞线、光纤和微波。分为有线链路、无线链路。 数据链路:网络中两个结点之间的逻辑通道,把实现控制数据传输协议…