大脑模拟AI学习策略,这项逼近反向传播的研究登上《自然-神经科学》

d53e152fa24b592f7e95c956d5c403c1.png

来源:机器之心

编辑:陈萍、杜伟

大脑是如何近似反向传播算法的?发表在《自然 - 神经科学》的一篇论文,研究者找到了可以生活在活体大脑并进行实时工作的等价物,他们提出的大脑学习算法模型可以模拟反向传播过程。

每当人类或机器学习更好地完成一项任务时,总会留下一系列的物理变化,比如人类大脑中的细胞或机器学习算法中的数值会发生相应的变化,这些变化是提高其性能的基础。但是,大脑或机器等系统如何准确地计算出需要做出哪些改变并不简单,在这个问题中,大脑或人工智能系统必须查明其 pipeline 中错误的原因,然后做出必要的改变,这一过程可称之为信用分配问题。

1865b671f01f3abf42e4f076ba0c1d0f.png

更简单地说:这好比一场推卸责任的游戏,需要找出哪部分出错了。

在机器学习(ML)领域,AI 工程师使用「反向传播」这种强大算法解决了机器的信用分配问题,该算法在 1986 年随着 Geoffrey Hinton、David Rumelhart 和 Ronald Williams 的工作而普及。现在,反向传播算法在最成功的 AI 系统(深度神经网络)中为网络学习提供了主要的学习动力。

现在看来,机器学习可以采用反向传播解决信用分配问题,那么大脑中有没有等价的机制解决信用分配问题呢?

今年 5 月发表在《自然 - 神经科学》上的一篇论文《Burst-dependent synaptic plasticity can coordinate learning in hierarchical circuits》中,研究者们终于找到了可以生活在活体大脑中并进行实时工作的等价物。

37cde5303bfafdeecc16ea8c4fd52022.png

论文地址:

https://www.nature.com/articles/s41593-021-00857-x

这篇论文由来自加拿大渥太华大学的 Richard Naud 以及麦吉尔大学的 Blake Richards 等研究者参与撰写,他们揭示了一种新的大脑学习算法模型,该模型可以模拟反向传播过程。

631b6446cae4b824647dde1e255ab518.png

麦吉尔大学的 Blake Richards(左)和渥太华大学的 Richard Naud(右),他们提出了一个新的大脑学习模式,最终可以解决人类大脑的信用分配问题。

Naud 表示:「这篇论文的主要目标是表明机器正在进行的学习方式可以通过生理过程来逼近。」

来自柏林洪堡大学的实验神经科学家 Matthew Larkum 表示:「来自更理论化方面的想法可以推动比较困难的实验得以进行,在我看来,这篇论文超越了这一标准,这在生物学上是合理的,可能会带来很大的影响。」

然而,人类和机器实现信用分配问题的过程并不完全相同。对于机器来说,当训练一个识别图像的深度神经网络时,它会分成两个阶段进行:首先是前向传播,然后是反向传播,期间网络会进行「学习」这一过程。在第一阶段,输入层中的神经元编码图像的特征并将其传递,然后隐藏层中的神经元执行计算并将它们的结果传递到输出层,输出层对输出图像进行预测。比如输入一张狗的图像,模型预测出来是一张猫,这时反向传播算法通过调整连接神经元的权重来解决问题,使得模型预测结果是一只狗。

d98235a2dbc8735691983cc45b41399a.png

反向传播示意图。

大脑如何逼近反向传播?

几十年来,研究人员一直试图弄清楚大脑是如何执行类似反向传播操作来解决信用分配问题的。反向传播本身在生物学上是不合理的,因为真正的神经元不可能停止处理来自外部的信息,以等待反向传播。如果大脑是这样工作的,那我们的视觉、听觉或其他感官就会丧失。

Naud 和 Richards 的新模型可以解决这个问题,他们通过对神经元之间进行相互交流的传统理解做了一个简单的改变来实现。我们知道神经元就像比特一样,只有两个输出,要么向另一个神经元发送电活动的尖峰信号(spike of electrical),要么不发送,即 1 或 0。但神经元也可以快速连续地发送「突发(burst)」尖峰信号。事实证明,这种方式可以改变神经元之间的连接,并使「突发」成为解决信用分配问题的一种选择。

5f7fca53c585cd50d00c7b36617767d5.png

突发相关的可塑性规则。

在新模型中,该团队认为神经元会突发第三个输出信号,即神经元不停地发送「突发」信号 1,这些信号相隔很近,实际上信号就变成了 2。2 不是对外部信息进行编码的,而是充当「教学信号」,告诉其他神经元根据电路顶部产生的误差,是加强还是削弱它们之间的连接。

但要想让这个教学信号在不「暂停」感官处理的情况下解决信用分配问题,研究者的模型还需要另一个关键部分。他们提出,神经元的顶部和底部有不同的间隔空间,它们以完全不同的方式处理神经代码。「我们的模型表明你真的可以有两个信号,一个上升信号和一个下降信号,它们可以相互传递,」Naud 说。

3391b19b9459301ca20512569553de6b.png

突发相关的可塑性可以解决异或(XOR)任务中的信用分配问题。

研究者假设,在神经元顶端接收输入信号的树状分支只监听突发信号——内部教学信号,以调整神经元之间的连接并减少误差。调整自上而下进行,就像在反向传播中一样,因为在他们的模型中,顶部的神经元正在调节其下方神经元发送突发信号的可能性。

研究者表示,当网络有更多的突发时,神经元往往会增加其连接的强度,而当突发信号不那么频繁时,连接的强度往往会降低。这个思路是这样的,突发信号告诉神经元它们应该在任务期间处于活跃状态,以加强它们之间的连接,这样做可以减少误差,而如果没有突发信号,则告诉神经元它们应该处于非活动状态并且可能需要削弱它们之间的连接。

2b63c75811c5a3eb5736b18628eb9770.png

周期性和反馈连接的突发依赖可塑性通过线性化和调整反馈来促进基于梯度的学习。

与此同时,神经元底部的分支将突发信号视为单个尖峰信号,即正常的外部信号,这使得信号能够继续在回路中向上发送感官信息而不受干扰。

「现在回想起来,这个想法似乎是合乎逻辑的,」苏黎世大学和苏黎世联邦理工学院的计算神经学家 João Sacramento 表示。

这项研究有什么意义?

过去,其他研究者也试图采用类似的逻辑。20 年前,来自宾夕法尼亚大学的 Konrad Kording 以及奥斯纳布吕克大学 Peter König 提出了一个双室(two-compartment)神经元学习架构。但是该提案缺乏与生物学相关的许多具体细节,而且这只是一个提案,他们无法证明这个双室神经元学习架构是否能真正的解决信用分配问题。

Kording 表示,当时他们只是缺乏测试这些想法的能力。他认为 Richard Naud 以及 Blake Richards 等人的研究是很了不起的工作。

如今借助算力,Naud、Richards 和他们的合作者成功地模拟了他们的模型,其中突发神经元(bursting neurons)扮演了学习规则的角色。他们表明,突发神经元解决了 XOR 经典任务中的信用分配问题,该任务需要学习在两个输入之一为 1 时做出响应。此外,研究结果还表明,使用他们的突发规则构建的深度神经网络可以近似反向传播算法在具有挑战性的图像分类任务上的性能, 不过该研究仍有改进的余地。

这对于 AI 研究人员来说也很兴奋,因为弄清楚大脑如何近似反向传播,反过来又可以改善 AI 系统的学习方式。「如果我们能够深入理解这个过程,那么这最终可能会导致系统能够像大脑一样高效地解决计算问题,」来自荷兰拉德堡德大学 Donders 研究所人工智能系主任 Marcel van Gerven 表示。

原文链接:

https://www.quantamagazine.org/brain-bursts-can-mimic-famous-ai-learning-strategy-20211018/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

4db25d17ed57c337ff669981621edbb8.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483303.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux的基础知识——TCP异常断开

1.TCP异常断开 1.1 心跳检测机制 1.2 设置TCP属性

普京谈“元宇宙”:这无疑是一种挑战

来源:参考消息网据塔斯社莫斯科11月12日报道,俄罗斯总统弗拉基米尔普京认为,“元宇宙”带来的可能性应该用于突破距离的限制,帮助交流和学习,而不是逃避现实世界的出路。普京在出席2021年“人工智能之旅”国际会议&…

论文阅读 | DasiamRPN

文献:DaSiamRPN: Zheng Zhu, Qiang Wang, Bo Li, Wu Wei, Junjie Yan, Weiming Hu."Distractor-aware Siamese Networks for Visual Object Tracking." ECCV (2018). [paper][github] 文章主要贡献 1.训练数据的扩充 加入Detection pair (ImageNet,COCO中…

linux的基础知识——UDP

1.UDP服务器 2.UDP处理模型 3.多播 4.分屏软件的实现

UC伯克利发现「没有免费午餐定理」加强版:每个神经网络,都是一个高维向量...

来源:AI科技评论作者:Mr Bear、杏花编辑:青暮经典的「没有免费午餐定理」表明:如果某种学习算法在某些方面比另一种学习算法更优,则肯定会在其它某些方面弱于另一种学习算法。也就是说,对于任何一个学习问题…

第二阶段团队冲刺(十)

会议内容: 高宇: 昨天制作了一个自定义的控件,可以实现,对时间的ViewText进行侦听,当点击时弹出自定义框,选择获取,年月日,并更改数据库方法 遇到的问题:所用的数据库查询…

专家:人工智能开始对现实世界产生重大影响

来源:人机与认知实验室编译:喻玲萧 编辑:王旭泉中国日报网11月8日电 据英国《卫报》报道,曾撰写过一本有关人工智能的权威教科书的美国科学家表示,在将人工智能的进步比作原子弹技术的发展时,专家们被自己在…

Java 添加、更新和移除PDF超链接

简介 PDF超链接用一个简单的链接包含了大量的信息,满足了人们在不占用太多空间的情况下渲染外部信息的需求。下面将介绍通过Java 在PDF中添加、更新和移除超链接。 (一)工具使用: Free Spire.PDF for Java 2.4.4(免费版…

linux的基础知识——shell基础

文章目录1.什么是shell?2.shell历史3.编写一个shell脚本3.1创建一个.sh文件3.2 编写一个简单的脚本内容3.3 执行4.shell 数据类型和变量4.1 数据类型4.2 变量5.文件名代换6.命令代换7.算术代换8.转义字符9.单引号10.双引号1.什么是shell? 2.shell历史 3.…

CCF发布2020-2021中国计算机科学技术发展报告

来源:中国计算机学会本年度《发展报告》的组织和策划工作得到了CCF各专业委员会和广大会员的大力支持与积极响应,共收到23份反映不同方向进展的报告申请。CCF学术工作委员会组织评审,遴选出具有代表性的高水平报告共14篇。本《发展报告》包含…

欧盟「人脑计划」​最新进展:新算法模拟生物进化,为大脑如何工作提供新见解...

来源:ScienceAI编辑:凯霞2013 年,欧盟「人脑计划」(Human Brain Project,HBP)正式启动,是欧洲最大的脑科学项目,也是欧盟资助的最大研究项目之一。是欧盟首批为期 10 年、预算 10 亿…

linux的基础知识——shell语法

文章目录1.shell语法——条件测试1.1 条件测试1.2 条件测试2.shell语法——分支语句3.shell语法——case分支语句4.shell语法——foreach循环5.shell语法——while循环6.shell语法——break和continue7.位置参数和特殊变量8.输入输出8.1 echo8.2 管道8.3 tee8.4 文件重定向9. 函…

杨振宁:宇宙有没有造物者?

来源:一刻talks未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱…

基于STM32的DS1302实时时钟模块应用及原理介绍

在嵌入式系统中,实时时钟模块是一个常见的功能模块,用于记录和管理系统的时间信息。DS1302是一款低功耗、具有多种功能的实时时钟芯片,被广泛应用于各种电子产品中。本文将介绍基于STM32微控制器的DS1302实时时钟模块的应用及原理&#xff0c…

发布一个npm包

前言 我这里是写了一个vue轮播图插件,因此我使用了vue的脚手架工具创建一个项目,当然你也可以选择自己搭建脚手架。 本例中我会使用vue脚手架创建一个项目,并发布到npm上面去。 通过脚手架创建项目 全局安装 首先,要创建项目&…

三大运营商扎堆进军“元宇宙”

来源: 数据观综合编辑: 蒲蒲三大运营商集体进军“元宇宙”目前,除了腾讯、字节跳动、谷歌、Facebook、英伟达等科技巨头企业开启了“元宇宙”领域的布局,国内三大电信运营商也扎堆进入“元宇宙”玩家阵营。11月2日,中国…

性能测试需求调研分析方法

一、测试背景和目的 在需求调研开始,测试人员需要明确的测试目的,那么首先得清楚项目本身情况,针对不同的项目情况也会有不同的目的,根据项目情况一般可以分为以下六种情况: 1、完全新建系统 完全新建系统意味着被测试…

数据结构——线性表的C语言实现

文章目录1.什么是线性表&#xff1f;2.线性表的抽象数据类型3.线性表之顺序表的C语言实现4.线性表之链式表的C语言实现1.什么是线性表&#xff1f; 2.线性表的抽象数据类型 3.线性表之顺序表的C语言实现 #include<stdio.h> #include<stdlib.h>#define ElementType…