神经网络支持大脑是「预测机器」,预测是节能的

722f3eea604d0b0407021368227ff0ab.png

来源:ScienceAI

编译:绿萝

我们的大脑,一个包裹在骨性头骨内的三磅重的组织,如何从感觉中产生知觉是一个长期存在的谜。大量证据和数十年的持续研究表明,大脑不能像拼拼图一样,简单地组合感官信息来感知周围环境。大脑可以根据进入我们眼睛的光线构建场景,即使传入的信息嘈杂和模糊,这一事实也证明了这一点。

因此,许多神经科学家开始将大脑视为「预测机器」。通过预测处理,大脑使用其对世界的先验知识,对传入的感官信息的原因作出推断或产生假设。这些假设——而不是感官输入本身——会在我们的头脑中产生感知。输入越模糊,对先验知识的依赖就越大。

荷兰 Radboud 大学预测大脑实验室(Predictive Brain Lab)的神经科学家弗洛里斯·德·兰格(Floris de Lange)说:「预测处理框架的美妙之处在于,它具有非常大的(有时批评家可能会说太大)的能力来解释许多不同系统中的许多不同现象。」

然而,越来越多的神经科学证据支持这一想法主要是间接的,并且可以接受其他解释。「如果你研究人类的认知神经科学和神经成像,[有] 很多证据——但超级隐含的、间接的证据,」Radboud 大学的蒂姆·基茨曼(Tim Kietzmann)说,他的研究是机器学习和神经科学的跨学科领域。

因此,研究人员正在转向计算模型来理解和测试预测大脑的想法。计算神经科学家构建了人工神经网络,其设计灵感来自生物神经元的行为,可以学习对传入的信息进行预测。这些模型展示了一些不可思议的能力,似乎模仿了真实大脑的能力。这些模型的一些实验甚至暗示大脑必须进化为预测机器以满足能量限制。

随着计算模型的激增,研究活体动物的神经科学家也越来越相信大脑学会推断感觉输入的原因。虽然大脑如何做到这一点的确切细节仍然模糊不清,但大刀阔斧的描绘正变得越来越清晰。

知觉中的无意识推理

乍一看,预测处理似乎是一种违反直觉的复杂感知机制,但科学家们转向预测处理的历史由来已久。甚至在一千年前,穆斯林阿拉伯天文学家和数学家 Hasan Ibn Al-Haytham 在他的《光学》(Book of Optics)一书中强调了它的一种形式,来解释视觉的各个方面。这个想法在 19 世纪 60 年代获得了力量,当时德国物理学家兼医生赫尔曼·冯·亥姆霍兹 (Hermann von Helmholtz) 认为,大脑会推断其传入的感官输入的外部原因,而不是根据这些输入「自下而上」构建其感知。

Helmholtz 阐述了「无意识推理」的概念来解释双稳态或多稳态感知,其中图像可以以不止一种方式被感知。例如,这发生在众所周知的模糊图像中,我们可以将其视为鸭子或兔子:我们的感知在两个动物图像之间不断翻转。在这种情况下,Helmholtz 断言,由于在视网膜上形成的图像不会改变,因此这种感知必然是关于感官数据原因的自上而下的无意识推理过程的结果。

在 20 世纪,认知心理学家继续建立这样的案例,即感知是一个积极构建的过程,它利用自下而上的感官和自上而下的概念输入。这项努力最终在 1980 年发表了一篇有影响力的论文「Perceptions as Hypotheses」,由已故的理查德·兰顿·格雷戈里 (Richard Langton Gregory)撰写,该论文认为,知觉、错觉本质上是大脑对感官印象原因的错误猜测。与此同时,计算机视觉科学家们在努力使用自下而上的重建,使计算机能够在没有内部「生成」模型供参考的情况下进行观察。

44f065734bf069b4d943f6da73f273cd.png

论文地址:https://www.jstor.org/stable/2395424

「试图在没有生成模型的情况下理解数据注定会失败——人们所能做的就是对数据中的模式做出陈述,」伦敦大学计算神经科学家 Karl Friston 说。

但是,尽管预测处理的接受度不断提高,但关于如何在大脑中实现的问题仍然存在。一种流行的模型,称为预测编码,主张大脑中信息处理级别的层次结构。最高级代表最抽象、最高级的知识(例如,对前方阴影中的蛇的感知)。该层通过向下发送信号来预测下一层的神经活动。下层将其实际活动与上面的预测进行比较。如果出现不匹配,该层会生成一个向上流动的错误信号,以便更高层可以更新其内部表示。

这个过程对于每对连续的层同时发生,一直到最底层,它接收实际的感官输入。从世界接收到的信息与预期之间的任何差异都会导致错误信号,并在层次结构上产生涟漪效应。最高层最终更新了它的假设(它毕竟不是一条蛇,只是地上盘绕的绳索)。

8a7eda1c7258d46228aa784645f203ef.png

「总的来说,预测编码的想法,特别是当它应用于皮层时,大脑基本上有两个神经元群,」de Lange 说:一个编码当前关于被感知的最佳预测,另一个是在预测中发出错误信号。

1999 年,计算机科学家 Rajesh Rao 和 Dana Ballard(当时分别在索尔克生物研究所和罗彻斯特大学工作)建立了一个强大的预测编码计算模型,该模型具有明确用于预测和纠错的神经元。他们模拟了灵长类大脑视觉处理系统中通路的一部分,该系统由负责识别面部和物体的分层组织区域组成。他们表明该模型可以概括灵长类动物视觉系统的一些不寻常行为。

3928e3cc69268d8872bec861b950145d.png

论文地址:https://www.nature.com/articles/nn0199_79

然而,这项工作是在现代深度神经网络出现之前完成的,现代深度神经网络具有一个输入层、一个输出层和夹在两者之间的多个隐藏层。到 2012 年,神经科学家开始使用深度神经网络来模拟灵长类动物腹侧视觉流。但几乎所有这些模型都是前馈网络,其中信息仅从输入流向输出。「大脑显然不是纯粹的前馈机器,」de Lange 说。「大脑中有很多反馈,大约与前馈 [信号] 一样多。」

因此,神经科学家转向了另一种类型的模型,称为循环神经网络(RNN)。纽约西奈山伊坎医学院的计算神经科学家兼助理教授 Kanaka Rajan 表示,这些特征使它们成为模拟大脑的「理想基质」,他的实验室使用 RNN 来了解大脑功能。RNN 的神经元之间同时具有前馈和反馈连接,并且它们具有独立于输入的持续不断的活动。「在很长一段时间内产生这些动态的能力(基本上是永远),让这些网络能够接受训练的能力,」Rajan 说。

预测是节能的

RNN 引起了哈佛大学的 William Lotter 和他的博士论文导师 David Cox 和 Gabriel Kreiman 的注意。2016 年,该团队展示了一个 RNN,它学会了预测视频序列中的下一帧。他们将其称为 PredNet(「我会因为没有足够的创造力来想出更好的东西而受到责备,」Lotter 说)。该团队按照预测编码的原则将 RNN 设计为四层的层次结构,每一层都预测来自下层的预期输入,在不匹配时,向上发送错误信号。

d28e7fa240942a3394538e17e3ec1a96.png

论文地址:https://arxiv.org/abs/1605.08104

然后,他们用安装在汽车上的摄像头拍摄的城市街道视频训练网络。PredNet 学会了连续预测视频中的下一帧。「我们不知道它是否真的有效,」Lotter 说。「我们试了一下,发现它实际上是在做预测。那太酷了。」

下一步是将 PredNet 连接到神经科学。去年在 《Nature Machine Intelligence》上,Lotter 及其同事报告说,PredNet 展示了猴子大脑中对意外刺激做出反应的行为,包括一些难以在简单的前馈网络中复制的行为。

bf05b8efbb6834bc576be7850bafb8a2.png

论文地址:https://www.nature.com/articles/s42256-020-0170-9

「这是一项了不起的工作,」Kietzmann 在谈到 PredNet 时说。但是他、Marcel van Gerven 和他们在 Radboud 的同事追求的是更基本的东西:Rao 和 Ballard 模型和 PredNet 都明确地结合了人工神经元进行预测和纠错,以及导致正确的自上而下预测,以抑制错误神经元的机制。但如果这些没有明确指定呢?「我们想知道是否真的需要所有这些 [烘焙] 架构限制,或者我们是否会采用更简单的方法。」Kietzmann 说。

Kietzmann 和 van Gerven 想到的是,神经交流在能量上是昂贵的(大脑是身体中能量最密集的器官)。因此,节约能源的需要可能会限制生物体中任何进化神经网络的行为。

研究人员决定看看是否有任何预测编码的计算机制可能出现在 RNN 中,这些 RNN 必须使用尽可能少的能量来完成任务。他们认为,他们网络中人工神经元之间的连接强度(也称为权重)可以作为突触传递的代理,这是生物神经元中大部分能量使用的原因。「如果你减少人工单位之间的重量,那就意味着你用更少的能量进行交流,」Kietzmann 说。「我们认为这是最小化突触传递。」

396e295a45303bc4f67a5d2664e7aa75.png

然后,该团队在多个连续数字序列上以升序、环绕顺序训练 RNN:1234567890、3456789012、6789012345 等。每个数字都以 28 x 28 像素图像的形式显示给网络。RNN 学习了一个内部模型,可以从序列中的任何随机位置开始预测下一个数字是什么。但是网络被迫以最小可能的单位之间的权重来做到这一点,类似于生物神经系统中的低水平神经活动。

在这些条件下,RNN 学会了预测序列中的下一个数字。它的一些人工神经元充当「预测单元」,代表预期输入的模型。其他神经元充当「错误单元」,当预测单元尚未学会正确预测下一个数字时,这些神经元最为活跃。当预测单元开始正确时,这些错误单元变得柔和。至关重要的是,网络采用这种架构是因为它被迫最大限度地减少能源使用。「它只是学会了人们通常明确地在系统中建立的那种抑制,」Kietzmann 说。「我们的系统开箱即用,作为紧急事情要做,是节能的。」

96bf8894a1336f88caa17b7bb16a12fe.png

论文地址:https://www.biorxiv.org/content/10.1101/2021.02.16.430904v1

结论是,最小化能源使用的神经网络最终会实现某种预测处理——证明生物大脑可能也在做同样的事情。

Rajan 称 Kietzmann 的工作是「一个非常巧妙的例子,说明了自上而下的约束(如能量最小化)如何间接导致特定功能(如预测编码)。」这促使她怀疑 RNN 中特定错误和预测单元的出现,是否可能是由于只有网络边缘的神经元接收输入的意外后果。如果输入分布在整个网络中,「我下意识的猜测是,你不会发现错误单位和预测单位之间的分离,但你仍然会发现预测活动,」她说。

大脑行为的统一框架

尽管这些来自计算研究的见解看起来很有说服力,但最终,只有来自活体大脑的证据才能说服神经科学家相信大脑中的预测处理。为此,麦吉尔大学和魁北克人工智能研究所 Mila 的神经科学家和计算机科学家 Blake Richards 及其同事提出了一些明确的假设,即大脑在学习预测意外事件时应该看到什么。

89aa3c3c0849ca856e55946f15f8c571.png

大脑中的金字塔神经元似乎在解剖学上适合预测处理,因为它们可以分别整合来自相邻神经元的「自下而上」信号和来自更远神经元的「自上而下」信号。

为了验证他们的假设,他们求助于西雅图艾伦脑科学研究所的研究人员,他们在老鼠身上进行了实验,同时监测了老鼠大脑的神经活动。特别有趣的是,大脑新皮质中的某些锥体神经元,它们被认为在解剖学上适合预测处理。它们可以接收来自附近神经元的局部自下而上的感觉信号(通过输入到它们的细胞体)和来自更远的神经元(通过它们的顶端树突)的自上而下的预测信号。

向小鼠展示了许多 Gabor 斑块序列,这些斑块由明暗条纹组成。每个序列中的所有四个补丁都具有大致相同的方向,小鼠开始期待这一点。(「一定很无聊,光看这些序列,」Richards 说。)然后研究人员插入了一个意想不到的事件:第四个 Gabor 补丁随机旋转到不同的方向。这些动物最初很惊讶,但随着时间的推移,他们也开始期待惊喜的元素。在此期间,研究人员一直在观察小鼠大脑中的活动。

他们发现,许多神经元对预期和意外刺激的反应不同。至关重要的是,这种差异在测试第一天的局部自下而上的信号中很强,但在第二天和第三天逐渐减弱。在预测处理的背景下,这表明随着刺激变得不那么令人惊讶,新形成的自上而下的期望开始抑制对传入感官信息的反应。

与此同时,顶端树突发生了相反的情况:它们对意外刺激的反应差异随着时间的推移而增加。神经回路似乎正在学习更好地表示令人惊讶事件的特性,以便在下一次做出更好的预测。

Richards 说:「这项研究为新皮层正在发生诸如预测学习或预测编码之类的事情提供了进一步的支持。」

的确,对神经元活动或动物行为的个体观察有时可以用其他一些大脑模型来解释。例如,神经元对相同输入的反应减弱,而不是被解释为错误单元的抑制,可能仅仅是由于适应过程。但随后「你会得到关于不同现象的解释的完整电话簿,」 de Lange 说。

另一方面,预测处理提供了一个统一的框架来一次性解释许多现象,因此它作为一种关于大脑如何工作的理论很有吸引力。「我认为目前的证据非常令人信服,」Richards 说。「实际上,我愿意为这个要求投入大量资金。」

参考内容:https://www.quantamagazine.org/to-be-energy-efficient-brains-predict-their-perceptions-20211115/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

6f14d98686a4add340cb48c6c4877b53.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483258.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

元宇宙不是下一代互联网,而是人类群体思维空间或梦境世界的具现

前言:本文是根据6G俱乐部举办的6G与元宇宙研讨会上的发言整理形成作者:刘锋目前,业内有一种声音提出元宇宙是下一代互联网,之前WEB2.0、物联网、移动互联网和区块链爆发的时候也曾经这样表达过,如果从互联网的发展历史…

数据结构和算法——栈、队列、堆

文章目录1.预备知识1.1 栈1.2 队列1.3 堆2.用队列实现栈2.1 题目描述2.2 解题思路2.3 C实现3.用栈实现队列3.1 题目描述3.2 解题思路3.3 C实现4.最小栈4.1 题目描述4.2 解题思路5.合法的出栈序列5.1 题目描述5.2 解题思路5.3 C实现6.基本计算器6.1 题目描述6.2 解题思路7.数组中…

综述 | 北斗系统应用趋势分析

来源:智绘科服初审:张艳玲复审:宋启凡终审:金 君一、前言2020年6月23日,北斗三号最后一颗组网卫星成功发射。2020年7月31日,北斗三号建成暨开通仪式举行,北斗三号全球卫星导航系统正式开通[1]…

数据结构与算法——贪心算法

文章目录1.分发饼干1.1 题目描述1.2 解题思路1.3 C实现2.摆动序列2.1 题目描述2.2 解题思路2.3 C实现3.移掉K位数字3.1 题目描述3.2 解题思路3.3 C实现4.跳跃游戏4.1 题目描述4.2 解题思路4.3 C实现5.跳跃游戏 II5.1 题目描述5.2 解题思路5.3 C实现6.用最少数量的箭引爆气球6.1…

人为什么要睡觉?科学家给出进一步答案

来源:科技日报作者:张佳欣 人类一生中有三分之一的时间在睡觉,包括苍蝇、蠕虫甚至水母等无脊椎动物也会睡觉。在整个进化过程中,睡眠对所有具有神经系统的有机体来说都是普遍的,也是必不可少的。然而你有没有想过&…

操作系统——简介

文章目录1.操作系统的功能和目标1.1 作为用户和计算机硬件之间的接口1.2 作为系统资源的管理者1.3 作为最接近硬件的层次2.操作系统的概念、功能和目标3.操作系统的四大特征3.1 并发3.2 共享3.3 虚拟3.4 异步4.操作系统的运行机制4.1 两种指令4.2 两种处理器状态4.3 两种程序5.…

Andrew Gelman、Aki Vehtari​ | 过去50年最重要的统计学思想是什么?

来源: 数据分析网作者 :Andrew Gelman 美国统计学家、哥伦比亚大学统计学教授Aki Vehtari 阿尔托大学计算机科学系副教授近日,图灵奖得主、“贝叶斯网络之父”Judea Pearl在Twitter上分享了一篇新论文“What are the most important statis…

全局唯一ID的生成

数据在分片时,典型的是分库分表,就有一个全局ID生成的问题。单纯的生成全局ID并不是什么难题,但是生成的ID通常要满足分片的一些要求: 1 不能有单点故障。 2 以时间为序,或者ID里包含时间。这样一是可以少一个索引…

操作系统——进程

文章目录1.进程的定义2.进程的组成3.PCB4.进程的状态4.1 进程的五种状态4.2 进程状态间的转换5.进程控制6.进程通信6.1 共享存储6.2 管道通信6.3 消息传递7.线程7.1 线程的概念7.2 引入线程后的变化7.3 线程的属性7.4 线程的实现方式7.4.1 用户级线程7.4.2 内核级线程7.4.3 混合…

10分钟了解图卷积神经网络的常用算法和发展方向

来源:数学算法俱乐部近几年,机器学习在各个领域井喷式发展,现已成为当下最热门的技术。掌握机器学习,你就比 80% 的人更具备竞争优势。谷歌的无人驾驶、抖音的推荐系统、百度的人脸识别、大疆的无人机、科大讯飞的语音识别、小米的…

操作系统——调度

文章目录1.调度的概念2.调度的三个层次2.1 高级调度2.2 中级调度2.3 低级调度2.4 三种调度之间的关联1.调度的概念 2.调度的三个层次 2.1 高级调度 2.2 中级调度 2.3 低级调度 2.4 三种调度之间的关联

诺奖得主被曝40多篇论文造假!

来源:科研城邦截止2021年11月6日,Gregg L. Semenza教授针对其在Pubpeer被挂的52篇论文,进行了至少6篇文章的纠正,且撤回了1篇文章。离谱的是,这位美国约翰霍普金斯大学教授,正是2019年诺贝尔生理学或医学奖…

操作系统——死锁

文章目录1.死锁的概念2.死锁产生的必要条件3.什么时候会发生死锁4.死锁的处理策略4.1 预防死锁4.1.1 破坏互斥条件4.1.2 破坏不剥夺条件4.1.3 破坏请求和保持条件4.1.4 破坏循环等待条件4.2 避免死锁4.2.1 安全序列4.2.2 银行家算法1.死锁的概念 2.死锁产生的必要条件 3.什么时…

苏联的三进制电脑,为什么被二进制干掉了?

来源:差评 当我们在电脑上打开一个软件,看一部电影,听一首歌的时候,我们很难想象,这些东西都是由 0 和 1 这样的二进制数字组成的。但你有没有好奇过?为什么计算机要用二进制呢?难道是因为它效…

linux标准I/O——标准I/O介绍

文章目录1.文件的相关概念1.1 什么是文件1.2 文件类型2.标准I/O概念2.1 什么是标准I/O2.2 FILE和流2.3 流的缓冲类型2.4 stdin,stdout和stderr1.文件的相关概念 1.1 什么是文件 \qquad一组相关数据的有序集合 1.2 文件类型 文件类型表示举例常规文件r文本文件、二…

70页论文,图灵奖得主Yoshua Bengio一作:「生成流网络」拓展深度学习领域

来源:机器学习研究组订阅GFlowNet 会成为新的深度学习技术吗?近日,一篇名为《GFlowNet Foundations》的论文引发了人们的关注,这是一篇图灵奖得主 Yoshua Bengio 一作的新研究,论文长达 70 页。在 Geoffrey Hinton 的「…

linux标准I/O——流的打开和关闭

文章目录1.打开流2.mode参数3.fopen举例4.新建文件权限5.处理错误信息6.关闭流1.打开流 2.mode参数 3.fopen举例 #include<stdio.h> int main() {FILE *fp;fpfopen("a.txt","r");if(fpNULL){printf("fopen error\n");return -1;}return 0…

卷积神经网络数学原理解析

来源&#xff1a;海豚数据科学实验室作 者&#xff1a;Piotr Skalski翻 译&#xff1a;通夜&#xff08;中山大学&#xff09;、had_in&#xff08;电子科技大学&#xff09;编 辑&#xff1a;Pita 原标题&#xff1a;Gentle Dive into Math Behind Convolutional Neural N…

【大数据】分布式集群部署

1、集群规划部署 节点名称NN1NN2DN RMNMhadoop01NameNode DataNode NodeManagerhadoop02 SecondaryNameNodeDataNodeResourceManagerNodeManagerhadoop03 DataNode NodeManager2、参考单机部署&#xff0c;拷贝安装目录至相同目录&#xff0c;使用ln -s 建立软连接 3、修改配置…

linux标准I/O——按字符输入和输出

文章目录1.流的读写方式2.按字符输入3.举例3.1 从键盘读取一个字符&#xff0c;并打印到终端上3.2 读取一个文件&#xff0c;并打印文件中的字符数目3.3 自行输入要查看的文件&#xff0c;并打印文件中的字符数目4.按字符输出5.举例5.1 从键盘读入&#xff0c;并打印到终端5.2 …