短期记忆容量必需有限

47a82c689ca1698c480463cf872b87e5.png

来源:CreateAMind

介绍一篇论文:

8cc193e321d9b4a1085a81c2846e7bc0.png

预测性大脑的短期记忆能力肯定是有限的

短期保持信息的能力可能是人类认知的一个标志, 因为它是许多领域所需要的,如感知、行动计划和语言。没有大脑的这一核心功能,人类无法思考、推理或计算,甚至可能无法感知。尽管短期记忆(STM)的概念通常仅指信息的存储,但工作记忆被认为涉及额外的执行过程,如信息的整合和处理, 并被认为支持复杂的认知活动,如语言处理、推理和问题解决(Baddeley,2003)。

从经验上来说,STM 是使用延迟匹配样本和变化检测任务等范式来检验的,在这些任务中,要求参与者对给定的感觉输入进行编码,以便最终在随后的时间点识别或回忆它。这些和其他相关的任务都揭示了一个有力但令人困惑的发现,即人类在短时记忆中所能保存的信息量(或人工操作的工作记忆) 受到严重限制。平均而言,据估计人类在短时记忆中只能保存四个项目(Cowan,2001)。

传统上,重点是解决这种限制背后的机制。认知过程,如信息的衰减或干扰

迄今为止,只有少数作者提出了对短时记忆限制的功能性解释,例如,认为它提高了记忆搜索的效率(例如,Dirlam,1972;MacGregor,1987), 有益于语言习得(如 Elman,1993),有助于检测环境中的共变(Kareev,2000),或作为动作控制的装置(Heuer 等人,2020)或作为眼动系统的核心组件

预测大脑

在过去十年中,人们对预测过程的兴趣急剧增长(最近的综述见 Clark,2013)。从这个角度来看, 大脑是主动的:它不仅仅依赖于自下而上的信息, 还会在感知推理过程中添加预期。一些实证研究为大脑预测其感觉输入提供了证据(例如,Alink 等人,2010)。大规模框架,如自由能原理,表明最小化惊喜可以提高大脑功能,如感知、记忆和行动(Friston,2010)。预测性大脑的概念为人类大脑的核心功能带来了新的功能解释:例如,从这个角度来看,注意力并不主要被视为一个选择过程,因为该系统否则会淹没在感官溢出中,而是被视为一种 为 预 测 和 预 测 错 误 分 配 权 重 的 机 制(Friston,2010)。同样,长期记忆(LTM),传统上被认为是一种存储过去信息的装置,已经被重新考虑为一个为未来事件的模拟提供先决条件的系统(Schacter & Addis,2007)。未来第一假说甚至假设“我们重温过去的能力可能只是我们构想未来能力 的 一 个 设 计 特 征 ”

预测和短期记忆

STM 是如何与预测过程联系起来的?预测框架的关键思想是,将传入的感觉输入与先前的信息或预期进行比较,只有偏差或预测误差在感觉层级中被前馈(参见 Clark,2013)。尽管许多研究调查了预测和处理预测误差的神经相关性,并用预测模型拟合了行为数据,但是很少讨论相关的心理或认知过程,例如感觉信息如何与先前的期望进行比较,在与感觉输入进行比较的过程中,如何从 LTM 中提取先前信息并使其可访问,以及它们的表示形式是什么。

大脑可以使用一种机制来突出和暂时保持来自 LTM 的先验知识中与感知决策或手头任务相关的部分。在大多数认知模型中,短时记忆被认为是来自 LTM 的提升或突出的信息,即,将选定部分标记为与当前加工相关的活动(例如,Ruchkin 等人,2003)。因此,STM 原则上可以为预测感觉输入提供最佳的机制,因为它可以在随后的比较过程中以高度可访问的状态保持相关的先验。有一些经验证据表明 STM 是预测所必需的。在一项相关的研究中,Travis 和他的同事(2013 年)使用了一种叫做上下文提示的视觉搜索范式,在这种范式中,参与者在看似随机的布局中搜索一个特定的目标,这个目标的身份在整个实验中保持不变。在他们不知道的情况下,一些布局在实验中重复了几次,参与者学会在这些布局中比在其他布局中更快地找到目标的位置。Travis 等人发现,当参与者在执行视觉搜索任务时必须在 STM 中保持额外的信息时,这种便利性受到阻碍,这表明 STM 对于预测物体的位置是必需的。此外,Cashdollar 等人(2017 年)证明, 在要求参与者注意一系列图像的任务中,STM 容量与预测的神经相关性相关。这些图像有一个概率分布,允许对其中一些进行预测。被试的短时记忆能力与预期过程的神经关联相关,这表明短时记忆在预测客体身份方面也有作用。

STM 与预测过程相关的观点也得到行动计划和执行领域的研究的支持。工作记忆一词最初是在计划行为的语境中引入的,指的是一种“当计划正在形成、转换或执行时,可以被暂时保留”的系统(Miller  et  al  . , 1960 , p.  207) 。有 人 认为,“工作记忆‘只不过’是执行一个动作的准备 , 无 论 是 动 眼 、 手 动 、 口 头 还 是 其 他 方式”(Theeuwes 等人,2009 年,第 198 页)。具体来说,工作记忆被认为对储存运动相关的视觉空间信息和行动计划都很重要(Postle,2006)。最近一项结合脑电图和功能性磁共振成像的研究表明,当工作记忆中保留的视觉内容与未来将要执行的特定动作相关联时,运动区的预激活,从而支持了工作记忆 在 行 动 规 划 中 发 挥 作 用 的 观 点 (van Ede,2020)。

工作记忆和行动计划之间的联系与最小化意外和预测错误的原则高度一致,因为感觉数据的一个重要原因是经历这些数据的有机体所追求的行动过程。如果人类根据他们计划的行动来预测他们的感觉,那么他们必须代表他们过去和未来的行动过程所产生的数据。在下文中,我们认为如果将 STM 视为预测设备的衍生物,则可以解释 STM 容量的限制。

预测必须是容量有限的

为了做出准确的预测,大脑必须代表事件的所有不确定性。然而,动态自然环境的一个重要特征是, 人们对未来的预测越深入,预测通常就变得越不确定。因此,与预测的不确定性的表示相关联的成本随着时间距离而急剧上升:如在国际象棋游戏中, 可能的配置(即,环境的状态)的数量随着要预测的移动的数量而指数上升。一个人要对下一步行动做出明智的决定,所有这些可能性和它们的不确定性都必须表现出来。

自然环境中的事件本质上是随机的,因为一个事件的概率取决于前一个事件的概率。例如,如果一个刚刚遇到的人伸出他的手,他的手势是友好的可能性取决于他之前是否表现出友好的面部表情;如果相反,他的面部表情暗示着攻击性,那么他伸出手来表示暴力行为的可能性就要高得多。为了绕过未来事件固有的不可预测性及其随机依赖性,最好使用有限的预测窗口。理想情况下,这个窗口不应该在离现在太近的地方结束,因为那样它不能有效地指导感知和行动,但也不应该延伸到太远的未来,因为那样表示会变得太昂贵(计算复杂)。图 1 显示了在随机环境中,作为从现在到未来的时间距离的函数的可能事件的数量。仅仅几个时间步骤之后,对未来的预测(a)变得太昂贵,因为需要表示所有可能的事件,以及(b)变得几乎无用,因为即使最可能的事件发生的概率也很低。因此,大脑的最佳策略是只预测短序列,这些短序列足够长以允许调整行为,但又足够短以避免可能性的指数爆炸和最可能序列的概率的指数衰减

在表示世界上的状态轨迹的准确性和复杂性之间的平衡方面,可以更技术性地表达基本思想。简而言之,依赖于离散状态的序列或连续的主动推理和预测处理的当前公式(例如,使用马尔可夫决策过程)考虑了从时间周期的开始到结束的少量离散步骤。随着时间的推移,这些顺序表征扮演着短时记忆和前瞻记忆的双重角色(即,对短期过去和未来的表征)。这些表示赋予生成模型以时间深度,并且对于根据预期的结果来评估动作的质量是必要的。至关重要的是,这些类型的生成模型可以根据它们的证据(或变化的自由能界限)进行优化。因为证据是准确性和复杂性之间的差异,所以必须有过去(或未来)的最佳时间步数来保持给定程度的预测准确性。如果有太多的时间步长,则生成模型中的自由度将增加其复杂性,其方式无法通过伴随的精度增加来平衡,因为世界的未来状态变得越来越不确定

通过说 STM 的容量限制是适应性的,我们的意思是它产生于对生物系统中计算复杂性的限制和准确性益处之间的最佳折衷。随着 STM 容量的增加,精度优势饱和(即,达到上限),容量的进一步增加带来额外的计算成本(复杂性),而没有好处。这意味着,根据 STM 的拟议功能作用,容量限制是可以预期的。

这种时间尺度的分离在层级生成模型中普遍存在,在层级生成模型中,较高层预测较低层的短轨迹。阅读提供了一个直观的例子:句子预测单词的短序列,单词本身预测字母的短序列(Friston et al .,2018)。这种设置还被用于模拟涉及延迟期的工作记忆任务,以说明对某个项目的持续呈现超过了其可见的时间段(Parr & Friston,2017)。同一种结构可能支持记忆策略,如组块,其中一系列短序列,通常约四至六个项目长,用于记忆长序列(如 Mathy & Feldman,2012)。

有人可能会说 STM 不一定只用于预期过程。然而,所有需要 STM 的实验任务最终都需要参与者保存信息,以便与未来的感知信息(探测)和/或预期的行动(反应)进行比较。从这个角度来看,短时记忆任务构成了一个预测加工问题。从环境中提取与现在或不久的将来的感知推断相关的信息,然后与输入的感觉信息进行比较,并且执行内部推断和/或外部动作来解决任何差异

如果一个考虑到 LTM 是一个保存过去的结构,人类对错误记忆的易感性似乎是次优的。关于人类如何通过在原始暴露的编码阶段之后添加新信息来构建新的、虚构 的 情 节 , 有 大 量 的 文 献 ( 关 于 综 述 , 参 见Loftus,2005)。然而,如果 LTM 利用过去的信息来模拟未来的情节,这样的错误就更有意义了,因为它们可以被认为是 LTM 在创作小说情节时的灵活性的副作用(Schacter & Addis,2007)。同样的想法也适用于 STM。STM 可以用来推断过去和未来, 但是如果从预测大脑的角度来看 STM,它的能力限制是最有意义的。

对进一步理论化和研究的启示

我们已经提出了一个关于 STM 容量限制的计算观点。也就是说,我们专注于系统必须解决的问题, 也就是说,尽可能实现最准确和最有信心的预测。

这一观点揭示了 STM 的容量限制是可以预期的。我们的观点可能会提供新的研究途径,偏离目前对STM 作为储存过去感觉输入的功能的关注。先前关于预测过程的工作主要集中在偏离预期(即预测误差)的神经后果上。大脑如何为即将到来的信息做准备的问题还没有得到广泛的解决,通过将 STM 视为代表自上而下预测的活动,可以刺激该领域的研究,这些预测是为了随后与感官输入进行比较而保留的。未来工作的另一个途径是对个体差异的评估,即低短时记忆能力和高短时记忆能力的个体在不同水平上的预测能力是否不同以及如何不同。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

5d4637636517ee9fc34c2d44f92e4ec5.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482254.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

读者-写者问题

文章目录1 问题描述2 问题分析3 代码实现1 问题描述 有读者和写者两组并发进程,共享一个文件,当两个或两个以上的读进程同时访问共享数据时不会产生副作用,但若某个写进程和其他进程(读进程或写进程)同时访问共享数据时…

9 操作系统第二章 进程管理 管程

文章目录1 管程1.1 为什么引入管程1.2 管程的定义和基本特征1.3 管程小结1 管程 1.1 为什么引入管程 产生原因:信号量机制存在的问题:编写程序困难、易出错 能不能设计一种机制,让程序员写程序是不需要再关注复杂的PV操作,使得代…

2021年世界科技进展100项

来源:三思派 作者:李万,钱娅妮1生命、生物、医药健康01新冠疫情1. 首次看清新冠患者体内蛋白质变化中国科学家分析出新冠肺炎死亡患者体内多器官组织样本中蛋白质分子病理全景图,相当于将医生在显微镜下看到的人体感染新冠病毒后细…

图灵奖获得者、信息安全常青树Adi Shamir:从密码学到AI对抗性样本研究|智源大会嘉宾风采...

来源:智源大会导读:RSA 算法是通信、金融产业中被广泛使用的安全基本机制,是信息时代的支柱技术。而在这个跨时代算法背后的设计者之一,正是密码学先驱 Adi Shamir。除了RSA 公钥密码算法以外,零知识证明、差分密码分析…

11 操作系统第三章 内存管理 内存的基本知识 内存管理 内存空间扩充 连续分配管理方式

文章目录1 内存概念1.1 内存作用1.2 逻辑地址VS物理地址1.3 装入的三种方式1.3.1 绝对装入1.3.2 可重定位装入1.3.3 动态重定位装入1.4 链接的三种方式1.4.1 静态链接1.4.2 装入时动态链接1.4.3 运行时动态链接1.5 内存的基础知识小结2 内存管理2.1 内存管理的任务2.2 内存保护…

Nature长文:打破AI黑盒的“持久战”

来源:大数据文摘2020年2月,随着 COVID-19在全球迅速传播且抗原检测难以获得,一些医生转向人工智能(AI)来尝试诊断病例。一些研究人员采用深度神经网络通过查看X射线和胸部计算机断层扫描(CT)扫描来快速区分患有COVID-19肺炎的人和未患肺炎的人…

12 操作系统第三章 内存管理 非连续分配管理方式 基本分页存储管理 基本分段存储管理 段页式存储管理

文章目录1 基本分页存储管理1.1 什么是分页存储1.2 重要的数据结构——页表1.3 基本地址变换机构1.4 具有快表的地址变换机构1.4.1 什么是快表(TLB)1.4.2 引入快表后,地址的变换过程1.4.3 地址变换过程小结1.5 两级页表1.5.1 单级页表存在的问…

13 操作系统第三章 内存管理 虚拟内存 请求分页管理方式 页面置换算法 页面分配策略

文章目录1 虚拟内存1.1 传统存储管理方式的特征、缺点1.2 局部性原理1.3 虚拟内存主要特征1.4 如何实现虚拟内存技术1.5 虚拟内存的基本概念小结2 请求分页管理方式2.1 页表机制2.2 缺页中断机构2.3 地址变换机构2.4 请求分页管理方式小结3 页面置换算法3.1 最佳置换算法 OPT3.…

视觉意识的主动推理模型

来源:CreateAMind论文介绍:在这里,我们旨在通过推进全球神经元工作区的扩展(预测性全球神经元工作区(PGNW))来克服这些限制,该工作区将 GNW 的基本方面与更近期的(贝叶斯)主动推理方法相结合,以理解大脑功能。具体来说,我们提出了一个基于主动推理的视觉…

14 操作系统第四章 文件管理 文件逻辑结构 文件目录结构

文章目录1 初识文件管理1.1文件属性1.2 文件内部的数据应该怎样组织起来?1.3 文件之间应该怎样组织起来?1.4 操作系统应该向上提供哪些功能?1.5 文件应如何存放在外存?1.6 文件系统总览2 文件逻辑结构2.1 文件分类2.2 顺序文件2.3…

AlphaFold 和 AI 蛋白质折叠革命的下一步是什么

来源:ScienceAI编辑:萝卜皮十多年来,分子生物学家 Martin Beck 团队一直在努力拼凑世界上最难的拼图游戏之一:人类细胞中最大分子机器的详细模型。这种被称为核孔复合体的庞然大物控制着分子进出细胞核的流动,也就是基…

15 操作系统第四章 文件管理 文件的物理结构 文件存储空间管理

文章目录1 文件的物理结构 (文件分配方式)1.1 文件块、磁盘块1.2 文件分配方式——连续分配1.3 文件分配方式——链接分配1.3.1 链接分配——隐式链接1.3.2 链接分配——显式链接1.3.3 链接分配(总结)1.4 文件分配方式——索引分配…

专访微软Greg Yang,构建神经网络的底层语言,探索AI的“万物理论”

来源:智源社区为了进一步解读这一工作背后的意义,智源社区采访了论文一作、微软研究院高级研究员Greg Yang(杨格)。采访中,我们不仅了解了Transfer的背景,以及项目背后更为远大的目标,也了解到了…

16 操作系统第四章 文件管理 文件的基本操作 文件共享 文件保护 文件系统的层次结构

文章目录1 文件的基本操作1.1 创建文件1.2 删除文件1.3 打开文件1.4 关闭文件1.5 读文件1.6 写文件1.7 文件基本操作小结2 文件共享2.1 基于索引结点的共享方式(硬链接)2.2 基于符号链的共享方式(软链接)2.3 文件共享小结3 文件保…

人工智能与量子计算在有前途的新忆阻器中融合

来源:ScienceAI编辑:萝卜皮近年来,计算在两个主要方面取得了进步——机器学习方面的突破,以开发通过经验自动改进的算法,以及对理论上证明比任何超级计算机更强大的量子计算机的研究。现在,科学家们已经创建…

17 操作系统第四章 磁盘管理 磁盘的结构 磁盘调度算法 减少磁盘延迟时间的方法

文章目录1 磁盘的结构1.1 磁盘、磁道、扇区1.2 磁盘如何读取数据1.4 盘面、柱面、磁盘的物理地址1.5 磁盘的分类1.6 磁盘的结构小结2 磁盘调度算法2.1 一次磁盘读/写操作需要的时间2.2 先来先服务算法(FCFS)2.3 最短寻找时间优先(SSTF&#x…

深度学习准备「爆破」著名的欧拉方程

来源:ScienceAI编辑:绿萝250 多年来,数学家一直试图「爆破」物理学中一些最重要的方程:那些描述流体如何流动的方程。如果他们成功了,那么他们将会发现一种情况,在这种情况下,这些方程会被打破—…

18 操作系统第五章 设备管理 IO设备的基本概念和分类 IO控制器 IO控制方式 IO软件层次结构 IO核心子系统 假脱机技术 设备的分配与回收 缓冲区管理

文章目录1 IO设备的基本概念和分类1.1 什么是I/O设备1.2 I/O设备分类2 IO控制器2.1 I/O设备组成2.2 I/O控制器功能2.3 I/O控制器的组成2.4 寄存器编址方式2.5 IO控制器小结3 IO控制方式3.1 程序直接控制方式3.2 中断驱动方式3.3 DMA方式3.3.1 DMA控制器3.3.2 DMA方式3.4 通道控…

Nature发布第一张人类造血干细胞发育的全面路线图

来源:生物通加州大学洛杉矶分校(UCLA)的科学家创建了一份史无前例的路线图,追踪了人类胚胎中造血干细胞发育的每一步,为人们在实验室中生产功能齐全的造血干细胞提供了蓝图。来自胚胎主动脉壁的人类造血干细胞这项研究…

1 计算机组成原理第一章 计算机系统概述 计算机发展历程、层次结构、性能指标

文章目录1 计算机发展历程1.1 软硬件发展1.2 分类以及发展方向2 计算机系统层次结构2.1 计算机系统组成2.1.1 硬件的基本组成2.1.2 软件系统2. 2 CPU及其工作过程2.2.1 运算器2.2.2 控制器2.2.3 计算机的工作过程2.2.4 计算机系统层次结构2.2.5 存储器3 计算机性能指标3.1 容量…