自监督学习启示大脑的运作方式

71b3ea3558934797f41d4a19520c61f9.jpeg

来源:混沌巡洋舰 

近十年来,许多最令人印象深刻的人工智能系统都使用大量的标记数据进行训练。例如,一张图片可能被标记为“虎斑猫”或“老虎”,以“训练”一个人工神经网络来正确区分虎斑猫和虎。这一策略既取得了惊人的成功,又存在严重的缺陷。

这种有监督学习需要人类辛苦地标记数据,而神经网络往往走捷径,学会将标记与最少的、有时是表面的信息联系起来。例如,一个神经网络可能会利用草的存在来识别一张奶牛的照片,因为奶牛通常是在田野里拍照的。

加州大学伯克利分校的计算机科学家Alexei Efros表示: “我们正在培养一代算法,它们就像本科生一样,整个学期都没来上课,然后在期末考试的前一天晚上,他们在临时抱佛脚。他们并没有真正学习材料,但他们在考试中表现很好。”

此外,对那些对动物和机器智能的交叉领域感兴趣的研究人员来说,这种“监督式学习”可能在揭示生物大脑方面受到限制。动物ーー包括人类ーー不使用带标签的数据集来学习。在大多数情况下,他们自己探索环境,并通过这样做获得了对世界丰富和强大的理解。

现在,一些计算神经科学家已经开始探索使用很少或没有人类标记的数据训练神经网络。这些“自监督学习”算法已被证明在建立人类语言模型,以及最近的图像识别领域非常成功。在最近的工作中,使用自监督学习模型建立的哺乳动物视觉和听觉系统的计算模型已经显示出比有监督学习模型更接近于大脑功能。在一些神经科学家看来,似乎人工网络开始揭示我们大脑用来学习的一些实际方法。

受人工神经网络启发的大脑模型大约在10年前成熟,大约在同一时期,一个名为 AlexNet 的神经网络彻底改变了对未知图像进行分类的任务。这个网络,像所有的神经网络一样,是由多层人工神经元组成的,这些计算单元彼此之间形成连接,这些连接的权重各不相同。如果一个神经网络未能正确分类一幅图像,学习算法将更新神经元之间连接的权重,以便在下一轮训练中减少错误分类的可能性。该算法对所有的训练图像进行多次重复这一过程,调整权重,直到网络的错误率达到可接受的低水平。

大约在同一时期,神经科学家利用像 AlexNet 及其后继者的神经网络,开发了灵长类动物视觉系统的第一个计算模型。这种结合看起来很有希望: 例如,当猴子和人工神经网络显示相同的图像时,真实神经元和人工神经元的活动显示出一种有趣的对应关系。随后建立了人工听觉和气味检测模型。

但随着该领域的发展,研究人员意识到有监督学习的局限性。例如,2017年,当时在德国蒂宾根大学的计算机科学家Leon Gatys和他的同事拍摄了一张福特 T 型车的照片,然后在照片上覆盖了一个豹皮图案,产生了一个奇怪但容易识别的图像。一个领先的人工神经网络正确地将原始图像分类为 T 型车,但将修改后的图像视为豹。它专注于纹理,对汽车(或豹子)的形状一无所知。

自监督学习策略的设计就是为了避免这类问题。在这种方法中,人类不会标记数据。相反,“这些标签来自数据本身,”瑞士Friedrich Miescher生物医学研究研究所的计算神经科学家Friedemann Zenke说。自我监督算法本质上是在数据中创建空白,并要求神经网络填补空白。例如,在所谓的大语言模型中,训练算法将向神经网络显示句子的前几个单词,并要求它预测下一个单词。当用从互联网上收集的大量文本进行训练时,该模型似乎能够学习语言的句法结构,展示出令人印象深刻的语言能力ーー这一切都没有外部标签或监督。

类似的努力正在计算机视觉领域进行。2021年末,何开明及其同事公布了他们的“蒙面自动编码器”,该编码器是基于埃弗罗斯团队在2016年开创的一项技术。自我监督学习算法随机掩盖图像,掩盖四分之一的图像。掩蔽的自动编码器将未掩蔽的部分转化为潜在的表征——包含有关对象重要信息的压缩数学描述。(就图像而言,潜在的表示可能是一种数学描述,它捕捉图像中物体的形状等信息。)然后,解码器将这些表示转换回完整的图像。

论文地址:https://arxiv.org/abs/2111.06377

自监督学习算法训练编译码器组合,将掩码图像转化为完整的图像。真实图像和重建图像之间的任何差异都会反馈到系统中以帮助它学习。这个过程对一组训练图像重复,直到系统的错误率适当地低。在一个例子中,当一个经过训练的蒙版自动编码器显示一个以前看不到的公交车图像,几乎80% 的公交车图像是模糊的,但模型仍然成功地重建了公交车的外观结构。

“这是一个非常、非常令人印象深刻的结果,”Efros说。

在这样的系统中创建的潜在表征似乎包含比以前的策略所能包含的更深层的信息。系统可能会了解汽车的形状,而不仅仅是它们的模式。这确实是自我监督学习的基本思想,即自下而上地积累知识。没有为了通过考试而临时抱佛脚。

自我监督的大脑

在这样的系统中,一些神经科学家发现这类似我们如何学习。“我认为毫无疑问,大脑90% 的功能是自我监督学习,” Blake Richards说,他是麦吉尔大学和魁北克人工智能研究所的计算神经科学家。生物大脑被认为是不断地预测,比如说,一个物体移动时的未来位置,或者一句话中的下一个单词,就像自我监督学习算法试图预测一幅图像或一段文本中的间隙。而且大脑也会从自己的错误中学习ーー我们大脑的反馈只有一小部分来自外部来源(“错误的答案”)。

例如,考虑人类和其他灵长类动物的视觉系统。这些是所有动物感觉系统中研究得最好的,神经科学家一直在努力解释为什么它们包括两个独立的通路: 负责识别物体和面孔的腹侧视觉通路和负责处理运动的背侧视觉通路(分别是“什么”和“哪里”通路)。

Richards和他的团队建立了一个自监督学习模型,这个模型暗示了一个答案。他们训练了一个结合了两种不同神经网络的人工智能: 第一种被称为 ResNet 架构,用于处理图像; 第二种被称为循环网络,可以跟踪一系列先前的输入,从而对下一个预期的输入做出预测。为了训练合成的人工智能,研究小组从一段视频的10帧序列开始,然后让 ResNet 一个一个地处理它们。然后回归网络预测第11帧的潜在表征,而不是简单地匹配前10帧。自监督学习算法将预测值与实际值进行比较,并指导神经网络更新权值,使预测结果更加准确。

Richards的研究小组发现,受过单一 ResNet 训练的人工智能擅长物体识别,但不擅长对运动进行分类。但当人工智能将单个 ResNet 分成两部分,创造出两条通路(在不改变神经元总数的情况下)时,人工智能就开发出了一个通路中的物体和另一个通路中的运动的表示,从而能够对这些属性进行下游分类ーー就像我们的大脑可能会做的那样。

论文地址:

https://www.biorxiv.org/content/10.1101/2021.06.18.448989v3.full

为了进一步测试人工智能,研究小组给它看了一组西雅图艾伦脑科学研究所的研究人员之前给老鼠看的视频。像灵长类动物一样,老鼠的大脑区域专门用于静态图像和运动。艾伦大学的研究人员记录了老鼠在观看视频时视觉皮层的神经活动。

在这里,Richards的团队也发现了人工智能和活体大脑对视频的反应方式的相似之处。在训练过程中,人工神经网络中的一条通路变得更加类似于小鼠大脑的腹侧物体检测区域,而另一条通路变得更加类似于运动集中的背侧区域。

Richards说,研究结果表明,我们的视觉系统有两条专门的路径,因为它们有助于预测未来看到的东西; 单一的路径表现的不够好。

人类听觉系统的模型讲述了一个类似的故事。今年6月,Meta AI 的研究科学家Jean-Rémi King领导的一个团队,训练了一种名为 Wav2Vec 2.0的人工智能,它利用神经网络将音频转换为潜在表征。研究人员掩盖了其中的一些表示,然后将其输入另一个称为transformer的神经网络。在训练过程中,transformer预测被掩盖的信息。在这个过程中,人工智能学会将声音转化为潜在的表征,同样不需要任何标签。该团队使用了大约600小时的语音数据来训练网络,“这大约是一个孩子在头两年的经验中所能得到的,”King 说。

论文地址:https://arxiv.org/abs/2206.01685

一旦系统被训练好,研究人员就用英语、法语和普通话播放有声读物的部分。然后,研究人员将人工智能的表现与来自412人的数据进行了比较。这412人都是以上述三种语言为母语的人,他们在接受功能磁共振成像(fMRI)扫描时,听到了相同的音频片段。King说他的神经网络和人类大脑,尽管有噪音和低分辨率的功能磁共振成像图像,“不仅相互关联,而且以一种系统的方式相互关联”: 人工智能早期层的活动与初级听觉皮层的活动相一致,而人工智能最深层的活动与大脑较高层的活动相一致,在这种情况下是脑前额叶外皮。“这是非常漂亮的数据,”Richards说。“这不是决定性的,但它是另一个令人信服的证据,表明我们学习语言的方式,实际上在很大程度上是通过试图预测将要说的下一句话。”

不是每个人都相信。Josh McDermott,麻省理工学院的计算神经科学家,利用有监督学习和自我监督学习,研究了视觉和听觉感知模型。他的实验室设计了他所谓的“元音”,合成的音频和视觉信号,对人类来说,只是难以理解的噪音。然而,对于人工神经网络来说,元计似乎与真实信号没有什么区别。这表明,在神经网络的深层形成的表征,即使有自我监督的学习,也与我们大脑中的表征不匹配。麦克德莫特说,这些自我监督的学习方法“在某种意义上是一种进步,因为你能够学习那些不需要所有这些标签就能支持大量识别行为的表示法。”。“但它们仍然存在许多受监督模型的病态。”

一旦系统被训练好,研究人员就用英语、法语和普通话播放有声读物的部分。然后,研究人员将人工智能的表现与来自412人的数据进行了比较。这412人都是以上述三种语言为母语的人,他们在接受功能磁共振成像(fMRI)扫描时,听到了相同的音频片段。金说他的神经网络和人类大脑,尽管有噪音和低分辨率的功能磁共振成像图像,“不仅相互关联,而且以一种系统的方式相互关联”: 人工智能早期层的活动与初级听觉皮层的活动相一致,而人工智能最深层的活动与大脑较高层的活动相一致,在这种情况下是脑前额叶外皮。“这是非常漂亮的数据,”理查兹说。“这不是决定性的,但它是另一个令人信服的证据,表明我们学习语言的方式,实际上在很大程度上是通过试图预测将要说的下一句话。”

自监督学习的未解之谜

不是每个人都这样认为。Josh McDermott,麻省理工学院的计算神经科学家,利用有监督学习和自我监督学习,研究了视觉和听觉感知模型。他的实验室设计了他所谓的“metamers”,合成的音频和视觉信号,对人类来说,只是难以理解的噪音。然而,对于人工神经网络来说,metamers似乎与真实信号没有什么区别。这表明,在神经网络的深层形成的表征,即使有自我监督的学习,也与我们大脑中的表征不匹配。麦McDermott说,这些自我监督的学习方法“在某种意义上是一种进步,因为你能够学习那些不需要所有这些标签就能支持大量识别行为的表示法。”。“但它们仍然存在许多受监督模型的问题。”

算法本身也需要更多的工作。例如,在 Meta AI 的 Wav2Vec 2.0中,人工智能只能预测几十毫秒的潜在声音表征,比发出一个感知上截然不同的噪音所需的时间还要短,更不用说一个单词了。“要做类似于大脑所做的事情,还有很多事情要做,”King说。

真正理解大脑功能需要的不仅仅是自我监督学习。首先,大脑充满了反馈连接,而目前的模型很少有这样的连接,如果有的话。下一个显而易见的步骤将是使用自我监督学习来训练高度重复(recurrent )的网络(这是一个困难的过程) ,并观察这些网络中的活动与真实的大脑活动之间的比较。另一个关键步骤是将自监督学习模型中人工神经元的活动与单个生物神经元的活动相匹配。“希望在未来,[我们的]结果也将通过单细胞记录得到证实,”King 说。

如果观察到的大脑和自我监督学习模型之间的相似性适用于其他感官任务,这将是一个更强有力的迹象,表明无论我们的大脑能够施展什么魔法,都需要以某种形式进行自我监督学习。如果我们确实发现了大不相同的系统之间的系统性相似之处,这(将)表明,也许没有那么多方法可以以智能的方式处理信息。至少,这是我们愿意研究的美丽假设。

原文链接:

https://www.quantamagazine.org/self-taught-ai-shows-similarities-to-how-the-brain-works-20220811/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

9fda1fc2c1fde664fa02f1b62080294c.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481708.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2022年中国AI芯片行业深度研究

人工智能技术与咨询 四大类人工智能芯片(GPU、ASIC、FGPA、类脑芯片)及系统级智能芯片在国内的发展进度参差不齐。用于云端的训练、推断等大算力通用 芯片发展较为落后;适用于更多垂直行业的终端应用芯片如自动驾驶、智能安防、机器人等专用…

图形学人物简史:两位图灵奖与奥斯卡得主的图形学研究往事

来源:大数据文摘大数据文摘授权转载自AI科技评论整理:李梅、王玥编辑:陈彩娴8 月 8 日至 11 日,计算机图形学国际顶级会议 SIGGRAPH 在加拿大温哥华举办。2019 年图灵奖和多次奥斯卡奖「双料得主」Pat Hanrahan 和 Ed Catmull 在大…

一种基于标签比例信息的迁移学习算法

人工智能技术与咨询 点击蓝字 关注我们 来源:《 计算机科学与应用》 ,作者汪槐沛等 关键词: 标签比例学习;数据挖掘;迁移学习 摘要: 摘要: 标签比例学习问题是一项仅使用样本标签比例信息去构建分类模型的挖掘任务&am…

智慧城市升级版已来 | 城市大脑建设标准十大原则

来源:球迷Long笔记(1) 城市大脑建设标准应具备的十个原则1.形成理论基础2.适应复杂场景3.突破地域限制 4.消除信息孤岛5.坚持以人为本 6.降低建设成本7.实现协同建设 8.体现人机融合9.保持持续进化 10.支撑协同发展(2)…

基于机器视觉的散热器钎焊缺陷检测系统研发

人工智能技术与咨询 点击蓝字 关注我们 来源:《 图像与信号处理》 ,作者 吕广贤 关键词: 机器视觉;缺陷检测;钎焊 摘要: 摘要: 为解决散热器钎焊缺陷在工业检测过程中效率低、差错率高的问题,本文设计了一…

逻辑究竟是什么以及逻辑应当是什么?

来源:“哲学园” 公众号编辑:姜天海审核:范 杰逻辑究竟是什么以及逻辑应当是什么?郝兆宽作者简介:郝兆宽,复旦大学哲学学院教授人大复印:《逻辑》2016 年 03 期原发期刊:《哲学分析…

基于遗传算法的无人机监视覆盖航路规划算法研究

基于遗传算法的无人机监视覆盖航路规划算法研究 人工智能技术与咨询 点击蓝字 关注我们 来源:《 计算机科学与应用》 ,作者 李御驰等 关键词: 人工势场法;无人机;监视覆盖航路规划 摘要: 摘要: 为解决传统覆盖航路规…

基于改进SSD算法的小目标检测与应用

人工智能技术与咨询 点击蓝字 关注我们 来源:《 计算机科学与应用》 ,作者刘洋等 关键词: SSD;深度学习;小目标检测 摘要: 摘要: 针对通用目标检测方法在复杂环境下检测小目标时效果不佳、漏检率高等问题,…

「上帝粒子」发现10周年

来源:FUTURE | 远见 选编:闵青云 2012年7月4日,欧洲核子研究中心(CERN)宣布发现了「上帝粒子」(希格斯玻色子)。希格斯玻色子是粒子物理学标准模型预言的一种玻色子,正是它的存在&am…

基于对抗生成网络的滚动轴承故障检测方法

人工智能技术与咨询 点击蓝字 关注我们 来源:《人工智能与机器人研究》 ,作者华丰 关键词: 不平衡工业时间序列;异常检测;生成对抗网络;滚动轴承数据 关注微信公众号:人工智能技术与咨询。了解更多咨询&…

社会演化动力学:人类社会复杂性为何不断增加?

来源: 集智俱乐部编译:任卡娜审校:刘培源编辑:邓一雪导语在全新世(the Holocene,11700年前以来)期间,人类社会的规模和复杂性显著地增长。一代又一代的研究者试图提出不同的理论来对…

基于机器学习的网络安全态势感知

人工智能技术与咨询 点击蓝字 关注我们 来源:《计算机科学与应用》 ,作者杨怡等 关键词: 机器学习;态势感知;关联分析;攻击场景重建 摘要: 摘要: 在传统网络防御手段抵御攻击的基础上,提出了一…

「Python」为什么Python里面,整除的结果会是小数?

原文:https://www.cnblogs.com/bEngi1/p/9155297.html  ‘//’明明是整除,为什么结果不是整数,而会出现小数? 首先,关于除法有三种概念:传统除法、精确除法和地板除 1 2 3 4 5 6 7 #1、传统除法&#x…

《Nature》创新技术发现环境变化影响活细胞的RNA形状

来源:生物通通过创新技术,揭示了环境条件对活细胞中RNA动态结构的影响。这项研究是Dame Caroline Dean FRS教授和Yiliang Ding博士团队合作的结果,增加了我们对细胞水平对环境信号的反应的理解。这增加了我们利用这些知识来微调作物或开发基于…

C/C++预处理指令#define,#ifdef,#ifndef,#endif…

原文https://www.cnblogs.com/zi-xing/p/4550246.html 管理 C/C预处理指令#define,#ifdef,#ifndef,#endif… 本文主要记录了C/C预处理指令,常见的预处理指令如下: #空指令,无任何效果 #include包含一个源代码文件 #define定义宏 #undef取消…

面向制造领域人机物三元数据融合的本体自动化构建方法

面向制造领域人机物三元数据融合的本体自动化构建方法 人工智能技术与咨询 点击蓝字 关注我们 摘要 当前,智能制造面临的许多问题都具有不确定性和复杂性,单纯地利用专家经验和机理模型难以有效解决.鉴于此,面向跨层跨域的复杂制造系统网络化协同控制机制,提出一种基于本…

“中国脑计划”:向最后的前沿进发

来源:神经科技编辑:Yezi审阅:mingzlee7大脑是人类智慧的集结,是已知宇宙当中最复杂的产物,但我们对大脑认知却很晚,比如我们常说心想事成、心外无物,在很长的历史时期当中,我们都以为…

基于人机协作的无人集群搜索方法研究

基于人机协作的无人集群搜索方法研究 人工智能技术与咨询 点击蓝字 关注我们 关键词: 无人集群 ; 人机协作 ; 动态规划 ; 多Agent系统 摘要: 人与机器人交互是当前一项研究热点,人与无人集群协作搜索是人机交互的典型场景,通过结…

chatbot1_2 RNN简单实现

chatbot1.2 如何处理多义词的embedding? 每个意思一个向量,多方叠加。在某个切面与其相同意思的向量相近 如何识别和学习词组的向量? 多次出现在一起,认为是词组 如何处理未曾见过的新词? 语境平均,语…

DeepMind创始人Demis Hassabis:AI 的强大,超乎我们的想象

来源:微信公众号“雷锋网”撰文:黄楠、王玥编辑:陈彩娴有人认为 AI 已经穷途末路,但一些绝顶聪明的人还在继续求索。近日,DeepMind 的创始人 Demis Hassabis 作客 Lex Fridman 的播客节目,谈了许多有趣的观…