Nature经典回顾:大脑中统一的物体空间模型

74fa0f05ae98ab7d885cf8c1c4305870.jpeg

导语

大脑能够轻而易举的完成物体识别,这一过程主要在大脑的下颞叶皮层进行。研究已经发现下颞叶皮层存在面孔、身体、场景等类别选择性区域,然而,仍有大部分下颞叶皮层未发现已知的功能特异性。这就带来一系列问题:未被理解的大片区域编码了何种信息?物体的视觉信息在下颞叶皮层是根据何种一般性原理进行表征的?2020年发表于Nature的一篇文章利用功能磁共振成像技术、微电刺激、电生理学和深度神经网络,研究了猕猴大脑下颞叶皮层的组织结构。该研究基于深度神经网络建立了一个低维物体空间来描述物体,下颞叶神经元对这些物体的响应显示出神经元的计算过程可以表征为在物体空间上某个轴的投射。从形态上来说,这些神经元因为相似性而聚集在一起,形成了一个对物体空间描述的地图。这张地图在下颞叶里至少重复了三次;此外,这些细胞包含了足够的信息,具有充分的编码能力,可以借助深度神经网络重构出物体。本研究的结果提供了一个可计算并且统一的物体空间模型,该模型不仅可以解释已有的实验结果,并且可以为未来的实验结果提供预测。

在集智俱乐部 NeuroAI 读书会上,北京大学心理与认知科学学院研究员、论文第一作者鲍平磊对这篇论文进行了深入解读。加入读书会即可解锁讲座录播,与老师同学交流。NeuroAI读书会聚焦在视觉、语言和学习领域的神经科学与人工智能交叉研究,欢迎感兴趣的朋友参加。

物体识别、深度神经网络

来源:集智俱乐部

作者:张慧

编辑:邓一雪

6d817a41469c99c09cafdbbd4f741c50.jpeg

论文标题:

A map of object space in primate inferotemporal cortex

论文地址:

https://www.nature.com/articles/s41586-020-2350-5

1.物体识别与下颞叶皮层

物体识别,即为不同的视觉特征分配不同标签的过程,是我们通过视觉信息理解世界的核心能力。它是很多与物体有关的神经过程的基础,包括意识、注意力、视觉记忆、决策和语言等。对于大脑而言,下颞叶皮层主要完成物体识别这一任务。已有研究表明下颞叶皮层存在若干特殊的解剖区域,如面部选择区、身体选择区、场景选择区等。但是,这些区域仅占下颞叶皮层的一小部分,仍有大部分区域没有展现出任何已知的功能特异性。这些未被理解的大片区域编码了什么信息?能否找到下颞叶对于物体空间识别的一般性组织原则?视觉皮层里大部分区域的功能组织都是由视网膜拓扑来决定,颞叶区是否也继承了这一组织特性?

该研究的研究者认为这一假说可取之处在于认为下颞叶存在层级结构,但是这一假说不能解释为什么面部选择区会在这一特定位置;另有研究认为下颞叶组织决定于物体有无生命以及物体的实际大小,但这一假说不能解释物体的层级结构;更加复杂的模型,如从语义角度出发构建的模型等不具备一般性。因此,该研究并未采取猜测下颞叶皮层未定义的区域到底偏好哪种特征的方法,而是从连接入手,定义“无主之地”,结合微电刺激和脑功能成像的方法,寻找除了微电刺激位点外还有哪些下颞叶区域被激活,找到新的网络,再研究其特征,建立统一模型。

2. 找到新的网络并研究其特性

首先,研究者在“无主之地”插入微电刺激,同时结合脑功能成像,从功能连接的角度找到了新的网络Network X,包含NML1、NML2、NML3三个区域。为了探究Nnetwork X的物体选择性,研究者用包含6个类别的51种不同物体(每个物体有24个视角)的图像作为刺激集,分析单个神经元对这些刺激的响应。结果显示NML1、NML2、NML3有高度相似的物体选择性,但是该网络并不像脸网络或者身体网络那样偏好某一类别。

为了探究不同动物个体中是否存在同样的Network X,研究者利用脑功能成像,向被试呈现该网络最喜欢的物体和最不喜欢的物体,对比二者引起的大脑响应,结果显示视觉刺激得到的结果与微电刺激得到的结果有高度重合,证明了视觉刺激的方式可以找到同样的Network X,并且被试2存在与被试1同样的network X。

以上结果证明了Network X中NML1、NML2、NML3的一致性,那么NML1、NML2、NML3之间有何不同?是否存在像脸网络那样的视点不变性?为了回答该问题,研究者在单个神经元和群体神经元上分析了不同物体不同视角的表征相似性,结果表明位于前端的NML3区域的神经编码是与视点无关的,即具有视点不变性。

接下来研究者继续探究Network X编码了何种视觉特性,对哪种视觉特性是最喜欢的。研究者利用简单猜测加验证的方法,计算了每个物体的长宽比,分析NML1、NML2、NML3的神经响应与物体长宽比之间的关系,发现二者存在显著正相关,证明这些区域的细胞确实偏好高长宽比的物体,Network X的神经元是被物体的长宽比调谐的。

除了猜测和验证的方法,是否有一种更加系统的方法来理解Network X的编码特性呢?研究者借助AlexNet这一深度神经网络建立了坐标系,包含第一维度(物体的长宽比)和第二维度(有无生命),从而能够用有限的维度描述任意物体,并且已经发现的Network X的偏好与AlexNet第一维度的偏好非常相似。

1dffbcfb6fa915a48abdcc93ce3eb88b.jpeg图1 微电刺激揭示下颞叶皮层中新的网络

f87e56d059a948d4f711757bccf14a60.jpeg

图2 下颞叶皮层中四个不同网络对不同物体的偏好

17d244f611777ea9de59297ee605fde4.jpeg图3 不同层级网络的神经元响应的视点不变性逐级递增

3.提出功能组织原则模型,

下颞叶皮层中的物体空间地图

如果下颞叶存在一个二维空间的拓扑结构(物体长宽比、有无生命),就很容易理解为什么Network X与AlexNet第一维度的偏好有很高的相似性。为了验证测试该模型是否正确,研究者将刺激集中Network X、脸网络、身体网络最偏好的图像投影到该二维空间中,发现以上图像分布在四个象限中的三个象限。由此提出预测:第四象限中应该偏好表征方形的、无生命的物体,该假设在脑功能成像实验中得到验证。由此归纳出下颞叶的功能组织结构:至少包含三种对物体空间的表征,这种表征由后到前越来越具有视点不变性,由四个网络来表征物体空间的四个象限,顺序为身体—脸—方形物体—Network X。四个网络中神经元编码的信息已经包含了足够的信息,具有充分的编码能力,可以借助GAN这一深度神经网络重构出物体。

a4d8bbcdfa1d5b36c2a95ed3f8ba7a68.jpeg

图4 功能磁共振影像揭示物体空间地图

26dce56741793376b6089dc20acf30e1.jpeg图5 利用GAN重构物体图像

4.统一的模型

该模型是个统一的模型,具有一般性,可以在已有实验中进行验证,并能为新的实验提供预测。

之所以说该模型是一个统一的模型,是因为该模型能够解释其他研究中观察到的关于下颞叶功能组织的结论,如组织结构决定于物体有无生命以及物体的实际大小,如组织结构决定于更像物体或者更像场景;另一方面,该模型提出下颞叶区域是根据物体形状而不是根据语义类别来组织的,并在脑功能成像和电生理实验上得到验证。

Reference:

Bao, P., She, L., McGill, M., & Tsao, D. Y. (2020). A map of object space in primate inferotemporal cortex. Nature, 1-6.

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

5827ff627ebbdfe3c217ae53c4c19327.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481318.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

小夕说,不了解动态空间增长的程序喵都是假喵(下)

小夕在本系列前两篇文章中为大家介绍了各类数据结构的扩容策略,且在上篇文末,小夕提到了加倍式扩容中,倍率采用2并不是最优的,为什么呢?有没有最优倍率呢?内存复用如果倍率采用2甚至更大的数,那…

ChatGPT 与AI大模型发展简要综述

来源:数据观综合编辑:蒲蒲"日前,美国硅谷的初创公司OpenAI推出了一款新的人工智能对话模型ChatGPT,模型中首次采用RLHF(从人类反馈中强化学习)方式。目前,模型处于测试阶段,用户…

Nature Reviews Physics:人工智能怎样促进科学理解

导语一个能正确预测每个粒子物理实验结果、每个可能的化学反应产物或每个蛋白质的功能的先知将彻底改变科学和技术。然而,科学家们不会完全满意,因为他们想了解先知是如何做出这些预测的。这就是科学理解(scientific understanding&#xff0…

史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(一)

喵喵喵~大家元宵节快乐噢。有没有要陪小夕出去看烟花的吖...小夕借此给热爱学习的喵喵们献上这篇拙文,希望不要嫌弃哦~还有,小夕画的封面图是不是很棒呀( ̄∇ ̄)小夕发现现在想进军人工智能领域的程序yuan甚至少年少女喵好多呀&…

OpenAI ChatGPT走红,DeepMind不甘示弱,推出剧本写作AI,一句话生成一个剧本

来源:机器学习研究组订阅Dramatron似乎在一定程度上克服了AI大模型写长剧本前后不连贯的问题。你是否有过这种体验:某一天逛街的时候,脑子里突然冒出来一个好玩的故事,但你一时想不到更多的细节,也没有一块完整的时间去…

[完结]以C++与Java为例,详解数据结构的动态增长策略

前言 本文改编自小夕的订阅号文章《【萌味】小夕说,不了解动态空间增长的程序喵都是假喵(上)》、《【萌味】小夕说,不了解动态空间增长的程序喵都是假喵(中)》、《【萌味】小夕说,不了解动态空间增长的程序喵都是假喵(…

量子计算机创造了虫洞吗?不完全是,但揭示了量子模拟的未来

来源:光子盒研究院最近,科学家们因据称产生了一个虫洞而成为头条新闻。发表在《自然》杂志上的这项研究使用量子计算机在简化的物理模型中模拟虫洞。消息传出后不久,物理学家和量子计算专家对虫洞是否真的存在表示怀疑。这是怎么回事&#xf…

复旦大学邱锡鹏教授:语言模型即服务,走向大模型的未来

来源:智源社区作者:智源社区整理:周致毅人类一直期待AI能在处理自然语言方面大放异彩,语言大模型在近些年已逐渐成为NLP领域的标配。随着模型的扩张,当前大模型的调用已变成上游厂商开放API供下游使用的模式。这一模式…

史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(二)

谢谢你们。小夕昨晚又熬夜被发现了,谢谢对小夕的关心...有你们陪着,小夕很幸运。路人乙:“小夕,别人都说上完coursera上的那门机器学习课就已经入门机器学习了,可你又不这样认为。那你认为上完那门课,或者说…

计算机史上首篇教你从算法问题提炼算法思想的文章

路人丙:“小夕,你说学算法有什么用呢?”小夕:“好玩呀。”路人丙:“算法问题那么多,现查现用不就好了?”小夕:“好咯,既然你诚心诚意的问了~小夕就大发慈悲的震惊你(&…

美国能源部正式宣布核聚变里程碑式突破,专家点评商业化还需数10年

来源:澎拜责任编辑:郑洁图片编辑:张同泽校对:施鋆耗资35亿美元的美国国家点火装置用了10多年时间不断冲击点火目标,过程一波三折。成功点火后有两条路可走。一是冲刺更高的能量增益,未来或将再建更大能量的…

Science:找到杀死癌细胞的“单词”

来源:生物通利用新的机器学习技术,加州大学旧金山分校(UCSF)的研究人员与IBM研究院的一个团队合作,开发了一个包含数千个细胞“命令句”的虚拟分子库,基于引导工程免疫细胞寻找并不知疲倦地杀死癌细胞的“单词”组合。预测模型允许…

拼写校正与动态规划的小故事

喵喵喵,细心的你有没有发现小夕已经将卧室和书房精装修了呢~可以输入口令【ho】,或者点击主页的“旧的故事”标签进入哦。一个小现象小夕今天给大家讲一个自然语言处理/信息检索领域的小现象~细心的同学可能发现啦,每当你在使用某度进行搜索时…

《物理世界》公布2022年度十大突破

来源:科技日报近日,英国《物理世界》杂志公布了2022年度十大突破,涵盖从量子、医学物理学、天文学到凝聚态物质等各个方面。这十项突破是由《物理世界》编辑小组从今年在该杂志网站上发布的涵盖物理学所有领域的数百项研究中精选出来的。开创…

飞行器真的是计算机!

小夕在一边默默的玩弄心爱的小四轴(飞行器)。路人丁:“小夕,你不是学计算机的吗?怎么玩起飞机来了?”小夕:“对呀,小四轴也是计算机呀”。路人丁:诶?会不会有…

谷歌员工担心自家 AI 敌不过 ChatGPT,高管回应:其过快发展可能损害公司

来源:AI前线整理:冬梅、核子可乐谷歌的 Jeff Dean 表示,一旦提供错误信息、大企业所面临的“声誉风险”要比小公司更严重,所以谷歌自然“比小型初创公司更加保守”。自 11 月底以来,AI 聊天机器人 ChatGPT 正式向公众发…

深入浅出不可思议的中文分词技术

亲爱的喵喵们,明天小夕就正式开学啦。开学后每周有几天的课比较多,小夕为了保证每篇文章的质量,可能做不到每天一更啦。但是小夕也会尽量挤出时间来写文章,尽量保证两三天更一篇。希望不要责怪小夕哦...分词,也叫切词&…

史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(三)

能够坚持走到阶段三的喵一定是很有毅力的喵!也是很合格的机器学习/人工智能研究者啦~但是走到这里,也意味着您不满足于使用看似孤立的机器学习模型来生硬的完成一些任务,那么,大一统的理论体系就在这一阶段建立吧~前言完成这一阶段…

专访中国工程院院士杜祥琬,可控核聚变美国成了吗?

凤凰网科技 出品作者|蒋浇微信编辑|李金洋12月13日,美国能源部宣布,在加利福尼亚州的劳伦斯利弗莫尔国家实验室(LLNL),研究人员首次在核聚变反应中产生“净能量增益”,即聚变反应产生…

一个问题就可以辨别真假NLP(自然语言处理)研究者

╮(╯▽╰)╭哎,自从人工智能火了以后,最近自称NLP研究者的人越来越多了,然而这其中的大忽悠有多少小夕就不想多说了。如果连自己在哪个领域、哪个学科搞研究都不懂的话,你相信他真的是这个领域的研究者喵?反正小夕不信…