从神经科学到计算机视觉:人类与计算机视觉五十年回顾

来源:全球人工智能

概要:在过去某段时间里,研究者们可能从来没有想过创建类似人类大脑处理任务一样的系统。


如何像人类大脑一样完成一项视觉任务是复杂的,比如深度感知、目标跟踪、边缘检测等,而扫描环境和定位是大脑经常做的事情,这些都被人们认为是理所当然的事情。在过去某段时间里,研究者们可能从来没有想过创建类似人类大脑处理任务一样的系统。然而,在过去的50年中,我们已经从神经科学中看似一些小的突破转向能够描述图片中场景的“电脑”。


在神经科学课程教学过程中,有很多趣闻发生以帮助同学们更好地理解大脑是如何工作的。比如Phineas Gauge是一名美国的铁路工人,在某次施工时遭遇爆炸事故,被一根铁棍击穿头颅,幸运的是他活了下来,但是他的左额叶皮质受到损伤,导致语言障碍,同时也影响其生理性格;还有Britten的论文描述大脑何时再混乱的移动点钟发现信号。所有这些零碎的研究开始加深我们对大脑如何工作的理解。



还有类似的一个例子,为人类视觉和计算机视觉的大量研究奠定了基础,那就是著名的Hubel和Wiesel的研究。由于二人在心理学上的突出贡献,获得了1981年的诺贝尔和平奖,此外他们在视觉系统的信息处理方面也获得了突破性的发现。他们打响了研究神经元的第一枪,他们通过连接一个电极到一个神经元上,就能够听到神经元对一条光的刺激作出的反应。他们对V1大脑皮层神经元的工作原理有了新的了解,这是令人兴奋的新认识,该研究有助于阐明V1神经元的映射和相关功能。


在下面的视频中,演示了 V1神经元是如何对待位置和角度的光条做出反应的,当光条移动时,就会有裂纹,这表明你听到猫的神经元对刺激做出的反应。


通过这个实验,他们演示了几种类型的神经元只有在某些刺激下是如何被激活的,另一个有趣的特征是细胞似乎自然地映射到不同角度,如下图所示,V1的每一部分都包含一组非常特殊的神经元,这些神经元通常对特定角度的光条作出反应。



这些细胞的反应以某种方式结合起来,理论上能够创建一个自下向上的自然世界形象,也就是说,通过接收许多神经元对各种光条的反应,人类大脑开始绘制出周围的图景。


一晃近30年过去了,江山代有才人出,时代属于Olshausen和David JField二位研究者。两位研究人员都专注于计算神经科学领域,这个领域主要是研究大脑如何编码和解码信息,并推动了这个领域相关工作的进一步发展。事实上,他们在自己的工作中引用了Hubel和Wiesel的研究成果。此外,他们不只是注重单一的光条,还拍摄了照片,开始研究如何通过算法识别和编码图像内部的特征。


他们在1996年(20多年前)写的一篇叫做自然图像统计和高效编码,本文的目的是讨论在图像识别应用中失败的Hebbian学习模型。具体来说,Hebbian学习算法利用了主成分分析算法学习,但存在的问题是,该模型不能同时学习定位、定向以及带通结构来绘制自然图像。从理论上讲,该模型部分源自于Hubel和Wiesel在关的研究成果,除此之外,对192个神经元的输出进行了建模。


他们的研究表明,在对自然图像客观存在的规律进行编码时,模型的建立更多地侧重于稀疏性会使得模型更有效。


使用一个稀疏模型,该模型限制每个基函数列表所需的系数数目,来表示一个图像中的各种特征,由下式证明:


其主体部分是为了找到实际图像和函数表示图像之间的最低平均误差。


然后与代价函数一起迫使算法限制表示图像表示所需的系数数量。


使用梯度下降算法最大限度地减少表示图像所需的系数数量,但是该篇论文自身还没有显示出能够将特征转化为图像的神经网络。


在1991年,互联网刚刚普及。现在科学已经从检测猫的神经元对光条刺激的反应转到神经网络的数学模型,该模型能够输出图像的实际特征。在1996年的那篇论文中,最后一行是“未来一项重要而令人兴奋的挑战将是如何将这些原理推理到更高级的皮层视觉领域以提供预测”。这是一个挑战,通过利用低级的特,然后创建一个自下而上的网络模型来真正地预测一副图像。



Olshausen等人的模型类似于上图,如果你对深度学习了解的话,那么对这个输出低级特征的矩阵看起来是不是非常熟悉。


在过去的几年中,很多论文都使用了与上图非常相似的矩阵,这些矩阵被用作卷积神经网络的卷积层。可以发现,这应该是模拟单个神经元对视觉刺激的反应方式。

此时此刻,利用这些低层次的特征来预测图像的实际背景不再是Olshausen等人论文中的最后一行中的理论猜想,这在今天变成了现实。


这同时也说明了神经元能够识别光条的原因,神经网络可以利用低层次的特征预测图像所包含的信息。2015年斯坦福大学的Andrej Karpathy和李飞飞发表了一篇关于这一问题的重要论文——Deep Visual-Semantic Alignments for Generating Image Descriptions。在这篇论文中,演示了通过一个递归神经网络能够详细描述图像,如下图所示,不仅仅只是指出了图片中有一只猫或一只狗,而且能够详细描述图像内容,比如“男孩在尾板上做后空翻”等。虽然现在它并不完美,但它相较于1968年而言,仍是一个跨越式的发展!




从1968年到现在,这是一个漫长的发展过程。本文引用的论文从1968年开始到2015结束都快有50年的时间。然而,从大局来看,神经网络的发展只会越来越快,它不仅仅只是用来识别图像,还被用于医学图像的癌症检测、预测人类的情感表达、自动驾驶等等各个领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498236.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机维修队,浙江万里学院计算机维修队

浙江万里学院计算机维修队语音编辑锁定讨论上传视频浙江万里学院计算机维修队是在校团委、计算机与信息学院的直接关怀与支持下,于2001年成立的一个公益性学生社团。她集维修、咨询、开展活动于一体,拥有较强的技术实力。计算机维修队根本任务是在浙江万…

深度解读:美国自动驾驶技术及测试示范区现状

来源: 公安部交通管理科研所微发布 作者:袁建华、王敏、陆文杰、罗为明、郑羽强 ,道路交通集成优化与安全分析技术国家工程实验室自动驾驶测试技术研发部 当前,美、欧、日等发达国家及地区对智能网联技术的支持不仅是在政策研究、…

计算机一级考试题组成,计算机一级考试试题汇总

计算机一级考试试题汇总2017年9月计算机一级考试将于9月23日-26日进行,为帮助考生们复习备考,以下是百分网小编搜索整理的一份计算机一级考试试题汇总。A 第一部分:单选题(每小题1分共30分)注意:打开你考试文件夹中的EXCEL工作簿文…

AI吉尼斯:那些你不知道的人工智能之“最”

来源:百度AI 概要:今天我们在这里隆重召开第一届(可能也是最后一届)AI吉尼斯,为各路AI好汉颁发“世界之最”大奖杯。 《吉尼斯世界纪录大全》里的这些人类都这么拼了,服(i)务&#…

深度 | 谷歌的新CNN特征可视化方法,构造出一个华丽繁复的新世界

作者:晓凡 概要:近日,来自谷歌大脑和谷歌研究院的一篇技术文章又从一个新的角度拓展了人类对神经网络的理解,得到的可视化结果也非常亮眼、非常魔性。 深度神经网络解释性不好的问题一直是所有研究人员和商业应用方案上方悬着的一…

年增长率超50%,AI芯片竞争白热化

来源:华尔街日报 概要:随着智能手机和个人电脑销售数量减少,芯片厂商正在竞相开发人工智能产品,以推动业绩增长。 随着智能手机和个人电脑销售数量减少,芯片厂商正在竞相开发人工智能产品,以推动业绩增长。…

win7需要计算机管理员权限,Win7系统提示“需要管理员权限”如何解决?

最近有Win7系统用户反映,很经常在安装软件或者对文件进行操作的时候,系统提示“需要管理员权限”,这让用户感觉很厌烦。其实对于这个问题,可能是系统设置问题,也可能是文件本身设置了安全访问限制,只要进行…

IBM超越谷歌抵达量子计算里程碑:研制出50量子位计算机

来源:澎湃新闻 概要:当地时间11月10日,在美国电气和电子工程师协会(IEEE)的工业峰会上,IBM对外宣布,公司已经成功研发20位量子比特的量子计算机,可在年底向付费客户开放。更值得一提…

AI、区块链和机器人:技术会让未来的工作发生什变化?

来源:36氪 概要:随着人工智能、区块链和机器人等颠覆性新技术的不断发展,人们对其也流露出了一些担忧的情绪,担心未来的就业机会越来越少,担心自己的岗位会被“机器”取代。 随着人工智能、区块链和机器人等颠覆性新技…

亚马逊 Alexa 的理想未来,会是智能手机时代的终结吗?

来源:36氪 概要:亚马逊的做法是否与十年前的苹果有点像呢? 随着亚马逊 Echo Show 和 Echo Spot 的推出,我们可以发现亚马逊助理设备的交互途径已经开始从智能扬声器迁移到触摸屏,亚马逊的这一举措背后意义何在呢&…

中山大学计算机是A类学科吗,中山大学a类学科有哪些?附中大a类学科名单

选择科目测一测我能上哪些大学选择科目领取你的专属报告>选择省份关闭请选择科目确定v>中山大学是广东省一所知名高校,位于广东省广州市,是我国著名的“211大学”、“985工程”之一,现已入选“双一流”建设高校。本期,小编将…

究竟深度学习在干什么?

来源:人机与认知实验室 概要: 深度学习取得了巨大的成功,这是无容置疑的。对此,我们不必再多说什么。但是,其理论基础仍然有很大的空白。 深度学习取得了巨大的成功,这是无容置疑的。对此,我们不…

128位计算机 ps2,64位就最强?为啥没有128位电脑?

虽然CPU只有64位,但是我们在选择显卡的时候可以看到显存有128位甚至256位的,那么这里的位数指的意思一样吗?既然64位的操作系统相比32位有更大的优势,那么为什么没有128位的操作系统和CPU呢?64位性能优势明显我们先简单…

微信AI体验中心发布上线了!

来源:全球人工智能 概要:微信的所有用户都可以直接通过微信小程序进行搜索“AI体验中心”进行使用! 最新消息,微信发布了“AI体验中心”小程序!微信的所有用户都可以直接通过微信小程序进行搜索“AI体验中心”进行使用…

新技术:如何用VR训练机器人?

来源:亿欧 概要:然而,如果请一个机器人来抓取同样的东西,你只会看到一个发呆的机器人或得到一团皱巴巴的东西抓在机器人手里。 帮我个忙,抓住你周围的一件东西。随便你怎么做,即使你以前从来没有做过这种事…

Google正式发布TensorFlow Lite预览版,针对移动/嵌入设备的轻量级解决方案

来源:AI科技评论 概要:日前,谷歌正式发布 TensorFlow Lite 开发者预览版,这是针对移动和嵌入式设备的轻量级解决方案。 日前,谷歌正式发布 TensorFlow Lite 开发者预览版,这是针对移动和嵌入式设备的轻量级…

百度最早量产?一图看全球公司无人驾驶汽车时间表

来源:全天候科技 概要:无论是Waymo、英伟达等科技公司,还是丰田、宝马等传统汽车厂商,都将2020年设为无人车产品落地的重要时间节点。 无论是Waymo、英伟达等科技公司,还是丰田、宝马等传统汽车厂商,都将2…

延边大学计算机金小峰,第九届中国信息安全博士论坛在我校开幕

8月6日第九届中国信息安全博士论坛(2016 China Information Security Doctor Conference,CISDC2016)在我校开幕,本届中国信息安全博士论坛是由延边大学和中国信息安全博士网联合主办,北京艾得威尔信息咨询中心承办,中国信息安全人…

电脑计算机d盘有用吗,d盘不见了,教您电脑d盘不见了怎么解决

安装完win7系统之后,一般用户会分硬盘有CDEF盘,可以方便我们存储文件软件等,而有win7系统用户要却发现没有D盘了,D盘不见了?这是怎么回事呢?该怎么去解决呢?下面,小编就给大家分享解…

深读|赛迪报告:国外低功耗广域网发展及启示

来源:通信产业报 概要:从人类进入信息时代以来,经济社会发展对信息互联互通的需求不断提升,通信的范围和边界已从人与人逐渐拓展到物与物以及人与物之间。 从人类进入信息时代以来,经济社会发展对信息互联互通的需求不…