神经网络无法区分异同,而且这个缺陷是本质性的

来源:混沌巡洋舰

1969年《芝麻街》的第一集中有一个片段叫做“这些东西中的一个与众不同”。观众们被要求考虑一张展示三个2和一个 w 的海报,然后一边跟着游戏的同名广告歌唱,一边决定哪个符号不属于这个标志。《芝麻街》中的很多集重复了这个游戏,比较的对象从抽象的图案到盘子里的蔬菜。孩子们从来不需要重新学习规则。理解“相同”和“不同”之间的区别就足够了。

机器则不然。人工智能系统中最强大的卷积神经网络,可以被训练以比人类更好地执行一系列复杂的任务,从医学图像中的癌症识别到围棋中的那一步更好选择。但是最近的研究表明 cnn只能在在非常有限的条件下, 可以分辨两个简单的视觉模式是否相同。稍微改变一下这些条件,网络的性能就会骤然下降。

这些结果在深度学习研究者和认知科学家中引起了争论。能否会产生像儿童那样理解同一性和差异性的 cnn?还是说,无论 cnn 的构建和训练有多么巧妙,它们的抽象推理能力从根本上是有限的?无论是哪种情况,大多数研究人员似乎都同意,无论是人工智能还是人类认知,理解相同或不同的关系都是智能的重要标志。

约翰·霍普金斯大学研究视觉认知的 Chaz Firestone 说: “不仅你和我在同一个不同的任务上取得了成功,许多非人类动物也取得了成功,包括小鸭子和蜜蜂。”。

在分辨异同任务中取得成功的能力可以被认为是人类做出各种推论的基础。DeepMind 的研究员Adam Santoro说,谷歌旗下的人工智能实验室正在“以整体的方式研究同异关系”,不仅研究视觉场景,还研究自然语言和物理互动。他解释说: “当我让人工智能‘拿起玩具车’时,这意味着我说的是我们玩过的那辆车,而不是隔壁房间里的另一辆玩具车。”。最近一项关于同异推理的研究调查也强调了这一点。“如果没有识别相同性的能力,”作者写道,“似乎就没有希望实现创造真正具有智能的推理机器这一梦想。”

https://www.sciencedirect.com/science/article/pii/S2352154620301352

至少从2013年开始,异同的关系就一直困扰着神经网络。当时,人工智能领域的先驱研究人员约Yoshua Bengio和他的Caglar Gulcehre表示,CNN 无法判断一组块状如俄罗斯方块式的图形是否相同。但是这个盲点并没有阻止 cnn 主宰人工智能,卷积网络帮助 AlphaGo 打败了世界上最好的围棋选手,近90% 的安卓深度学习应用程序都依赖于它。

这种能力的爆炸性增长重新点燃了一些研究人员探索这些神经网络不能做什么的兴趣。CNN 通过大致模仿哺乳动物大脑处理视觉输入的方式来学习。一层人工神经元检测原始数据中的简单特征,如明亮的线条或对比度的差异。网络将这些特性传递给隐藏层,这些层将它们组合成更复杂、更抽象的类别。布朗大学机器学习研究员Matthew Ricci表示,同异关系似乎很好地测试了 cnn 的极限,因为它们是“对于一幅与其特征无关的图像,你能提出的最简单的问题”也就是说,两个物体是否相同并不取决于它们是一对蓝色三角形还是相同的红色圆圈。特征之间的关系很重要,而不是特征本身。

在2018年,Ricci 和合作者 Junkyung Kim 和 Thomas Serre 测试了来自合成视觉推理测试(SVRT)的 cnn,这是一个简单模式的集合,旨在探测神经网络的抽象推理技能。这些图案由一对对不规则的形状组成,黑色的轮廓画在白色的正方形上。如果这两张照片在形状、大小和方向上完全相同,那么这张照片就被归类为“相同”; 否则,这两张照片就被归类为“不同”

研究人员发现,经过训练的 CNN 能够区分“相同”和“不同”,当从 SVRT 图像集中显示新的例子时,准确率高达75% 。但是,里奇说,通过两种表面的方式修改形状——让它们变大,或者让它们彼此之间相距更远——使 cnn 的精度将显著下降”。研究人员得出结论,神经网络仍然专注于特征,而不是学习“同一性”的关系概念。

去年,蒂宾根大学的 Christina Funke 和 Judy Borowski 表明,将神经网络中的层数从6层增加到50层,在同样的 SVRT 任务中,其准确率提高到90% 以上。然而,他们没有测试 CNN 在 SVRT 数据集之外的例子上的“深度”表现,正如 Ricci 的小组所做的那样。因此,这项研究并没有提供任何证据表明更深层的 cnn 可以概括相同和不同的概念。

       

       

Guillermo Puebla 和布里斯托尔大学的认知科学家 Jeffrey Bowers 在今年早些时候的后续研究中进行了调查。Puebla表示: “一旦你掌握了一种关系,你就可以把它应用到任何来到你身边的事情上。”。他坚持认为,cnn 应该遵循同样的标准。

Puebla和 Bowers 用不同的初始设置(包括 Funke 和 Borowski 使用的一些相同的设置)训练了4个 cnn,这些 cnn 在 SVRT 的相同-不同的任务上有不同的表现。他们发现,图案底层特征的细微变化——比如将形状轮廓的厚度从一个像素改为两个像素——往往足以将 CNN 的表现从近乎完美降至几乎不超过概率的一半。

https://www.biorxiv.org/content/10.1101/2021.04.06.438551v3

这对人工智能意味着回答取决于你的问题。Firestone 和 Puebla 认为最近的研究结果给经验证明提供了证据,即目前的 cnn 缺乏基本的推理能力,而这种能力无法用更多的数据或更聪明的训练来支撑。Puebla表示,尽管 cnn 的能力不断扩大,但它们“解决异同问题的可能性非常小”“如果你添加其它模块,它们可能是解决方案的一部分。但是仅仅依靠CNN是不行的。”

Funke同意,Puebla的研究结果表明,cnn 仍然没有概括同异的概念。“然而,”她说,“我建议在声称深度卷积神经网络通常不能学习这个概念时要非常小心。”

DeepMind 的研究人员 Santoro 也同意这一观点: “缺乏证据并不一定就是缺乏证据的证据,对神经网络历来就是如此。”他指出,神经网络已经在数学上被证明原则上能够逼近任何函数。Santoro 说: “研究人员的工作是确定在实践中学习所需功能的条件。

Ricci认为,让任何机器学习同与不同的区分,将需要在理解学习本身方面取得突破。孩子们只看了一集《芝麻街》,并没有经过大量的训练,就明白了“这些东西中的一个与众不同”。鸟类、蜜蜂和人类都可以通过这种方式学习——不仅仅是在学习区分“相同”和“不同”时,而是在完成各种认知任务时。“我认为,除非我们弄清楚如何从一些例子和新奇的物体中学习,否则AGI就难以实现,”

原文翻译自:

https://www.quantamagazine.org/same-or-different-ai-cant-tell-20210623/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484424.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

matlab计算级数和

级数(series)是指将数列的项依次用加号连接起来的函数。典型的级数有正项级数、交错级数、幂级数、傅里叶级数等。 —百度百科 matlab提供了直接计算级数的两个方法,symsum的两种形式(做题刚开始以为是重载,直接导致了上一篇帖子的产生 &…

北国风光

转载于:https://www.cnblogs.com/ssyfj/p/10214328.html

“期待已久的UFO报告”公布了

来源:环球网 作者:张晓雅多家美媒表示,调查没有得出确切结论。包括美国有线电视新闻网(CNN)、美联社、美国哥伦比亚广播公司(CBS)在内多家美媒最新消息,美国政府当地时间25日发布报告…

Bmp格式与编程读取解析

Bmp格式 DigitalImage图像类设计 图像加载函数,通过bmp图片路径,加载图像数据,通过类构造函数来实现。 DigitalImage::DigitalImage(LPCTSTR lpszPath) {StrCpy(m_FilePath, lpszPath);CFile RdBmp;if (!RdBmp.Open(m_FilePath, CFile::modeRead | CFil…

关于奈氏准则和香农公式

对于带宽固定的信道,提高信息传输速率有两种方式: 提高码元在信道中的传输速率;提高信噪比; 我们以高速公路的例子来理解: 码元相当于车辆,信道相当于公路,所有的汽车都在运输相同的货物&…

五角大楼公布UFO报告,不明飞行物到底是什么?(全文)

来源:大数据实验室五角大楼周五发布的一份有关不明飞行物的重要报告称,国防和情报分析人员缺乏足够的数据来确定军事飞行员观察到的神秘飞行物体的性质,包括它们是先进的地球技术、大气层还是外星天体。这份报告提交国会并向公众公布&#xf…

python 词云小demo

词云小demo jiebawordcloud一 什么是词云? 由词汇组成类似云的彩色图形。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼…

python--类与GUI编程框架

类属性 类的数据属性(静态成员):仅仅是定义的类变量在类创建后被使用可以由类的方法来更新,也可以在主程序中更新类属性和实例无关,修改类属性需要使用类名 class Dog(object):counter0def __init__(self,name):self.…

信道复用技术之码分复用

2020730第一次修改:提升了图片的清晰度 1. 首先来说说什么是信道复用 信道复用,顾名思义,就是把多个用户使用的信道合并在一条信道,即一条信道承载着多个用户传输数据的任务; ps:信道:数据信息传…

《新一代城市大脑建设与发展》专家研讨会在京举办

2021年6月26日,新一代城市大脑建设与发展专家研讨会在京举办,本次活动由城市大脑全球标准研究组主办,远望智库承办。20多位专家参与本次研讨会,对城市大脑、智慧城市的发展趋势,存在的问题,产生的新成果等方…

【基于Python+Flask项目部署系列--03】开发测试环境配置-基于Ubuntu16.04

一、开发测试环境介绍 前提已经部署完【基于PythonFlask项目部署系列--02】Ubuntu16.04服务器安装。建议部署2套环境:开发测试环境生产环境。 这篇文章主要讲解测试环境如何配置python flask项目与运行。 测试环境主要使用【虚拟环境】进行部署代码部署,…

机器学习

机器学习 sklearn基础功能: 主要使用python的sklearn库:sklearn库共分为6大部分,分别用于完成分类任务、回归任务、聚类任务、降维任务、模型选择以及数据的预处理。各模块功能介绍 分类任务分类模型加载模块最近邻算法neighbors.NearestNeighbors支持…

费米悖论的三十种解释

© David B. Mattingly来源:利维坦 文:Ella Alderson译:Rachel校对:Yord原文:/medium.com/predict/30-solutions-to-the-fermi-paradox-aaabfce56280利维坦按:我个人现阶段觉得,与其说接受宇…

无监督学习

目标 利用无标签的数据学习数据的分布或数据与数据之间的关系被称作无监督学习。 有监督学习与无监督学习的最大去区别在于数据是否有标签。 无监督学习最常见的应用场景是聚类和降维。 聚类 聚类,就是根据数据的“相似性”将数据分为多类的过程。相似性评估&am…

重磅!三星宣布3nm成功流片!

来源:世界先进制造技术论坛(AMT)编辑:小艾 6月29日,据外媒最新报道,三星宣布,3nm制程技术已经正式流片! 据悉,三星的3nm制程采用的是GAA架构,性能上完胜台积电的3nm FinFET架构!据报导&#xff…

前端实战:仿写小米官网第一天

前端实战的第一天 小米官网 目前效果: 实现功能: 导航栏,首页切换,无淡入淡出效果的轮播图,搜索功能,产品展示栏下滑 代码(便于记录,将js、css和html糅合在了一起)&…

ubuntuxu双系统安装+git/g++/vim+pytorch+opencv+yolo+sitl相关学习

multirotor The first day ——12.10 1.install vmware-workstation and ubuntu swap sources and 换输入法 2.learn git github关联远程仓库 3.install and use Typora Git codemeaningmkdir test创建目录cd test进入目录git init初始化仓库ls ;ls -ah查看目…

MySQL日志详细说明

这片博文我们会详细说明MySQL本身的日志,不包含重做日志和undo日志(这两个日志是innodb存储引擎的日志)。 MySQL本身的日志有以下几种(MySQL5.7版本): 错误日志慢查询日志通用日志二进制日志错误日志 默认情…