为什么AI感知与人类感知无法直接比较?

来源丨TechTalks

作者丨Ben Dickson

编译丨科技行者

人类级别的表现、人类级别的精度……在开发AI系统的企业中,我们经常会听到这类表述,其指向范围则涵盖人脸识别、物体检测,乃至问题解答等各个方面。随着机器学习与深度学习的不断进步,近年来越来越多卓越的产品也开始将AI算法作为自身的实现基础。

但是,这种比较往往只考虑到在有限数据集上对深度学习算法进行的测试结果。一旦贸然将关键性任务交付给AI模型,这种草率的考核标准往往会导致AI系统的错误期望,甚至可能产生危险的后果。

最近一项来自德国各组织及高校的研究,强调了对深度技术在视觉数据处理领域进行性能评估时所面临的实际挑战。研究人员们在这篇题为《人与机器的感知比较:众所周知的难题》的论文中,着重指出了当前深度神经网络与人类视觉系统的识别能力比较方法存在的几个重要问题。

在这项研究中,科学家们进行了一系列实验,包括深入挖掘深度学习结果的深层内容,并将其与人类视觉系统的功能做出比较。他们的发现提醒我们,即使AI看似拥有与人类相近甚至已经超越人类的视觉识别能力,我们仍然需要以谨慎的态度看待这方面结果。

人类与计算机视觉的复杂性

对于人类感知能力的基本原理,特别是重现这种感知效果的无休止探索当中,以深度学习为基础的计算机视觉技术带来了最令人称道的表现。卷积神经网络(CNN)是计算机视觉深度学习算法中所常用的架构,能够完成种种传统软件根本无法实现的高难度任务。

然而,将神经网络与人类感知进行比较,仍是一项巨大的挑战。一方面是因为我们对人类的视觉系统乃至整个人类大脑还不够了解,另一方面则是因为深度学习系统本身的复杂运作机制同样令人难以捉摸。事实上,深度神经网络的复杂度之高,往往令创造者也对其感到困惑。

近年来,大量研究试图评估神经网络的内部工作原理,及其在处理现实情况中表现出的健壮性。德国研究人员们在论文中写道,“尽管进行了大量研究,但对人类感知与机器感知能力进行比较,仍然极度困难。”

在此次研究中,科学家们主要关注三个核心领域,借此评估人类与深度神经网络究竟如何处理视觉数据。

神经网络如何感知轮廓?

第一项测试为轮廓检测。在此项实验中,人类与AI参与者需要说出所面对的图像中是否包含闭合轮廓。其目标在于了解深度学习算法是否掌握了闭合与开放形状的概念,以及其能够在各类条件下都顺利检测出符合概念定义的目标。

▲你能判断出,以上哪幅图像中包含闭合图形吗?

研究人员们写道,“对于人类来说,图中所示为一个闭合轮廓,其周边则分布着大量开放轮廓。相比之下,DNN则可能很难检测到闭合轮廓,因为神经网络可能会把闭合轮廓与其他图形视为统一的整体。”

在实验当中,科学家们使用了ResNet-50,即由微软公司AI研究人员们开发的一套流行卷积神经网络。他们使用迁移学习技术,使用14000个闭合与开放轮廓图像对该AI模型进行了微调。

接下来,他们又通过其他类似的训练数据(使用不同指向的图形)进行AI测试。初步发现表明,经过训练的神经网络似乎掌握了闭合轮廓的基本概念。即使训练数据集中仅包含直线图形,模型也能够在处理曲线图形时带来良好表现。

科学家们写道,“这些结果表明,我们的模型确实掌握了开放轮廓与闭合轮廓的概念,而且其判断过程与人类非常相似。”

▲即使训练数据集中仅包含直线图形,模型也能够在处理曲线图形时带来良好表现。

但进一步调查显示,某些不会影响到人类判断的因素却有可能降低AI模型的判断准确率。例如,调整线条的颜色与宽度会导致深度学习模型的准确率骤然下降。而当形状的尺寸超过特定大小时,模型似乎也难以正确对形状作出判断。

▲当图形中包含不同的颜色与粗细线条,且总体尺寸远大于训练集图像时,ResNet-50神经网络将很难做出准确判断。

此外,神经网络对于对抗性干扰也显得非常敏感。所谓对抗性干扰,属于一类精心设计的变化。人眼虽然无法察觉这些变化,但却会给机器学习系统的行为带来巨大影响。

▲右侧图像已经进行过对抗性干扰处理。在人眼看来,两张图像没有任何区别;但对于神经网络,二者却已经截然不同。

为了进一步研究AI的决策过程,科学家们使用了特征袋(Bag-of-Feature)网络,这项技术旨在对深度学习模型决策中所使用的数据位进行定位。分析结果证明,“神经网络在进行分类标记时,确实会使用某些局部特征,例如具有端点与短边,作为强依据。”

机器学习能够对图像做出推理吗?

第二项实验旨在测试深度学习算法在抽象视觉推理中的表现。用于实验的数据基于合成视觉推理测试(SVRT),AI需要在其中回答一系列关于图像中不同形状间关系的问题。测试问题分为找不同(例如,图像中的两个形状是否相同?)以及空间判断(例如,较小的形状是否位于较大形状的中心?)等。人类观察者能够轻松解决这些问题。

▲SVRT挑战,要求AI模型解决找不同与空间判断类型的任务。

在实验当中,研究人员们使用RESNet-50测试了其在不同大小的训练数据集中的表现。结果表明,通过28000个样本进行微调训练之后的模型,在找不同与空间判断任务上均表现良好。(之前的实验,使用的是一套小型神经网络并配合100万张样本图像)随着研究人员减少训练示例的数量,AI的性能也开始下滑,而且在找不同任务中的下滑速度更快。

研究人员们写道,“相较于空间判断类任务,找不同任务对于训练样本的需求量更大。当然,这并不能作为前馈神经网络与人类视觉系统之间存在系统性差异的证据。”

研究人员们指出,人类视觉系统天然就在接受大量抽象视觉推理任务的训练。因此,直接比较对于只能在低数据样本量下进行学习的深度学习模型并不公平。所以,不能贸然给出人类与AI内部信息处理方式之间存在差异的结论。

研究人员们写道,“如果真的从零开始进行训练,人类视觉系统在这两项识别任务中,没准会与表现出ResNet-50类似的情况。”

衡量深度学习的间隙判别

间隙送别可以算是视觉系统当中最有趣的测试之一。以下图为例,大家能不能猜出完整的图像呈现的是什么?

毫无疑问,这是一只猫。从左上方的局部图来看,大家应该能够轻松预测出图像的内容。换言之,我们人类需要看到一定数量的整体形状与图案,才能识别出图像中的物体。而局部放大得越夸张,失去的特征也就越多,导致我们越难以区分图像中的内容。

▲根据图中所包含的特征,小猫图像中不同部分的局部放大图,会对人类的感知产生不同的影响。

深度学习系统的判断也以特征为基础,但具体方式却更加巧妙。神经网络有时候能够发现肉眼无法察觉的微小特征,而且即使把局部放得很大,这些特征仍然能够得到正确检测。

在最终实验当中,研究人员们试图通过逐渐放大图像,直到AI模型的精度开始显著下降,借此衡量深度神经网络的间隙判别。

这项实验表明,人类的图像间隙判别与深度神经网络之间存在很大差异。但研究人员们在其论文中指出,以往关于神经网络间隙判别的大多数测试,主要基于人类选择的局部图。这些局部的选择,往往有利于人类视觉系统。

在使用“机器选择”的局部图对深度学习模型进行测试时,研究人员们发现人类与AI的间隙判别表现基本一致。

▲间隙判别测试能够评估局部图对于AI判断准确率的具体影响。

研究人员们写道,“这些结果显示,只有在完全相同的基础之上进行人机比较测试,才能避免人为设计给结果造成的偏差。人与机器之间的所有条件、命令与程序都应尽可能接近,借此保证观察到的所有差异都源自决策策略——而非测试程序中的差异。”

缩小AI与人类智能之间的鸿沟

随着AI系统复杂程度的不断提升,我们也需要开发出越来越复杂的方法以进行AI测试。这一领域之前的研究表明,大部分用于衡量计算机视觉系统准确率的流行基准测试中存在一定误导性。德国研究人员们的工作,旨在更好地衡量人工智能表现,并准确量化AI与人类智能之间的真实差异。他们得出的结论,也将为未来的AI研究提供方向。

研究人员们总结道,“人与机器之间的比较性研究,往往受到人类自发解释思维这一强烈偏见的影响。只有选择适当的分析工具并进行广泛的交叉核查(例如网络架构的变化、实验程序的统一、概括性测试、对抗性示例以及受约束的网络测试等),我们才能对结果做出合理解释,并正视这种自发性偏见的存在。总而言之,在对人类与机器的感知能力进行比较时,必须注意不要向其中人为强加任何系统性的偏见。”

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/487081.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微软白皮书:47页报告详解中国芯片设计云技术

来源:智东西在多方面因素的推动下,中国的芯片设计行业迎来了前所未有的发展契机。当前,我国芯片设计业的产品范围已经涵盖了几乎所有门类,且部分产品已拥有了一定的市场规模,但我国芯片产品总体上仍然处于中低端&#…

一文读懂马斯克展示脑机接口:硬币大小芯片植入猪脑 实时读取猪脑信息

视频:马斯克展示脑机接口设备无线实时读取猪脑信息,时长约7分10秒来源:腾讯科技马斯克展示了一群实验猪。这些实验猪之前曾接受过外科手术,由手术机器人将最新版的Neuralink设备植入大脑。这些项目的目标都是利用大脑植入技术实现…

循环,函数,指针作业

一、循环 题目1:7-6 统计素数并求和 提交列表: 流程图: 问题: 解决:mn最多一个素数,都为0无答案;m和n本身也可能是素数。 题目2:7-12 约分最简分式 提交列表: 流程图&…

华为徐文伟:后香农时代,面向数学的十大挑战问题

本文为2020年8月28日徐文伟在长沙由中国工业与应用数学学会举办的“数学促进企业创新发展论坛”上的发言来源:中国科学院院刊徐文伟华为技术有限公司董事,华为战略研究院院长后香农时代数学决定未来发展的边界数学作为基础的基础,将决定未来发…

06006_redis数据存储类型——String

1、概述 (1)字符串类型是Redis中最为基础的数据存储类型,它在Redis中是二进制安全的,这意味着该类型可以接受任何格式的数据,如JPEG图像数据或Json对象描述信息等; (2)在Redis中字符…

comparator 多个条件控制_JUnit5学习之四:按条件执行

欢迎访问我的GitHubhttps://github.com/zq2599/blog_demos内容:所有原创文章分类和汇总,及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;本篇概览本文是《JUnit5学习》系列的第四篇,有时咱们希望测试方法仅在一定…

“星链”或成美军未来作战理念新载体

本文来源:中国军网在美国航天政策愈发重视商业航天发展,尤其是美太空军发展对巨型弹性低轨星座提出重大需求的背景下,美国太空探索公司SpaceX乘势将业务从商业航天发射、载人航天货物和乘员运输逐渐扩展至低轨宽带通信服务,即“星…

基基于多态的职工管理系统

效果 添加 显示 删除 查找 排序&#xff08;不演示了&#xff09; 清空所有 头文件 员工类 #pragma once #include <iostream> #include <string> using namespace std;//职工抽象基类 class Worker { public://显示个人信息virtual void showInfo() 0;//获取…

typescript箭头函数参数_Typescript 入门基础篇(一)

Typescript 基础Typescript是Javascript的一个超集。以下typescript简称为ts, 此文章主要是对ts官网文档的一个简化&#xff0c;缩短学习基础时间。类型基础ts 的类型主要有布尔值、数字、字符串、数组、元组、枚举、Any、Void、Null和Undefined、Never。# Boolean let boo : b…

sublime学习笔记

学习课程地址&#xff1a;快乐的sublime编辑器_sublime编辑器使用 另可参考笔记地址&#xff1a; http://c.haoduoshipin.com/happysublime/ http://blog.csdn.net/u014465934/article/details/72810763 PS&#xff1a;博主的一些文章地址&#xff1a;http://happypeter.github…

里程碑式的数学证明,攻破著名Erdős猜想中关键障碍

大数据文摘出品来源&#xff1a;wired编译&#xff1a;Canary、Andy最近&#xff0c;两名数学家解决了一个关于整数相加性质最著名猜想中的第一部分。该猜想由匈牙利传奇数学家Paul Erdős于60多年前提出&#xff0c;一个无限整数序列在何时一定会包含至少有三个等差数的模式&a…

浅复制和深复制

浅复制是由默认构造函数实现的&#xff0c;将对应数据成员一一复制。 浅复制 template<class T> Array<T>::Array(const Array<T>&a) {sizea.size;a.list list; }如果主函数中有这样的语句&#xff1a; int main() {Array<int> a(10);Array<…

admin select 2 异步_解决Angularjs异步操作后台请求用$q.all排列先后顺序问题

最近我在做angularjs程序时遇到了一个问题1.页面有很多选择框&#xff0c;一个选择框里面有众多的选择项&#xff0c;和一个默认选定的项,像下面这样(很多选择框&#xff0c;不只一个)&#xff1a;2.众多的选项要从后台接口得到&#xff0c;默认项从另一个后台接口得到&#xf…

产业|世界十大工业自动化公司,你知道几家?

来源&#xff1a;机械前线国内工业自动化行业的竞争激烈&#xff0c;国外工业自动化设备、产品制造商依然控制国内上游产品供应的主要市场&#xff0c;下面来看看国外最赚钱的工业自动化公司有哪些。▶1、德国西门子西门子股份公司(SIEMENSAGFWB:SIE&#xff0c;NYSE:SI)是全球…

12月25晚-12月29日做的两个网页

1 <!doctype html>2 <html>3 <head>4 <meta charset"utf-8">5 <title>仿山东理工大学</title>6 <link rel"stylesheet" href"css/wangye.css">7 <link href"img/favicon.ico" r…

2运行内存多大_智能设备中的内存与容量为何傻傻分不清?它们的区别是什么?...

在日常生活中&#xff0c;很多时候会把某些电子产品的容量说成内存&#xff0c;或者把内存说成了容量。比如有人问&#xff1a;“这个手机的内存多大&#xff1f;”或许会有这样回答的&#xff1a;“内存是256G。”这种问答方式虽然看似很普通&#xff0c;如果让业内人士以及了…

Nature突破:首个比头发丝还细的机器人诞生了!可用针头注射入人体

来源&#xff1a;科研大匠1959年&#xff0c;诺贝尔奖得主、理论物理学家Richard Feynman 首次提出微型医用机器人的概念。此后&#xff0c;将电子器件微型化以生产细胞大小的机器人一直是科学家们追求的目标&#xff0c;但由于缺乏合适的微米级致动器系统&#xff0c;该技术一…

腾讯云云机安装dockers

云机的配置 首先更新一下源&#xff08;更新前一直装不了&#xff09;下载dockers-ce&#xff08;社区版&#xff09;启动dockers服务使用hello-world进行测试&#xff08;由于本地没有hello-world这个镜像&#xff0c;所以dockers会下载下来并且在容器里运行&#xff09;转载于…

移动短信回执怎么开通_才知道移动积分需要主动开通功能,才会消费产生积分,垃圾!!!...

几天前朋友突然跟我说用移动积分兑换了流量&#xff0c;于是我很好奇就打开移动APP想查询下自己有多少积分&#xff0c;毕竟几年了从来没想到过积分兑换。有趣的事情发生了&#xff0c;我发现自己的积分显示是0&#xff0c;这怎么可能呢。用了好几年的号码怎么可能没有积分。当…

AIoT成功的关键要素

来源&#xff1a;中国工业和信息化本文发表于《中国工业和信息化》杂志2020年8月刊总第26期随着科技的不断发展&#xff0c;一些在功能上具有相互补充作用的技术正在不可避免地发生结合——例如&#xff0c;人工智能&#xff08;AI&#xff09;和物联网&#xff08;IoT&#xf…