观点 | 别忽视深度学习的种种问题,Gary Marcus 泼冷水义不容辞

来源:AI科技评论


纽约大学心理学教授 Gary Marcus 曾是 Uber 人工智能实验室的负责人,他自己创立的人工智能创业公司 Geometric Intelligence 2016 年 12 月被 Uber 收购,自己也就加入 Uber 帮助他们建立人工智能实验室。Gary Marcus 也曾号召研究人员们「借用认知科学领域的知识」,更多地构建和人类类似的认识概念。


然而 Gary Marcus 却不是一个令人深受鼓舞的「正面人物」,实际上他曾反复对人工智能和深度学习泼冷水,警告大家我们现在取得的进展多么微不足道、人们又有多么过于乐观。


圣诞-元旦长假刚过,Gary Marcus 在 arXiv 上传了一篇论文,对现在火热的深度学习的现状进行了全面的、而且一点都不乐观的分析。他在论文中针对现在火热的深度学习指出了十个问题,现把这十个问题简单介绍如下:


一、渴求大量的数据


人类学可以根据明确的规律学习,比如学会一元二次方程的三种形式以后就可以用来解各种题目;也可以从不多的几个样本中迅速学到隐含的规律,见过了京巴、柴犬之后,再见到德牧就知道它也是一种狗。然而深度学习不是这样的,「越多的数据 = 越好的模型表现」就是深度学习的基本规律,它没有能力从字面上给出的规律学习。


对企业来说,IT 巨头在深度学习时代更容易凭更大的数据量建立起马太效应,第二梯队的竞争者们已经开始感到担忧。学者们也对此不是很乐观,Geoffrey Hinton 在近期的胶囊论文中也提到「卷积网络在新类别上泛化能力的困难度……要么在网格中复制特征检测器,网格的大小随着维度数目指数增长,要么同样以指数方式增加的标注训练集的大小」。对于可用的数据有限的场合,深度学习往往并不是最佳的选择。


二、学到的知识并不深入而且很难迁移


我们都知道深度学习的「深」指的是网络的层数深、隐层数目多,而人类喜欢且崇敬的对事物运行规律的深刻总结则在深度学习中无处可寻。


即便对于需要和环境交互、理应更好地认识到环境规律的强化学习模型,一旦环境发生任何变化,它们也仍然需要重新适应——它们其实没有真的理解「墙」是什么、「通道」是什么。除了 DeepMind 的玩 Atari 游戏的强化学习模型表现出了这样的特点,其它许多研究者在各自的研究领域中也都观察到了轻微改变输入数据就会造成输出结果有巨大差别的现象。


深度学习模型学到的数据模式,看起来要比我们认为的弱得多。


三、难以处理层次化的结构


举例来说,对多数深度学习语言模型来说,句子就是一串单词而已,然而在语言学家眼中,句子是有固有的层次结构的;英文长句中的定语从句就是一类经典的例子,同样是结构基本完整的句子,从层次结构角度讲却只是某一个词或者词组的补充说明。


深度学习对于各种层次化的结构都无能为力。人类可以把「煮米饭」这个目标拆分成「淘米、加水、设火力时间」几个动作逐个完成,游戏 AI 也有需求找到单个操作和全局战略之间的平衡和协调。然而深度学习是提供不了层次化的理解、总结、控制等等能力的,它本身学到的特征就是「平坦」的,或者说是非层次化的,每个特征都只是清单中的一项。所以深度学习系统自身没有能力表示出层次化结构,尝试用一些技巧提取层次化结构的 Word2Vec 之类的模型就马上可以脱颖而出。


然而考虑到多数任务、多数数据、多数电气系统都有显而易见的层次结构(这甚至就是人类构建实用系统的基本思路),深度学习在它们之上的表现都还很值得怀疑。


四、对于开放性推理问题爱莫能助


人类在看过书籍电影之后总能对其中的转折和故事发展提出不同于原作的见解、对作者的暗示提出种种猜想,然而即便是在 SQuAD 问答数据集上表现最好的模型,也只能是在给定的文本中找到最相关的词句然后把它们进行组合而已,完全没有创新和理解暗示的能力。即便已经有研究者做出了尝试,目前来说也没有任何深度学习系统基于真实知识做开放性推理的能力可以和人类相提并论。


五、深度学习依然不够透明


关于深度学习的「黑箱」神经网络问题,在过去几年来一直是被广泛关注和讨论的焦点。而在今天,深度学习系统动辄拥有数以百万甚至十亿计的参数,开发人员难以用可解释的方式 (「last_character_typed」) 对一个复杂的神经网络进行标注 (e.g., the activity value of the ith node in layer j in network module k)。尽管通过可视化工具,我们可以看到复杂网络中的个体节点所产生的贡献,但更多时候研究者会发现,神经网络依然是一个黑匣子一般的谜。


这对于我们会产生什么样的影响犹未可知,如果系统的鲁棒性足够、自适应性也做得够好,那么可解释与否并不成为问题。但如果它需要被用在一些更大的系统上,那么它所具备的可调试性就变得尤为重要。


深度学习的透明性问题尚未被解决,而对于以金融或是医学诊断为代表的应用领域,它将是一个绕不过的坑,毕竟,人们需要向机器的决策要一个可解释的答案。就像 Catherine O』Neill (2016) 所指出的那样,深度学习的不透明性将引致偏见的系列问题。


六、深度学习远未与先验知识紧密结合


深度学习的一个重要方向在于解释学,即将它与其它的知识区隔开来。典型的深度学习方式往往是寻找一个数据集,通过调参等各种方式,学习输入输出的关联,并掌握解决问题的方法。有少数研究会刻意地弱化先验知识,比如以 LeCun 为代表的神经网络连接约束等研究。


而以 Lerer et al 的研究为例,团队尝试让系统学习物体从高塔上掉落的物理特性,在这个研究中,除了卷积隐含内容外,团队没有加入物理学的先验知识。我即将发表的论文中也提及了这一点,即深度学习研究者看起来对先验知识偏见不小,即便这些知识都是众所周知的。


此外,将先验知识整合到深度学习系统中也并非易事。主要原因在于,知识表征主要描述不是抽象的量化特征,而是特征间的关系;机器学习过于强调系统的独立性,而把通用性知识排除在外。以 Kaggle 机器学习竞赛平台为例,所给的数据集、所提出的问题,都是给定的,尽管在比赛的范式驱动下,研究者已经有了长足的进步,但与真实世界亟待解决的问题还有着很大差距。


生活并非一场 Kaggle 竞赛。真实世界的数据并不会洗干净打包好等着你,而问题也比竞赛所遇到的要复杂得多。在以语音识别为代表的,有大量标记的问题上,深度学习可能表现不俗。但如果是开放性的问题呢?几乎没有人知道要怎么办。被绳子卡住链条的自行车怎么修?我要主修数学还是神经科学?没有数据集可以告诉我如何解决。


与分类离得越远的问题、与常识靠得越近的问题,越难被机器学习所解决。而目前据我所知,也没有人尝试过解决这样的问题。


七、深度学习无法区分因果性与相关性


如果因果性与相关性确实不同,那么两者的区分会是深度学习的一个严峻问题。简单地说,深度学习习得的是输入与输出特征间的复杂关系,而非因果性的表征。深度学习系统可以把人类当作整体,并学习到身高与词汇量(height and vocabulary)的相关性,但并不能了解到长大与发展间(growth and development)的关系。也就是说,孩子随着长大会学到更多单词,但不代表学习更多单词会让孩子长大。因果关系对于 AI 而言是一个核心问题,但可能因为深度学习的目标并非解决这些问题,因此深度学习领域很少涉足这一研究。


八、深度学习对环境的稳定性提出要求,这可能会存在问题


深度学习目前在高度稳定的环境中工作得最好,比如围棋,因为它的规则不变,而一旦遇到政治和经济问题(这些问题会不断变化),效果则不尽人意。


在一定程度上来说,深度学习可以应用到诸如股票预测等任务上,但是有很大的可能最终会得到类似 Google Flu Trends 的结果,虽然一开始的疫情预测表现良好,但却没能提前预知 2013 年的流感高发季。


九、深度学习目前得出来的结果只是近似值,不能彻底相信


从前面提出的问题中可以看到,深度学习系统在某些给定领域的大部分情况下工作得很好,却很容易被愚弄。


越来越多的论文表明深度学习容易受到攻击,比如上面提到的 Robin Jia 和 Percy Liang 在语言方面的研究,以及计算机视觉领域的大规模的案例——将黄黑相间的条纹误以为校车,将带有贴纸的停车标志误以为装满食品的冰箱。最近还有一些现实世界中的例子,比如被轻微涂损过的停车标志被深度学习系统误认为是限速标志,3d 打印的乌龟被误认为是步枪。近期,还有新闻报道了英国警局系统不能正确区分裸体和沙丘。


深度学习系统易受欺骗(spoofability)的特性可能是由 Szegedy 等在 2013 年的一篇论文中首次被提出的,四年过去了,经过了如此多的研究,研究人员还是没能找到什么鲁棒性的解决方法。


十、深度学习发展到现在还是很难工程化


从上面提到的所有问题中得出的另一个事实是,用深度学习来做鲁棒性工程很难。谷歌团队发表的论文 Machine Learning: The High-Interest Credit Card of Technical Debt 中,他们的标题将机器学习形容为「技术债务里高利息的信用卡」,这表明,系统在给定了限制的环境下会工作, 但是很难保证在添加了新的数据,并且这些数据与之前的训练数据存在差异的情况下能工作。在 ICML 2015 上,Leon Bottou 将机器学习与飞机引擎的发展作了对比,他表示,飞机的设计依赖于构建复杂的系统,这可以保障可靠的性能,但机器学习系统的缺乏类似的保障。


正如谷歌的 Peter Norvig 在 2016 年所指出的那样,机器学习与传统项目相比,还缺乏增量性(incrementality)、透明性(transparency)和可调试性(debuggability),想要实现机器学习的鲁棒性,这是一项挑战。Henderson 和他的同事最近也提出了这一观点,他们专注于深度强化学习,指出了这一领域在鲁棒性和可复制性方面存在的一些严重问题。


尽管我们在开发机器学习系统的过程中已经取得了一些进步,但还有很长的路要走。


诚然,深度学习在计算机视觉、强化学习、NLP 等领域都优异地解决了不少疑难问题,但我们在对深度学习抱有热情的同时也应当看到,深度学习并不能解决所有的问题,它高超的提取特征和非线性抽象的能力也远不足以构成通用人工智能的基础架构。AI 科技评论认为,深度学习的研究当然要持续,它的火热也为整个机器学习、人工智能界带来了大量关注和人才;但言必深度学习也并不是一个良好的发展状况,我们更希望各种技术和认识方法可以齐头并进,合力构建出人类理想中的「人工智能」。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/497680.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

spring框架做全局异常捕获_@ControllerAdvice注解(全局异常捕获)

背景ControllerAdvice 注解 通常用于定义ExceptionHandler, InitBinder和ModelAttribute 适用于所有RequestMapping方法的方法。ExceptionHandler异常处理器作用:可以拦截程序抛出来的指定异常。使用场景:主要使用与项目统一异常处理,对于rest风格的返回…

DeepMind推出「控制套件」:为「强化学习智能体」提供性能基准

来源:arxiv作者:Yuval Tassa, Yotam Doron, Alistair Muldal, Tom Erez,Yazhe Li, Diego de Las Casas, David Budden, Abbas Abdolmaleki, Josh Merel,Andrew Lefrancq, Timothy Lillicrap, Martin Riedmiller「雷克世界」编译:嗯~阿童木呀、…

pytorch统计矩阵非0的个数_矩阵的三种存储方式---三元组法 行逻辑链接法 十字链表法...

在介绍矩阵的压缩存储前,我们需要明确一个概念:对于特殊矩阵,比如对称矩阵,稀疏矩阵,上(下)三角矩阵,在数据结构中相同的数据元素只存储一个。 [TOC] 三元组顺序表 稀疏矩阵由于其自…

【视频】2017,50个令人屏息的科技瞬间

来源:甲子光年概要:整个世界的巨变,肇始于一颗微尘的颤动。「甲子光年」挑选了属于2017年的50个科技瞬间。十年后再回望时,它们可能正是那个撼动世界的历史性时刻。即将过去的2017年,一定有这样的一瞬:整个…

机加工程序工时程序_准终工时、人工工时、机器工时,十个工程师九个会弄错...

​上一篇文章种蚂蚁先生跟大家详细分析了产品成本的组成,其主要分为材料成本和制造成本两个部分。 然而要得到制造成本,则必须有标准工时数据。那么标准工时究竟是什么呢?​标准工时制: 标准工时是在标准工作环境下,进…

互联网大脑的云反射弧路径选择问题,兼谈ET大脑模糊认知反演理论

互联网大脑的云反射弧路径选择问题研究2008年以来,我们在互联网大脑架构和互联网进化的研究中提到,“互联网大脑架构,就是互联网向与人类大脑高度相似的方向进化过程中,形成的类脑巨系统架构。互联网云脑架构具备不断成熟的类脑视…

如何传入比较器_typescript专题(五) 装饰器

欢迎来到我专题文章【typescript】,更多干货内容持续分享中,敬请关注!本章目标基于webpack4.x从0开始搭建ts的开发环境ts中的装饰器的基本使用基于webpack4.x从0开始搭建ts的开发环境webpack4.x已经问世好久了,0配置是一大亮点&am…

『报告』IDC:2018年物联网产业10大预测

来源:T客汇编译概要:根据市场研究公司IDC的报告,2018年全球物联网支出总额将达到7720亿美元。新年新气象,2017年被称作物联网(IoT)元年,而2018年还将续写IoT的高歌猛进。根据市场研究公司IDC的报…

hbase获取表信息_HBase的读写和javaAPI的使用

一、hbase系统管理表hbase:namespace,记录了hbase中所有namespace的信息 ,当前系统下有哪些namespace信息scan hbase:namespacehbase:meta,记录了region信息scan hbase:meta二、读写思想client(get、scan)rowkey条件(1)由于rowkey是存储在region上的(2)判…

机器学习必知的15大框架

作者 | Devendra Desale译者 | Mags来源 | 云栖社区不管你是一个研究人员,还是开发者,亦或是管理者,想要使用机器学习,需要使用正确的工具来实现。本文介绍了当前最流行15个机器学习框架。机器学习工程师是开发产品和构建算法团队…

区分大小屏幕_第一个Python程序——在屏幕上输出文本

本节我将给大家介绍最简单、最常用的 Python 程序——在屏幕上输出一段文本,包括字符串和数字。Python 使用 print 函数在屏幕上输出一段文本,输出结束后会自动换行。在屏幕上输出字符串字符串就是多个字符的集合,由双引号" "或者单…

2018 年物联网发展五大趋势预测

来源:腾股创投作者 :Pramod Chandrayan物联网已经开始在所有行业的企业中走向主流。 到 2018 年底,物联网支出预计将增长 15%,达到 7725 亿美元,毫无疑问,未来一年连接设备和企业物联网项目数量…

js中立即执行函数会预编译吗_JavaScript预编译过程

什么是预编译?当js代码执行时有三个步骤:1.语法分析,这个过程检查出基本的语法错误。2,预编译,为对象分配空间。3,解释执行,解释一行执行一行,一旦出错立即停止执行。预编译发生在代…

知识图谱火了,但你知道它的发展历史吗?|赠书5本

作者:尼克 编辑|Emily版式由AI前线整理知识图谱火了,但你知道它的发展历史吗?本文节选自《人工智能简史》第 3 章,从第一个专家系统 DENDRAL 到语义网再到谷歌的开源知识图谱,对知识图谱的发展历程进行了…

英特尔爆发史诗级芯片漏洞,Linux之父痛斥英特尔公司

来源:CEO来信概要:1月4日消息,英特尔处理器存在芯片级漏洞的消息仍在发酵,恐怕将会成为计算机行业发展史上最大的安全漏洞之一。1月4日消息,英特尔处理器存在芯片级漏洞的消息仍在发酵,恐怕将会成为计算机行…

曲线均匀分布_曲线篇:深刻理解B 样条曲线(下)

前两篇中讲解了贝塞尔曲线和B样条基础。FrancisZhao:曲线篇: 贝塞尔曲线​zhuanlan.zhihu.comFrancisZhao:曲线篇:深刻理解B 样条曲线(上)​zhuanlan.zhihu.com本文讲一下B样条的进阶clamped B样条由于我们常用的B样条…

JSON.parse()解析单引号错误的问题

1、当用JSON.parse()方法,解析从后台传来的json字符串,而且字符串中含有单引号(如Iam ....),页面将出现如下异常 2、页面引起报错部分 3、解决办法:在后台将特殊字符转义 bookBlockVoListJSONString BaseStringUtils.getJsonFor…

Facebook人工智能实验室提出「全景分割」,实现实例分割和语义分割的统一

原文来源:arxiv作者:Alexander Kirillov、Kaiming He1、Ross Girshick、Carsten Rother、Piotr Dollar「雷克世界」编译:嗯~阿童木呀、KABUDA现如今,我们提出并研究了一种新的“全景分割”(Panoramic segmentation&…

art.dialog弹出框后再根据其内部iframe的大小调整大小

1、主页面,用来弹出弹出页面 //查看错误小练习$.exerciseClick function(rowId ){$.event.get().preventDefault();var tdScore $("#" rowId).find("[aria-describedbyhomeworkStudentListGrid_score]");if( parseInt(tdScore.html()) 100 …

句子录音打分代码参考

1、页面名称:sentenceReadRecordDialogAnyone.jsp 2、页面效果 3、页面源码 <% page language"java" pageEncoding"UTF-8" contentType"text/html;charsetUTF-8"%> <% include file"/common/taglibs.jsp"%><script la…