《自然》:修复AI神经网络的缺陷

640?wx_fmt=jpeg

来源:王宏琳科学网博客

我在上一篇《海外观察》博客中,介绍了纽约大学马库斯教授和戴维斯教授的新书《重启 AI:构建我们可以信任的人工智能》和图灵奖得主朱迪亚•珀尔的著作《为什么:关于因果关系的新科学》。这两本书都分析了以深度学习为基础的人工智能的缺陷。最近读了《自然》杂志网站10月8日发表的道格拉斯·海文(Douglas Heaven)的文章(参考资料[1]),此文题为《Why deep-learning AIs are so easy to fool(为什么深度学习人工智能很容易被愚弄)》,有个副题“Artificial-intelligence researchers are trying to fix the flaws of neural networks(人工智能研究人员正试图修复神经网络的缺陷)”。文章列举了深度神经网络的脆弱性的例证,介绍了人工智能研究人员进行的修复努力。我注意到文中也提到马库斯教授的观点和混合人工智能模型,以及智能体需要了解因果关系等,特在这里介绍这篇文章的要点。

【易被愚弄,易受攻击】

DNN(深度神经网络)模式识别方法,对各种输入正确分类非常成功,包括图像、语音和消费者偏好数据。它们已经成为日常生活的一部分,从自动电话系统到媒体服务用户推荐的方方面面。然而,对输入进行改变——以人类通常察觉不到的微小变化的形式——可能会愚弄神经网络。

《自然》杂志网站的道格拉斯·海文的文章描述了这样场景例子:一辆自动驾驶汽车接近停车标志,但它没有减速,而是加速进入繁忙的十字路口。后来一份事故报告显示,标志的正面贴了四个小矩形,这些欺骗了车上的人工智能,把“Stop(停车)”这个标志误解为“Speed limit 45(限速45)”。该例子出于密歇根大学安娜堡分校、华盛顿大学、加州大学伯克利分校和石溪大学的研究人员设计的“RP2(Robust Physical Perturbations,鲁棒的物理扰动)”的研究报告(这样的误判很是出人意外,详情见:参考资料[2])。

640?wx_fmt=jpeg

简单地旋转图像中的物体,也可以愚弄一些最好的图像分类器。图像中的旋转物体会使得DNN混淆,可能是因为它们与训练网络的类型太不一样了。

640?wx_fmt=jpeg

即使是自然图像,也能愚弄DNN,因为它可能聚焦在图像的颜色、纹理或背景上,而不是挑出人类能识别的显著特征。比如把蘑菇识别饼干,把蜻蜓识别为井盖。

640?wx_fmt=jpeg

除了愚弄人工智能系统使其误读停车标志外,还可以通过在眼镜或帽子上粘贴印刷图案来欺骗面部识别系统,以及通过在音频中插入白噪声模式来欺骗语音识别系统,使其听到虚幻的短语。这些只是破坏人工智能中被称为DNN(深度神经网络)的一些例子。这些问题比不太完美的技术中的怪癖,更令人担忧。它们是DNN脆弱性的例证。

这可能会导致实质性的问题。深度学习系统越来越多地从实验室转移到现实世界,从驾驶自动驾驶汽车,到绘制犯罪地图和诊断疾病。有研究报告称,恶意添加到医学扫描中的像素可能会欺骗DNN错误地检测癌症。另外,黑客也可能利用这些弱点劫持一个基于人工智能的在线系统,以便它运行入侵者自己的算法。

在努力找出问题所在的过程中,研究人员发现了很多关于DNN系统失败的原因。加州山景城谷歌的人工智能工程师弗朗索瓦·乔莱特认为,“深度神经网络的基本脆弱性没有解决办法”。为了超越这些缺陷,研究人员需要用额外的能力来增强模式匹配的DNN:例如,建造能够自己探索世界、编写代码和保留记忆的人工智能。一些专家认为,这种系统将构成未来十年人工智能研究的故事。

【能力强,脆性大】

在前面提到的《自然》杂志网站的道格拉斯·海文的文章中,这样描述DNN(深度神经网络):With great power comes great fragility(巨大的能力带来巨大的脆弱性)。

2011年,谷歌披露了一个可以在YouTube视频中识别猫的系统,不久之后,一些基于DNN的分类系统出现了。许多人都说:“哇,太神奇了,计算机终于能够理解世界了。” 但是人工智能研究人员知道DNN实际上并不了解这个世界。它们不精确地模仿大脑的结构,是由大量排列在许多层的数字神经元组成的软件结构。每一个神经元都与其上下各层相连。进入底层的原始输入的特征——比如图像中的像素——触发其中一些神经元,然后这些神经元根据简单的数学规则将信号传递给上层的神经元。训练DNN网络需要提供它大量的样本,每次都要调整神经元的连接方式,这样最终顶层会给出想要的答案——比如,总是把狮子的图片解释成狮子,即使DNN以前从未见过那张图片。

2013年,谷歌研究员克里斯蒂安·塞格迪和他的同事发布了一份名为《神经网络的迷人特性》的预印本。该项研究表明,用一张DNN能够识别的狮子图像并且通过改变几个像素,可让机器相信它在看不同的东西,比如图书馆。该团队称修改后的图像为“对抗性样本”。

一年后,克鲁恩等人证明了让DNN看到不存在的东西是可能的,比如一只波浪线图案中的企鹅。“任何玩过机器学习的人都知道这些系统偶尔会犯愚蠢的错误,” 深度学习的先驱、加拿大蒙特利尔大学的约书亚·本吉奥说,“令人惊讶的是这种错误,”他说,“那很惊人。这是一种我们没有想到会发生的错误。”

不仅是对象识别,任何使用DNN对输入(如语音)进行分类的人工智能都可能被愚弄。2017年,加州大学伯克利分校的计算机科学家Sandy黄和她的同事们通过称为强化学习训练的DNN的过程击败Atari视频游戏。在这种方法中,人工智能被赋予一个目标,并通过反复试验来学习如何达到这个目标。这是AlphaZero背后的技术。即便如此,黄的团队还是能够通过在屏幕上添加一两个随机像素,让他们的人工智能输掉游戏。

今年早些时候,加州大学伯克利分校的人工智能博士生亚当·格莱夫和他的同事们证明了可在人工智能的环境中引入智能体(agent),这种智能体会实施旨在混淆人工智能反应的“敌对政策”。

知道DNN的弱点在哪里,甚至可以让黑客接管强大的人工智能。其中一个例子是去年谷歌的一个团队展示了使用对抗样本不仅可以迫使DNN犯特定的错误,还可以完全重新编程——有效地将接受过某项任务训练的人工智能,重新用于另一项任务。

【修复缺陷】

DNN非常强大,因为它们有许多层,意味着当试图对输入进行分类时,可以从输入的许多不同特征中获取模式。受过识别飞机训练的人工智能,可能会发现颜色、纹理或背景等特征,与我们认为突出的东西(如机翼)一样,是强有力的预测因素。但是这也意味着输入中的一个很小的变化,就可以把它转变成被人工智能认为明显不同的状态。

解决办法是简单地向人工智能提供更多的数据;特别是反复将人工智能暴露在有问题的情况下,并纠正其错误。在这种形式的“对抗性训练”中,当一个网络学会识别物体时,另一个网络试图改变第一个网络的输入,从而出错。这样,对抗样本就成为了DNN训练数据的一部分。

有人建议,通过测试一个DNN在众多对抗样本中的表现,来量化它对犯错的稳健性。然而,他们说,训练一个网络来抵御一种攻击,可能会削弱它抵御其它的攻击。由伦敦谷歌DeepMind的普什米·科利领导的研究人员,正试图给DNN系统接种预防出错的疫苗。许多敌对攻击都是通过对输入的组成部分进行微小的调整来实现的——比如微妙地改变图像中像素的颜色——直到这将DNN教引入错误分类。科利的团队建议,一个强大的DNN不应该因为其输入的微小变化而改变其输出,并且这一特性可能会在数学上融入网络,约束其学习的方式。

在《自然》网站的文章中,道格拉斯·海文还讨论了即兴发挥的机器人自学,从更少的数据中学习,学习如何学习等问题。

自学的例子是2017年,DeepMind自学游戏软件的最新版本AlphaZero在仅仅一天多的时间里,就被训练成为围棋、象棋和日本象棋(shogi)的超人玩家。

婴儿可以从几个数据点中识别出新的样本——即使他们以前从未见过长颈鹿,他们仍然可以在看了一两次后学会辨认出长颈鹿。其部分原因是因为婴儿见过许多其他生物。授予人工智能这种能力的一个术语是转移学习:其理念是将从前几轮培训中获得的知识,转移到另一项任务中。

人工智能的下一个重要步骤是赋予DNN系统编写自己的算法的能力,而不是使用人类提供的代码。用推理能力补充基本模式匹配,可以使人工智能更好地处理超出舒适区的输入。计算机科学家多年来一直在研究程序合成,即计算机自动生成代码——计算机可以自动编写程序,只要告诉它我们想要什么。将这一领域与深度学习相结合,可能会导致DNN系统更接近人类的抽象心智模型。

然而,目前还没有人能解决脆弱人工智能的整体问题。“深度学习三巨头”之一、图灵奖得主约书亚·本吉奥说,问题的根源在于DNN系统没有一个很好的模式来辨别什么是重要的。当人工智能将修改过的狮子图像视为图书馆时,人仍然会看到狮子,因为它们有一个基于一系列高级特征——耳朵、尾巴、鬃毛等——的动物心理模型,这让他们能够从低级的任意或偶然的细节中抽象出来。“我们从以前的经验中知道哪些特征是突出的,”本吉奥说。"这来自对世界结构的深刻理解."

解决这一问题的一个尝试,是将数字神经网络与符号人工智能相结合。通过符号人工智能(机器学习之前人工智能的主要范式),机器使用硬编码规则推理世界是如何工作的,例如它包含离散的对象,并且它们以各种方式相互关联。一些研究人员,比如纽约大学的心理学家加里·马库斯,认为混合人工智能模型是前进的方向。马库斯说:“深度学习在短期内非常有用,以至于人们忽略了长期。”马库斯是当前深度学习方法的长期批评者。今年5月,他在加州帕洛阿尔托共同创立了一家名为Robust AI的初创公司,旨在将深度学习与基于规则的人工智能技术相结合,开发能够与人安全相处的机器人。公司到底在做什么仍未公开。

即使规则可以嵌入到DNN系统中,它们仍然只能和它们从中学习到的数据一样好。本吉奥说人工智能智能体(agent)需要在他们可以探索的更丰富的环境中学习。例如,大多数计算机视觉系统不能识别一罐啤酒是圆柱形的,因为它们是在2D图像的数据集上训练的。在3D环境中学习——真实的或模拟的——会有所帮助。

人工智能的学习方式也需要改变。本吉奥说,“在世界上做事的智能体需要了解因果关系,他们可以进行实验和探索。”另一个深度学习的先驱,瑞士的戴尔·摩尔人工智能研究所的于尔根·施密德胡伯,也有类似的想法。他说,模式识别非常强大——足以让阿里巴巴、腾讯、亚马逊、脸书和谷歌等公司成为世界上最有价值的公司。“但是会有更大的浪潮到来,”他说。“这将是关于操纵世界并通过自己的行动创建自己的数据的机器。”

【结语】

尽管DNN有其脆弱性,还有对大量训练数据依赖的问题,但这项技术将会继续存在。十年来,人们意识到深度神经网络结合巨大的计算力,可以被训练成如此好地识别模式,这仍然是一个启示。

正在开展的对抗性训练、接种预防出错的疫苗、机器人自学、转移学习、强化学习等的研究,有益于修复机器学习的脆弱性。探索机器学习与程序合成技术相结合,探索将深度学习与基于规则的人工智能技术相结合,探索如何使得智能体具备了解因果关系能力,将使得未来的人工智能系统更加健壮。建造能够自己探索世界AI系统、赋予DNN系统编写自己的算法和保留记忆的能力,将构成未来十年人工智能研究的故事。

参考资料:

[1] Douglas Heaven.Why deep-learning AIs are so easy to fool.09 OCTOBER 2019. Nature, Published online: 09 October 2019; doi: 10.1038/d41586-019-03013-5

[2] Kevin Eykholt, Ivan Evtimov, Earlence Fernandes, Bo Li, Amir Rahmati,Chaowei Xiao, Atul Prakash, Tadayoshi Kohno, and Dawn Song. Robust Physical-World Attacks on Deep Learning Visual Classification.CVPR 2018

640?wx_fmt=jpeg

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/489850.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

三. 自动化测试用例设计

1. 主要内容: 2. 手工测试用例与自动化测试用例区别 目前自动化测试更多的时候是定位在冒烟测试和回归测试; 冒烟测试执行的是主体功能点的用例。回归测试执行全部或部分的测试用例。3. 测试类型 4. 异常 5. WebDriver错误截图 get_screenshot_as_f…

c++卸载工具_win7系统如何卸载office2007兼容包

win7系统如何卸载office2007兼容包?office2007是一款热门的办公软件,但有的朋友不习惯使用office2007,但是一些说电脑安装office2007软件后,想要更换其他版本的话,此前需要将office2007卸载掉,不知怎么卸载office2007…

人工智能伦理如何设定,从种群层面看人类的知识积累和进化

前言:9月份中宣部出版局《中国图书评论》对《崛起的超级智能》进行了推荐和评论,对其中阐述的种群知识库扩展观点给予了重点关注。应该说种群知识库扩展是互联网大脑架构不断发展的抽象推论,这个推论对于人工智能及其伦理的建立也应有相应的价…

python可以这样学读后感_Python基础教程的读后感10篇

《Python基础教程》是一本由Magnus Lie Hetland著作,人民邮电出版社出版的平装图书,本书定价:69.00元,页数:471,文章吧小编精心整理的一些读者的读后感,希望对大家能有帮助。 《Python基础教程》…

光通信的再思考:5G流量爆发下的数据密度革命

来源:未来智库1.投资要件区别于市场的观点:(1)市场对 5G 时代流量爆发的认知不足。市场认为当前大带宽高流量新应用的爆发趋势尚不明显,当前流量增长需求不清。我们认为,5G 时代的流量的爆发将会是数十倍的…

玩家可以输入辅助指令_最后生还者 第二部辅助功能详解 盲人玩家也能玩

顽皮狗首席系统设计师Matthew Gallant,今天在Playstation Blog公开了《最后生还者 第二部》中辅助功能的详情。他们表示从设计之初,他们就希望有更多的粉丝能够体验到这款作品。在《神秘海域4:盗徒末路》的基础上,《TLOU2》提供了…

为什么深度学习如此容易被愚弄?AI研究员正在努力修复神经网络缺陷

来源:nature假设一辆自动驾驶汽车看到停车标志时并没有减速,而是加速驶入了繁忙的十字路口,从而导致了交通事故。事故报告显示,停车标志的表面粘了四个小的矩形标志。这说明一些微小扰动就能愚弄车载人工智能(AI&#…

.net core image怎么保存_C# 将PDF转为多种Image图像文件格式(Png/Bmp/Emf/Tiff)

PDF是一种在我们日常工作学习中最常用到的文档格式之一,但常常也会因为文档的不易编辑的特点,在遇到需要编辑PDF文档内容或者转换文件格式的情况时让人苦恼。通常对于开发者而言,可选择通过使用组件的方式来实现PDF文档的编辑或者格式转换&am…

h5课件制作_PPT新功能!竟然还能用来制作H5

原标题:PPT新功能!竟然还能用来制作H5最近几年随着移动端的快速发展,我们获取信息的途径更加便捷了,我们几乎每天都会刷微博、看朋友圈。而在众多的信息传递中,H5页面成了最受大众欢迎的形式。所谓的H5,简单…

Nature重磅发现:神经活动影响人类寿命!

来源:中国生物技术网北京时间10月17日,发表在《Nature》上的一篇新研究中,来自美国哈佛医学院的科学家发现,长期以来与从痴呆症到癫痫等疾病有关的大脑神经活动,在人类衰老和寿命方面也发挥着作用。这项基于人脑、小鼠…

bootstrap 富文本_入坑吗?说说几个富文本编辑器

也许,你时常会遇到要开发基于Web的文本编辑器的情况。有时候,只需实现一个简约且轻量级的应用程序,不必有其他任何不必要的功能。因此,总能找到一种工具,来创建符合用户需求和资金要求的在线文本编辑器。本文将简要介绍…

战略 | 分析这25家千亿美元市值企业后,发现了这些趋势......

文章来源 |《哈佛商业评论》图片来源 | 网络编辑 | 智慧云导读:本文发表在《哈佛商业评论》上,作者通过对几百家卓越的公司进行相关调查研究,发现这些公司在其成功的数十年间采用的战略始终符合3个基本法则。本文在此基础上,对相关…

bs 程序用户个性化设置保存_想更改win10设置,这12种打开方法你不可不知,方便又快捷...

“设置”应用程序是Windows 10中最有用和最重要的应用程序之一,我们设置帐户、应用程序、系统、设备、网络和Internet、个性化、时间和语言、更新和安全等等都要通过它来进行。由于我们使用此应用程序比系统中的任何其他应用程序都要多,所以我们要熟悉打…

AR普及后的未来是怎样的?

来源:ARC增强现实 AR普及后的未来是怎样的?知名投资机构A16Z合伙人Ben Evans曾描绘AR未来场景:我会在你头顶上看到你的LinkedIn资料卡;收到Salesforce提示说你是一个重要的目标客户; Truecaller会提示说你打算向我推销…

python基础100_python基础100题

有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少? def test_01(): count 0 num_lst [] for i in range(1, 5): for j in range(1, 5): for k in range(1, 5): if (i ! j) & (j ! k) and (i ! k):…

oracle数据库启动

遇到个白痴问题,放假停电,回来时启动数据库,发现无法进入oracle管理员界面。 如下输入,但是显示的命令无效。 [oraclecrm001 database]$ sqlplus / as sysdba bash: sqlplus: command not found 后来查百度知道问题的原因&#xf…

图灵测试还重要吗?

撰文丨Harry Collins(卡迪夫大学社会学教授)来源丨原理(ID:principia1687)1我们正在步入人工智能时代。随着人工智能程序越来越擅长像人类般行事,我们也越来越多地面临这样一个问题:人类的智能是…

mysql 禁止使用enum_MySQL慎用 ENUM 字段

前言:在网上看了很多文章,大家都是推荐 MySQL 要慎用 ENUM 字段,但是原理感觉还是有点模糊。今天我们就从官网来818这些东西1、关于 ENUM 迁移的问题?这里引用别人的一段话:但ENUM带来的问题也不少,比如数据…

2019年雁栖湖会议重大科学问题面向全球发布

来源:中国科学杂志社10月13日,由中国科学院学部和北京市政府联合举办的2019年度雁栖湖会议在北京怀柔开幕。中国科学院副院长张亚平、北京市委副秘书长郑登文以及来自国内外免疫学领域的院士、著名专家学者和中国科学院大学、中国科学院微生物所的师生等…

vscode怎么安装python包_vscode如何安装python

vscode安装python的方法: 1、在vscode的扩展中输入"ext install python"安装python插件打开VScode,Ctrlp 输入 "ext install python",搜索时间可能会比较长 安装过程不能停止,否则重新安装;2、在配…