产生和防御对抗样本的新方法 | 分享总结

来源:AI研习社

作者:杨文


在线上公开课上,来自清华大学的在读博士生廖方舟分享了他们团队在 NIPS 2017 上一个对抗样本攻防大赛中提到的两个新方法,这两个方法在大赛中分别获得了攻击方和防守方的第一名。在此可看视频回放:http://www.mooc.ai/open/course/383 


廖方舟,清华大学化学系学士,生医系在读博士。研究方向为计算神经学,神经网络和计算机视觉。参加多次 Kaggle 竞赛,是 Data Science Bowl 2017 冠军,NIPS 2017 对抗样本比赛冠军。Kaggle 最高排名世界第 10。


分享主题:


动量迭代攻击和高层引导去噪:产生和防御对抗样本的新方法


分享内容:


大家好,我是廖方舟,今天分享的主题是对抗样本的攻和防。对抗样本的存在会使得深度学习在安全敏感性领域的应用收到威胁,如何对其进行有效的防御是很重要的研究课题。 我将从以下几方面做分享。


  • 什么是对抗样本


  • 传统的攻击方法


  • 传统的防守方法


  • 动量迭代攻击


  • 去噪方法


  • 高层引导去噪方法


什么是对抗样本


对抗样本的性质不仅仅是图片所拥有的性质,也不仅仅是深度学习神经网络独有的性质。因此它是把机器学习模型应用到一些安全敏感性领域里的一个障碍。


当时,机器学习大牛 Good fellow 找了些船、车图片,他想逐渐加入一些特征,让模型对这些船,车的识别逐渐变成飞机,到最后发现人眼观测到的图片依然是船、车,但模型已经把船、车当做飞机。



我们之前的工作发现样本不仅仅是对最后的预测产生误导,对特征的提取也产生误导。这是一个可视化的过程。


当把一个正常样本放到神经网络后,神经元会专门观察鸟的头部,但我们给它一些对抗样本,这些对抗样本也都全部设计为鸟,就发现神经网络提取出来的特征都是乱七八糟,和鸟头没有太大的关系。也就是说欺骗不是从最后才发生的,欺骗在从模型的中间就开始产生的。



下图是最简单的攻击方法——Fast Gradient Sign Method 



除了 FGSM 单步攻击的方法,它的一个延伸就是多步攻击,即重复使用 FGSM。由于有一个最大值的限制,所以单步的步长也会相应缩小。比如这里有一个攻击三步迭代,每一步迭代的攻击步长也会相应缩小。



产生图片所用的 CNN 和需要攻击的 CNN 是同一个,我们称为白盒攻击。与之相反的攻击类型称为黑盒攻击,也就是对需要攻击的模型一无所知。



以上所说的都是 Non Targeted, 只要最后得到的目标预测不正确就可以了。另一种攻击 Targeted FGSM,目标是不仅要分的不正确,而且还要分到指定的类型。


一个提高黑盒攻击成功率行之有效的办法,是攻击一个集合。

而目前为止一个行之有效的防守策略就是对抗训练。在模型训练过程中,训练样本不仅仅是干净样本,而是干净样本加上对抗样本。随着模型训练越来越多,一方面干净图片的准确率会增加,另一方面,对对抗样本的鲁棒性也会增加。

下面简单介绍一下 NIPS 2017 上的这个比赛规则


  比赛结构


两个限制条件:容忍范围不能太大;不能花太长时间产生一个对抗样本,或者防守一个对抗样本


FGSM 算法结果


图中绿色模型为攻击范围,最后两栏灰色是黑盒模型,随着迭代数量的增加, 攻击成功率反而上升。这就给攻击造成了难题。


我们解决的办法就是在迭代与迭代中间加入动量


加入动量之后,白盒攻击变强了,而且对黑盒模型攻击的成功率也大大提升了。


总结


以前方法(iterative attack)的弱点是在迭代数量增多的情况下,它们的迁移性,也就是黑盒攻击性会减弱,在我们提出加入动量之后,这个问题得到了解决,可以很放心使用非常多的迭代数量进行攻击。


在 NIPS 2017 比赛上得到最高的分数


需要提到的一点,上面提到的都是 Non-targeted , 在 Targeted 攻击里面,这个策略有所不同。在 Targeted 攻击里面,基本没有观察到迁移性,也就是黑盒成功率一直很差,即便是加入动量,它的迁移程度也非常差。


下面讲一下防守


首先想到的就是去噪声,我们尝试用了一些传统的去噪方法(median filter 、BM3D)效果都不好。之后我们尝试使用了两个不同架构的神经网络去噪。一个是 Denoising Autoencoder,另一个是 Denoising Additive U-Net。



我们的训练样本是从 ImageNet 数据集中取了三万张图片 ,使用了七个不同的攻击方法对三万张图片攻击,得到 21 万张对抗样本图片以及三万张对应的原始图片。除了训练集,我们还做了两个测试集。一个白盒攻击测试集和一个黑盒攻击测试集。



训练效果



我们发现经过去噪以后,正确率反而有点下降。我们分析了一下原因,输入一个干净图片,再输入一个对抗图片,然后计算每一层网络在这两张图片上表示的差距,我们发现这个差距是逐层放大的。


图中蓝线发现放大的幅度非常大,图中红线是去噪过后的图片,仍然在放大,导致最后还是被分错。

为了解决这个问题,我们提出了经过改良后的网络 HGD

HGD 的几个变种

和之前的方法相比,改良后的网络 HGD 防守准确率得到很大的提升

HGD 有很好的迁移性

最后比赛中,我们集成了四个不同的模型,以及训练了他们各自的去噪, ,最终把它们合并起来提交了上去。

  HGD 网络总结


优点:


  • 效果显著比其他队伍的模型好。


  • 比前人的方法使用更少的训练图片和更少的训练时间。


  • 可迁移。


缺点:


  • 还依赖于微小变化的可测量


  • 问题并没有完全解决


  • 仍然会受到白盒攻击,除非假设对手不知道 HGD 的存在


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/497633.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

36小时,造一个亚马逊无人商店 | 实战教程+代码

夏乙 问耕 编译整理量子位 出品 | 公众号 QbitAIclass"video_iframe" data-vidtype"2" allowfullscreen"" frameborder"0" data-ratio"1.7666666666666666" data-w"848" scrolling"no" data-src"h…

穷查理宝典--人类误判心理学思维导图

穷查理宝典--人类误判心理学思维导图 分享地址:https://www.processon.com/view/link/5d6e0976e4b09176f3092aa6

深度学习将眼睛变成健康“指示器”

来源:科学网概要:科学家正利用该方法寻找基因组中的突变,并且预测单个细胞布局的变化。眼膜图象可使计算机预测一个人是否会马上心脏病发作。人们常说,眼睛是心灵的窗户。但谷歌公司的研究人员将其视为个人健康的“指示器”。这个…

AI智能手机会是什么样?至少有这十个功能

来源:腾讯科技,编译:云开概要:AI功能将成为智能手机厂商提升产品差异度,获得新客户,留住现有用户的一种手段。业界媒体digit近日发表文章称,据调研公司Gartner预测,到2022年&#xf…

Mockito教程--思维导图笔记

笔记来源:https://blog.csdn.net/xiang__liu/article/details/81147933 思维导图地址:https://www.processon.com/view/link/5da7bfbfe4b0ea86c2b3db94

有生之年,人工智能会给世界带来什么变化?这里是现代机器人之父Rodney Brooks关于未来的预言

来源:网络大数据概要:所有的新技术都会“这项技术对人类有多少好处”或者“这项技术有多糟糕”之类的预测。新年伊始,世界著名的机器人学家,机器人企业家(iRobot和Rethink Robotics两家知名机器人企业的创始人),澳大利…

《学习究竟是什么》思维导图笔记

《学习究竟是什么》思维导图笔记 详细地址:https://www.processon.com/view/5f0184a6e401fd3908b1f1a7#map

百度CES大秀,Apollo2.0与DuerOS新产品背后的百度开放新姿态

来源:亿欧概要:在过去的一年里,无论是自动驾驶开放平台 Apollo和智能语音交互平台DuerOS都取得了外界瞩目的成绩,百度迫切地希望把这份成绩传达出去,并且吸引来更多的合作伙伴,扩大战果。美国当地时间1月8日…

HttpClient 指南思维导图笔记

完整思维导图:https://www.processon.com/view/link/5ff28968e401fd661a0f0c2f

机器人产业的前途取决于人工智能关键技术的发展

来源:亿欧概要:让机器人实现智能的关键技术在最近十年会发展到什么程度?整个产业的应用前景将会如何?目前的机器人已经能够胜任精确、重复性的工作,但很多时候,它还不能够灵活地为新任务进行自我调整&#…

携手320+合作伙伴,英伟达扔下一枚自动驾驶炸弹,打响新年越野赛 | CES2018

来源:36Kr概要:英伟达宣布世界首个自动机器处理器英伟达DRIVE Xavier,2018年第一季度发布,称这是英伟达有史以来最大的研发投入,研发投入高达 20 亿美元。还是那个伸手就可以从兜里掏出芯片的老黄。黄仁勋以2个小时的主…

对象设计——责任、角色和协作思维导图笔记

思维导图url:https://www.processon.com/view/link/5ff6660007912930e01fc923

英特尔宣布全新自动驾驶平台整合处理器和视觉芯片

来源:网易科技概要:在英特尔主题演讲环节中,英特尔公司Mobileye联合创始人Amnon Shashua发布了英特尔全新的自动驾驶平台,包含2个EyeQ5芯片以及一个凌动芯片。美国拉斯维加斯时间1月9日至12日,第51届国际消费类电子产品…

ThoughtWorks洞见领域驱动设计思维导图笔记

思维导图url:洞见领域驱动设计 | ProcessOn免费在线作图,在线流程图,在线思维导图 |

大江大海2018: 冲浪科技之巅不可错过的十大数字前沿趋势

来源:腾讯研究院概要:所有主流科技公司、创业公司都相继进入战线,为科技的未来发展打造必要的元素。序 言2017年,人工智能的“热身”刚刚结束。继李世石人机大战,AlphaGo升级再复出,三度进化,让…

设计原本思维导图笔记

https://www.processon.com/view/link/601d04a87d9c0830de487b91

深度长文:智能手机的社会学研究

来源:36Kr编辑:郝鹏程媒介是人的延伸,智能手机是直接嫁接在我们身体上的一种器官这是一篇长文,以社会学的研究路径展示了智能手机的影响:它潜移默化、无影无踪。斯麦兹”受众商品论“的论断仍然存在,乔姆斯…

Mockito教程

https://www.cnblogs.com/Ming8006/p/6297333.html 目录 1 Mockito 介绍 1.1 Mockito是什么? 1.2 为什么需要Mock 1.3 Stub和Mock异同 1.4 Mockito资源 1.5 使用场景 2 使用Mockito 2.1 验证行为 2.2 模拟我们所期望的结果 2.3 RETURNS_SMART_NU…

日本科学家利用AI扫描大脑活动,「看到」了你正在「想什么」

原文来源:biorxiv作者:Guohua Shen、Tomoyasu Horikawa1、Kei Majima、Yukiyasu Kamitani「雷克世界」编译:嗯~阿童木呀、KABUDA你有没有想象过,将来的某一天,计算机可以“看到”你在想什么。图表由Kamitani实验室提供…

python正方形阴影面积计算_利用Python求阴影部分的面积实例代码

一、前言说明今天看到微信群里一道六年级数学题,如下图,求阴影部分面积看起来似乎并不是很难,可是博主添加各种辅助线,写各种方法都没出来,不得已而改用写Python代码来求面积了二、思路介绍1.用Python将上图画在坐标轴…