GDPR到底是如何影响机器学习的?

摘要: GDPR时代来临,你的机器学习模型还能训练吗?

一般数据保护条例(GDPR对数据科学产生了很大的影响。现在GDPR有99条正文条款和173篇声明(Recital),长而复杂,但是随着时间的推移以及条款的执行,它可能会变得更加复杂。同时,由于GDPR的存在,律师和隐私工程师将成为未来大型数据科学项目的核心组成部分。


本文主要讨论GDPR与机器学习(ML)之间三个最常见的问题。

1.GDPR是否禁止机器学习?

总的来说,在GDPR生效后,ML不会在欧盟被禁止。

但是,从技术的角度来看,这个问题的答案是肯定的。GDPR作为法律条文,确实做出了对使用自动化决策的全面禁止的规定。当GDPR使用“自动化决策”这个术语时,该法规指的是任何模型都可以在没有人直接参与决策的情况下做出决定。这可能包括数据主体的自动“概要分析”,例如将其分类为“潜在客户”或“40-50岁男性”等特定组,以确定贷款申请人是否有资格获得贷款。

因此,GDPR对ML模型的产生的影响是在没有人直接参与决策制定的情况下,它们是否可以自动部署。如果可以自动部署,那么在大量的ML模型中这种自动部署的设置将会被默认禁止。尽管有许多律师或数据科学家确实反对过,但参与起草和解释GDPR的欧盟官方工作组还是坚持该项规定。

当然,GDPR禁止ML也有例外情况。简单来说,该法规确定了使用自主决策合法的三个领域:合同处理的必要性,其他法律另行授权的情况,或数据主体明确同意的情况。

但是,让用户同意并不容易,用户可以同意许多不同类型的数据处理,并且他们也可以在任何时候撤销同意,这意味着用户同意需要细化和进一步的规范。

那么,GDPR是否真的禁止使用ML模型?当然不是,但在许多应用ML的例子中,它使得这些模型及其输入数据的部署和管理变得越来越困难。

2. ML有没有“解释权”

作者去年写了一篇专门讨论这个问题的文章。潜在的解释能力的存在可能会对数据科学产生巨大的影响,因为ML模型的预测能力很大程度上很难解释,即使有可能,也很难解释

在GDPR的第13-15条中反复声明,数据主体有权获得“有关所涉逻辑的有意义的信息”以及自动决策的“重要性和设想的后果”。然后,在GDPR的第22条中规定,数据主体有权利不受上述影响类型的影响。最后,作为该条例中包含的一项非约束性评论的一部分,第71条声明(Recital)表示,数据主体除了能够对这些决定提出质疑之外,还有权对自动决策做出解释。综上所述,这三项规定在数据主体和处理数据的模型之间创建了许多新的复杂的义务,这表明了一种相当强大的可解释性权利。

虽然理论上,欧盟监管机构可以以最严格的方式解释这些条款,但是现实中要想实现充分合理解释似乎是不可能的。欧盟监管机构甚至可以将这些条款解读为,当ML被用于在没有人为干预的情况下做出决定时,以及当这些决定对数据主体产生重大影响时,这些人有权获得关于正在发生的事情的一些基本形式的信息。在GDPR中被称为“有意义的信息”和“设想的后果”可能会在此背景下被读出。欧盟监管机构可能会将注意力集中在一个数据主体上,该数据主体基于有关模型的信息和其部署的上下文的相关信息,对数据的使用做出明智的决定。

3. 数据主体是否有能力要求模型在没有数据的情况下进行训练?

作者认为在实践中答案是否定的。在GDPR下,所有数据的使用都需要有法律依据,《条例》第6条规定了六个相应的依据。最重要的两个是“合法利益”的基础,以及用户明确同意使用该数据的地方。当处理的法律基础是后者时,数据主体将会保留对这些数据的极大控制权,也就是说,他们可以在任何时候撤销,而处理这些数据的法律依据将不再存在。

因此,如果一个组织从一个数据主体收集数据,用户同意将他们的数据用于训练一个特定模型,然后数据主体随后撤回该同意,那么用户何时可以强制模型重新训练新数据呢?

只有当该模型继续使用该用户的数据时,答案才会出现。正如GDPR的29条规定的那样,即使撤销同意后,撤回之前所发生的所有处理仍然合法。因此,如果这些数据被合法的用于创建模型或预测,那么这些数据所产生的任何东西都可能被保留下来。在实践中,一旦用一组训练数据创建了一个模型,训练数据就可以在不影响模型的情况下被删除或修改。

然而,从技术上讲,一些研究表明,模型可能会保留关于训练数据的信息,即使在训练数据被删除之后,这些信息仍然可能被发现,正如研究人员Nicolas Papernot等人所写的那样。这意味着,在某些情况下,在不重新训练模型的情况下删除数据不能保证训练数据不会被重新发现,或者不能保证原始数据不会被继续使用。

但是训练数据通过模型被重新发现几乎是不可能的。作者认为,这种重新发现只是在学术环境中进行的,与企业数据科学家的日常相差甚远。尽管这在理论上是有可能的,但这似乎是一个边缘案例,监管者和数据科学家只有在这种特定类型的实例变得更加现实的情况下才能解决这个问题。

文章原标题《how-will-the-gdpr-impact-machine-learning》

原文链接

本文为云栖社区原创内容,未经允许不得转载。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521556.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

iphone字体_iPhone 适合老人盘吗?

过年的时候,有多少人会选择给家里的老人购买一台新智能手机做为礼物呢?又有多少人选择赠送的手机是 iPhone 呢? (图片来自网络)很久以前,咆哥就看见很多有关‘ iPhone ’是否可以作为孝心机的话题&#xff…

干货 | 金融级消息队列的演进 — 蚂蚁金服的实践之路

摘要: 小蚂蚁说: 消息队列作为一个数据的集散中心,承载了越来越多的场景和数据,从最开始的 OLTP 到 OLAP,甚至再到物联网、人工智能、机器学习等场景,都有很大的想像空间。 在能力上,消息队列现…

海底光缆,到底是怎么安装和维护的?

戳蓝字“CSDN云计算”关注我们哦!作者 | 鲜枣课堂责编 | 阿秃大家应该都知道海底光缆是什么吧?没错!简单来说,就是埋在海底的光纤线缆。如今这个时代,我们每天都在上网。通过上网,我们可以随时和世界各地保…

android padding作用,android:padding和android:layout_margin的区别

简单点来说:android:padding是内边距,控件本身的内容与控件边缘的距离。android:layout_margin是外边距,控件与其他控件之间的距离。下面以具体的例子来进行解释:1、不设置边距android:layout_width"match_parent"andro…

8张图理解Java

摘要: 一图胜千言,下面图解均来自Program Creek 网站的Java教程,目前它们拥有最多的票选。如果图解没有阐明问题,那么你可以借助它的标题来一窥究竟。8张图理解Java一图胜千言,下面图解均来自Program Creek 网站的Java…

云栖大会|十年阿里云存储进化史:今天最好的表现就是明天最低的要求

戳蓝字“CSDN云计算”关注我们哦!科技创新的能力仍然是俘获市场用户的必要条件,而善于发现新需求的敏锐嗅觉以及直面挑战的魄力,更是巨头企业的绝杀武器。随着大数据、人工智能等新兴技术的发展,图像语音识别、智能机器人、自动驾…

他在阿里的逆袭,只因为想做个“锤子”

摘要: 我叫孟白,这是我在阿里的第五年。这五年,我从一个外包工程师,到同事眼中的“铁打的”技术专家。填过无数次坑,也无数次想过放弃。留在阿里,是因为同事一句无意间的玩笑:“你只能做钉子&am…

vb6 判断打印机是否有效_讲述3D打印机怎么用 初学者必看

许多朋友买来了3D打印机,但却不知道如何下手,其实,3D打印机远远没那么复杂。那么,今天就来简单说一下3D打印机怎么用?第一步:创建模型想要玩转3D打印,最重要也是必不可少的环节就是建模!现在可以绘制三维图…

Intellij Idea 离线安装插件

一、idea插件下载地址 http://plugins.jetbrains.com/ 二、下载插件 安装插件 1、下载插件&#xff1a; 2、安装插件&#xff1a; settings -> plugins -> install plugin from disk&#xff0c;然后重启IDEA即可。 <!-- https://mvnrepository.com/artifact/org…

android dialog自定义圆角,Android自定义Dialog实现通用圆角对话框

前言&#xff1a;圆角对话框在项目中用的越来越多&#xff0c;之前一篇文章有介绍过使用系统的AlertDialogCardView(Android中使用CardView实现圆角对话框)实现了圆角对话框的样式&#xff0c;今天介绍自定义Dialog实现通用的圆角对话框。效果图&#xff1a;1.继承自AlertDialo…

漫画:什么是囚徒困境?

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 小灰责编 | 刘丹故事发生在小灰小时候......囚徒困境讲的是一件怎样的事情呢&#xff1f;话说某一天&#xff0c;警察抓到了嫌疑犯小A和小B&#xff0c;虽然明知道他们肯定是罪犯&#xff0c;却没有决定性的证据。于是警察想…

Dubbo Cloud Native 之路的实践与思考

摘要&#xff1a; Cloud Native 应用架构随着云技术的发展受到业界特别重视和关注&#xff0c;尤其是 CNCF&#xff08;Cloud Native Computing Foundation&#xff09;项目蓬勃发展之际。Dubbo 作为服务治理的标志性项目&#xff0c;自然紧跟业界的潮流&#xff0c;拥抱技术的…

android mtk 按键,Android 4.0 虚拟按键、手机模式、平板模式(转)

nullem;text-align:left">平台信息:内核&#xff1a;linux2.6/linux3.0系统&#xff1a;android/android4.0平台&#xff1a;S5PV310(samsungExynos4210/4412)作者&#xff1a;xubin341719(欢迎转载&#xff0c;请注明作者) 三星新拿回来来的BSP&#xff0c;编译后没…

y电容如何选型_干式试验变压器选型依据

湖北中试高测电气控股有限公司为您解答&#xff1a;干式试验变压器选型依据干式试验变压器是电力系统中常用的设备之一&#xff0c;适用于各种电气设备绝缘性能的现场检测。当前市面上的干式试验变压器品牌、种类众多&#xff0c;如何才能选购到最适合自己使用的产品呢&#xf…

eplan如何导入access_EPLAN如何助力汽车行业的智能制造转型?

本文从汽车行业智能制造建设需求出发&#xff0c;结合EPLAN服务全球汽车行业企业实现智能制造的最佳实践&#xff0c;介绍了EPLAN在汽车行业智能制造建设过程中所能提供的完整、成熟的电气设计解决方案。作者&#xff1a;Eplan 王阳 | 来源&#xff1a;e-works一、汽车行业快速…

全面讲解OpenStack技术知识

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 鲜枣课堂责编 | 刘丹对于大部分人来说&#xff0c;这是一个很陌生的词&#xff0c;不知道它到底是什么&#xff0c;从哪里来&#xff0c;有什么用&#xff0c;和自己的工作有什么关系。有人可能知道&#xff0c;它和现在非常…

Dubbo在互金行业的应用

摘要&#xff1a; 融之家技术团队从2015年截止到目前累计经历了4次演进&#xff08;单体应用、多实例部署、半微服务、微服务&#xff09;&#xff0c;让平台能更懂用户&#xff0c;更理解用户的需求&#xff0c;把合适的人匹配到合适的产品。前言本文章是根据潘志伟老师在上海…

os是android5.0,Funtouch OS 2.1曝光 完美改Android5.0

由于设计风格华丽&#xff0c;UI特色鲜明&#xff0c;vivo基于Android 5.0开发的Funtouch OS 2.1曝光后&#xff0c;一直备受用户关注。近日&#xff0c;vivo官方再次公布其设计细节&#xff0c;据Funtouch官方微博发布的系统截图显示&#xff0c;Funtouch OS 2.1全面升级了And…

哈工大理论力学第八版电子版_校史上的这些天(37)| 和你一起在“岁月”中读懂哈工大...

1954年5月26日中央高等教育部委托哈工大组织举办理论力学、机械原理、机械零件3门课程教学座谈会。1990年5月26至27日哈尔滨建筑工程学院召开第六次党员代表大会。大会选举王玉林、朱华、刘剑秋、沈世钊、吴满山、张云学、张树仁、荣大成、高廷臣为中共哈尔滨建筑工程学院第六届…