隐私保护 AI 的演变:从协议到实际实现

近些年,人工智能不断发展,在解决日常人类任务方面变得更加高效。但与此同时,它增加了个人信息滥用的可能性,在分析和传播个人数据方面达到了前所未有的力量和速度水平。在这篇文章中,我想仔细研究一下人工智能系统和机器学习之间的紧密联系,以及它们对日益私密和敏感的数据的使用。

我们将共同探讨现有的隐私风险,讨论机器学习中的传统隐私方法,并分析克服安全漏洞的方法。

隐私在人工智能中的重要性

如今,人工智能被广泛应用于许多领域,包括营销,这已经不是什么秘密了。NLP,即自然语言处理,解释人类语言,用于语音助手和聊天机器人,理解口音和情绪;它将社交媒体内容与参与度联系起来。机器学习采用算法来分析数据、提高性能,并使 AI 能够在没有人为干预的情况下做出决策。深度学习依赖于神经网络,并使用广泛的数据集进行明智的选择。

这些 AI 类型经常协作,对数据隐私构成挑战。人工智能有意地收集数据,用户提供信息,或者无意中,例如通过面部识别。当无意的数据收集导致意外使用,损害隐私时,就会出现问题。例如,在手机上讨论宠物食品或更私密的购买可能会导致有针对性的广告,从而揭示无意的数据收集。人工智能算法虽然很智能,但可能会无意中捕获信息并使其受到未经授权的使用。因此,用于家庭识别的带有面部识别功能的可视门铃可能会无意中收集有关无关个人的数据,从而导致邻居担心监控和数据访问。

考虑到上述情况,建立一个关于使用新人工智能技术的道德决策框架至关重要。应对隐私挑战并考虑技术伦理对于人工智能的持久成功至关重要。其中一个主要原因是,在技术创新和隐私问题之间找到平衡将促进对社会负责的人工智能的发展,有助于公共价值和私人安全的长期创造。

传统方法风险

在我们继续使用有效的隐私保护技术之前,让我们先看看传统方法及其可能面临的问题。传统的隐私和机器学习方法主要围绕两个概念:用户控制和数据保护。用户想知道谁收集他们的数据,出于什么目的,以及这些数据将被存储多长时间。数据保护涉及匿名和加密的数据,但即使在这里,差距也是不可避免的,尤其是在机器学习中,解密通常是必要的。

另一个问题是,机器学习涉及多个利益相关者,从而形成了一个复杂的信任网络。在不同实体之间共享数字资产(例如训练数据、推理数据和机器学习模型)时,信任至关重要。试想一下,有一个实体拥有训练数据,而另一组实体可能拥有推理数据。第三个实体提供在推理上运行的机器学习服务器,由其他人拥有的模型执行。此外,它还在涉及多方的广泛供应链的基础设施上运营。因此,所有实体都必须在复杂的链条中表现出对彼此的信任。管理这个信任网络变得越来越困难。

安全漏洞示例

随着我们更多地依赖使用机器学习的通信技术,数据泄露和未经授权访问的可能性就会增加。黑客可能会试图利用这些系统中的漏洞来获取个人数据,例如姓名、地址和财务信息,这可能导致资金损失和身份盗用。

一份关于恶意使用人工智能的报告概述了三个安全问题领域:现有威胁的扩展、新的攻击方法以及威胁典型特征的变化。恶意使用人工智能的例子包括使用深度伪造技术的BEC攻击,助长了社会工程策略。IBM 的 DeepLocker 演示了 AI 辅助的网络攻击,展示了 AI 如何通过根据趋势和模式做出决策来增强勒索软件攻击。值得注意的是,TaskRabbit 遭受了 AI 辅助的网络攻击,其中支持 AI 的僵尸网络执行了 DDoS 攻击,导致数据泄露,影响了 375 万客户。

此外,网上购物的增加助长了无卡 (CNP) 欺诈,再加上合成身份和身份盗窃问题的上升。预计到 2024 年,其损失可能达到 2000 亿美元,交易量将增长 23% 以上。

保护隐私的机器学习

这时,保护隐私的机器学习就有了解决方案。最有效的技术包括联邦学习、同态加密和差分隐私。联邦学习允许不同的实体在不共享显式数据的情况下共同训练模型。反过来,同态加密可以在整个过程中对加密数据进行机器学习,而差分隐私确保计算输出不会与单个数据存在相关联。这些技术与可信的执行环境相结合,可以有效地解决隐私和机器学习交叉点的挑战。

隐私联邦学习的优势

正如你所看到的,与保护隐私的机器学习技术(尤其是联邦学习)相比,经典的机器学习模型缺乏安全实施人工智能系统和物联网实践的效率。作为机器学习的去中心化版本,联邦学习有助于使 AI 安全保护技术更加可靠。在传统方法中,敏感的用户数据被发送到集中式服务器进行训练,这带来了许多隐私问题,而联邦学习通过允许模型在设备上本地训练来解决这个问题,从而确保用户数据安全。

增强数据隐私和安全性

联邦学习具有协作性质,将边缘上的每个物联网设备视为唯一的客户端,在不传输原始数据的情况下训练模型。这确保了在联邦学习过程中,每个物联网设备只收集其任务所需的信息。通过将原始数据保留在设备上并仅向中央服务器发送模型更新,联邦学习可以保护私人信息,最大限度地降低个人数据泄露的风险,并确保安全操作。

提高数据准确性和多样性

另一个重要问题是,用于训练模型的集中式数据可能无法准确表示模型将遇到的全部数据。相比之下,在来自各种来源的去中心化数据上训练模型并将它们暴露在更广泛的信息中,可以增强模型泛化新数据、处理变化和减少偏差的能力。

更高的适应性

联邦学习模型表现出的另一个优势是无需重新训练即可适应新情况的显着能力,这提供了额外的安全性和可靠性。利用以前经验的见解,这些模型可以做出预测,并将在一个领域获得的知识应用到另一个领域。例如,如果模型在预测特定领域的结果方面变得更加熟练,它可以将这些知识无缝地应用于另一个领域,从而提高效率、降低成本并加快流程。

加密技术

为了增强 FL 中的隐私,通常使用更有效的加密技术。其中包括同态加密和安全多方计算。这些方法可确保数据在通信和模型聚合期间保持加密和安全。

同态加密允许在不解密的情况下对加密数据进行计算。

例如,如果用户想要将数据上传到基于云的服务器,他们可以对其进行加密,将其转换为密文,然后才能上传。然后,服务器将在不解密的情况下处理该数据,然后用户将取回它。之后,用户将使用他们的密钥解密它。

多方计算 (MPC) 使多方(每方都有自己的私有数据)能够评估计算,而不会泄露每方持有的任何私有数据。

多方计算协议确保了隐私性和准确性。各方持有的私人信息不能从协议的执行中推断出来。

如果组内任何一方决定在协议执行过程中共享信息或偏离指令,MPC 将不允许其强迫其他方输出错误结果或泄露任何私人信息。

最后

与其说是结论,不如说是强调在机器学习中采用高级安全方法的重要性和紧迫性。为了在人工智能安全和安保方面取得有效和长期的成果,人工智能开发界与法律和政策机构之间应协调努力。在制定规范、道德、标准和法律方面建立信任并建立积极主动的合作渠道,对于避免技术和政策部门的反应反应和可能无效至关重要。

我还想引用上述报告的作者的话,他们提出了以下建议,以应对人工智能的安全挑战:

  1. 政策制定者应与技术研究人员密切合作,探索、预防和减轻人工智能的潜在恶意应用。
  2. 人工智能研究人员和工程师应认识到其工作的双重用途性质,考虑滥用的可能性,并允许这些考虑影响研究重点和规范。当有害应用是可预见的时,他们还应该积极主动地与相关利益攸关方接触。
  3. 从成熟的研究领域(如计算机安全)中确定最佳实践,并将其应用于解决人工智能中的两用问题。
  4. 积极努力扩大利益攸关方和领域专家对应对这些挑战的讨论的参与。

希望本文能鼓励您自己研究该主题,为更安全的数字世界做出贡献。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/694488.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

spinalhdl,vivado,fpga

https://spinalhdl.github.io/SpinalDoc-RTD/master spinal hdl sudo apt install openjdk-17-jdk scala curl echo “deb https://repo.scala-sbt.org/scalasbt/debian all main” | sudo tee /etc/apt/sources.list.d/sbt.list echo “deb https://repo.scala-sbt.org/scal…

浅谈加密算法(对称加密、非对称加密、混合加密、数字签名、哈希函数)

1、对称加密 对称加密只有一个密钥,直接使用这一个密钥对信息进行加密或解密。这样子就使得对称加密解密十分高效,计算量也相较于非对称加密小很多,适合有大量数据的场合。 密钥只有一个且他一定不能泄漏。由此分发密钥,讲这个密钥…

SQL 练习题目(入门级)

今天发现了一个练习SQL的网站--牛客网。里面题目挺多的,按照入门、简单、中等、困难进行了分类,可以直接在线输入SQL语句验证是否正确,并且提供了测试表的创建语句,也可以方便自己拓展练习,感觉还是很不错的一个网站&a…

ChromeDriver | 谷歌浏览器驱动下载地址 及 浏览器版本禁止更新

在使用selenoum时,需要chrome浏览器的版本和chrome浏览器驱动的版本一致匹配,才能进行自动化测试 一、ChromeDriver驱动镜像网址 国内可以搜到的谷歌浏览器下载地址里面最新的驱动器只有114版本的CNPM Binaries Mirror 在其他博主那找到了最新版本12X的…

【PX4SimulinkGazebo联合仿真】在Simulink中使用ROS2控制无人机沿自定义圆形轨迹飞行并在Gazebo中可视化

在Simulink中使用ROS2控制无人机沿自定义圆形轨迹飞行并在Gazebo中可视化 系统架构Matlab官方例程Control a Simulated UAV Using ROS 2 and PX4 Bridge运行所需的环境配置PX4&Simulink&Gazebo联合仿真实现方法建立Simulink模型并完成基本配置整体框架各子系统实现原理…

识别图片字符-PaddleOCR

PaddleOCR 是由百度开发的一个开源光学字符识别(OCR)工具,它可以识别图片中的文本信息。然而,PaddleOCR 本身主要专注于文本的检测与识别 安装PaddleOCR框架 pip install paddlepaddle paddleocr 使用PaddleOCR识别图片代码 fro…

STL - hash

1、unordered系列关联式容器 在C98中,STL提供了底层为红黑树结构的一系列关联式容器,在查询时效率可达到O(),即最差情况下需要比较红黑树的高度次,当树中的节点非常多时,查询效率也不理想。最好 的查询是,进…

第四十一回 还道村受三卷天书 宋公明遇九天玄女-python创建临时文件和文件夹

宋江想回家请老父亲上山,晁盖说过几天带领山寨人马一起去。宋江还是坚持一个人去。 宋江到了宋家村,被两个都头和捕快们追捕,慌不择路,躲进了一所古庙。一会儿,听见有人说:小童奉娘娘法旨,请星主…

SpringBoot2整合支付宝进行沙箱支付

目录 1. 进入支付宝的开放平台 2. 导入Maven依赖 3. 配置application.yml文件 NATAPP.cn(内网穿透工具) 注册登录 下载 4. 后端配置 5. 测试 1. 进入支付宝的开放平台 开发平台: 支付宝开放平台 登录后,点击控制台 点击最下面的沙箱 2. 导入Maven依赖 <dependency…

频率主义线性回归和贝叶斯线性回归

整体概述 频率主义&#xff08;Frequentist&#xff09;线性回归和贝叶斯&#xff08;Bayesian&#xff09;线性回归是统计学中用于数据分析和预测的两种主要方法&#xff0c;特别是在建模关于因变量和自变量之间线性关系的上下文中。尽管两种方法都用于线性回归分析&#xff…

【LeetCode】746. 使用最小花费爬楼梯(简单)——代码随想录算法训练营Day38

题目链接&#xff1a;746. 使用最小花费爬楼梯 题目描述 给你一个整数数组 cost &#xff0c;其中 cost[i] 是从楼梯第 i 个台阶向上爬需要支付的费用。一旦你支付此费用&#xff0c;即可选择向上爬一个或者两个台阶。 你可以选择从下标为 0 或下标为 1 的台阶开始爬楼梯。 …

Git 客户端可视化工具tortoisegit

Git 使用教程 git一点通 (kdocs.cn) 二、Git 客户端可视化工具-推荐 1.常用工具 tortoisegit 官网 https://tortoisegit.org/ 推荐 sourcetree 官网 https://www.sourcetreeapp.com/ 2.tortoisegit安装 2.1 下载安装包 2.2 下载语言包 2.3 安装 2.4 安装语言包 5.使用 5.1 新建…

C++ CRTP设计范式

CRTP&#xff08;Curiously Recurring Template Pattern&#xff09;奇异递归模板范式是一个相对少有人知的C设计范式&#xff0c;它可以实现基类指针调用派生类的函数&#xff0c;从而实现另类多态。 如&#xff1a; #include <iostream> // 基类模板&#xff0c;接受…

Sora 一款文本转视频模型

**Sora** 是一个由美国人工智能研究机构 **OpenAI** 开发的 AI 视频模型。让我们一起了解一下这个令人兴奋的项目&#xff1a; 1. **名称和含义**&#xff1a; - 在日语中&#xff0c;**Sora** 是“天空”的意思&#xff0c;引申含义还有“自由”。 - **Sora** 的官方介绍页上展…

js之事件循环

JavaScript的事件循环是它的并发模型的核心部分&#xff0c;使得JavaScript能够在单线程中处理异步操作。事件循环允许JavaScript在执行代码时&#xff0c;同时进行非阻塞的I/O操作&#xff08;如网络请求、文件操作等&#xff09;。这个概念对于理解如何高效地构建交互式Web应…

本地模拟发送、接收RabbitMQ数据

文章目录 前言一、相关文章二、相关代码1.模拟的 Channel 类2.接收消息3.模拟推送MQ数据前言 日常开发中,当线上RabbitMQ坏境还没准备好时,可在本地模拟发送、接收消息 一、相关文章 Docker安装RabbitMQ 【SpringCloud】整合RabbitMQ六大模式应用(入门到精通) Spring R…

Spring学习笔记(三)--Spring中的Bean的管理

一、什么是Bean Bean是注册到Spring容器中的Java类&#xff0c;控制反转和依赖注入都是通过Bean实现的&#xff0c;任何一个Java类都可以是一个Bean。Bean由Spring进行管理&#xff0c;可以通过xml文件对bean进行配置和管理。 二、BeanFactory接口和ApplicationContext接口&a…

利用Python实现科学式占卜

一直以来&#xff0c;中式占卜都是基于算命先生手工实现&#xff0c;程序繁琐&#xff08;往往需要沐浴、计算天时、静心等等流程&#xff09;。准备工作复杂&#xff08;通常需要铜钱等道具&#xff09;&#xff0c;计算方法复杂&#xff0c;需要纯手工计算二进制并转换为最终…

2023年12月 Python(六级)真题解析#中国电子学会#全国青少年软件编程等级考试

Python等级考试(1~6级)全部真题・点这里 一、单选题(共25题,共50分) 第1题 运行以下程序,输出的结果是?( ) class A():def __init__(self,x):self.x=x

手机连接电脑后资源管理器无法识别(识别设备但无法访问文件)

问题描述 小米8刷了pixel experience系统,今天用电脑连接后无法访问手机文件,但是手机选择了usb传输模式为文件传输 解决办法 在设备和打印机页面中右键选择属性 点击改变设置 卸载驱动,注意勾选删除设备的驱动程序软件 卸载后重新连接手机,电脑弹出希望对设备进行什么操作时…