研究人员发现 OpenAI ChatGPT、Google Gemini 的漏洞

自 OpenAI 推出 ChatGPT 以来,生成式 AI 聊天机器人的数量及其在企业中的采用率在一年多时间里呈爆炸式增长,但网络安全专业人士的担忧也随之增加,他们不仅担心威胁组织对新兴技术的使用,还担心大型网络的安全性及模型(LLM)本身。

网络安全供应商的研究人员分别发现了 ChatGPT 和 Gemini 中的漏洞,Gemini 是谷歌的生成式人工智能聊天机器人,直到上个月还被称为 Bard。

API 安全公司 Salt Security 公布了ChatGPT 插件中的安全漏洞,这些漏洞可能会让不良行为者访问第三方网站上的帐户和敏感数据。在收到有关漏洞的通知后,OpenAI 和第三方供应商修复了这些问题。没有迹象表明这些缺陷被广泛利用。

人工智能安全供应商 HiddenLayer 在一份报告中表示,不良行为者可以操纵 Gemini 的 LLM 泄露系统提示,使其遭受更有针对性的攻击,从而制造错误信息,这是美国和其他国家为高水平做好准备时的一个关键问题。今年的个人资料选举 - 并通过 Google Workspace 间接注入来伤害用户。

随着企业加大对生成式人工智能工具的采用力度,Salt Security 的研究机构 Salt Labs 和 HiddenLayer 的研究是对安全性的重要检查。云安全公司赞助的一项 IDC 调查发现,三分之二的受访者表示,他们已经在公司的任一部门或更广泛的范围内部署了生成式人工智能。

Box 在 1 月份的一篇博客文章中写道:“随着组织寻求技术来实现业务流程自动化、提高员工生产力和降低成本,企业对人工智能的采用正在推动这些增长趋势。 ”

鉴于此,密切关注安全性非常重要。

生成式人工智能给企业带来了很多好处,最终几乎所有公司都会以某种方式使用生成式人工智能。我们支持旨在引入新功能的公司。只要安全地完成,这就是一件好事。然而,这一领域的快速发展带来了巨大的网络安全差距,需要比平时更多的关注。

生成式人工智能生态系统

在 ChatGPT 的报告中,该框架和其他生成式 AI 框架的早期版本仅保存在训练过程中可用的数据,这限制了可以向他们提出的问题。那已经改变了。

为了解决这些问题,所有主要的生成式人工智能平台都包含生成式人工智能生态系统的概念,它允许生成式人工智能平台与外部服务之间的连接和数据交换。这些服务可以是任何东西,从简单的互联网搜索到特定服务的连接,如 GitHub、Google Drive、Saleforce 等。

通过这一点,ChatGPT 不仅仅是一个对话式聊天机器人,而是一个“可以在广泛的平台上运行、简化工作流程并提供更具互动性和生产力的体验的强大工具。” 与生成式人工智能的大规模增长类似,这些外部连接获得了很大的吸引力,并且很快扩展(并且仍在增长)以包括数百个不同的外部连接。

生成式人工智能生态系统概念使 ChatGPT 和其他聊天机器人通过其插件入口点对第三方构成威胁。这些插件允许 ChatGPT 将敏感数据发送到第三方网站,有时还允许访问 Google Drive、GitHub 和其他地方的私人帐户。

ChatGPT 的缺陷

Salt Labs 研究人员在 ChatGPT 插件中发现了三种类型的缺陷,其中一种存在于 ChatGPT 中。当用户安装新插件时,聊天机器人会将其重定向到插件网站以获取必须经过用户批准的代码。使用 OAuth 批准的代码,ChatGPT 会自动安装插件,并可以代表用户与插件进行交互。黑客可以利用该功能并通过新的恶意插件提供代码批准,让攻击者在受害者的帐户上安装其凭据。

由于攻击者是该插件的所有者,因此他可以看到受害者的私人聊天数据,其中可能包括凭据、密码或其他敏感数据。

PluginLab 中的另一个缺陷(开发人员和组织用它来开发 ChatGPT 插件)没有正确验证用户帐户。它可能允许攻击者插入另一个用户 ID 并获取代表受害者的代码,从而允许他们接管帐户。第三个漏洞是在多个插件中发现的,这些插件不会将攻击者发送给受害者的经过验证的 URL 发送给受害者,从而让他们接管帐户。

API 攻击的威胁日益严重

总体而言,针对 API 的攻击是一个日益严重的问题,Salt 的 2023 年第一季度 API 安全报告发现,针对 Salt 客户的攻击比前六个月增加了 400%。API 是每个现代应用程序的核心,生成式人工智能也不例外。

这些 API(确切的通信)经常暴露给攻击者,让攻击者看到来自服务器的任何请求和响应,这是一个与 LLM 相关的新攻击面。

Salt 在 ChatGPT 中的发现适用于任何生成式 AI 平台,尽管重点是 OpenAI 的聊天机器人。HiddenLayer 研究人员在关于 Gemini 中发现的缺陷的报告中也有类似的信息,其中包括 LLM 提示泄露和越狱。

Gemini

Gemini 具有三种型号尺寸:Gemini Nano 适用于设备上处理等轻量级应用;Pro,用于扩展广泛的任务;Ultra,用于复杂的任务。它与 OpenAI 的 GPT-4 竞争。HiddenLayer 的大部分测试都是在 Gemini Pro 上运行的。

Gemini Pro 模型目前为开发人员提供了灵活、可访问的人工智能模型。其均衡的性能和功能使其非常适合为聊天机器人、内容生成工具、搜索改进系统以及其他需要自然语言理解和生成的应用程序提供支持。

第一个漏洞导致系统提示泄露,这是给 LLM 的指令。如果黑客对它们进行逆向工程以窃取它们或创建更有效的攻击或从中窃取敏感信息(例如密码),则即时泄漏是危险的。HiddenLayer 研究人员能够操纵提示绕过护栏并获得准确的指令。

这种攻击利用了 LLM 的逆缩放特性,随着 LLM 规模越来越大,对现有的每一个攻击示例进行微调变得极其困难。因此,模型往往容易受到同义词攻击,而原始开发人员可能没有对它们进行过训练。

他们还能够使用重置模拟方法让系统从提示中泄漏信息。

越狱LLM

此外,研究人员还可以通过使用虚构的故事来操纵 Gemini Pro,以绕过谷歌为防止不良行为者利用法学硕士越狱产生有关选举的错误信息而设置的防御措施。

这次越狱攻击表明,尽管该模型已被调整为拒绝任何有关选举的错误信息(尝试一下!),但它无法防止所有错误信息。

研究人员进行演示的同一周,谷歌概述了今年在美国和印度为防止错误信息和其他与选举相关的威胁而采取的措施。

HiddenLayer 还成功地对 Gemini Ultra 使用了相同的越狱攻击,包括让聊天机器人创建热接线汽车的指令,并提取部分系统提示,不过 这是一种“稍微调整的方法”。研究人员发现了 Ultra 中的一些其他漏洞,这些漏洞展示了反向扩展效应,其中最大的漏洞是利用 LLM 推理能力的多步骤越狱。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/757052.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

点云预处理——滤波、旋转和平移等处理

目录 一、环境配置 二、步骤 一、环境配置 安装好ubuntu系统和ROS环境 操作系统: Ubuntu 20.04 wget http://fishros.com/install -O fishros && . fishros 二、步骤 打开终端,并在终端命令行输入以下指令: git clone https://gitee.com/wccworld/…

MNN Session 创建执行器(六)

系列文章目录 MNN createFromBuffer(一) MNN createRuntime(二) MNN createSession 之 Schedule(三) MNN createSession 之创建流水线后端(四) MNN Session::resize 之流水线编码&am…

MFC界面美化第三篇----自绘按钮(重绘按钮)

1.前言 最近发现读者对我的mfc美化的专栏比较感兴趣,因此在这里进行续写,这里我会计划写几个连续的篇章,包括对MFC按钮的美化,菜单栏的美化,标题栏的美化,list列表的美化,直到最后形成一个完整…

中小企业Java/SpringBoot体系技术抽象沉淀

目录 1. 起因 2. 参考 3.总结: 1. 起因 企业开发的过程中会逐渐沉淀自己的一些公共starter&方法等;建议可以整合开源项目与自身沉淀的一些做一个统一的parent包 2. 参考 内容参考内容框架包,基础core包,统一返回&#x…

详解Redis的持久化RDB和AOF

Redis的持久化是将内存中的数据同步到硬盘的过程 具体来说,Redis支持两种主要的持久化方式:RDB 和 AOF。 RDB(Redis Database) 简介 默认持久化方式 RDB会将内存中的数据快照保存到磁盘上的一个二进制文件中。这个文件包含了…

创建React+Ts项目

1.创建脚手架 create-react-app 项目名称 --template typescript 2.配置路径别名 配置路径别名---React_h5 路径别名设置-CSDN博客 3.添加组件库 npm i antd --save App.tsx 文件 引用 ant design react import React from react;import { Button } from antd;function …

NLP---Bert分词

目录&#xff1a; Q&#xff1a;bert分词步骤1&#xff1a;构建N * N 的相关性矩阵&#xff0c;计算相邻两个字的相关性&#xff0c;低的话&#xff08;<阈值&#xff09;就切割。2&#xff1a;将A词进行mask计算出A的embedding&#xff0c;然后将AB两个词一起mask&#xff…

4.线性数据结构——3.栈及例题

标准库的栈 定义&#xff1a;stack<typename> myStack;大小&#xff1a;size()压栈&#xff1a;push()弹栈&#xff1a;pop()栈顶&#xff1a;top()判空&#xff1a;empty() #include <cstdio> #include <string> #include <map> #include <algor…

视觉信息处理和FPGA实现第5次作业-Matlab实现图像逆时针旋转90度

一、Matlab2022a安装 链接&#xff1a;https://pan.quark.cn/s/6e177bc7c11d 提取码&#xff1a;dKNN 二、Matlab使用 2.1 新建一个脚本文件&#xff08;.m文件&#xff09; 2.2 另存为到便于归档的地方 考虑到.m文件如果不是全英文路径&#xff0c;也有可能会出问题&#…

Linux 服务升级:MySQL 主从(半同步复制) 平滑升级

目录 一、实验 1.环境 2.Mysql-shell 检查工具兼容性 3.逻辑备份MySQL数据 4.备份MySQL 数据目录、安装目录、配置文件 5.MySQL 升级 6.master节点 使用systemd管理mysql8 7. slave1 节点升级 8. slave2 节点升级 9.半同步设置 二、问题 1.mysqldump备份报错 2.Inn…

Docker部署dart-frog服务

参考&#xff1a; dart-frog官网&#xff1a;https://dartfrog.vgv.dev/docs/overview 使用 Dart Frog 体验 Dart 服务端开发 - 简书 打包项目 按照demo新增项目后&#xff0c;执行&#xff1a; dart_frog build 等待build后生成 build 文件夹&#xff0c;这个文件夹就是需要…

【爬虫】专栏文章索引

为了方便 快速定位 和 便于文章间的相互引用等 作为一个快速准确的导航工具 爬虫 目录&#xff1a; &#xff08;一&#xff09;web自动化和接口自动化 &#xff08;二&#xff09;实战-爬取Boss直聘信息数据

详细分析Python模块中的雪花算法(附模板)

目录 前言1. 基本知识2. 模板3. Demo 前言 分布式ID的生成推荐阅读&#xff1a;分布式ID生成方法的超详细分析&#xff08;全&#xff09; 1. 基本知识 Snowflake 算法是一种用于生成全局唯一 ID 的分布式算法&#xff0c;最初由 Twitter 设计并开源 它被设计用于解决分布式…

使用甘特图实现高效时间规划

甘特图虽然看似简单,却蕴含着规划时间的奥秘。它将复杂的工序分解成逻辑严密的任务链条,每个短小的条形图块都清晰地道出一个任务的起始、持续和终止。就像指挥家挥舞手中的棒,每个动作都精确拍着节奏,确保各个乐手分工合作、行云流水。择一个好用的甘特图制作工具,会让你事半功…

C#,图论与图算法,有向图(Graph)之环(Cycle)判断的颜色算法与源代码

1 检查该图是否包含循环 给定一个有向图,检查该图是否包含循环。如果给定的图形至少包含一个循环,则函数应返回true,否则返回false。 方法:深度优先遍历可用于检测图中的循环。连接图的DFS生成树。只有当图中存在后缘时,图中才存在循环。后边是从节点到自身(自循环)或…

Linux umount命令教程:如何安全地卸载文件系统(附实例详解和注意事项)

Linux umount命令介绍 umount命令在Linux和UNIX操作系统中用于卸载已挂载的文件系统。它通过从Linux默认文件系统的挂载点删除连接&#xff0c;使外部设备或目录不再是Linux文件系统层次结构的一部分。这个命令确保任何正在进行的文件操作都已完成&#xff0c;防止数据损坏或丢…

.NET 异步编程(异步方法、异步委托、CancellationToken、WhenAll、yield)

文章目录 异步方法异步委托async方法缺点CancellationTokenWhenAllyield 异步方法 “异步方法”&#xff1a;用async关键字修饰的方法 异步方法的返回值一般是Task<T>&#xff0c;T是真正的返回值类型&#xff0c;Task<int>。惯例&#xff1a;异步方法名字以 Asy…

ClickHouse列式存储基础笔记

一、基础概念 ClickHouse是俄罗斯Yandex在2016年开源&#xff0c;使用C编写的列式存储数据库&#xff0c;近几年在OLAP领域大范围应用。国内&#xff1a;阿里、字节、腾讯 、虎牙、青云、新浪等在使用&#xff1b;国外&#xff1a;优步、Ebay、Spotify、思科等在使用. 官网&a…

已解决redis.clients.jedis.exceptions.JedisConnectionException异常的正确解决方法,亲测有效!!!

已解决redis.clients.jedis.exceptions.JedisConnectionException异常的正确解决方法&#xff0c;亲测有效&#xff01;&#xff01;&#xff01; 目录 问题分析 报错原因 解决思路 解决方法 总结 博主v&#xff1a;XiaoMing_Java redis.clients.jedis.exceptions.JedisC…

linux之centos7vmware虚拟机的安装

目录 一、下载合适的vmware和操作系统镜像安装文件 来自引用文章的软件下载本片文章使用的软件下载 二、根据教程进行安装 三、网络配置解说 四、配置网络 编辑虚拟机网络 对VMWARE虚拟机网络进行配置 设置虚拟机网络为NAT模式 设置自定义网络为 VMnet8(NAT模式) 编辑li…