第55期|GPTSecurity周报

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. REVS: 通过词汇空间中的排名编辑在语言模型中消除敏感信息

简介:大语言模型(LLMs)可能无意中记住并泄露训练数据中的敏感信息,引发隐私担忧。为解决此问题,研究者提出了一种名为REVS的创新模型编辑技术。该技术通过识别和修改与敏感信息相关的神经元子集来消除这些信息。REVS将这些神经元映射到词汇空间,以确定生成敏感内容的关键组件,并通过计算反嵌入矩阵的伪逆来编辑模型,从而减少敏感数据的生成。研究者通过电子邮件数据集和合成的社会保障号码数据集这两个数据集,验证了REVS的有效性。结果表明,REVS在消除敏感信息和抵御提取攻击方面表现出色,同时保持了模型的完整性。

链接:

https://arxiv.org/pdf/2406.09325

2. 人工智能作为新黑客:开发用于进攻性安全的智能体

简介:在网络安全领域,人工智能(AI)技术正被用于开发自主攻击代理ReaperAI,以模拟和执行网络攻击。通过利用大语言模型如GPT-4的能力,ReaperAI能够自主识别和利用安全漏洞。在多个平台上的测试表明,ReaperAI成功利用已知漏洞,展示了其在进攻性安全策略中的潜力。然而,AI在进攻性安全中的应用也引发了伦理和操作上的挑战,包括命令执行、错误处理和伦理约束。本研究强调了AI在网络安全中创新应用的重要性,并提出了未来研究方向,包括AI与安全工具的交互优化、学习机制的提升以及伦理指导方针的讨论。

链接:

https://arxiv.org/abs/2406.07561

3. 利用大语言模型(LLM)辅助的代码补全模型易触发后门攻击:注入伪装的漏洞以对抗强检测

简介:大语言模型(LLMs)在软件工程中通过提供上下文建议显著提高了代码补全的效率。然而,这些模型在特定应用中的微调可能遭受中毒和后门攻击,导致输出被秘密篡改。为应对这一安全威胁,研究者提出了CodeBreaker,这是一个利用LLMs(如GPT-4)进行复杂载荷转换的后门攻击框架,确保中毒数据和生成代码能够绕过强漏洞检测。CodeBreaker通过直接将恶意载荷集成到源代码中,挑战了现有的安全措施,凸显了对代码补全系统加强防御的必要性。实验和用户研究证实了CodeBreaker在不同环境下的攻击效能,证明了其在现有方法中的优越性。

链接:

https://arxiv.org/abs/2406.06822

4. SecureNet: DeBERTa与大语言模型在钓鱼检测中的比较研究

简介:在网络安全领域,钓鱼攻击通过社会工程学手段诱骗用户泄露敏感信息,对组织构成重大威胁。本文探讨了大语言模型(LLMs)在检测钓鱼内容方面的潜力,并与DeBERTa V3模型进行了比较。通过使用包括电子邮件、HTML、URL、短信和合成数据在内的公共数据集,研究者系统地评估了这些模型的性能和局限性。

研究发现,基于Transformer的DeBERTa模型在检测钓鱼内容方面表现最佳,其召回率高达95.17%,而GPT-4的召回率为91.04%。此外,研究者还探讨了这些模型在生成钓鱼邮件方面的挑战,并评估了它们在这一背景下的性能。研究结果为未来加强网络安全措施提供了宝贵的见解,有助于更有效地检测和应对钓鱼威胁。

链接:

https://arxiv.org/abs/2406.06663

5. 探索大语言模型(GPT-4)在二进制逆向工程中的有效性

简介:本研究探讨了大语言模型(LLMs),特别是GPT-4,在二进制逆向工程(RE)领域的应用能力。通过结构化的实验方法,研究者分析了LLMs在解释人类编写的和反编译的代码方面的性能。研究包括两个阶段:第一个阶段关注基本代码解释,第二个阶段则涉及更复杂的恶意软件分析。关键发现表明,LLMs在一般代码理解方面表现出色,但在详细的技术和安全分析方面效果各异。

研究强调了LLMs在逆向工程中的潜力和当前的局限性,为未来应用和改进提供了关键的见解。此外,研究者还检查了实验方法,如评估方法和数据限制,为研究者未来在此领域的研究活动提供了技术视野。

链接:

https://arxiv.org/abs/2406.06637

6. OccamLLM:单步快速精确语言模型算术

简介:为了提高大语言模型(LLMs)在执行复杂算术运算时的准确性,研究者提出了一种新框架,该框架允许在单个自回归步骤中进行精确的算术运算。通过利用LLM的隐藏状态来控制符号架构,研究者的方法在单个算术运算上达到了100%的准确率,与GPT-4相当,甚至在多步骤推理问题上也超过了Llama 3 8B Instruct和GPT-3.5 Turbo。该方法不仅提高了速度和安全性,还保持了LLM的原有能力。研究者计划不久后公开代码,以促进更广泛的研究和应用。

链接:

https://arxiv.org/abs/2406.06576

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/29786.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

操作系统笔记(自用随笔)

如有错误,欢迎指正!!!

【Linux Vim的保姆级教程】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

【网络安全的神秘世界】Kali 自带 Burp Suite 使用指南:字体与CA证书设置详解等

🌝博客主页:泥菩萨 💖专栏:Linux探索之旅 | 网络安全的神秘世界 | 专接本 | 每天学会一个渗透测试工具 Kali 自带 Burp Suite 使用指南目录 Burp Suite的打开方式设置Burp Suite软件的字体大小查看Burp Suite 默认代理在火狐浏览器…

智能机械设备如何远程运维?向日葵SDK提供专业方案

随着物联网技术的不断发展,智能化、自动化的物联网机器人设备开始出现在诸多行业中,大幅提升生产效率,带动产业转型和升级,比较有代表性的包括农业、园艺、施工、测绘和设施服务等领域。 在这些传统意义上“人力密集型”的产业中…

c++里 lamda 表达式,其实被编译器处理为匿名类,并实例化为匿名对象

该匿名对象定义了括号 () 运算符函数,所以可以像函数一样被调用。 lamda 表达式必须在函数作用域中定义。通过按值捕获或按引用捕获,可以使用所在函数中定义的变量。在类的成员函数中定义的 lamda 表达式,若捕获了 this ,则可以修…

SpringBoot的入门案例

1、创建一个Maven工程 2、点击设置自动导入jar包 3、导入spring boot需要的依赖 打开sping boot的文档 导入依赖的pom.xml配置内容 4、创建一个spring boot的执行入口程序 5、写controller,service,dao的页面逻辑代码 6、测试,运行工程&#…

总结一下 C# 如何自定义特性 Attribute 并进行应用

前言 Attribute(特性)是一种用于为程序元素(如类、方法、属性等)提供元数据信息的方法。 特性是一种声明式的信息,附加到程序元素上,提供额外的数据用于描述和控制这些元素的行为。 在编译和运行时&…

Git快速上手

初识Git 是一个免费开源, 分布式的代码版本控制系统, 帮助开发团队维护代码 作用: 记录代码内容,切换代码版本,多人开发时高效合并代码内容 Git和GitHub Git是一个软件, Github是一个网站,两者的功能都是提供版本控制服务. 官网: GitHub: Let’s build from here GitHub …

oracle12c到19c adg搭建(三)oracle19c数据库软件安装

由于这里的19c是做备库所以我们只安装软件不用创建实例,实例由主库同步过来 解压软件到安装目录 注意19c得db要直接解压到19c得软件安装目录 [rooto12u19p software]# ls V982063-01.zip [rooto12u19p software]# ls -ll total 2987996 -rw-r--r-- 1 root ro…

【css】创建一个带有上矩形和下倒三角角标

涉及到的主要CSS属性&#xff1a; clip-path&#xff1a;使用CSS剪切路径属性创建上矩形和下倒三角形的形状。 transform: scale(0.8);&#xff1a;缩小角标的大小&#xff0c;使其看起来更协调。完整html及css: <!DOCTYPE html> <html lang"en"><h…

PAT B1008. 数组元素循环右移问题

题目描述 一个数组A中存有N(N>O)个整数&#xff0c;在不允许使用另外数组的前提下&#xff0c;将每个整数循环向右移M(M≥0)个位置,即将A中的数据由( …)变换为(……)(最后M个数循环移至最前面的M个位置)。如果需要考虑程序移动数据的次数尽量少,则应如何设计移动的方法?输…

Harbor本地仓库搭建002_Harbor负载均衡节点搭建_nginx安装配置_harbor安装---分布式云原生部署架构搭建002

负载均衡的机器. 可以看到上面是安装nginx的过程 首先去编辑一下yum仓库地址,配置一下nginx的仓库地址 然后这个是配置的内容 然后在进行安装之前最好yum makecache fast 更新一下缓存,这样安装的时候 会安装最新的包 然后就可以安装nginx yum -y install nginx 然后去

设备档案包括哪些内容

设备档案通常包括以下内容和要求&#xff1a; 1. 设备基本信息&#xff1a;包括设备名称、型号、规格、生产厂商、出厂日期、购买日期等。 2. 设备安装信息&#xff1a;包括设备的安装位置、安装日期、安装人员等。 3. 设备维护信息&#xff1a;包括设备的维护保养记录&#xf…

C++类与对象、类的6个默认成员函数、构造函数、析构函数等的介绍

文章目录 前言一、类的6个默认成员函数二、构造函数1. 概念2. 特性1. 无参构造函数2. 带参构造函数3. 编译器默认生成的无参构造函数 3. 构造函数的初始化4. 默认构造函数 三、析构函数1. 概念2. 特性3. 编译器默认生成的析构函数的作用4. 构造函数的使用 总结 前言 C类与对象…

docker容器中连接宿主机mysql数据库

最近要在docker中使用mysql数据库&#xff0c;首先考虑在ubuntu的镜像中安装mysql&#xff0c;这样的脚本和数据库都在容器中&#xff0c;直接访问localhost&#xff1a;3306&#xff0c;脚本很简单&#xff0c;如下&#xff1a; import pymysql# 建立数据库连接 db pymysql.…

HTML5基本语法

文章目录 HTML5基本语法一、基础标签1、分级标题2、段标签3、换行及水平线标签4、文本格式标签 二、图片标签1、格式2、属性介绍 三、音频标签1、格式2、属性介绍 四、视频标签1、格式2、属性介绍 五、链接标签1、格式2、显示特点3、属性介绍4、补充&#xff08;空链接&#xf…

拼多多,藏着水果版中国地图

越来越多人开始在拼多多买水果。在发现这个现象后&#xff0c;我询问他们同一个问题&#xff1a;“那你收到过烂掉的吗&#xff1f;” 几乎所有频繁下单的人都告诉我&#xff0c;收到过。他们在拼多多买全国各地的水果&#xff0c;偶尔收到烂掉的&#xff0c;但依然会继续在拼…

工业物联网关为智能制造业提供哪些支撑?天拓四方

随着科技的飞速发展&#xff0c;智能制造业已成为工业领域的转型方向。在这一转变中&#xff0c;工业物联网关发挥着至关重要的作用。作为连接物理世界与数字世界的桥梁&#xff0c;工业物联网关不仅实现了设备与设备、设备与云平台之间的互联互通&#xff0c;更通过实时数据采…

设计模式(五)创建者模式之工厂模式

工厂模式 工厂模式上面类图代码实现Coffee 抽象类AmericanCoffeeLatterCoffeeCoffeeStoreUser 简单工厂模式增加工厂方法更改CoffeeStore 类优缺点扩展静态工厂 工厂方法模式概念结构具体类图代码实现Coffee类AmericanCoffeeLatterCoffee抽象工厂CoffeeFactoryAmericanCoffeeFa…

Android studio中如何下载sdk

打开 file -> settings 这个页面, 在要下载的 SDK 前面勾上, 然后点 apply 在 platforms 中就可以看到下载好的 SDK: 如果sdk下载失败是不是硬盘没有权限&#xff0c;管理员权限从启android studio运行下载sdk