第69期 | GPTSecurity周报

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. AutoSafeCoder:通过静态分析和模糊测试保障LLM代码生成安全的多智能体框架

简介:最近,大语言模型(LLM)的自动代码生成技术取得了重大进展,推动着我们向完全自动化安全软件开发的目标迈进了一步。然而,现有的方法多依赖单一智能体进行代码生成,这种方式难以生成安全且无漏洞的代码。传统基于 LLM 的程序合成主要关注功能正确性,常常忽视运行时的动态安全隐患。为解决这些问题,研究者提出了 AutoSafeCoder——一个多智能体框架,该框架利用 LLM 驱动的智能体进行代码生成、漏洞分析以及通过持续协作进行安全增强。此框架由三个智能体组成,分别是负责代码生成的编码智能体、识别漏洞的静态分析智能体以及使用基于变异的模糊测试方法进行动态测试以检测运行时错误的模糊测试智能体。研究者的贡献在于通过在代码生成过程中整合动态和静态测试,以迭代的方式提高 LLM 生成代码的安全性。基于 SecurityEval 数据集的实验结果表明,与基准 LLM 相比,代码漏洞减少了 13%,且未对功能性造成影响。

链接:

https://arxiv.org/abs/2409.10737

2. PROMPTFUZZ:利用模糊测试技术对大语言模型中的提示注入进行鲁棒性测试

简介:大语言模型(LLMs)虽在各种应用中广泛使用,但其安全性和可靠性因提示注入攻击而引发担忧。提示注入攻击可通过恶意提示覆盖模型原始指令操纵生成文本,确保 LLM 抵御此类攻击的鲁棒性对其在现实世界尤其是关键任务中的部署至关重要。

研究者提出新颖测试框架 PROMPTFUZZ,利用模糊测试技术系统性评估 LLM 抵御提示注入攻击的鲁棒性。该框架受软件模糊测试启发,分为准备和重点两个阶段。准备阶段选择有潜力的初始种子并收集少量示例;重点阶段利用收集的示例生成多样化高质量提示注入,能发现更多 LLM 漏洞。在实际竞赛中,部署 PROMPTFUZZ 生成的攻击提示后,在 4000 多名参与者中获得第七名,仅用时 2 小时。此外,研究者还构建数据集用于微调 LLM 以增强其抗攻击鲁棒性,即便微调后,PROMPTFUZZ 仍能发现漏洞。

总之,研究者的工作突出了有效测试工具的关键需求,提供了实用框架用于评估和提高 LLM 抵御提示注入攻击的鲁棒性,强调了对 LLM 进行鲁棒性测试的重要性。

链接:

https://arxiv.org/abs/2409.14729

3. 针对大语言模型的有效且具有规避性的模糊测试驱动越狱攻击

简介:近年来,研究者发现大语言模型(LLMs)虽然在多项任务中表现出色,但仍然容易遭受越狱攻击,攻击者通过提示设计误导模型生成有害内容。现有越狱方法依赖手动设计模板,扩展性差,或生成语义不连贯的提示,容易被检测到。为解决这些问题,研究者提出了一种自动化黑盒越狱攻击框架,通过结合黑盒模糊测试与定制化设计,克服了传统方法的局限性。

该框架无需手动设计模板,从空种子池开始,依靠三个新型问题相关变异策略生成语义连贯且简短的提示。同时,研究者设计了两级评判模块,精确识别成功的越狱攻击。在对7个主流LLMs的评估中,该方法在GPT-3.5 Turbo、GPT-4和Gemini-Pro上的攻击成功率分别超过90%、80%和74%,相比现有基线提升了60%以上。此外,提示长度大幅缩短,语义连贯性得到保持,且对最先进的防御措施具有较强鲁棒性。

链接:

https://arxiv.org/abs/2409.14866

4. 攻击图谱:从实践者的角度看生成式人工智能红队测试中的挑战与陷阱

简介:随着生成式人工智能,特别是大语言模型(LLMs)逐渐融入生产应用,新的攻击面和漏洞不断出现,进一步增强了对自然语言和多模态系统中对抗性威胁的关注。在这一背景下,红队测试在主动识别系统弱点方面变得尤为重要,而蓝队则专注于抵御这些对抗性攻击。尽管学术界对生成式人工智能的对抗风险日益重视,但针对实践者在实际环境中评估和缓解这些挑战的指导仍显不足。

为此,研究者提出了以下贡献:(1) 对保护生成式人工智能的红队和蓝队策略进行了实用性检验;(2) 识别了防御开发和评估过程中面临的关键挑战及未解问题;(3) 提出了“攻击图谱”,这是一个直观的框架,为分析单轮输入攻击提供了实用的方法,使其成为实践者的重要参考工具。此项研究旨在弥合学术见解与生成式人工智能系统保护的实际安全措施之间的差距,以增强对抗性威胁的应对能力。

链接:

https://arxiv.org/abs/2409.15398

5. LSAST — 通过LLM支持的静态应用安全测试增强网络安全

简介:在快速发展的网络安全领域,研究者们认识到大语言模型(LLMs)在分析软件代码方面发挥着至关重要的作用,持续提升其性能。本文提出了一种创新的漏洞扫描方法,通过将保守的静态应用安全测试(SAST)扫描器与LLM能力相结合,构建了LSAST(LLM支持的静态应用安全测试)框架。该方法显著增强了LLM在漏洞扫描中的性能,确立了该领域的新标准。

研究者们对LSAST的效率进行了基准测试,并将其结果与最先进的LLM进行了对比分析。同时,本文还讨论了LLM在漏洞扫描过程中存在的固有缺陷,包括对静态训练数据集的依赖,导致最新漏洞的遗漏,以及将代码发送至第三方LLM提供商所引发的隐私问题。为解决这些挑战,研究者们采用了一个开源LLM,以确保用户隐私,并提出了一种新颖的方法来收集相关的漏洞信息,从而为LLM提供最新的知识。这一工作为提升网络安全中的漏洞扫描能力提供了有效的解决方案。

链接:

https://arxiv.org/abs/2409.15735

6. APILOT:通过避开过时API陷阱,导航大语言模型生成安全代码

简介:随着大语言模型(LLMs)的快速发展,研究者们发现其应用领域已扩展至代码辅助等多个方面。然而,LLMs的庞大规模使得训练过程非常耗费资源和时间,频繁的再训练或更新变得不切实际。因此,时效性数据可能会过时,从而在时效性任务中误导LLMs。例如,每天都会在各种程序中发现新的漏洞,如果不更新知识,LLMs可能会不小心生成包含这些新发现漏洞的代码。当前的策略,如提示工程和微调,并未有效解决这一问题。

为了解决这一挑战,研究者提出了名为APILOT的解决方案,该方案维护了一个实时、快速可更新的过时API数据集。此外,APILOT利用增强生成方法,通过该数据集引导LLMs生成安全的、版本感知的代码。研究者们进行了全面评估,以衡量APILOT在减少七种不同最先进LLMs中过时API推荐的有效性。评估结果显示,APILOT平均可以减少89.42%的过时代码推荐,且性能开销有限。值得注意的是,APILOT在增强安全性的同时,还提高了LLMs生成代码的可用性,平均提升了27.54%。这一研究成果突显了APILOT在当代软件开发环境中同时提升代码建议的安全性和实用性的双重能力。

链接:

https://arxiv.org/abs/2409.16526

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/55737.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

react 知识点汇总(非常全面)

React 是一个用于构建用户界面的 JavaScript 库,由 Facebook 开发并维护。它的核心理念是“组件化”,即将用户界面拆分为可重用的组件。 React 的组件通常使用 JSX(JavaScript XML)。JSX 是一种 JavaScript 语法扩展,…

HCIP——GRE和MGRE

目录 VPN GRE GRE环境的搭建 GRE的报文结构 GRE封装和解封装报文的过程 GRE配置​编辑 R1 R2 GRE实验​​​​​​​​编辑 MGRE 原理 MGRE的配置 R1 R2 R3 R4 查看映射表 抓包 MGRE环境下的RIP网络 综合练习​编辑 VPN 说到GRE,我们先来说个大…

Http 协议和 RPC 协议有什么区别?

Http 协议和 RPC 协议有什么区别? 三个层面来述说: 从功能特性来说: HTTP是一个属于应用层的超文本传输协议,是万维网数据通信的基础,主要服务在网页端和服务端的数据传输上。 RPC是一个远程过程调用协议&#xff0…

AI+视频监控:EasyCVR安防平台赋能火电制造行业的视频智能管理方案

随着信息技术的飞速发展和智能制造的深入推进,火电制造行业作为国民经济的重要组成部分,正面临着智能化转型的迫切需求。为了提升生产效率、保障设备安全、优化管理流程,火电制造企业迫切需要引入先进的视频监控与人工智能技术。EasyCVR安防监…

TinyOS 点对基站通信

文章目录 一、前言1.1 发包的BlinkToRadio的数据包格式 二、混淆基站源码分析2.1 Makefile2.2 组件连接2.3 主逻辑代码 一、前言 1.1 发包的BlinkToRadio的数据包格式 如下,注意:AM层类型(1byte)即handlerID使可以在组件中修改的。 二、混淆基站源码…

《安富莱嵌入式周报》第343期:雷电USB4开源示波器正式发布,卓越的模拟前端低噪便携示波器,自带100W电源的便携智能烙铁,NASA航空航天锂电池设计

周报汇总地址:嵌入式周报 - uCOS & uCGUI & emWin & embOS & TouchGFX & ThreadX - 硬汉嵌入式论坛 - Powered by Discuz! 更新一期视频教程 【授人以渔】CMSIS-RTOS V2封装层专题视频,一期视频将常用配置和用法梳理清楚&#xff0…

【Mybatis篇】Mybatis的注解开发

🧸安清h:个人主页 🎥个人专栏:【计算机网络】,【Mybatis篇】 🚦作者简介:一个有趣爱睡觉的intp,期待和更多人分享自己所学知识的真诚大学生。 文章目录 🎯 Select注解 …

自动猫砂盆有必要买吗?高性价比的自动猫砂盆怎么选通通看这篇

最近市面上又新出了很多款式的自动猫砂盆,有些铲屎官蠢蠢欲动,但又在犹豫,自己真的需要自动猫砂盆吗?作为养猫4年的资深铲屎官,在买过这么多猫咪智能用品的里面,最不后悔的就是自动猫砂盆了!要知…

【北京迅为】《STM32MP157开发板嵌入式开发指南》-第二十五章 Source Insight 的安装和使用

iTOP-STM32MP157开发板采用ST推出的双核cortex-A7单核cortex-M4异构处理器,既可用Linux、又可以用于STM32单片机开发。开发板采用核心板底板结构,主频650M、1G内存、8G存储,核心板采用工业级板对板连接器,高可靠,牢固耐…

ElasticSearch备考 -- Multi match

一、题目 索引task有3个字段a、b、c,写一个查询去匹配这三个字段为mom,其中b的字段评分比a、c字段大一倍,将他们的分数相加作为最后的总分数 二、思考 通过题目要求对多个字段进行匹配查询,可以考虑multi match、bool query操作。…

RabbitMQ的相关题

一、 MQ的作⽤及应⽤场景 类似问题: 项⽬什么场景下使⽤到了MQ, 为什么需要MQ? RabbitMQ 的作⽤?使⽤场景有哪些? RabbitMQ…

【JWT安全】portswigger JWT labs 全解

目录 1.利用有缺陷的 JWT 签名验证 ①接受任意签名 lab1:通过未验证的签名绕过 JWT 身份验证 ②接受无签名的token lab2:通过有缺陷的签名验证来绕过 JWT 身份验证 2.暴力破解密钥 ①使用hashcat lab3:通过弱签名密钥绕过 JWT 身份验证 3.JWT 标头参数注入 ①通过 jwk…

多模态大语言模型(MLLM)-InstructBlip深度解读

前言 InstructBlip可以理解为Blip2的升级版,重点加强了图文对话的能力。 模型结构和Blip2没差别,主要在数据集收集、数据集配比、指令微调等方面下文章。 创新点 数据集收集: 将26个公开数据集转换为指令微调格式,并将它们归类…

大数据新视界 --大数据大厂之 GraphQL 在大数据查询中的创新应用:优化数据获取效率

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

【C++】--类和对象(3)

🤑个人主页: 起名字真南 🤑个人专栏:【数据结构初阶】 【C语言】 【C】 目录 1 深入构造函数2 类型转换3 static成员4 友元函数5 内部类6 匿名对象 1 深入构造函数 之前我们实现构造函数的时候,初始化成员变量都是在函数体内赋值&#xff0c…

selenium有多个frame页时的操作方法(5)

之前文章我们提到,在webdriver.WebDriver类有一个switch_to方法,通过switch_to.frame()可以切换到不同的frame页然后才再定位某个元素做一些输入/点击等操作。 比如下面这个测试网站有2个frame页:http://www.sahitest.com/demo/framesTest.h…

5.toString()、构造方法、垃圾回收、静态变量与静态方法、单例设计模式、内部类

文章目录 一、toString()1. 优缺点2. 使用方法举例① Dos类里更省事的方法 ② Application里 二、构造方法1. 导入2. 什么是构造方法3. 怎么写构造方法① 无参的构造方法(无参构造器)② 有参的构造方法(有参构造器)③ 注意 4. 构造方法的重载 三、再探this1. 给成员变量用2. 给…

【用户管理 添加用户 超级用户 用户和组】

用户管理 添加用户超级用户用户和组 添加用户 介绍用户的管理操作 比如,添加一个用户 sudo useradd -m test1 其中,sudo表示管理员身份运行 修改用户密码 sudo passwd test1 删除用户 sudo userdel test 超级用户 1.首次使用时,需要给roo…

快速区分 GPT-3.5 与 GPT-4

问:鲁迅为什么暴打周树人? GPT3.5回答 各种稀奇古怪的理由 GPT4回答 正确区分鲁迅和周树人是同一个人 国内GPT入口 https://ai-to.cn/url/?ulihaimao

Android Preference的使用以及解析

简单使用 values.arrays.xml <?xml version"1.0" encoding"utf-8"?> <resources><string-array name"list_entries"><item>Option 1</item><item>Option 2</item><item>Option 3</item&…