第66期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. 利用高级大语言模型增强小语言模型:一种可解释的知识蒸馏方法

简介:高级大语言模型如 GPT-4 和 LlaMa 3 性能卓越但成本高、难自托管,存在安全隐私问题。研究者引入一种可解释的知识蒸馏新方法,以增强可自托管的小型经济语言模型性能。在构建客户服务代理场景中,该方法不同于传统知识蒸馏,采用“策略”教学,由教师提供策略提升学生在不同场景表现,在“场景生成”和“改进策略”步骤间交替,创建定制场景库和优化策略,仅需黑盒访问模型,不操纵参数。在客户服务应用中,该方法提高性能且策略可转移到训练集外。其可解释性利于通过人工审核防范潜在危害。

链接:

https://arxiv.org/abs/2408.07238

2. 评估基于大型语言模型的个人信息提取及其对策

简介:研究者进行了一项系统测量研究,对基于大语言模型(LLM)的个人信息提取及对策进行基准测试。他们提出基于 LLM 的提取攻击框架,收集了包括 GPT-4 生成的合成数据集和两个真实世界数据集。引入基于“提示注入”的新型缓解策略,并使用 10 个 LLM 和三个数据集进行基准测试。主要发现有:攻击者可能滥用 LLM 准确提取个人信息,LLM 在提取上优于传统方法,而提示注入能在很大程度上减轻风险且优于传统对策。其代码和数据可在特定网址获取。这为防范个人信息被大规模提取提供了重要参考,有助于提升信息安全防护水平。

链接:

https://arxiv.org/abs/2408.07291

3. 用于高效入侵检测系统的 Transformer 和大语言模型:全面综述

简介:本综述全面分析了 Transformer 和大语言模型在网络威胁检测系统中的应用。概述了论文选择方法和文献计量分析以评估现有研究,讨论了 Transformer 基本原理及相关网络攻击背景和常用数据集。探索了其在入侵检测系统中的应用,涵盖多种架构和新兴方法。还探讨了在不同环境和应用中的实施情况,包括计算机网络、物联网等。阐述了该领域研究挑战和未来方向,确定可解释性等关键问题。最后,结论总结研究结果,强调其在增强网络威胁检测能力的重要性,同时概述了进一步研究和开发的潜在途径,为提升网络安全提供了重要参考,有助于推动相关技术的发展和应用,以更好地应对不断演变的网络威胁。

链接:

https://arxiv.org/abs/2408.07583

4. CodeMirage:大语言模型生成代码中的幻觉

简介:研究者指出大语言模型在程序生成和无代码自动化中有巨大潜力,但易产生幻觉,代码生成中也存在类似现象,如语法逻辑错误、安全漏洞等。为此,他们首次研究大语言模型生成代码中的幻觉,引入代码幻觉定义和分类法,提出首个基准数据集 CodeMirage,包含 GPT-3.5 为 Python 编程问题生成的幻觉代码片段。通过实验发现 GPT-4 在 HumanEval 数据集上表现最佳,在 MBPP 数据集上与微调后的 CodeBERT 基线相当。最后,讨论了各种缓解代码幻觉的策略并总结工作,为提高代码生成质量和可靠性提供了方向,有助于推动大语言模型在代码生成领域的更好应用。

链接:

https://arxiv.org/abs/2408.08333

5. 基于智能控制的 GPT 增强型强化学习在车辆调度中的应用

简介:随着城市居民对出行质量要求提高,车辆调度在在线网约车服务中愈发重要。但当前车辆调度系统难以应对城市交通动态复杂性,导致乘客出行困难、司机接不到单,城市交通服务质量下降。为此,本文引入 GARLIC,即基于智能控制的 GPT 增强型强化学习车辆调度框架。它利用多视图图捕捉交通状态,学习考虑司机行为的动态奖励函数,并集成经自定义损失函数训练的 GPT 模型以实现高精度预测和优化调度策略。在两个真实世界数据集上的实验表明,GARLIC 能降低车辆空载率且与司机行为一致,为提升车辆调度效率和城市交通服务质量提供了新方法,有望改善网约车服务的运营效果。

链接:

https://arxiv.org/abs/2408.10286

6. 大语言模型作为端到端的安全代码生产者表现如何?

简介:研究者指出,以GPT-4为代表的大语言模型(LLMs)的飞速发展彻底改变了软件工程的格局,使这些模型成为现代开发实践的核心。随着预期这些模型将发展成为软件开发中的主要和可信赖工具,确保它们生成的代码的安全性变得至关重要。研究者对大语言模型生成安全代码的能力进行了系统研究,研究了 GPT-3.5 和 GPT-4 对包括自身在内的四种流行模型生成代码的漏洞识别和修复能力。通过审查 4900 段代码发现,大语言模型缺乏场景安全风险意识,生成超 75%有漏洞代码,且难以准确识别自身生成代码的漏洞,修复其他模型代码成功率为 33.2% - 59.6%,修复自身代码表现不佳。为解决单次修复局限性,开发了轻量级工具,在语义分析引擎辅助下,将修复成功率提高到 65.9% - 85.5%。为提升大语言模型生成安全代码的能力提供了思路。

链接:

https://arxiv.org/abs/2408.10495

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/53043.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++:关于反向迭代器的学习分享

前言: 小编仅是一位初学者,所以对于C的理解有限,文章大概率会出现表达不清楚可能也只是因为小编不知道如何更好表达,本文章仅作为一个学习的总结分享。 反向迭代器的概念 反向迭代器故名思意解释反向的迭代器,与正向迭…

银行接口测试的具体流程及内容?

银行接口测试的具体流程及内容可以概括为以下几个关键步骤: 一、测试前准备 接口测试计划制定: 确定测试目标、范围、人员分工、时间计划等。 编写接口测试计划文档,明确测试策略、测试方法、测试工具等。 接口文档解析: 深入理…

边缘智能网关 P1600:智慧城市的创新引擎

智慧城市(Smart City)是以发展更科学、管理更高效、生活更美好为目标,以信息技术和通信技术为支撑,通过透明、充分的信息获取,广泛、安全的信息传递和有效、科学的信息处理,提高城市运行效率,改…

数据库管理-第238期 23ai:全球分布式数据库-架构与组件(20240904)

数据库管理238期 2024-09-04 数据库管理-第238期 23ai:全球分布式数据库-架构与组件(20240904)1 架构图2 分片数据库与分片3 Shard Catalog4 Shard Director5 Global Service6 管理界面总结 数据库管理-第238期 23ai:全球分布式数…

Python案例 | 四阶龙格库塔法简介

1.引言 在数值分析中,龙格-库塔法(Runge-Kutta methods)是用于非线性常微分方程的解的重要的一类隐式或显式迭代法。这些技术由数学家卡尔龙格和马丁威尔海姆库塔于1900年左右发明。 龙格-库塔(Runge-Kutta)方法是一种在工程上应用广泛的高…

HALCON与LabVIEW的联合编程 视觉与控制结合

HALCON与LabVIEW的联合编程在工业自动化和视觉检测领域中越来越受到重视。通过将HALCON的强大图像处理能力与LabVIEW的灵活控制功能相结合,工程师们可以开发出高效且精确的自动化系统。这种整合不仅提高了系统的整体性能,还简化了开发流程。本文将详细介…

人工智能造福公众:未来一片光明

作者:来自 Elastic Peter Dutton 我们如何衡量人工智能对政府的影响?毫无疑问,人工智能将为运营流程和决策带来的好处已被广泛讨论 —— 从自动化工作流程到节省成本再到减少重复工作。 但对于以服务公众为目标的组织来说,人工智…

2024 年 Web3 融资情况解析:公售项目占比超八成,散户抱团取暖

作者:Jasper De Maere,Outlier Ventures 编译:J1N,Techub News 自 2024 年 3 月以来, 加密货币市场出现大幅度回调, 多数 Altcoin (除了比特币、以太坊等以外的代币),特…

echo命令、重定向、zip讲解

一、echo echo命令的使用方法: echo “hello Linux”屏幕上面打印Linux 本质上:这个就是从键盘上面输入数据,从屏幕上面输出数据 二、重定向 1、输出重定向 符号:“>”。 使用方法:在echo后面加上“>”文件…

HTTP“请求”和“响应”的报头及正文详解

目录 一、请求 "报头" (header) 二、请求 "正文" (body) 2.1 application/x-www-form-urlencoded 2.2 multipart/form-data 2.3 application/json 三、HTTP 响应状态码 四、响应 "报头" (header) 五、响应 "正文" (body) 5.1…

Frida 环境配置

frida介绍 “为开发者、逆向工程师和安全研究人员提供的动态插桩工具包。” 安装frida pip install frida(默认安装最新版本) 卸载frida pip uninstall frida 安装指定版本的frida pip install fridaxx.xx.xx 例如:pip install frida14.2.…

Find My轮椅|苹果Find My技术与轮椅结合,智能防丢,全球定位

轮椅是装有轮子可以帮助替代行走的椅子,是用于伤员、病员、残疾人居家康复、周转运输、就诊、外出活动的重要移动工具。轮椅不仅满足肢体伤残者和行动不便人士的代步需求,更重要的是方便家属移动和照顾病员,使病员借助于轮椅进行身体锻炼和参…

EE trade:为什么黄金没有100%的纯度

黄金的纯度通常无法达到100%,主要原因涉及提纯技术的限制、经济成本的考虑、市场规范以及商业实践等多个方面。 1. 技术难度 提纯黄金的过程非常复杂,随着纯度的提高,去除杂质的难度和成本都会显著增加。具体来说: 提纯过程&am…

Vue前端路由详解——以Ruoyi框架为案例学习

Vue路由 Vue路由详解_vue 页面路由-CSDN博客 路由模式 Vue 的路由模式:hash 模式和 history 模式的区别_vue路由history和hash的区别-CSDN博客 URL格式: Hash模式:URL中包含#号,用于区分页面部分,实际请求的页面地址…

《物流科技》是什么级别的期刊?是正规期刊吗?能评职称吗?

​问题解答 问:《物流科技》是不是核心期刊? 答:不是,是知网收录的第一批认定学术期刊。 问:《物流科技》级别? 答:国家级。主管单位: 中国商业联合会 主办单位&am…

ActiViz实战:使用Actor2D画一个二维网格

文章目录 一、效果预览二、交互三、C#源码示例一、效果预览 二、交互 1、能实现等比缩放 2、不允许平移和旋转 3、能够与三维坐标大小匹配 三、C#源码示例 private void AddCudeAxes2D() {double scale =

如何使用ChatGPT撰写研究计划书?AI写作全攻略

大家好,感谢关注。我是七哥,一个在高校里不务正业,折腾学术科研AI实操的学术人。关于使用ChatGPT等AI学术科研的相关问题可以和作者七哥(yida985)交流,多多交流,相互成就,共同进步&a…

华为云征文|使用sysbench对Mysql应用加速测评

文章目录 ❀前言❀测试环境准备❀测试工具选择❀测试工具安装❀mysql配置❀未开启Mysql加速测试❀开启Mysql加速测试❀总结 ❀前言 大家好,我是早九晚十二。 昨天有梳理一篇关于华为云最新推出的云服务器产品Flexus云服务器X。当时有说过,这次的华为云F…

Leetcode 第 410 场周赛题解

Leetcode 第 410 场周赛题解 Leetcode 第 410 场周赛题解题目1:3248. 矩阵中的蛇思路代码复杂度分析 题目2:3249. 统计好节点的数目思路代码复杂度分析 题目3:3250. 单调数组对的数目 I思路代码复杂度分析 题目4:3251. 单调数组对…

结构型设计模式—组合模式

结构型设计模式—组合模式 欢迎长按图片加好友,我会第一时间和你分享持续更多的开发知识,面试资源,学习方法等等。 组合模式(Composite Pattern)是一种结构型设计模式,它允许你将对象组合成树形结构来表示…