【大语言模型】ACL2024论文-23 检索增强的多语言知识编辑

【大语言模型】ACL2024论文-23 检索增强的多语言知识编辑


目录

文章目录

  • 【大语言模型】ACL2024论文-23 检索增强的多语言知识编辑
    • 目录
      • 摘要
      • 研究背景
      • 问题与挑战
      • 如何解决
      • 核心创新点
      • 算法模型
      • 实验效果(包含重要数据与结论)
      • 相关工作
      • 后续优化方向
    • 后记


检索增强的多语言知识编辑(Retrieval-augmented Multilingual Knowledge Editing)
在这里插入图片描述

摘要

本文提出了一种名为检索增强多语言知识编辑器(ReMaKE)的方法,旨在更新大型语言模型(LLMs)中的知识。由于LLMs中的知识经常不正确或过时,且通过微调更新知识计算成本高昂且不可靠,因此知识编辑(KE)作为一种有效且经济的替代方案应运而生。当前的KE研究主要集中在单一语言设置中,通常是英语。ReMaKE通过从多语言知识库检索新知识并与提示串联,实现多语言设置中的模型无关知识编辑。实验结果表明,ReMaKE在多语言环境中的表现超过了基线知识编辑方法,是首个在多语言设置中工作的知识编辑方法。研究者还提供了一个包含12种语言的多语言知识编辑数据集(MzsRE),以及代码和额外的项目信息。

研究背景

大型语言模型(LLMs)在搜索引擎和其他下游任务中被用作事实知识的来源。尽管取得了显著进展,LLMs中的事实可能是错误的或随着世界的变化而过时。从头开始预训练或微调LLMs以适应新知识不仅计算成本高昂,而且不能保证成功。因此,研究者提出了知识编辑(KE)技术,作为微调的有效替代方案,用于在LLMs中添加或更新特定事实。KE可以涉及更新模型参数或添加额外组件。尽管对此问题兴趣浓厚,当前的KE研究集中在单一语言设置中,通常是英语。然而,如果新知识以一种语言提供,而我们希望在另一种语言中查询LLM,该怎么办?为了解决多语言知识编辑问题,研究者提出了ReMaKE。

问题与挑战

多语言知识编辑面临的挑战包括:

  1. 跨语言知识传播:如何在一种语言中编辑知识,并在所有其他语言中传播这些更改。
  2. 检索相关性:开发能够根据用户输入提取高度相关信息的多语言检索器。
  3. 上下文干扰:减少由于不相关事实而产生的上下文干扰。
  4. 模型和语言不可知:开发一种不依赖于特定LLM或语言设置的知识编辑框架。

如何解决

ReMaKE通过以下方式解决上述挑战:

  • 多语言知识检索:通过将查询和知识库条目映射到共享的多语言嵌入空间,并训练分类器来确定知识事实是否与查询语义相关。
  • 多语言上下文编辑:ReMaKE执行零次拍摄和几次拍摄编辑,通过将检索到的结果与用户输入串联形成提示,以预测输出。
  • 模型和语言不可知:ReMaKE可以应用于任何LLM,并且是可扩展的,可以跨不同语言编辑大量事实。

核心创新点

ReMaKE的核心创新点包括:

  1. 检索增强的多语言知识编辑框架:ReMaKE是首个能够在多语言设置中工作的多语言知识编辑框架。
  2. 检索器的高相关性:开发的多语言检索器能够提取与用户输入高度相关的信息,减少上下文干扰。
  3. 零次拍摄和几次拍摄编辑:ReMaKE能够执行零次拍摄和几次拍摄编辑,提高了编辑的灵活性和效果。

算法模型

ReMaKE由两个阶段组成:多语言知识检索和多语言上下文编辑。在多语言知识检索阶段,ReMaKE使用一个简单的多语言检索模型来搜索知识库中与查询最相关的事实上。在多语言上下文编辑阶段,ReMaKE执行零次拍摄和几次拍摄编辑,通过将检索到的知识与用户查询串联起来创建提示。
在这里插入图片描述
在这里插入图片描述

实验效果(包含重要数据与结论)

实验结果表明,ReMaKE在多语言环境中的表现超过了基线知识编辑方法。ReMaKE在12种语言中的平均准确率得分从最小的+24.76(捷克语)增加到最大的+58.72(俄语),表明这种方法已准备好大规模部署。具体数据包括:

  • 可靠性:ReMaKE在各种语言中的可靠性得分均高于基线方法,显示出较高的平均准确率。
  • 通用性:ReMaKE在处理被改写输入时的平均准确率也高于基线方法,表明其在提示框架偏差下的有效性。
  • 局部性:ReMaKE在响应知识编辑后不相关语义查询的平均准确率上表现优异,测试了知识编辑器仅更新所需知识而不影响模型中其他知识的能力。
  • 可移植性:ReMaKE在需要推理的问题上的平均准确率得分高于基线方法,表明KE有效地适应了LLMs的知识以支持推理。

在这里插入图片描述

相关工作

相关工作主要集中在单语言知识编辑方法上,这些方法可以分为四个主要范式:超网络编辑器、定位和编辑编辑器、插件编辑器和基于提示的编辑器。这些方法都是基于模型依赖的单语言方法,编辑性能不可靠且可扩展性低。ReMaKE解决了这些问题,并将KE扩展到多语言场景,涵盖了许多事实。

后续优化方向

未来的工作将集中在以下几个方向:

  1. 扩展知识库:研究者计划扩展知识库以适应现实世界的应用,并研究大容量知识库对关键指标的影响。
  2. 改进检索器:提高检索器的准确性,特别是在处理某些语言(如中文和俄语)时。
  3. 多语言模板开发:开发正式的多语言模板,以适应更广泛任务的范围。
  4. 推理能力提升:研究如何通过KE方法影响LLMs的推理能力,以提高可移植性得分。

后记

如果您对我的博客内容感兴趣,欢迎三连击 ( 点赞、收藏和关注)和留下您的评论,我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型,深度学习和计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/62754.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

_C#_串口助手_字符串拼接缺失问题(未知原理)

最近使用WPF开发串口助手时,遇到一个很奇怪的问题,无论是主线程、异步还是多线程,当串口接收速度达到0.016s一次以上,就会发生字符串缺失问题并且很卡。而0.016s就一切如常,仿佛0.015s与0.016s是天堑之隔。 同一份代码…

基于Python的猎聘网招聘数据采集与可视化分析

1.1项目简介 在现代社会,招聘市场的竞争日趋激烈,企业和求职者都希望能够更有效地找到合适的机会与人才。猎聘网作为国内领先的人力资源服务平台,汇聚了大量的招聘信息和求职者数据,为研究招聘市场趋势提供了丰富的素材。基于Pyt…

基于Java Springboot高校社团微信小程序

一、作品包含 源码数据库设计文档万字PPT全套环境和工具资源部署教程 二、项目技术 前端技术:Html、Css、Js、Vue、Element-ui 数据库:MySQL 后端技术:Java、Spring Boot、MyBatis 三、运行环境 开发工具:IDEA/eclipse 微信…

springboot(20)(删除文章分类。获取、更新、删除文章详细)(Validation分组校验)

目录 一、删除文章分类功能。 (1)接口文档。 1、请求路径、请求参数。 2、请求参数。 3、响应数据。 (2)实现思路与代码书写。 1、controller层。 2、service接口业务层。 3、serviceImpl实现类。 4、mapper层。 5、后端接口测试。…

【前端】特殊案例分析深入理解 JavaScript 中的词法作用域

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: 前端 文章目录 💯前言💯案例代码💯词法作用域(Lexical Scope)与静态作用域什么是词法作用域?代码执行的详细分析 💯函数定义与调用的…

Node.js 实战: 爬取百度新闻并序列化 - 完整教程

很多时候我们需要爬取一些公开的网页内容来做一些数据分析和统计。而多数时候,大家会用到python ,因为实现起来很方便。但是其实Node.js 用来爬取网络内容,也是非常强大的。 今天我向大家介绍一下我自己写的一个百度新闻的爬虫,可…

三分钟快速掌握——Linux【vim】的使用及操作方法

一、vim的使用 vim是一个文本编辑器 非常小巧轻便 1.1如何进入vim编辑器 方法一: 首先使用touch 1.c 创建一个源文件 然后使用vim 1.c进入 方法二: 直接使用指令 vim 2.c 会直接创建一个2.c的源文件 退出时记得保存(使用wq或者x&am…

(简单5步实现)部署本地AI大语言模型聊天系统:Chatbox AI + grok2.0大模型

摘要: 本文将指导您如何部署一个本地AI大语言模型聊天系统,使用Chatbox AI客户端应用和grok-beta大模型,以实现高效、智能的聊天体验。 引言: 由马斯克X-AI发布的Grok 2大模型以其卓越的性能超越了GPT4.0。Grok模型支持超长文本…

docker安装hadoop环境

一、使用docker搭建基础镜像 1、拉取centos系统镜像 # 我这里使用centos7为例子 docker pull centos:7 2、创建一个dockerfiler文件,用来构建自定义一个有ssh功能的centos镜像 # 基础镜像 FROM centos:7 # 作者 #MAINTAINER hadoop ADD Centos-7.repo /etc/yum.re…

中国电信张宝玉:城市数据基础设施建设运营探索与实践

11月28日,2024新型智慧城市发展创新大会在山东青岛召开,中国电信数字政府研究院院长张宝玉在大会发表主旨演讲《城市数据基础设施运营探索与实践》。报告内容包括城市数据基础设施的概述、各地典型做法及发展趋势建议三个方面展开。 篇幅限制&#xff0…

Linux内核4.14版本——ccf时钟子系统(6)——DTS相关的API

目录 1. of_clk_add_provider 2. of_clk_get_from_provider 2.1 __of_clk_get_hw_from_provider 2.2 __clk_create_clk 3. of_clk_set_defaults 3.1 __set_clk_parents 3.2 __set_clk_rates 再回到第2章DTS相关的介绍,clock driver使用一个DTS node描述一个c…

2024年度桌面便签软件电脑版推荐

随着2024年的尾声渐近,这一年中涌现出了许多优秀的软件,其中便签软件因其便捷性和高效性成为了备受欢迎的工具。这类软件无论是在工作还是日常生活中,都极大地提升了我们的效率和生活质量。 在众多桌面便签中,敬业签是一款值得推…

WPS for Mac免登录使用工具栏

一、mac下载国际版https://www.wps.com 下载下来是在线安装包,对了,不再需要汉化!!! 二、干掉登录 进入目录/Applications/wpsoffice.app/Contents/Frameworks/office6(访达、应用程序、wpsoffice.app右…

【计算机网络】实验3:集线器和交换器的区别及交换器的自学习算法

实验 3:集线器和交换器的区别及交换器的自学习算法 一、 实验目的 加深对集线器和交换器的区别的理解。 了解交换器的自学习算法。 二、 实验环境 • Cisco Packet Tracer 模拟器 三、 实验内容 1、熟悉集线器和交换器的区别 (1) 第一步:构建网络…

【技巧】Mac上如何显示键盘和鼠标操作

在制作视频教程时,将键盘和鼠标的操作在屏幕上显示出来,会帮助观众更容易地理解。 推荐Mac上两款开源的小软件。 1. KeyCastr 这款工具从2009年至今一直在更新中。 https://github.com/keycastr/keycastr 安装的话,可以从Github上下载最…

Docker:在 ubuntu 系统上生成和加载 Docker 镜像

本文将介绍在 ubuntu系统上进行 Docker 镜像的生成和加载方法和代码。 文章目录 一、下载和安装 docker二、加载 docker 文件三、保存你的镜像四、将镜像上传到云端并通过连接下载和加载 Docker 镜像五、Docker 容器和本地的文件交互5.1 从容器复制文件到本地宿主机5.1.1 单个文…

PHP爬虫性能优化:从多线程到连接池的实现

背景介绍 随着网络数据的爆炸式增长,爬虫技术成为数据获取的重要工具。从市场调研到用户行为分析,爬虫的应用无处不在。然而,在实际应用中,我们常常遇到爬虫性能不足的问题:单线程处理效率低下、请求超时、数据采集量…

《现代网络技术》读书笔记:网络虚拟化

本文部分内容来源于《现代网络技术:SDN,NFV,QoE、物联网和云计算:SDN,NFV,QoE,IoT,andcloud》 虚拟局域网 图9-1显示了一个比较常见的层次化局域网场景,在这个例子中,局域网中的设备分为四个部分,每个部分都通过以太网…

在c#控制台中使用Raylib-cs库,绘制控制小球和插入音频(附带c++中小球的控制代码)

下载网址 GitHub - chrisdill/raylib-cs: C# bindings for raylib, a simple and easy-to-use library to learn videogames programming 克隆库 克隆GitHub仓库-CSDN博客 1 .制作dll 点击 生成之后就会多出这些东西 2.在项目中添加dll 然后就导进来了 测试一下用例代码 …

「Mac畅玩鸿蒙与硬件40」UI互动应用篇17 - 照片墙布局

本篇将带你实现一个简单的照片墙布局应用,通过展示多张图片组成照片墙效果,用户可以点击图片查看其状态变化。 关键词 UI互动应用照片墙布局Grid 布局动态图片加载用户交互 一、功能说明 照片墙布局应用的特点: 动态加载多张图片组成网格布…