Unifying Large Language Models and Knowledge Graphs: A Roadmap

本文依旧是LLM系列的相关文章,LLM与知识图谱结合,针对《Unifying Large Language Models and Knowledge Graphs: A Roadmap》的翻译。

统一大语言模型与知识图谱:路线图

  • 摘要
  • 1 引言
  • 2 背景
    • 2.1 大语言模型(LLMs)
      • 2.1.1 仅编码器LLMs
      • 2.1.2 编码器-解码器LLMs
      • 2.1.3 仅解码器LLMs
    • 2.2 提示工程
    • 2.3 知识图谱(KGs)
      • 2.3.1 百科全书式知识图谱
      • 2.3.2 常识知识图谱
      • 2.3.3 领域特定知识图谱
      • 2.3.4 多模态知识图谱
    • 2.4 应用
  • 3 路线图与分类
    • 3.1 路线图
      • 3.1.1 KG增强的LLMs
      • 3.1.2 LLM增强的KGs
      • 3.1.3 协同LLMs+KGs
    • 3.2 分类
  • 4 KG增强的LLMs
    • 4.1 KG增强LLM预训练
      • 4.1.1 将KG纳入训练目标
      • 4.1.2 将KG纳入LLM输入
      • 4.1.3 通过额外的融合模块集成KG
    • 4.2 KG增强LLM推理
      • 4.2.1 动态知识融合
      • 4.2.2 检索增强知识融合
    • 4.3 KG增强LLM的可解释性
      • 4.3.1 KGs用于LLM探测
      • 4.3.2 KGs用于LLM分析
  • 5 LLM增强用于KGs
    • 5.1 LLM增强KG嵌入
      • 5.1.1 LLMs作为文本编码器
      • 5.1.2 LLM用于联合文本和KG嵌入
    • 5.2 LLM增强KG补全
      • 5.2.1 LLM作为编码器(PaE)
      • 5.2.2 LLM作为生成器(PaG)
      • 5.2.3 PaE和PaG的比较
      • 5.2.4 模型分析
    • 5.3 LLM增强的KG构建
      • 5.3.1 实体发现
      • 5.3.2 核心指代消解(CR)
      • 5.3.3 关系抽取(RE)
      • 5.3.4 端到端的KG构建
      • 5.3.5 从LLM中蒸馏知识图谱
    • 5.4 LLM增强KG到文本的生成
      • 5.4.1 利用来自LLM的知识
      • 5.4.2 构造大型弱KG文本对齐语料库
    • 5.5 LLM增强KG问答
      • 5.5.1 LLMs作为实体/关系抽取器
      • 5.5.2 LLMs作为答案的推理者
  • 6 协同LLMs+KG
    • 6.1 知识表征
    • 6.2 推理
  • 7 未来方向
    • 7.1 KG用于LLM中的幻觉检测
    • 7.2 KG用于编辑LLM的知识
    • 7.3 KG用于黑盒LLM知识注入
    • 7.4 多模态LLM用于KG
    • 7.5 LLM用来理解KG结构
    • 7.6 用于二元推理的协同LLM和KGs
  • 8 结论

摘要

大型语言模型(LLM),如ChatGPT和GPT4,由于其涌现能力和可推广性,正在自然语言处理和人工智能领域掀起新的浪潮。然而,LLM是黑匣子模型,通常无法捕捉和获取事实知识。相反,知识图谱(KGs),例如维基百科和华普,是明确存储丰富事实知识的结构化知识模型。KGs可以通过为推理和可解释性提供外部知识来增强LLM。同时,KGs很难从本质上构建和进化,这对KGs中现有的生成新事实和表示未知知识的方法提出了挑战。因此,将LLM和KGs统一在一起并同时利用它们的优势是相辅相成的。在本文中,我们提出了LLM和KGs统一的前瞻性路线图。我们的路线图由三个通用框架组成,即:1)KG增强的LLM,它在LLM的预训练和推理阶段纳入了KG,或者是为了增强对LLM所学知识的理解;2) LLM增强的KG,利用LLM执行不同的KG任务,如嵌入、补全、构建、图到文本生成和问答;以及3)协同LLM+KGs,其中LLM和KGs扮演着平等的角色,并以互利的方式工作,以增强LLM和KG,实现由数据和知识驱动的双向推理。我们在路线图中回顾和总结了这三个框架内的现有努力,并确定了它们未来的研究方向。

1 引言

2 背景

2.1 大语言模型(LLMs)

2.1.1 仅编码器LLMs

2.1.2 编码器-解码器LLMs

2.1.3 仅解码器LLMs

2.2 提示工程

2.3 知识图谱(KGs)

2.3.1 百科全书式知识图谱

2.3.2 常识知识图谱

2.3.3 领域特定知识图谱

2.3.4 多模态知识图谱

2.4 应用

3 路线图与分类

3.1 路线图

3.1.1 KG增强的LLMs

3.1.2 LLM增强的KGs

3.1.3 协同LLMs+KGs

3.2 分类

4 KG增强的LLMs

4.1 KG增强LLM预训练

4.1.1 将KG纳入训练目标

4.1.2 将KG纳入LLM输入

4.1.3 通过额外的融合模块集成KG

4.2 KG增强LLM推理

4.2.1 动态知识融合

4.2.2 检索增强知识融合

4.3 KG增强LLM的可解释性

4.3.1 KGs用于LLM探测

4.3.2 KGs用于LLM分析

5 LLM增强用于KGs

5.1 LLM增强KG嵌入

5.1.1 LLMs作为文本编码器

5.1.2 LLM用于联合文本和KG嵌入

5.2 LLM增强KG补全

5.2.1 LLM作为编码器(PaE)

5.2.2 LLM作为生成器(PaG)

5.2.3 PaE和PaG的比较

5.2.4 模型分析

5.3 LLM增强的KG构建

5.3.1 实体发现

5.3.2 核心指代消解(CR)

5.3.3 关系抽取(RE)

5.3.4 端到端的KG构建

5.3.5 从LLM中蒸馏知识图谱

5.4 LLM增强KG到文本的生成

5.4.1 利用来自LLM的知识

5.4.2 构造大型弱KG文本对齐语料库

5.5 LLM增强KG问答

5.5.1 LLMs作为实体/关系抽取器

5.5.2 LLMs作为答案的推理者

6 协同LLMs+KG

6.1 知识表征

6.2 推理

7 未来方向

在前几节中,我们回顾了统一KGs和LLM的最新进展,但仍有许多挑战和悬而未决的问题需要解决。在本节中,我们将讨论这一研究领域的未来方向。

7.1 KG用于LLM中的幻觉检测

LLMs中的幻觉问题会产生事实上不正确的内容,这严重阻碍了LLMs的可靠性。如第4节所述,现有研究试图利用KG通过预训练或KG增强推理来获得更可靠的LLM。尽管做出了这些努力,但在可预见的未来,幻觉问题可能会继续存在于LLM领域。因此,为了获得公众的信任和边界应用,必须检测和评估LLM和其他形式的人工智能生成内容(AIGC)中的幻觉实例。现有的方法试图通过在一小部分文档上训练神经分类器来检测幻觉,这些文档既不健壮,也不强大,无法处理不断增长的LLM。最近,研究人员试图使用KGs作为外部来源来验证LLM。进一步的研究将LLM和KGs结合起来,实现了一个通用的事实核查模型,该模型可以检测跨领域的幻觉[249]。因此,它为利用KGs进行幻觉检测打开了一扇新的大门。

7.2 KG用于编辑LLM的知识

7.3 KG用于黑盒LLM知识注入

7.4 多模态LLM用于KG

7.5 LLM用来理解KG结构

7.6 用于二元推理的协同LLM和KGs

8 结论

将大型语言模型(LLM)和知识图谱(KGs)统一起来是一个活跃的研究方向,越来越受到学术界和工业界的关注。在这篇文章中,我们对该领域的最新研究进行了全面的概述。我们首先介绍了整合KGs以增强LLM的不同方式。然后,我们介绍了现有的将LLM应用于KG的方法,并基于各种KG任务建立了分类法。最后,我们讨论了这一领域的挑战和未来方向。我们希望本文能对这一领域有一个全面的了解,并推动未来的研究。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1179.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

只需一个提示词解除GPT-4的字符限制!

ChatGPT的内存有限,GPT-3.5-turbo的限制为4897个令牌,而GPT-4的最大限制为8192。如果您在使用GPT-4进行聊天时超过8192个令牌(约6827个单词),它就会开始遗忘。我想出了一种新的技巧,可以轻松将对话扩展10倍。 这种技巧不会将对话中的每个字都保存到内存中。当您去开会时,会有人…

Windows - 如何判断一个DLL已经注册

判断一个DLL是否注册: reg query HKLM\SOFTWARE\Classes\CLSID /s /f "aaa.dll" 如果返回0个匹配,则没有注册,有匹配,则注册过了。 注册一个DLL regsvr32 aaa.dll 取消注册一个DLL regsvr32 /u aaa.dll通过上面两…

如何解除“无法完成操作 因为文件包含病毒或潜在垃圾软件”

当运行软件遇到“无法完成操作 因为文件包含病毒或潜在垃圾软件”时,如何解决?如果确认此软件不是病毒软件,那么可以按照如下方法进行解决: 1:关闭防火墙 控制面板-系统和安全-Windows Defender防火墙-自定义设置&am…

分布式运用存储系统Ceph

一、ceph的相关知识 1.ceph介绍与简介 Ceph是一个开源的分布式存储解决方案,旨在提供可扩展性、高性能和强大的数据可靠性。它采用了一种分布式对象存储架构,能够同时提供块存储和文件存储的功能。 Ceph使用C语言开发,是一个开放、自我修复和…

前端如何使用WebSocket发送消息

前端如何使用WebSocket发送消息 WebSocket是一种在Web应用程序中实现实时双向通信的协议。相比传统的HTTP协议,WebSocket提供了更高效、更快速的双向通信方式,可以在客户端和服务器之间实时交换数据。本文将详细介绍前端如何使用WebSocket发送消息&…

MySQL数据表高级操作

一、克隆/复制数据表二、清空表,删除表内的所有数据删除小结 三、创建临时表四、MySQL中6种常见的约束1、外键的定义2、创建外键约束作用3、创建主表test44、创建从表test55、为主表test4添加一个主键约束。主键名建议以"PK_”开头。6、为从表test5表添加外键&…

数据结构与算法——顺序表(顺序存储结构)及初始化详解

顺序表,全名顺序存储结构,是线性表的一种。通过《什么是线性表》一节的学习我们知道,线性表用于存储逻辑关系为“一对一”的数据,顺序表自然也不例外。 不仅如此,顺序表对数据的物理存储结构也有要求。顺序表存储数据…

Java包装类的自动装箱拆箱使用以及详解

Java包装类的自动装箱拆箱使用以及详解 一、Java包装类简介:二、Java中的自动拆箱:三、Java中的自动装箱:四、自动拆箱和装箱的作用:1. 类型转换的便利性:2. 泛型的支持:3. 集合类的支持:4. 方法…

【论文阅读】TransCAM: Transformer Attention-based CAM Refinement for WSSS

分享一篇阅读的用于弱监督分割的论文 论文标题: TransCAM: Transformer Attention-based CAM Refinement for Weakly Supervised Semantic Segmentation 作者信息: 代码地址: https://github.com/liruiwen/TransCAM Abstract 大多数现有…

【React】- 组件生命周期连续渲染两次问题

最近在整理生命周期相关的知识内容,然后发现一个奇怪的现象,即组件的生命周期会运行2次!经过确认不是代码问题,于是开始找度娘,终于找到其原因-React中的严格模式,在这里记录一下 一、问题重现 如图所示&a…

EMC学习笔记(十五)射频PCB的EMC设计(二)

射频PCB的EMC设计(二) 1.滤波1.1 电源和控制线的滤波1.2 频率合成器数据线、时钟线、使能线的滤波 2.接地2.1 接地分类2.2 大面积接地2.3 分组就近接地2.4 射频器件接地2.5 接地时应该注意的问题2.6 接地平面的分布 1.滤波 1.1 电源和控制线的滤波 随着…

Ubuntu切换内核

一、下载指定内核 1.1查看当前内核 使用uname -a 命令可知当前内核为5.4.0-149-generic,根据需要安装指定内核5.4.0-139-generic uname -a Linux adyonggan-u01 5.4.0-149-generic #156~18.04.1-Ubuntu SMP Wed Jan 25 15:56:22 UTC 2023 x86_64 x86_64 x86_64 GN…

人工智能自然语言处理:N-gram和TF-IDF模型详解

人工智能自然语言处理:N-gram和TF-IDF模型详解 1.N-gram 模型 N-Gram 是一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为 N 的滑动窗口操作,形成了长度是 N 的字节片段序列。 每一个字节片段称为 gram,对所…

SpringBoot 整合redis + Aop防止重复提交 (简易)

1.redis的安装 redis下载 解压 安装 # wget http://download.redis.io/releases/redis-6.0.8.tar.gz # tar xzf redis-6.0.8.tar.gz # cd redis-6.0.8 # make 看一下就会有 进入redis-6.0.8下的src目录 [rootVM-16-8-centos redis]# cd redis-6.0.8 [rootVM-16-8-centos re…

HCIP——HCIA回顾及静态实验

HCIP HCIA一、知识回顾1、OSI七层参考模型:2、重要的几个协议报头格式 二、静态实验1、实验拓扑图2、实验要求3、实验思路4、实验步骤1、给接口划分IP地址以及配置环回地址2、交换机配置划分VLAN3、配置静态路由4、配置DHCP服务5、测试6、优化 HCIA 1、七层参考模型…

ng+php架构下websocket监听实例

系统架构:nginx服务器应用服务器数据库 通过websocket监听应用服务器的8090端口;前端js发送websocket请求到ng服务器;ng服务器转发请求到应用服务器的8090端口 1、php后端设置websocket监听 $_ip取应用服务器ip $_port为监听的端口 启动…

51单片机学习--独立按键控制LED

功能&#xff1a;按下K1时D1亮&#xff0c;松开时D1灭&#xff0c;P3_1对应K1 , P2_0对应D1 #include <REGX52.H>void main() {while(1) {if(P3_1 0) //按下K1{P2_0 0;}else{P2_0 1;}}} 按下按钮和松开按钮时会有抖动&#xff0c;所以需要用延时函数来避免抖动造成的…

短视频抖音账号矩阵系统源码开发分享

引用&#xff1a;MySQL数据库&#xff0c;NGINX&#xff0c;PHP7.4&#xff0c;MySQL5.7&#xff0c;redis 媒体组件 组件 描述 image 图片 图片。支持 JPG、PNG、SVG、WEBP、GIF 等格式。 video 视频 视频组件。相关 API 请参考 tt.createVideoContext。 开发背景&…

手机快充协议

高通:QC2.0、QC3.0、QC3.5、QC4.0、QC5.0、 FCP、SCP、AFC、SFCP、 MTKPE1.1/PE2.0/PE3.0、TYPEC、PD2.0、PD3.0/3.1、VOOC 支持 PD3.0/PD2.0 支持 QC3.0/QC2.0 支持 AFC 支持 FCP 支持 PE2.0/PE1.1 联发科的PE&#xff08;Pump Express&#xff09;/PE 支持 SFCP 在PP…

计算机网络——三次握⼿、四次挥手

TCP 三次握手 1、第⼀个SYN报⽂&#xff1a; 客户端随机初始化序列号client_isn&#xff0c;放进TCP⾸部序列号段&#xff0c; 然后把SYN置1。把SYN报⽂发送给服务端&#xff0c;表⽰发起连接&#xff0c; 之后客户端处于SYN-SENT状态。 2、第⼆个报⽂SYNACK报⽂&#xff1a; …