可信和可解释的大语言模型推理-RoG

可信和可解释的大语言模型推理-RoG

web/2025/7/2 21:05:33/文章来源:https://blog.csdn.net/weixin_43145427/article/details/140087938

大型语言模型（LLM）在复杂任务中表现出令人印象深刻的推理能力。然而，LLM在推理过程中缺乏最新的知识和经验，这可能导致不正确的推理过程，降低他们的表现和可信度。知识图谱(Knowledge graphs, KGs)以结构化的形式存储了大量的事实，为推理提供了可靠的知识来源。然而，现有的基于KG的LLM推理方法只将KG作为事实知识库，忽略了其结构信息对推理的重要性。本文提出了一种称为图谱推理(RoG)的新方法，该方法将LLM与KGs协同使用，以实现可信和可解释的推理。
在这里插入图片描述

1 三个步骤

推理图（Reasoning on Graphs, RoG）提出了一个计划-检索-推理框架，该框架的核心流程包括以下几个步骤：

规划生成（Planning Generation）：给定一个问题，首先使用大型语言模型（LLM）生成若干个基于知识图谱（KG）的关系路径作为推理规划。这些关系路径捕捉了实体间的语义关系，并被用作推理答案的规划。

路径检索（Path Retrieval）：利用生成的推理规划，从知识图谱中检索有效的推理路径。这一步确保LLM能够获取最新的知识，并基于这些路径进行推理。

推理（Reasoning）：基于检索到的推理路径，LLM进行推理并生成答案，同时解释推理过程。

RoG不仅可以从KGs中提取知识，通过训练提高llm的推理能力，这个过程不仅提高了答案的可信度，还增强了解释性。还可以在推理过程中与任意llm无缝集成。

2 两个模块

RoG包含两个组成部分:1)一个规划模块，该模块生成以KGs为基础的关系路径作为可信规划;2)检索推理模块，首先根据计划从KGs中检索有效的推理路径，然后根据检索到的推理路径进行忠实推理，生成具有可解释解释的答案。

尽管LLM具有将关系路径生成为规划的优势，但LLM对KGs中包含的关系一无所知，因此LLM不能直接生成以KGs为基础的关系路径作为可信规划。此外，LLM可能无法正确理解推理路径，并基于它们进行推理。为了解决这些问题，RoG设计了两个指令调优任务:

规划模块优化，将KGs中的知识提取到LLM中以生成忠实关系路径作为规划;

检索-推理模块优化，使LLM能够基于检索到的推理路径进行推理。

3 结语

RoG通过将LLMs与KGs相结合，提出了一种新颖的规划-检索-推理框架，显著提高了LLMs的推理能力和可解释性，并在实验中展示了其在处理高风险场景（如法律判决和医疗诊断）中的潜力，通过提供最新的知识和避免推理过程中的幻觉，RoG提高了LLMs在这些场景中的性能和可信度。

论文题目：Reasoning on Graphs: Faithful and Interpretable Large Language Model Reasonin
论文链接：https://arxiv.org/pdf/2310.01061（发表于ICLR2024）

PS: 欢迎大家扫码关注公众号^_，我们一起在AI的世界中探索前行，期待共同进步！
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/web/37218.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

基于lightgbm hyperopt的旋转机械故障诊断（Python）

基于lightgbm hyperopt的旋转机械故障诊断（Python）

前置文章： 将一维机械振动信号构造为训练集和测试集（Python） https://mp.weixin.qq.com/s/DTKjBo6_WAQ7bUPZEdB1TA 旋转机械振动信号特征提取（Python） https://mp.weixin.qq.com/s/VwvzTzE-pacxqb9rs8hEVw import…

阅读更多...

Python变量的命名规则与赋值方式

Python变量的命名规则与赋值方式

第二章：Python 基础语法第一节：变量的命名规则与赋值方式 2.1.1 引言在编程中，变量是存储数据的基本单元。变量的命名和赋值是编程语言中表达和操作数据的基础。了解和遵循变量命名规则对于编写清晰、可维护的代码至关重要。 2.1.2 变量…

阅读更多...

【linux】网络基础(1)

【linux】网络基础(1)

文章目录网络基本概念网络的定义网络的类型局域网（LAN）广域网（WAN） 网络协议OSI七层模型TCP/IP模型TCP/IP模型的结构网络传输的基本流程计算机与计算机之间的通信计算机的信息处理封装报头网络基本概念网络的定义 1.网络是指…

阅读更多...

专题一： Spring生态初探

专题一： Spring生态初探

咱们先从整体脉络上看下Spring有哪些模块，重要的概念有个直观印象。从Spring框架的整体架构和组成对整体框架有个认知。 Spring框架基础概念 Spring基础 - Spring和Spring框架组成上图是从官网4.2.x获取的原图，目前我们使用最广法的版本应该都是5.x&am…

阅读更多...

GitHub每日最火火火项目（6.30）

GitHub每日最火火火项目（6.30）

项目名称：modelscope / DiffSynth - Studio 项目介绍：该项目致力于让用户体验扩散模型的神奇魅力。扩散模型是一种具有广泛应用前景的技术，在图像生成、音频处理等领域展现出了强大的能力。通过DiffSynth - Studio，用户可以深入探…

阅读更多...

Arrays.asList 和 java.util.ArrayList 区别

Arrays.asList 和 java.util.ArrayList 区别

理解 Java 中的 Arrays.asList 和 java.util.ArrayList 的区别在 Java 编程中，Arrays.asList 方法和 java.util.ArrayList 是两种常用的处理列表数据的方式。虽然它们在功能上看起来相似，但在内部实现和使用上有着本质的不同。本文将探讨这两种方式的区…

阅读更多...

一区算法MPA|海洋捕食者算法原理及其代码实现(Matlab/Python))

一区算法MPA|海洋捕食者算法原理及其代码实现(Matlab/Python))

Matlab/Python： 本文KAU将介绍一个2020年发表在1区期刊ESWA上的优化算法——海洋捕食者算法 (Marine Predators Algorithm，MPA)[1] 该算法由Faramarzi等于2020年提出，其灵感来源于海洋捕食者之间不同的觅食策略、最佳相遇概率策略、海洋记…

阅读更多...

【Linux】IO多路复用——select，poll，epoll的概念和使用，三种模型的特点和优缺点，epoll的工作模式

【Linux】IO多路复用——select，poll，epoll的概念和使用，三种模型的特点和优缺点，epoll的工作模式

文章目录 Linux多路复用1. select1.1 select的概念1.2 select的函数使用1.3 select的优缺点 2. poll2.1 poll的概念2.2 poll的函数使用2.3 poll的优缺点 3. epoll3.1 epoll的概念3.2 epoll的函数使用3.3 epoll的优点3.4 epoll工作模式 Linux多路复用 IO多路复用是一种操作系统的…

阅读更多...

MCU复位时GPIO是什么状态？

MCU复位时GPIO是什么状态？

大家一定遇到过上电或者复位时外部的MOS电路或者芯片使能信号意外开启，至此有经验的工程师就会经常关心一个问题，MCU复位时GPIO是什么状态？什么电路需要外部加上下拉？ MCU从上电到启动，实际可分为复位前和复位后、初始…

阅读更多...

【WPF】Windows系统桌面应用程序编程开发新手入门-打造自己的小工具

【WPF】Windows系统桌面应用程序编程开发新手入门-打造自己的小工具

电脑Windows系统上的桌面程序通常是用Visual Studio 开发工具编写出来的，有两种开发方式供选择，一种是WindowForm，简称WinForm，另一种是Windows Presentation Foundation，简称WPF，这里将学习WPF项目。文章…

阅读更多...

大物3错题整理

大物3错题整理

平衡位置：在O点上的位置相位： 当N很大的时候，wxwywz。因此，平均平动动能除以3，就是能量均分定理。 W F在x上的积分 Π时无单位 180，就是单位 1rad，rad就是单位左手定则、右手定则、安培定…

阅读更多...

C++模板类与继承

C++模板类与继承

1）模板类继承普通类（常见）。 2）普通类继承模板类的实例化版本。 3）普通类继承模板类。(常见) 4）模板类继承模板类。 5）模板类继承模板参数给出的基类（不能是模板类）。示…

阅读更多...

【抽代复习笔记】24-群（十八）：循环群的两道例题

【抽代复习笔记】24-群（十八）：循环群的两道例题

例1：证明： （1）三次交错群A3是循环群，它与(Z3,)同构，其中Z3 {[0],[1],[2]}； （2）G {1,i,-1,-i}，G上的代数运算是数的乘法，则G是一个循环群&…

阅读更多...

如何解决三菱软件提示起动MELSOFT Mediative Server失败

如何解决三菱软件提示起动MELSOFT Mediative Server失败

前言： 注意，这篇文章仅针对如何解决起动MELSOFT Mediative Server失败的问题。对于其他相关的问题，请搜索其他相应的解决办法。本人是在重装三菱GX Works软件时遇到此问题的。后来搜索发现无人能妥善的关闭这个提示。因此本文介绍如何关…

阅读更多...

【Web3项目案例】Ethers.js极简入门＋实战案例：实现ERC20协议代币查询、交易

【Web3项目案例】Ethers.js极简入门＋实战案例：实现ERC20协议代币查询、交易

苏泽大家好这里是苏泽一个钟爱区块链技术的后端开发者本篇专栏 ←持续记录本人自学智能合约学习笔记和经验总结如果喜欢拜托三连支持~ 目录简介前景科普-ERC20 Ethers极简入门教程：HelloVitalik（非小白可跳） 教程概览开发工具 V…

阅读更多...

魔行观察-烤匠麻辣烤鱼-开关店监测-时间段：2011年1月至 2024年6月

魔行观察-烤匠麻辣烤鱼-开关店监测-时间段：2011年1月至 2024年6月

今日监测对象：烤匠麻辣烤鱼，监测时间段：2011年1月至 2024年6月本文用到数据源获取地址魔行观察http://www.wmomo.com/ 品牌介绍： 2013年，第一家烤匠在成都蓝色加勒比广场开业，随后几年成都国金中心店…

阅读更多...

超详细的tomcat安装以及简略项目的部署

超详细的tomcat安装以及简略项目的部署

一、安装包安装路径： 链接：https://pan.baidu.com/s/1JzPQQ2zUdnXi_FaTTG0pvg?pwdriht 提取码：riht 安装完之后我们打开，可看见以下目录结构二、环境变量配置首先打开我们电脑的高级环境变量配置我们先配置一个系统变量…

阅读更多...

Variables Reference for vscode

Variables Reference for vscode

Predefined variables Visual Studio Code 支持在调试、任务配置文件以及一些特定的设置中使用变量替换。这些变量可以使用 ${variableName} 语法在 launch.json 和 tasks.json 文件的某些键和值字符串中使用。 Predefined variables Visual Studio Code 支持以下预定义变量…

阅读更多...

Zookeeper：Zookeeper JavaAPI操作与分布式锁

Zookeeper：Zookeeper JavaAPI操作与分布式锁

文章目录一、Zookeeper JavaAPI操作1、Curator介绍2、创建、查询、修改、删除节点3、Watch事件监听二、Zookeeper分布式锁原理一、Zookeeper JavaAPI操作 1、Curator介绍 Curator是Apache Zookeeper的Java客户端。常见的Zookeeper Java API： 原生Java API。ZkC…

阅读更多...

天气网站爬虫及可视化

天气网站爬虫及可视化

摘要：随着互联网的快速发展，人们对天气信息的需求也越来越高。本论文基于Python语言，设计并实现了一个天气网站爬虫及可视化系统。该系统通过网络爬虫技术从多个天气网站上获取实时的天气数据，并将数据进行清洗和存储。同时&#…

阅读更多...

最新文章