LLM大模型x知识图谱2024最新SOTA方案【附开源代码】

大模型LLM与知识图谱KG的结合可以充分发挥两者的优势,例如LLMs的通用知识和语言处理能力,以及KGs的结构化和准确性。这种结合不仅能够提升模型的知识处理能力,还能够在多个层面上优化模型的性能,更好地解决各种现实世界的问题,例如搜索引擎、推荐系统和AI助手等。

今天我就盘点了大模型结合知识图谱最新的35个技术方案,2024年的已经帮同学们分析好了方法和创新点,部分开源代码也都整理了,剩余技术方案和项目代码需要的同学看文末

Evaluating Large Language Models in Semantic Parsing for Conversational Question Answering over Knowledge Graphs

「方法:」通过对不同大小和训练目标的LLMs生成的输出进行系统比较,重点关注优化于对话交互的模型。通过广泛的基准数据集,作者评估了模型在从对话中生成SPARQL查询方面的性能,并讨论了它们的个体能力和限制。作者的贡献包括评估四个LLMs的基准研究,利用自动评估和人工评估来识别生成的图查询中的八种常见错误类型,并详细讨论了用于改善模型性能的提示和微调策略。

「创新点:」

  • 本文评估了未经过专门训练的大型语言模型在对话语义解析任务上的性能,通过一系列实验比较了不同大小的模型和不同提示技术的性能,并识别了生成输出中的常见问题类型。

  • 与之前的模型不同,本文采用了上下文学习和后处理的方法,实现了端到端的结构化查询生成。本文旨在研究大型语言模型在理解对话、解决词汇问题和生成具有正确语法的SPARQL查询方面的性能。

keqing: knowledge-based question answering is a nature chain-of-thought mentor of LLM

「方法:」作者提出了Keqing框架,该框架的主要内容是通过预定义的模板将复杂问题分解为子问题,并在知识图谱上检索候选实体,然后通过推理回答子问题,并生成带有推理路径的回答。实验结果表明,Keqing在知识图谱问答数据集上取得了竞争性的性能,并且能够解释每个问题的回答逻辑。

「创新点:」

  • 提出了问题分解模块,将复杂的用户问题根据预定义的问题模板分解为多个子问题。这种设计的思想是,文本形式的问题分解逻辑相对于SQL形式更容易被大型语言模型(LLMs)捕捉到。每个真实世界的问题都可能有多个解决方案(推理路径)来达到潜在的答案候选,而足够的答案候选可以为后续的答案推理过程提供容错能力。

  • 提出了候选推理模块,根据分解的子问题的依赖关系,选择正确的实体来回答当前问题,并迭代地得出最终答案。通过问题分解和知识检索,得到了答案候选,然后利用候选推理模块选择正确的实体,并根据子问题的依赖关系逐步得出最终答案。

  • 提出了基于知识图谱的检索模块,用于收集相关的三元组,为LLMs提供高质量的上下文信息,以完成知识库问答任务。与基于嵌入的语料库检索方法不同,该方法可以精确地提供高质量的上下文信息,避免了重复或无关的内容对LLMs生成的响应质量的影响。

Quartet Logic: A Four-Step Reasoning (QLFR) framework for advancing Short Text Classification

「方法:」作者引入了Quartet Logic: A Four-Step Reasoning(QLFR)框架,该框架将STC任务分解为四个步骤:关键概念识别、常识知识检索、文本重写和分类。通过引导CoT,该框架有效地解决了STC中的语义和句法复杂性问题。作者还提出了CoT-Driven Multi-task learning(QLFR-CML)方法,通过从LLMs中转移任务相关的知识来增强较小模型的性能。

「创新点:」

  • 引入了Quartet Logic: A Four-Step Reasoning (QLFR)框架,这是一种基于CoT提示的多步推理方法,用于改进LLM在STC任务中的性能。该框架通过四个步骤的推理来引发内在的知识和能力,然后确定预测的标签。

  • 提出了Syntactic and Semantic Enrichment CoT (SSE-CoT)的CoT方法,提供了一个四步推理的方法,用于提高输入文本的清晰度和上下文,并丰富其解释深度。

TechGPT-2.0: A large language model project to solve the task of knowledge graph construction.

「方法:」研究重点是评估具有减少参数的大型模型在知识图谱构建任务中的性能,旨在为中国开源社区提供一个能够构建知识图谱并保留Chat模型整体能力的实用模型。所有模型都是从LLAMA2派生而来,首先在中文上进行预训练,然后使用大量指令进行微调。该报告还介绍了在TechGPT-2.0项目开发过程中遇到的挑战和得出的经验。此外,报告还讨论了模型训练中遇到的问题以及解决长文本挑战的技术解决方案。

「创新点:」

  • 作者提出了QLoRA fine-tuning的方法,通过使用位置插值来解决处理长文本时遇到的问题。

  • 作者开发了两个7B-scale模型,用于知识图谱构建任务,并针对长文本问题设计了QLoRA权重。

  • 作者发现当前小规模大模型在知识图谱构建任务中表现不佳,旨在填补中国开源社区在该领域的空白。

The Earth is Flat? Unveiling Factual Errors in Large Language Models

「方法:」作者设计并实现了FactChecker,这是第一个专门用于系统性发现LLM中事实错误的自动化框架。FactChecker利用结构化的知识图谱自动生成各种主题和关系的问题,通过对LLM的回答进行评估,成功地检测出了大量的事实错误。

「创新点:」

  • FactChecker是第一个自动化框架,用于系统地揭示LLMs中的事实错误。

  • FactChecker可以有效地发现商业和研究LLMs中的大量事实错误。

  • FactChecker可以通过In-Context Learning(ICL)和模型微调方法显著提高LLMs的事实准确性。

  • FactChecker的测试结果表明,通过ICL方法,事实错误的平均改进率为6.5%,通过模型微调方法,事实错误的显著改进率为33.2%。

Chain of History: Learning and Forecasting with LLMs for Temporal Knowledge Graph Completion

「方法:」本文提出了一种新颖的方法,将时间链接预测视为历史事件链中的事件生成任务,以提高语言模型的推理能力。研究通过有效的微调方法,使语言模型适应特定的图文信息和时间线模式。同时,引入基于结构的历史数据增强和逆向知识的整合,以增强语言模型对结构信息的感知能力。

「创新点:」

  • 作者通过对三种商业LLM模型在TKGC任务上的测试,探索了多任务指令微调和人类反馈强化学习(RLHF)后的性能差异。

  • 作者将TKGC任务建模为在历史事实链上的事件生成过程,并利用LLM的微调来增强其生成时间事件的能力。

  • 作者通过结构化的历史数据增强和引入逆向四元组来解决逆转问题,提高了LLM感知图结构的能力。

Conversational Question Answering with Reformulations over Knowledge Graph

「方法:」作者提出了一种创造性地将问题改写和强化学习结合在知识图谱上的模型CoRnNet,以实现准确的多轮对话式问答。CoRnNet利用师生蒸馏方法和强化学习从知识图谱中找到答案。实验结果表明,CoRnNet在各种基准数据集上超过了现有方法。

「创新点:」

  • 利用现有的LLMs(GPT2和Bart)进行微调,生成高质量的改写,以人类编写的改写作为基准。这一方法提高了ConvQA的性能。

  • 提出了一种师生架构,进一步提高了ConvQA的性能。CoRnNet直接使用训练数据中的人类编写改写来训练师傅模型,并使用LLMs生成的改写来间接训练学生模型,以模仿师傅模型的输出,从而接近人类水平的性能。

  • 提出了一种基于RL的模型,通过从策略网络中采样动作来引导遍历知识图谱(KG)并定位答案。这一方法在定位答案方面表现出了有效性,并且优于现有的对话式问答基线模型。

Think and Retrieval: A Hypothesis Knowledge Graph Enhanced Medical Large Language Models

「方法:」本文提出了HyKGE,一种通过整合LLMs和知识图谱来增强医学大型语言模型的假设知识图谱。作者还提出了一个片段重新排序模块,通过分而治之的思想,进一步增强用户查询和外部知识推理路径之间的对齐。通过案例研究,展示了HyKGE模型在使用GPT-3.5 Turbo时的有效性。

「创新点:」

  • 我们提出了HyKGE,这是一种融合了大型语言模型和知识图谱的假设知识图增强医学模型,通过整合LLMs和知识图谱,HyKGE在解决准确性和可解释性挑战方面展现出卓越的性能。

  • 我们提出了一个片段重新排序模块,通过分而治之的思想,对检索到的知识进行重新排列和整合,进一步增强用户查询和外部知识推理路径之间的对齐。

  • 与以往的方法相比,我们让LLMs首先处理用户查询,通过LLMs的理解,获得与用户查询相关的更多医学知识。我们从"H O"和"Q"中提取医学实体。

KnowledgeNavigator: Leveraging Large Language Models for Enhanced Reasoning over Knowledge Graph

「方法:」本文研究了LLM中的知识限制挑战,并介绍了一个名为KnowledgeNavigator的框架,以提高LLM在知识图谱上的推理和问答能力。KnowledgeNavigator包括三个阶段:问题分析、知识检索和推理。在问题分析阶段,KnowledgeNavigator首先对问题进行预分析并生成变体,以辅助推理。然后,在LLM的指导下,它迭代地检索和过滤知识图谱中的候选实体和关系,提取相关的外部知识。最后,这些知识被转化为有效的提示,以提高LLM在知识密集型任务上的性能。

「创新点:」

  • 知识导航器(KnowledgeNavigator):这是一个新颖的框架,旨在通过从知识图谱中高效准确地检索外部知识来改进LLM的推理能力。知识导航器通过细化问题所隐含的约束条件来引导推理过程,并通过迭代地结合LLM的见解和问题的要求来选择性地从知识图谱中收集支持信息。最后,知识导航器将这些结构化信息准备成LLM友好的提示,增强其推理能力。

  • 问题分析:问题分析阶段通过预先分析给定的问题来增强和限制推理过程,从而解决了KGQA任务中的多跳推理问题。这种方法有助于提高检索效率和准确性。

  • 案例研究:作者通过一个案例研究展示了知识导航器在KGQA任务中的应用。知识导航器首先基于PLM预测从核心实体“Babaloo Mandel”开始的推理跳数,并为目标问题生成2个类似的问题,以供LLM使用。

Urban Generative Intelligence (UGI): A Foundational Platform for Agents in Embodied City Environment

「方法:」本文介绍了城市生成智能(UGI)系统的架构和方法。UGI系统旨在利用大型语言模型驱动的智能代理来模拟城市的复杂动态,并支持决策等各种应用。该系统的关键组件包括开放数字基础设施、城市模拟器、城市知识图谱和各种数据流。

「创新点:」

  • 建立多学科协作的UGI开发者社区,使得大数据、城市模拟、大型语言模型等领域的研究人员和开发人员能够共享数据集、数据处理方法和数据生成方法,为UGI提供高质量的数据流。

  • 引入大型语言模型(LLMs)来增强城市智能代理的能力。通过将多源城市数据训练到基于城市的大型语言模型CityGPT中,UGI能够创建具有人类级智能的具体代理,这些代理能够解决各种城市挑战,并在社会、经济和环境等方面提供洞察和解决方案。

  • UGI平台提供了一个开放的数字基础设施,集成了城市模拟器、城市知识图谱和各种数据流。这个基础设施不仅能够收集大量的空间-时间数据,模拟城市系统的复杂交互,还能够提供标准的语言接口,方便大型语言模型和生成代理的插件。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“结合35”获取论文+代码合集

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/654545.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新火种AI|Taylor Swift不雅照被疯传!AI背后的隐患和危机引人深思...

作者:小岩 编辑:彩云 如今本就是一个信息爆炸的年代,再伴随2023年AI技术的井喷式发展,AI正在以迅雷不及掩耳之势渗透到我们生活的方方面面。不过,AI技术是一把双刃剑,我们在享受AI技术带来的便捷和实用的…

代码随想录刷题笔记 DAY17 | 平衡二叉树 No.110 | 二叉树的所有路径 No.257 | 左叶子之和 No.404

Day 17 01. 平衡二叉树(No. 110) 题目链接 代码随想录题解 1.1 题目 给定一个二叉树,判断它是否是高度平衡的二叉树。 本题中,一棵高度平衡二叉树定义为: 一个二叉树每个节点 的左右两个子树的高度差的绝对值不超…

LabVIEW直流电机转速检测与控制

研究了使用LabVIEW软件和ELVIS实验平台来检测和控制直流电机的转速。通过集成光电传感器和霍尔传感器,实现了对电机转速的精确测量和调节。 系统组成:系统由NI ELVIS实验平台、光电传感器、霍尔传感器和直流电机组成。通过这些硬件元件,系统…

架构篇19:单服务器高性能模式-Reactor与Proactor

文章目录 ReactorProactor小结上篇介绍了单服务器高性能的 PPC 和 TPC 模式,它们的优点是实现简单,缺点是都无法支撑高并发的场景,尤其是互联网发展到现在,各种海量用户业务的出现,PPC 和 TPC 完全无能为力。今天我将介绍可以应对高并发场景的单服务器高性能架构模式:Rea…

如何本地搭建Tale博客网站并发布到公网分享好友远程访问——“cpolar内网穿透”

文章目录 前言1. Tale网站搭建1.1 检查本地环境1.2 部署Tale个人博客系统1.3 启动Tale服务1.4 访问博客地址 2. Linux安装Cpolar内网穿透3. 创建Tale博客公网地址4. 使用公网地址访问Tale 前言 今天给大家带来一款基于 Java 语言的轻量级博客开源项目——Tale,Tale…

C/C++编码问题研究

文章目录 一、Unicode字符集与U8/U16/U32编码二、编码1. 占字节数2. ASCII、GB2312、GBK、GB18030 以及 UTF8 的关系3. BOM4. UTF-8的存储实现 三、编译器字符集设置1. GCC语法Example 2. MSVC语法Example 三、wchar_t五、编码转换函数六、代码 & 实践1. UTF8与UTF16、UTF3…

机器学习系列 16:使用 scikit-learn 的 Pipeline

在机器学习项目中,我们经常需要进行大量的数据预处理步骤,最后用处理干净的数据集来拟合机器学习算法得到一个合适的机器学习模型。 scikit-learn 提供了一个强大的 Pipeline 类来帮助我们将所有的数据预处理步骤和训练模型的步骤串起来。就像流水线一样…

数据目录驱动测试——深入探讨Pytest插件 pytest-datadir

在软件测试中,有效管理测试数据对于编写全面的测试用例至关重要。Pytest插件 pytest-datadir 提供了一种优雅的解决方案,使得数据目录驱动测试变得更加简单而灵活。本文将深入介绍 pytest-datadir 插件的基本用法和实际案例,助你更好地组织和利用测试数据。 什么是pytest-da…

重写Sylar基于协程的服务器(0、搭建开发环境以及项目框架 || 下载编译简化版Sylar)

重写Sylar基于协程的服务器(0、搭建开发环境以及项目框架 || 下载编译简化版Sylar) 重写Sylar基于协程的服务器系列: 重写Sylar基于协程的服务器(0、搭建开发环境以及项目框架 || 下载编译简化版Sylar) 前言 sylar是…

搜索<2>——记忆化搜索与剪枝

Part 1:记忆化搜索 记忆化搜索其实就是拿个数组记录下已经得到的值,这样再遇到的时候直接调用即可。 P1464: 虽然此题好像不用记忆化也行,但我们还是老老实实写个记忆化吧。没什么困难的地方,就是它叫你怎么干你就怎么干,记得开…

PDA移动终端怎样解决货物管理混乱问题

在现代物流仓储行业中,货物管理混乱、信息不准确是一个普遍存在的问题。为了解决这一难题,PDA移动终端应运而生,通过其强大的数据采集功能、丰富传输功能、丰富联网方式和高防护性能等,为物流仓储企业提供了一种全新的解决方案。 …

jenkins pipeline配置maven可选参数

1、在Manage Jenkins下的Global Tool Configuration下对应的maven项添加我们要用得到的不同版本的maven安装项 2、pipeline文件内容具体如下 我们maven是单一的,所以我们都是配置单选参数 pipeline {agent anyparameters {gitParameter(name: BRANCH_TAG, type: …

【笔试常见编程题03】统计回文、连续最大和、不要二、把字符串转换成整数

1. 统计回文 “回文串”是一个正读和反读都一样的字符串,比如“level”或者“noon”等等就是回文串。花花非常喜欢这种拥有对称美的回文串,生日的时候她得到两个礼物分别是字符串A和字符串B。现在她非常好奇有没有办法将字符串B插入字符串A使产生的字符串…

Mysql运维篇(三) MySQL备份与恢复

一路走来,所有遇到的人,帮助过我的、伤害过我的都是朋友,没有一个是敌人。如有侵权,请留言,我及时删除! 一、物理备份与逻辑备份 1、物理备份:备份数据文件,转储数据库物理文件到某…

Web 开发 9:Django 框架基础

在本篇文章中,我们将深入探讨 Django 框架的基础知识。Django 是一个功能强大且流行的 Python Web 框架,它提供了一套完整的工具和功能,用于开发高效、可扩展的 Web 应用程序。 什么是 Django? Django 是一个基于 Python 的免费…

【qt】switchBtn

方法1 在qtdesigner中设置按钮图标的三个属性,normal off 、normal on和checkabletrue。 from PyQt5.QtWidgets import * from PyQt5.QtGui import * from PyQt5.QtCore import * from PyQt5 import uic from switchBtn import Ui_Dialogclass Test(QDialog, Ui_…

Python判断语句——if语句的基本格式

一、引言 在Python编程语言中,if语句是一种基本的控制流语句,用于根据特定条件执行不同的代码块。它的基本格式相对简单,使得Python代码清晰、易于阅读。下面,我们将深入探讨if语句的基本格式、用法和注意事项。 二、if语句的…

Date类型转成字符类型(String),字符类型(String)转成Date类型

效果图 注意:不建议使用YYYY-MM-dd HH:mm:ss格式,使用yyyy-MM-dd HH:mm:ss格式 import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date;public class DateTimeDemo {public static void main(String[] args) thro…

群辉开启WebDav服务+cpolar内网穿透实现移动端ES文件浏览器远程访问本地NAS文件

文章目录 1. 安装启用WebDAV2. 安装cpolar3. 配置公网访问地址4. 公网测试连接5. 固定连接公网地址6. 使用固定地址测试连接 本文主要介绍如何在群辉中开启WebDav服务,并结合cpolar内网穿透工具生成的公网地址,通过移动客户端ES文件浏览器即可实现移动设…

电路笔记 :MOS场效应晶体管+红外遥控+AMS1117 电源模块

三极管(BJT,Bipolar Junction Transistor)和 MOSFET(Metal-Oxide-Semiconductor Field-Effect Transistor)是两种不同类型的晶体管,它们在工作原理、性能特性和应用方面有一些重要的区别。 结构和工作原理…