能发顶会!GNN结合LLMs的三大创新思路!新SOTA准确率提升10倍

LLMs在处理NLP任务方面表现出色,而GNNs在挖掘和分析复杂关系数据(图数据)方面展现出其卓越的能力。这种趋势催生了将这两种技术整合的研究兴趣,为解决更多领域的实际问题。GNN结合LLMs也逐渐成为了研究的热点。

GNN+LLMs可以发挥二者的互补优势,实现更全面的数据处理和分析,以便构建更大的模型,获得更好的性能。以港大等发布的通用图大模型GraphGPT为例:

GraphGPT通过与图结构的文本信息进行对齐,结合自监督学习的图结构信号和任务特定的图指令,引导语言模型在理解复杂图结构和提高在不同任务中的适应性方面取得了显著的改进。

GraphGPT主要贡献:

1.通过引入文本-图对齐的概念,GraphGPT框架实现了图结构与自然语言空间之间的合理对齐。

2.利用自监督信号通过图匹配任务来指导语言模型的调优。通过引入这种自监督的指令调整,语言模型可以获得与图相关的领域特定的结构知识,从而增强其对图结构的理解能力。

3.通过将思维链(COT)蒸馏引入框架,GraphGPT增强了逐步推理的能力,并在面对分布转移时提高了性能。

目前,GNN结合LLMs主要有三大创新方向:LLM作为增强器、LLM作为预测器和GNN-LLM对齐。GraphGPT就属于LLM作为预测器这类。

本文整理了这三大创新方向最新的代表性成果(共16篇),模型原文以及开源代码已附,方便各位复现。

论文原文以及代码需要的同学看文末

LLM作为增强器

LLMRec: Large Language Models with Graph Augmentation for Recommendation

方法:通过使用LLM增强模型来解决稀疏隐式反馈信号和低质量辅助信息的挑战,通过对用户交互偏好进行分析和去偏执化的项目属性。同时,为了确保增强数据的质量,引入了去噪增强鲁棒机制。

创新点:

  • 数据增强方法:作者引入了一种去噪的增强鲁棒性机制,以确保增强数据的质量。这种方法通过利用大模型的共识知识,使用LLMs作为推断模型,增强边缘和加强节点特征,从而提高模型的性能。

  • 通过LLM增强的推荐模型:作者提出了一种LLMRec模型,该模型通过建立LLMs对用户互动偏好进行建模和解除项目属性偏差,从而解决了稀疏隐式反馈信号和低质量辅助信息的挑战。

One for All: Towards Training One Graph Model for All Classification Tasks

方法:研究提出了一种名为OFA的通用框架,可以利用一个单一的图模型来解决图领域中的多样化任务。OFA使用文本属性图来统一不同的图数据,并使用语言模型将不同领域的文本属性编码成相同嵌入空间中的特征向量。

创新点:

  • 利用Text-attributed graphs (TAGs)将不同领域的图数据统一为同一种格式,使得一个单一的LLM可以将所有TAGs编码到同一个嵌入空间中。

  • 引入Nodes-of-Interest (NOI) subgraph和NOI prompt node的概念,将不同类型的图任务统一起来,并提升基于图模型的学习能力。

  • 提出了Graph Prompting Paradigm (GPP)来实现图数据的上下文学习,通过将prompt graph插入原始输入图中,使得模型可以根据任务从图中获取相关信息,实现多任务学习和零样本学习的能力。

LLM作为预测器

Can Language Models Solve Graph Problems in Natural Language?

方法:论文提出了一种名为NLGraph(Natural Language Graph)的综合基准,用于评估大型语言模型在自然语言中处理图形和结构推理的能力。NLGraph包含29,370个问题,涵盖了八个不同复杂度的图推理任务,从简单的连通性和最短路径到复杂的最大流和模拟图神经网络。

创新点:

  • 作者通过设计两种特殊情况(链和团)来评估LLMs在连接性任务上的脆弱性。

  • 作者提出了“构建图形提示”和“算法提示”两种指导方法,显著提高了LLMs在解决自然语言图问题方面的性能。

  • NLGraph基准提供了一个全面的测试平台,涵盖了八个具有不同复杂性的图推理任务。

GNN-LLM对齐

GRENADE: Graph-Centric Language Model for Self-Supervised Representation Learning on Text-Attributed Graphs

方法:作者开发一种新的图中心语言模型——Grenade,旨在为各种下游任务创建具有表现力和可泛化性的表示。通过优化两个专门的自监督学习算法:图中心对比学习和图中心知识对齐,Grenade能够有效地捕捉文本属性图上的信息文本语义和结构上下文信息。

创新点:

  • 图中心语言模型Grenade:
    • 通过结合预训练语言模型和图神经网络的协同效应,Grenade有效地捕捉了文本属性图上的信息文本语义和结构上下文信息。

    • Grenade利用了两种专门的自监督学习算法进行优化:图中心对比学习和图中心知识对齐。

  • 图中心对比学习:
    • 与传统的实例级对比学习不同,图中心对比学习还强调邻近节点共享相似表示。

    • 不同于现有方法,该方法通过考虑局部邻域信息来扩展正样本构建的设计,以捕捉复杂的图结构。

    • 图中心对比学习有效地帮助Grenade捕捉了TAG上的信息文本语义以及结构上下文信息。

  • 图中心知识对齐:
    • 节点级知识对齐通过以跨模态形式进行图中心对比学习,对两个编码器学习的表示进行对齐。

    • 邻域级知识对齐通过最小化两个编码器计算的邻域相似性分布之间的KL散度,对两个编码器之间的知识进行对齐。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“大模型GNN”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/742326.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

集智书童 | 炸裂 !轻量化YOLO | ShuffleNetv2与Transformer结合,重塑YOLOv7成就超轻超快YOLO

本文来源公众号“集智书童”,仅用于学术分享,侵权删,干货满满。 原文链接:炸裂 !轻量化YOLO | ShuffleNetv2与Transformer结合,重塑YOLOv7成就超轻超快YOLO 随着移动计算技术的迅速发展,在移动…

ECharts饼图图例消失踩的坑

在使用Echarts的饼图时,当时做法是在图例数小于8时显示全部的图例,在大于8的时候显示前8个图例。于是用了两种不同的方式处理。导致出现切换时间后图例不显示的情况。 错误过程: 在进行图例生成时采用了两种不同的方式: ①如果…

打造你的HTML5打地鼠游戏:零基础入门教程

🌟 前言 欢迎来到我的技术小宇宙!🌌 这里不仅是我记录技术点滴的后花园,也是我分享学习心得和项目经验的乐园。📚 无论你是技术小白还是资深大牛,这里总有一些内容能触动你的好奇心。🔍 &#x…

Rust生命周期和生命周期声明‘作用Missing lifetime specifier

Missing lifetime specifier:报错说明缺失声明周期声明 Rust 生命周期机制是与所有权机制同等重要的资源管理机制。 之所以引入这个概念主要是应对复杂类型系统中资源管理的问题。 引用是对待复杂类型时必不可少的机制,毕竟复杂类型的数据不能被处理器…

UDP连接树莓派时提高连接速度,降低卡顿感

背景 树莓派4B刷的是ubuntu20.4系统,使用win10自带的远程桌面连接和其连接,卡的一批,于是探索并记录下如何降低连接卡顿感 步骤一 点击显示选项, 降低显示配置和颜色深度: 步骤二 我的树莓派是通过电脑移动热点的方式…

Qt+FFmpeg+opengl从零制作视频播放器-13.打包为exe包发布软件

1.首先visual studio给生成程序添加桌面图标。 右键工程,添加新文件资源文件Resource.rc 选择导入文件,我这里导入了Player.ico文件。 添加后,在资源文件那里就可以看见ico文件。 然后编译release程序, 生成的可执行程序就带上了图标。 2.使用Qt 程序打包发布-windeployq…

AWS入门实践-AWS CLI工具的使用介绍

AWS CLI(Amazon Web Services Command Line Interface)是一个强大的工具,它允许您直接从命令行与AWS服务进行交互。这不仅可以加快许多任务的处理速度,而且还可以通过脚本自动化。 一、AWS CLI工具的安装 1、Windows 安装下载…

uniapp图片涂鸦插件(支持多种涂鸦方式,图片放大缩小)

工程地址https://gitee.com/geshijia/ct-graffiti ct-graffiti涂鸦组件使用说明 参考说明 参考链接:https://github.com/ylyuanlu/yl-graffiti 感谢作者的付出,给我提供了一些思路,并做了如下优化: 增加图片放大缩小移动功能添…

第十四届蓝桥杯蜗牛

蜗牛 线性dp 目录 蜗牛 线性dp 先求到达竹竿底部的状态转移方程 求蜗牛到达第i根竹竿的传送门入口的最短时间​编辑 题目链接:蓝桥杯2023年第十四届省赛真题-蜗牛 - C语言网 关键在于建立数组将竹竿上的每个状态量表示出来,并分析出状态转移方程 in…

[实战]API防护破解之签名验签

前言: 传统的接口在传输的过程中,是非常容易被抓包进行篡改,从而进行中间人攻击。这时候我们可以通过对参数进行签名验证,如果参数与签名值不匹配,则请求不通过,直接返回错误信息,从而防止黑客…

混合A*源码解读(c++)

基于ros中通过slam建立的栅格地图&#xff0c;使用混合A*进行路径规划。 首先是run_hybrid_astar.cpp: #include "hybrid_a_star/hybrid_a_star_flow.h" #include "3rd/backward.hpp" #include <ros/ros.h>namespace backward { backward::SignalHa…

带钢切割控制液压比例阀放大器

比例阀控制器放大器放大板技术是电液比例控制系统中的重要组成部分&#xff0c;它负责对比例阀进行精确控制&#xff0c;以实现对液压系统中流量、压力等参数的精细调节。可以实现对液压流量或压力的精确控制&#xff0c;从而使系统以更高的精度和更快的响应速度执行各种操作。…

以102flowers数据集为例训练ResNet50模型

以102flowers数据集为例训练ResNet50模型 使用飞桨高阶API&#xff0c;使用最少的代码量&#xff0c;实现在102flowers数据集训练ResNet50模型。同时可以一条命令修改成Mnist、Cifar10、Cifar100等数据集&#xff0c;换成其它模型也是只需要一句话代码。 数据集介绍 102flowe…

Zoho Mail有微信小程序啦!从微信就能直接收发邮件

Zoho Mail有微信小程序啦&#xff01;从微信就能直接收发邮件。可实现&#xff1a;从微信直接查看邮件、撰写新邮件、回复邮件。对于那些想从手机访问Zoho Mail企业邮箱来收发邮件&#xff0c;但又不想下载Zoho Mail 的手机app来占用手机存储的用户来说&#xff0c;微信小程序实…

Celery知识

celery介绍 # celery 的概念&#xff1a; * 翻译过来是芹菜 * 官网&#xff1a;https://docs.celeryq.dev/en/stable/ # 是分布式的异步任务框架&#xff1a; 分布式&#xff1a;一个任务&#xff0c;拆成多个任务在不同机器上做 异步任务&#xff1a;后台执行…

【开源】SpringBoot框架开发软件学院思政案例库系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 系统管理员2.2 普通教师 三、系统展示四、核心代码4.1 查询思政案例4.2 审核思政案例4.3 查询思政课程4.4 思政案例点赞4.5 新增思政案例评语 五、免责说明 一、摘要 1.1 项目介绍 基于JAVAVueSpringBootMySQL的软件学…

Mysql8.0.30数据data目录文件解释

数据库内存和磁盘架构 data目录展示 [rootDESKTOP-9ADRUGP data]# pwd /usr/local/software/mysql/3312/data [rootDESKTOP-9ADRUGP data]# ls -l total 96616 -rw-r----- 1 systemd-coredump input 56 Jul 24 2023 auto.cnf -rw-r----- 1 systemd-coredump input 30…

数据库基础理论知识

1.基本概念 数据(Data)&#xff1a;数据库存储的基本对象。数字、字符串、图形、图像、音频、视频等数据库(DB)&#xff1a;在计算机内&#xff0c;永久存储、有组织、可共享的数据集合数据库管理系统(DBMS)&#xff1a;管理数据库的系统软件数据库系统(DBS)&#xff1a;DBDBM…

浏览器的工作原理

从输入一个url到页面加载完成&#xff0c;中间都发生了什么&#xff1f; 参考原文地址 首先在浏览器地址栏输入一个地址并回车之后&#xff0c; 1. DNS查找 浏览器会进行DNS查找&#xff0c;把域名https://example.com转化为真实的IP地址10.29.33.xx&#xff0c;根据IP地址找…

linux驱动——中断

1.Cortex-A系列的中断的简介 中断的基本概念&#xff1a;(interrupt) 中断本质上是系统内部的异常机制,当中断产生之后&#xff0c;他会停下当前正在执行的任务&#xff0c;转而去做其他的事情,在停下当前正在执行的任务之前,要先入栈&#xff08;保护现场,其他的事情做完之后…