Locality-aware subgraphs for inductive link prediction in knowledge graphs

Locality-aware subgraphs for inductive link prediction in knowledge graphs

a b s t r a c t

最近的知识图(KG)归纳推理方法将链接预测问题转化为图分类任务。 他们首先根据目标实体的 k 跳邻域提取每个目标链接周围的子图,使用图神经网络 (GNN) 对子图进行编码,然后学习将子图结构模式映射到链接存在的函数。 尽管这些方法取得了巨大的成功,但增加 k 通常会导致邻域呈指数扩张,从而因过度平滑而降低 GNN 的表达能力。 在本文中,我们将子图提取制定为局部聚类过程,旨在基于个性化 PageRank (PPR) 方法对目标链接周围紧密相关的子图进行采样。 根据经验,在三个现实世界的 KG 上,我们表明,对基于 PPR 的局部聚类提取的子图进行推理可以产生比依赖固定跳距离内的邻居更准确的链接预测模型。 此外,我们研究了平均聚类系数和节点度等图属性,并表明这些属性与基于子图的链接预测的性能之间存在关系。

1. Introduction

GNN 在集成节点特征和捕获大型复杂图中的拓扑模式时存在一些局限性 [19-22]。 因此,增加目标链接周围邻域的大小不会提高(或可能降低)GNN 的预测性能。 在本文中,我们试图解决对目标链路周围的局部感知子图进行推理是否可以比对通过固定跳数提取的子图进行推理产生更高的链路预测精度。

我们使用 PPR 围绕给定种子节点(目标链接的头部和尾部)执行局部偏置随机游走,这使我们能够对目标链接图中节点的重要性进行排名。 然后,我们依靠 PPR 分数来提取目标链接附近的局部和密集子图,用于所提出的基于 GNN 的链接预测模型的训练和推理阶段。

本文贡献:

  1. 引入一种名为 LCILP(归纳链接预测的局部聚类)的新策略,通过对基于 PPR 的局部聚类技术提取的局部感知子图进行推理来进行归纳链接预测。
  2. 研究图属性和我们提出的方法之间的关系。 我们证明了图的平均聚类系数、平均节点度和链路预测的性能之间存在关系。

3. Approach

在这里插入图片描述

(1)使用基于 PPR 的局部聚类技术提取 u 和 v 周围的子图,
(2)标记提取的子图节点,
(3)使用 GNN 模型对子图进行编码 ,
(4)对子图进行评分。

3.1. Step 1: subgraph extraction

在这里插入图片描述

子图提取由两个步骤组成:首先,根据节点与给定种子集(代表目标实体)的接近度对节点进行评分。 其次,按节点得分的降序考虑节点以创建嵌套的本地集群,然后可以使用优度度量对其进行评估。 PPR,也称为随机游走与重启,是衡量节点重要性的最常见的评分方法之一。 我们使用近似 PPR 来克服 PPR 计算成本昂贵的问题。 如算法 1 所示,我们根据种子集 = { u , v }(两个节点) 对图 G 的顶点进行排序。 近似参数维护两个向量:解向量 p 和残差向量 r,其中 p 向量是 PPR 向量的近似值,向量 r 包含近似误差。 隐形传态概率 α 控制我们从种子集的邻域中合并的信息量。 也就是说,当 α 的值接近 1 时,随机游走传送到种子节点的频率更高,因此我们更加重视节点的直接邻域。 随着 α 值的减小,我们反而更加重视种子节点的扩展(多跳)邻域。

3.2. Step 2: node labeling

们为子图中的每个实体(节点)定义一个与实体无关的嵌入。 按照 [15] ,目标关系的 u 和 v 节点周围的子图中的每个节点 i 都用元组 (d(i, u ) , d(i, v )) 标记,其中 d(i, u ) 是 节点 i 和 u 之间的最短距离(对于 d(i, v ) 也是如此)。 两个目标节点 u 和 v 被标记为 (0, 1) 和 (1, 0),以便模型可识别。 该方案捕获子图中每个节点相对于目标链接的位置。 在这里插入图片描述

3.3. Step 3: subgraph embedding

在这里插入图片描述在这里插入图片描述

3.4. Step 4: scoring and loss function

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/22938.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spark SQL - 操作数据帧

本教程将通过一个具体的案例来演示如何在Spark SQL中操作数据帧。我们将从获取学生数据帧开始,包括两种方法:一是由数据集转换而来,二是直接读取文件生成数据帧。然后,我们将对数据帧进行各种操作,如投影、过滤、统计和…

Linux系统进行DNS域名解析

文章目录 一、DNS1.1 DNS概述1.2 DNS的通俗解释1.3 域名的体系结构1.4 DNS解析的参数 1.5 DNS域名解析的过程 二、如何实现DNS(内网)2.1 DNS正向解析2.2 DNS反向解析2.3 主从DNS 一、DNS 1.1 DNS概述 DNS :Domain Name System,是域名系统的简称&#x…

Flutter Bloc之简单记录

目录 0.库安装 1.插件和自动生成 2.状态的配置 1.初始化中: 2.赋值完成后: 3.如果出错: 3.事件的配置 1.定义一个读取事件 2.定义一个更改事件 4.Bloc的设置 5.Bloc的使用 1.BlocProvider 2.内部调用 参考文章进行类的配置 0.库…

NSS题目练习7

[MoeCTF 2022]baby_file 打开看见一串源代码,需要get传参传入file 题目提示php伪协议 用dirsearch扫描发现flag.php 用php伪协议查看,回显一串base64编码 解码后得到flag [鹤城杯 2021]Middle magic 读取这两个文件 一个php正则表达式 补充&#xff1a…

解锁ArrayBlockingQueue奥秘:深入源码的精彩之旅

1.简介 ArrayBlockingQueue 是 BlockingQueue 接口的一个实现类,它基于数组实现了一个有界阻塞队列。创建 ArrayBlockingQueue 实例时需要指定队列的容量,队列的大小是固定的,无法动态增长。 主要特点包括: 有界性:A…

STM32——hal_SPI_(介绍)

SPI(串行外围设备接口)是一种高速的、全双工、同步的通信协议,通常用于短距离通信,尤其是在嵌入式系统中与各种外围设备进行通信。SPI接口由摩托罗拉公司推出,由于其简单和灵活的特性,它被广泛用于多种应用…

2023年计算机图形学课程知识总结

去年就该写的,但是去年这个时候太忙了。 就写来自己看看。留个记录留个念 文章目录 1. 图形,图像的定义2. 点阵、矢量3. 走样,反走样4. 字符裁剪精度(1) 串精度(2) 字符精度(3&…

SpringBoot打war包并配置外部Tomcat运行

简介 由于其他原因,我们需要使用SpringBoot打成war包放在外部的Tomcat中运行,本文就以一个案例来说明从SpringBoot打war包到Tomcat配置并运行的全流程经过 环境 SpringBoot 2.6.15 Tomcat 8.5.100 JDK 1.8.0_281 Windows 正文 一、SpringBoot配置打war包 第一步&a…

J-Lin烧录

1、J-linK介绍 J-Link是由德国SEGGER公司推出的,主要用于支持仿真ARM内核芯片的JTAG仿真器。它支持JTAG和SWD两种模式,可以配合多种集成开发环境(如IAR EWAR, ADS, KEIL, WINARM, RealView等)使用,支持ARM7/ARM9/ARM…

odoo16 档案管理

档案管理,odoo15升级至odoo16完善 电子档案管理是指将传统纸质档案数字化,以便更加方便、快捷、安全地进行档案管理。电子档案管理系统可以对档案进行数字化、存储、检索、共享、传递和销毁等操作,从而提高了档案管理的效率和准确性&#xf…

使用cesiumLab使shp转为3dtlies

过程不做赘述,网上大把,说下注意事项。 1. 存储3DTiles 选项 若是打开则输出的文件为glb格式文件,因为glb文件好储存易传输跨平台。cesium可以使用但无法处理,例如改变颜色,改着色器等。若是不打开则输出的文件为bm3d格式文件,此…

Bond网卡

一、Bond网卡 1.1 Bond网卡概述 Bond网卡是指使用 Linux 系统中的 Bonding 技术创建的虚拟网络接口。 Bonding 技术允许将多个物理网卡(也称为接口或端口)绑定在一起,形成一个虚拟的网络接口,以增加网络带宽、提高网络容错性和…

表达式求值中的“整型提升”概念

一.基本原理和概念 如:代码 char a,b,c ; a b c ; 该代码在计算的时候就会先将 b 和 c 提升为 int 类型进行加法后,再将数据进行截断存放在内存存放变量 a 的空间中。 (1)提升和截…

眼底照 + OCT图 + 精神状态 ,预测阿尔兹海默症

眼底照片和OCT图像,预测阿尔兹海默症 数据多模态网络模型集成可视化分析 论文:https://www.ophthalmologyretina.org/action/showPdf?piiS2468-6530%2824%2900045-9 目前,认知障碍的诊断依赖于血清和蛋白质生物标志物的检测、脑脊液检查和正…

【教程】WordPress主题子比主题 添加私密评论功能

教程如下 打开子比主题的 functions.php 文件,在最后一个 ?> 的前面添加以下代码: //私密评论 function liao_private_message_hook( $comment_content , $comment){$comment_ID = $comment->comment_ID; $parent_ID = $comment->comment_parent; $parent_emai…

[SaaS] AI+数据,tiktok选品,找达人,看广告数据

TK观察专访丨前阿里“鲁班”创始人用AIGC赋能TikTok获千万融资用AI数据做TikTokhttps://mp.weixin.qq.com/s/xp5UM3ROo48DK4jS9UBMuQ主要还是爬虫做数据的。 商家做内容:1.找达人拍内容,2.商家自己做原生自制内容,3.广告内容。 短视频&…

南京观海微电子----焊机用DC-DC 24V 升压电路分析

焊机用DC-DC 24V 升压电路分析 辅电升压电路关键元件有:UC3843、电感、MOS功率管、整流二极管等组成。其核心是UC3843。UC3843是脉宽调制IC,工作频率可达500kHz,组成电路引脚少、外围元件简单,启动电流仅需1mA,开启电压…

BC C language

题目汇总 No.1 打印有规律的字符(牛牛的字符菱形) 代码展示 #include<stdio.h> int main() {char ch=0;scanf("%c"

Meta Llama 3 残差结构

Meta Llama 3 残差结构 flyfish 在Transformer架构中&#xff0c;残差结构&#xff08;Residual Connections&#xff09;是一个关键组件&#xff0c;它在模型的性能和训练稳定性上起到了重要作用。残差结构最早由He et al.在ResNet中提出&#xff0c;并被广泛应用于各种深度…

ArUco与AprilTag 标签

一、简介 在许多计算机视觉应用程序中&#xff0c;姿势估计非常重要&#xff1a;机器人导航&#xff0c;增强现实等等。 该过程基于发现真实环境中的点与其2d图像投影之间的对应关系。 这通常是一个困难的步骤&#xff0c;因此通常使用合成或基准标记来简化操作。 最受流行的…