论文浅尝 | 探索用于归纳型知识图谱补全的关系语义

b070fce18f04bba623b5388970ead310.png

笔记整理:徐雅静,浙江大学在读硕士,研究方向为知识图谱的表示学习,零样本学习。

KGC指的是在不完整的KG中推理出缺失的实体。以前的多数工作仅仅考虑到直推式场景(实体都存在KG中),不能有效地解决归纳式场景(包含新出现的实体)。近年来一些基于图神经网络的方法通过聚合邻居信息来从相邻的辅助三元组捕获一些不确定的语义信息解决归纳式场景问题。但是那些方法都忽视了利用现存三元组中包含的关系语义去为新出现的实体提供更加丰富的表示信息。本文中,作者提出了一个新的模型CFAG,它分别利用粗粒度的聚合器(CG-AGG)和细粒度的生成对抗网络(FG-GAN)来解决归纳式场景。模型整个流程图如下图所示:

6f08873a66c8d37c7aa0f9fe9faabdd0.png

为了使用粗粒度的关系语义,本文首先将KG转化成一个超图,然后使用一个基于HGNN的全局聚合器去捕获全局实体信息和一个基于GNN的局部聚合器去捕获局部实体信息。最后,结合两个聚合器去获取带有多种语义的实体表示。

•超图构造过程:在超图中,超边是结点的非空子集。本文为每个关系构造两个超边   、   ,分别表示关系r关于头实体和尾实体的集合。本文中关于KG的超图被定义为3282faaa1cfc7e0bd3d181ebd9b535a0.png,  Z =  55ac9148ba9ab29b810c3f7c9e1b0502.png是超边的集合,e05239521676f8eb7b8754f1bf9d9c48.png是实体的集合,a0ba52822ef865b87b6795a54c1095b8.png。HG被定义为关联矩阵H,304a96f6fb2c65edc3dbf041bc158c09.png,Figure2(a)展示了使用三元组构造H的过程。

•全局聚合:本文中,作者借助一层HGNN构造全局聚合器捕获全局实体信息。如(b)所示,首先,作者通过聚合每个实体的超边表示形成超边特征:

9e8e809a74d27b6e2eff23cd5315a782.png

E是实体嵌入矩阵,H是关联矩阵,D是关于超边度的对角矩阵,W是表示超边权重的对角矩阵。

其次,通过聚合和s相关的超边表示去得到s的表示:

abb2ba00344afed55f1c7c813566a93d.png

  表示激活函数,24f3a49a9e03044ec0438e12681fdd54.png表示可训练的权重矩阵,e87be8a82bd9fd54ee281231ba94666b.png表示关联向量。

•局部聚合:和传统的基于GNN解决归纳式KGC任务相似,作者借助单层GNN去捕获局部实体信息。局部聚合的主要思想是通过聚合邻居表示信息去生成实体的表示。

03a6eb3f82b2b51210dadf6657a61bbb.png

dcd4e27d9fdc777121ec7e8e7da8e34f.png表示可训练的权重矩阵,54c5ea5b2cb8f0a91fc362d5ffce31aa.png是一个关于s的邻居的关联矩阵,94b54f597bc2c0fcc4bc5bee2e86a867.png

最后,通过结合局部聚合和全局聚合的表示去得到s的新的表示。

01b0be41dd87b0f2da6c2d388b5db1f5.png

由于不同的分布表示不同的语义,为了使用更加细粒度的关系语义,作者将关系与先验分布联系起来,使用条件性GAN去构造FG-GAN使得具有相同询问关系的实体表示匹配相同的分布。作者建立基于CNN的生成器希望能生成带有特定语义的实体表示,同时具备执行KGC任务的能力。

•生成器:聚合后获得的实体具有混合语义,但是对于一个特定询问关系q,实体应该具备具体的语义。为了实现,作者使用CNN作为生成器G去得到在某一具体关系下的实体表示:

d6fcddbc01998f1c6495571806fcf966.png

R 是关系嵌入矩阵、q是关系q的独热编码、K是过滤数量、14eda7fb85b0d1d0c32dfb742b952cb5.png表示第i个过滤。

生成器使用询问关系q和CG-AGG的输出作为输入,具体过程如下:

首先,它将实体和关系的表示结合成一个矩阵,然后使用过滤器对其执行卷积操作,最后将过滤器生成的特征映射到向量中,并在向量上应用激活函数作为输出。

•鉴别器:不同的关系通常表示不同的语义,在相同询问关系下的实体通常具有相似性。为了区分这种不同和相似性,作者将每种关系和先验分布联系起来,并使具有相同询问关系的实体表示匹配相同的分布。论文中作者使用带有鉴别器的对抗性训练程序来实现:

7e0c59ff72add3e1d7f187b65598931a.png

||表示连接操作,w和b表示多层感知机的参数。

•目标函数确定:模型的一个目标是强制生成器生成以查询关系 sq 为条件的实体表示,该查询关系与先验分布 pq 匹配。我们将生成器生成的表示视为负例,并将从先验分布采样的示例作为正例。训练时,生成器试图生成正例来欺骗判别器,而判别器则试图区分负例和正例。这种对抗性训练过程优化了 min-max 目标函数,如下所示:

92bd91e0535360ccaf1885c02731fdf9.png

模型的另一个目标是执行 KGC 任务。首先定义一个评分函数,它可以衡量三元组的合理性:

f1ee59599b8d9c482fb470637ce83749.png

O是由A生成的。然后使用激活函数计算O的可能性:

314f141d654b1fe50182f7459ece06ed.png

目标函数使用cross-entropy 损失:

4eb33cabbcef9b4895aebb6d2bac533a.png

考虑到这两个目标,最后的目标函数定义为:

6f88033d31fc2cc637ea146743772c5a.png

实验部分作者做了五类实验,包括与baseline方法的对比学习、消融研究、在直推式KGC场景中与直推式方法比较、新出现实体占比影响、不同生成器的影响。实验结果如下:

6f7152db7d69f2839be34d5163821113.png

4cb8603d27a9f0c43d8572a16e9f8631.png

28b4e69b8472e60be4ab962158456658.png

71105322feb3bd2efeb281d2215343fe.png

3c202714d392896a7931c210aee356f2.png

351b59c23e3000b7f5775c61b4666889.png

从实验结果中可以看出模型在几个基准数据集上的取得的效果高于之前其它模型取得的最好的结果,而且从消融实验的结果中可以看出,模型设计的聚合器和生成器都发挥了作用。

欢迎有兴趣的同学阅读原文。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

31cbbbf86521fc5523e95b27afd9a325.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477585.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关于深度学习,我们写了一本1400页的全栈手册

不知不觉写文章已经四年了。最开始是一个人,后来恰了恰饭,就招揽了很多比小夕厉害的小伙伴一起写。不知不觉已经积累了300多篇了。。三年以来,我跟小伙伴们原创的300篇深度学习与NLP领域的入门资料、子方向综述、2018~2022学术前沿解读、工业…

LeetCode 1019. 链表中的下一个更大节点(单调栈)

1. 题目 给出一个以头节点 head 作为第一个节点的链表。链表中的节点分别编号为:node_1, node_2, node_3, … 。 每个节点都可能有下一个更大值(next larger value):对于 node_i,如果其 next_larger(node_i) 是 node…

Spring Cloud Hystrix的请求合并

通常微服务架构中的依赖通过远程调用实现,而远程调用中最常见的问题就是通信消耗与连接数占用。在高并发的情况之下,因通信次数的增加,总的通信时间消耗将会变的不那么理想。同时,因为对依赖服务的线程池资源有限,将出…

LeetCode 306. 累加数(暴力回溯)

1. 题目 累加数是一个字符串,组成它的数字可以形成累加序列。 一个有效的累加序列必须至少包含 3 个数。除了最开始的两个数以外,字符串中的其他数都等于它之前两个数相加的和。 给定一个只包含数字 ‘0’-‘9’ 的字符串,编写一个算法来判…

关于深度学习,我们4年时间写了一本1400页的全栈手册

不知不觉写文章已经四年多了。最开始是一个人,后来恰了恰饭(感恩理解),就招揽了很多比小夕厉害的小伙伴一起写。不知不觉已经积累了300多篇了。。四年以来,我跟小伙伴们原创的300篇深度学习领域(含NLP、CV等…

会议交流 | 第十六届全国知识图谱与语义计算大会(工业界论坛)——8月24日-27日...

点击阅读原文,进入 CCKS 官方网站。OpenKGOpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

消费者驱动的微服务契约测试套件Spring Cloud Contract

在微服务架构下,你的服务可能由不同的团队提供和维护,在这种情况下,接口的开发和维护可能会带来一些问题,比如服务端调整架构或接口调整而对消费者不透明,导致接口调用失败。 为解决这些问题,Ian Robinson…

LeetCode 842. 将数组拆分成斐波那契序列(暴力查找)

1. 题目 给定一个数字字符串 S&#xff0c;比如 S “123456579”&#xff0c;我们可以将它分成斐波那契式的序列 [123, 456, 579]。 形式上&#xff0c;斐波那契式序列是一个非负整数列表 F&#xff0c;且满足&#xff1a; 0 < F[i] < 2^31 - 1&#xff0c;&#xff…

做CV和做NLP,是否都有光明的未来?

本文授权转载自公众号“算法圈的小破事”&#xff0c;点击以上卡片进行关注大家好&#xff0c;我是在互联网危险边缘疯狂试探的皮皮虾。最近有点忙&#xff0c;拖更了&#xff0c;不知道有没有读者惦记皮皮虾推文呢&#xff08;目测没有TT&#xff09;。首先祭出新华字典的老图…

论文浅尝 | 知识表示、多模态融合、搜索匹配三大方向探索——360人工智能研究院知识图谱算法团队...

转载公众号 | 老刘说NLP当前以促进技术发展、提升模型指标&#xff0c;探究模型天花板的竞赛越来越多&#xff0c;也逐步成为各大研究机构、互联网大厂竞相角逐的主战场。自2022年以来&#xff0c;在组员的共同努力下&#xff0c;团队(360人工智能研究院知识图谱算法团队)&…

Spring Cloud Zuul重试机制探秘

简介 本文章对应spring cloud的版本为(Dalston.SR4)&#xff0c;具体内容如下&#xff1a; 开启Zuul功能通过源码了解Zuul的一次转发怎么开启zuul的重试机制Edgware.RC1版本的优化 开启Zuul的功能 首先如何使用spring cloud zuul完成路由转发的功能&#xff0c;这个问题很简…

论文浅尝 | PASSLEAF: 一个用于不确定知识图谱嵌入的基于样本池的半监督学习框架...

笔记整理&#xff1a;杨露露&#xff0c;天津大学硕士链接&#xff1a;https://ojs.aaai.org/index.php/AAAI/article/view/16522/16329动机在不确定知识图谱的嵌入中&#xff0c;实体之间的每个关系都有一个置信度。鉴于现有的嵌入方法可能会丢弃不确定性信息&#xff0c;或只…

LeetCode 60. 第k个排列(回溯 康托展开)

文章目录1. 题目2. 解题2.1 回溯2.2 数学-康托展开1. 题目 给出集合 [1,2,3,…,n]&#xff0c;其所有元素共有 n! 种排列。 按大小顺序列出所有排列情况&#xff0c;并一一标记&#xff0c;当 n 3 时, 所有排列如下&#xff1a; “123” “132” “213” “231” “312” “…

我在谷歌实习时发现了一个模型 bug,于是有了这篇 ACL

文 | AlbertYang编 | 小轶表格的自动理解与检索已经成为 NLP 以及多模态任务中重要的一环。如果我们给模型一个冬奥会的奖牌榜并且问&#xff0c;“哪个国家的金牌最多&#xff1f;”&#xff0c;现有的模型已经可以毫不费力地输出正确的答案&#xff08;通常都是表格首行的国家…

Spring Cloud Zuul的fallback优化

如何在Zuul中使用fallback功能 我们在项目中使用Spring cloud zuul的时候&#xff0c;有一种这样的需求&#xff0c;就是当我们的zuul进行路由分发时&#xff0c;如果后端服务没有启动&#xff0c;或者调用超时&#xff0c;这时候我们希望Zuul提供一种降级功能&#xff0c;而不…

技术动态 | 「新一代知识图谱关键技术」最新2022进展综述

转载公众号 | 专知链接&#xff1a;https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.20210829近年来&#xff0c;国内外在新一代知识图谱的关键技术和理论方面取得了一定进展&#xff0c;以知识图谱为载体的典型应用也逐渐走进各个行业领域,包括智能问答、推荐系统、个人助手…

LeetCode 397. 整数替换(递归 贪心)

文章目录1. 题目2. 解题2.1 递归2.2 记忆化递归2.3 贪心1. 题目 给定一个正整数 n&#xff0c;你可以做如下操作&#xff1a; 如果 n 是偶数&#xff0c;则用 n / 2替换 n。如果 n 是奇数&#xff0c;则可以用 n 1或n - 1替换 n。 n 变为 1 所需的最小替换次数是多少&#…

搭配对比学习,万能的 prompt 还能做可控文本生成

文 | ZenMoore编 | 小轶可控文本生成&#xff0c;旨在让语言模型的输出带有我们想要的某种属性。比如情感、主题、三元组等。一般我们习惯采用 CTRL[1] 或者 PPLM[2] 等方式。但是&#xff0c;CTRL 是对整个语言模型进行 Finetuning, PPLM 因为需要在生成的过程中迭代更新 hidd…

Eureka Client注册到Eureka Server的秘密

前言 我们知道Eureka分为两部分&#xff0c;Eureka Server和Eureka Client。Eureka Server充当注册中心的角色&#xff0c;Eureka Client相对于Eureka Server来说是客户端&#xff0c;需要将自身信息注册到注册中心。本文主要介绍的就是在Eureka Client注册到Eureka Server时R…

论文浅尝-综述 | 基于强化学习的知识图谱综述

转载公众号 | 人工智能前沿讲习论文来源&#xff1a;https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.20211264摘要&#xff1a;知识图谱是一种用图结构建模事物及事物间联系的数据表示形式&#xff0c;是实现认知智能的重要基础&#xff0c;得到了学术界和工业界的广泛关注.…