论文浅尝 | BoxE:一种基于Box的知识图谱表示学习模型

笔记整理 | 耿玉霞,浙江大学直博生。研究方向:知识图谱,零样本学习等。


论文链接:  https://arxiv.org/pdf/2007.06267.pdf

本文是发表在NeurIPS 2020上的一篇基于Box的知识图谱表示学习模型的文章。在以往知识图谱表示学习(KG Embedding)的相关工作中,通常将知识图谱中的实体和关系均映射为n维向量空间中的一个点,而这篇文章提出将图谱中的关系表示为n维空间中的一个区域,即一个Box,基于Box的关系表示,使得表示学习模型的表达能力更强、能更好地捕获隐含在图谱中推理规则,同时可以兼容外来的推理规则。更重要的是,模型支持对图谱中多元关系(>2)的表达,对于更复杂的知识库有较强的学习能力。

1. 背景:知识图谱与知识库

通常,知识库由一组facts组成,每个fact表示为   ,即m个实体  及其关联关系   。其中关系r依据其关联实体个数的不同,称为m元关系。而知识图谱作为一种特殊的知识库,其中的关系均为二元关系,即图谱中的fact为三元组。

一般的表示学习工作主要围绕图谱的表示学习展开,而对于带有多元关系的知识库的表示学习工作则较少。

2. 模型设计

2.1 实体及关系表示

本文提出的BoxE模型将实体表示为n维向量空间中的一个点,而关系则表示为n维向量空间中的区域,即对于m元关系,它的表示为n维空间中的m个区域(即m个Boxes),如二元关系parentOf,其表示为n维空间中的两个Boxes。

具体地,每个实体的表示由两个向量组成:一个是基向量(base position vector);一个是转移向量(translational bump vector),用于将当前实体的信息转移到位于同一个fact中的其他实体的表示上;换言之,对于每一个实体,其最终的表示为融合了该实体的基向量与位于同一个fact中的其他实体的转移向量的向量表示,如对于fact  中的第  个实体,其最终表示为:

其中,  为实体  的基向量,  为其转移向量。

如对于一个fact  ,其中实体  的表示为:,  表示为:。而关系则由两个Box表示,一个代表为头实体范围的Box,另一个为代表尾实体范围的Box。基于此,作者假设,fact 成立的条件为实体最终的向量表示将出现在其对应位置的关系Box中。如下图所示,为其头实体所在的Box,为其尾实体代表的Box。

1.2 损失函数

     基于上述假设,作者设计了一个距离函数,用于约束向量空间中的实体位置及其对应的Box的位置:

      其中, 表示Box的中心位置,表示Box的宽度,, 分别表示box 的上界和下界。

     此距离函数的设计,使得实体位于其所在的Box时,函数的值较小,而实体在Box外时,函数值较大,从而产生较大的梯度。

 模型最终训练的损失函数定义为:

3. 模型能力

     

3.1 对于图谱中推理规则的捕捉

      一般地,知识库中蕴含了一些诸如层次性、对称性的逻辑规则,对于这些逻辑规则的捕捉,可以帮助知识库进行更好地推理和泛化。如已知某关系有对称属性时,对于fact 可以推理得到新的fact

  现有知识图谱表示学习的方法,如TransE可捕捉Inversion、Composition等推理规则,而对于Symmetry等规则则无法捕捉,本文提出的BoxE利用关系基于Box的表示,通过Box之间的操作实现对图谱中逻辑规则的捕捉,如对于对称规则,当关系存在对称属性时,其头尾实体对应的Box为相同的Box;而当关系为一对反关系时(Inversion规则),关系头实体对应的Box为关系尾实体对应的Box。

  推理规则的释义及现有表示学习模型对于其捕捉能力的说明见下图所示。

      其中,泛化的推理规则是指表示学习模型可以同时捕捉相同类型的推理规则的多个实例;除此之外,BoxE还可以同时捕捉不同类型的规则实例,这是以往的表示学习模型无法实现的。

3.2 对于外部引入的推理规则的融合

  一般地,对于一些已知的、先验的推理规则,以往的模型利用推理机等符号推理的方式,将这些规则应用到知识图谱的三元组实例数据上,从而推理出更多的图谱实例。现有的表示学习模型由于其向量化的表示方式,难以将这些先验规则引入模型。而BoxE中基于Box的关系表示方式,使得模型可以利用Box之间的操作将推理规则融入模型。

3.3 对于多元关系的表示和学习

  如前所述,二元关系在BoxE模型中被表示为两个Box,而对于包含多元关系的fact ,其关系由m个Box表示。这种表示方式,相比于其他处理多元关系的模型,具有更好的效果。

4. 实验结果

      作者首先在标准的知识图谱补全(KGC)的数据集如FB15k-237、WN18RR及YAGO3-10等上进行了实验,实验结果如下图所示。

BoxE相比于TransE、RotatE等模型,达到了SOTA或comparable的结果。

随后,作者在包含多元关系的JF17K、FB-AUTO等数据集上进行了知识库补全(KBC)的实验,实验结果如下图所示:

最后,为验证模型对于外来推理规则的融合能力,作者在NELL数据集的子集Sports NELL上验证了模型的性能,实验结果如下所示:

相比于BoxE模型,加入了融合模块(BoxE+RI)的模型,具有非常好的预测结果。

5.总结

(1)本文提出了一个基于Box的表示学习模型,在提升图谱补全能力的同时,对于图谱中推理规则进行了有效的捕捉,以及对于外部推理规则进行了有效的融合,同时还可泛化至包含多元关系的知识库的表示和推理。

(2)对于知识图谱表示学习等模型来说,对于先验推理规则的应用是非常重要的,其对于模型推理能力的提升可提供有效的帮助,尤其是在图谱样本稀缺、低资源的情况下;

(3)而在深度学习的背景下,BoxE这类基于区域的表示学习模型,对于图谱中实体及关系的表示提供了丰富的表达能力,这些表达更丰富的实体及关系对于其相关符号化知识(推理规则等)的引入提供了方便。


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478375.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 127. 单词接龙(图的BFS/双向BFS)

文章目录1. 题目2. 图的BFS解题2.1 单向BFS2.2 双向BFS !厉害了1. 题目 给定两个单词(beginWord 和 endWord)和一个字典,找到从 beginWord 到 endWord 的最短转换序列的长度。 转换需遵循如下规则: 每次转换只能改变…

Leaf——美团点评分布式ID生成系统

在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识。如在美团点评的金融、支付、餐饮、酒店、猫眼电影等产品的系统中,数据日渐增长,对数据分库分表后需要有一个唯一ID来标识一条数据或消息,数据库的自增ID显然不能满足…

@开发者,第二届马栏山杯国际音视频算法大赛高分攻略请查收,心动大奖等你来战!...

一秒让墙上的广告消失,保留完整墙面;户外大屏幕显示LOGO被擦除后,背景毫不违和……欢迎来到魔法世界——停!这其实并不是什么魔法,而是由弗吉尼亚理工大学提出的基于流的视频补全算法FGVC的一项应用。作为视频的“橡皮…

论文小综 | Attention in Graph Neural Networks

作者 | 方尹、杨海宏,浙江大学在读博士,主要研究方向为图表示学习近年来,图卷积神经网络(Graph Convolutional Network, GCN)利用图卷积从图结构数据中提取特征,成功应用于节点分类、图分类、链接预测等任务,用途广泛。…

LeetCode 126. 单词接龙 II(图的BFS)

1. 题目 给定两个单词(beginWord 和 endWord)和一个字典 wordList,找出所有从 beginWord 到 endWord 的最短转换序列。 转换需遵循如下规则: 每次转换只能改变一个字母。转换过程中的中间单词必须是字典中的单词。 说明: 如果…

外卖订单量预测异常报警模型实践

外卖业务的快速发展对系统稳定性提出了更高的要求,每一次订单量大盘的异常波动,都需要做出及时的应对,以保证系统的整体稳定性。如何做出较为准确的波动预警,显得尤为重要。 从时间上看,外卖订单量时间序列有两个明显的…

聊一聊“超大模型”

文 | 金雪锋源 | 知乎最近经常被问,你看“万亿的模型都出来了,你们训练的千亿模型是不是落伍了?”我想说:“虽然都叫超大模型,但是类型是不一样的,虽说每一类模型训出来都不容易,不过澄清一下概…

技术动态 | 不确定性知识图谱的表示和推理

本文转载自漆桂林知乎。作者 | 张嘉韬、漆桂林、吴天星文章链接 | https://zhuanlan.zhihu.com/p/369068016

LeetCode 665. 非递减数列(双指针)

1. 题目 给定一个长度为 n 的整数数组&#xff0c;你的任务是判断在最多改变 1 个元素的情况下&#xff0c;该数组能否变成一个非递减数列。 我们是这样定义一个非递减数列的&#xff1a; 对于数组中所有的 i (1 < i < n)&#xff0c;满足 array[i] < array[i 1]。…

数据还是模型?人类知识在深度学习里还有用武之地吗?

文 | Severus编 | 小戏近些年来&#xff0c;随着数据量越来越多&#xff0c;算力价格越来越便宜&#xff0c;根植于数据算力的深度学习茁壮成长。在这种背景下&#xff0c;作为一种强有力的表示学习方法的深度学习让人们惊讶的发现&#xff0c;只要投喂足够多的数据&#xff0c…

LeetCode 130. 被围绕的区域(图的BFS/DFS)

文章目录1. 题目2. 解题2.1 BFS2.2 DFS1. 题目 给定一个二维的矩阵&#xff0c;包含 ‘X’ 和 ‘O’&#xff08;字母 O&#xff09;。 找到所有被 ‘X’ 围绕的区域&#xff0c;并将这些区域里所有的 ‘O’ 用 ‘X’ 填充。 示例: X X X X X O O X X X O X X O X X 运行你的…

论文浅尝 - ECIR2021 | 两种实体对齐方法的严格评估

笔记整理 | 谭亦鸣&#xff0c;东南大学博士生来源: ECIR 2021在这篇工作中&#xff0c;作者对两种SOTA实体对齐方法做了广泛的研究&#xff1a;首先仔细分析了现有benchmark的过程&#xff0c;并论证了其中存在一些缺陷&#xff0c;使得原始方法给出的实验结果之间可能存在不可…

Android App包瘦身优化实践

随着业务的快速迭代增长&#xff0c;美团App里不断引入新的业务逻辑代码、图片资源和第三方SDK&#xff0c;直接导致APK体积不断增长。包体积增长带来的问题越来越多&#xff0c;如CDN流量费用增加、用户安装成功率降低&#xff0c;甚至可能会影响用户的留存率。APK的瘦身已经是…

NLP界新SOTA!吸纳5000万级知识图谱,一举刷爆54个中文任务!

大家还记得2019年底首次将GLUE榜单分数刷过90大关的百度ERNIE模型吗&#xff1f;在随后一年多的时间里&#xff0c;又陆续出现了GPT-3、Switch Transformer等一众靠模型体量取胜的千亿乃至万亿参数规模的超大预训练模型&#xff0c;似乎新训一个预训练模型没有个千亿参数都不好…

LeetCode 543. 二叉树的直径(DFS)

1. 题目 给定一棵二叉树&#xff0c;你需要计算它的直径长度。一棵二叉树的直径长度是任意两个结点路径长度中的最大值。这条路径可能穿过根结点。 示例 : 给定二叉树1/ \2 3/ \ 4 5 返回 3, 它的长度是路径 [4,2,1,3] 或者 [5,2,1,3]。注意&#xff1a;两结点之…

论文浅尝 | 用于嵌套命名实体识别的二部平面图网络(BiFlaG)

笔记整理 | 栾岱洋&#xff0c;东南大学来源&#xff1a;ACL 2020链接&#xff1a;https://www.aclweb.org/anthology/2020.acl-main.571.pdf本文提出了一种可以实现重叠主体的识别的BiFlaG&#xff08;bipartite flatgraph network&#xff09;模型&#xff0c;包含两个子图模…

不是所有问题都适合用神经网络去搞!

文 | YukiRain知乎不是所有问题都适合用神经网络预测&#xff0c;YukiRain总结了以下几种不适合用神经网络做预测的场景&#xff1a;小样本情况&#xff0c;无论是低维还是高维&#xff0c;不如SVM和贝叶斯模型低维数据&#xff0c;大样本量&#xff0c;不如各种ensemble类算法…

从Google白皮书看企业安全最佳实践

前不久Google发布了一份安全方面的白皮书Google Infrastructure Security Design Overview&#xff0c;直译的版本可以参考“网路冷眼”这版《Google基础设施安全设计概述》&#xff0c;直译点评的版本可以参考“职业欠钱”的《Google基础设施安全设计概述翻译和导读》。 此前G…

LeetCode 415. 字符串相加(大数加法)

1. 题目 给定两个字符串形式的非负整数 num1 和num2 &#xff0c;计算它们的和。 注意&#xff1a;num1 和num2 的长度都小于 5100. num1 和num2 都只包含数字 0-9. num1 和num2 都不包含任何前导零。 你不能使用任何內建 BigInteger 库&#xff0c; 也不能直接将输入的字符串…

会议交流 | 智能风控技术峰会(请关注图分析相关论坛)

2021年5月15日&#xff0c;9:00-18:00&#xff0c;DataFunSummit——智能风控技术峰会将如约而至&#xff0c;本次峰会由3位主席和8位出品人精心策划而成&#xff0c;邀请来自业界的40余位嘉宾从风控系统的架构&#xff0c;到智能风控的核心算法&#xff0c;再到内容、金融、交…