论文浅尝 | 重新实验评估知识图谱补全方法

论文作者:Farahnaz Akrami,美国德州大学阿灵顿分校,博士生。

笔记整理:南京大学,张清恒,硕士生。


     

链接:https://arxiv.org/pdf/2003.08001.pdf

代码:https://github.com/idirlab/kgcompletion

一、概述

目前的知识图谱(KG)规模庞大,但还远远不够完备。近年来,知识图谱补全(KGC)研究已然成为热门话题,其目标是将缺失的事实补充到KG中。研究者们对KG表示学习模型或嵌入(embedding)模型进行了广泛的研究,提出了众多新的嵌入模型。我们进行了实验研究以评估这些方法,本文将发表在SIGMOD 2020。

本文主要研究了KGC方法的真实有效性,同时发现了基准数据集FB15k、WN18以及YAGO3-10中存在的缺陷。这些数据集被广泛用于训练和评估众多嵌入模型,它们包含大量的反向和重复三元组,本文揭示了这些数据集中存在的数据冗余和测试集遗漏问题对嵌入模型的影响。本文研究的另一问题是FB15k数据集中存在笛卡尔积关系。数据集中存在的上述问题会导致模型准确性出现误差。此外,使用这些数据集训练KGC模型容易导致过拟合,使用上述三元组优化的模型,很难被推广到真实的应用场景中。简而言之,通过研究有以下发现:

  1. 广泛使用的基准数据集中存在数据冗余和测试集遗漏等问题,导致许多模型的准确性被高估了19%-175%;

  2. 我们发现笛卡尔积关系也会导致性能评估出现误差;

  3. 用于评估模型的许多测试用例在现实场景中不是真实存在的。

二、嵌入模型与相关数据集

对于KG中的三元组(head entity, relation, tail entity),使用 (h, r, t) 表示,嵌入模型学习它们的多维表示 h,r,t。众所周知,数据集在训练机器学习模型中起着重要作用。用于训练和测试嵌入模型的数据集存在各种问题,因此这些模型在真实场景下难以发挥效果。

FB15k & FB15k-237

FB15k数据集中包含很多反向关系,存在大量的反向三元组(h,r,t)和(h,r^{-1}, t),其中 r 和 r^{-1} 是反向关系。例如,(Avatar, film/directed_by, James Cameron)和(James Cameron, director/film, Avatar)是一对反向三元组。事实上,Freebase 使用一种特殊的关系reverse_property 来表示反向关系,例如,(film/directed_by, reverse_property, director/film)。在FB15k中,训练集中大约有70%的三元组存在反向关系,在测试集中大约有70%的三元组,其对应的反向三元组存在于训练集中。

这些数据特征表明,在链接预测任务中,嵌入模型将偏向于学习反向关系。更具体地说,该任务在很大程度上可以推断出两个关系r1和r2是否形成反向对。考虑到数据集中存在大量的反向三元组,可以不使用复杂的实体和关系嵌入模型实现上述目标。可以使用数据集中三元组的统计信息来生成类似(h,r1,t) => (h, r2, t)形式的简单规则。实际上,本文使用这样一个简单的模型,在FB15k上 FHits@1↑ 指标达到了71.6%,作为对比,目前性能最优的模型在FB15k上FHits@1↑ 的结果为73.8%。

值得注意的是,如果给定这类数据,链接预测任务在真实世界中是不存在的。对于FB15k而言,来自Freebase的冗余反向关系是人为创建的。新的事实总是作为一对反向三元组添加到Freebase中,由关系reverse_property明确表示。对于这种总是成对出现的内在逆向关系,当某个三元组对应的反向三元组已经出现在KG中时,我们是不需要预测该三元组的。因此,使用FB15k训练KGC模型会出现过拟合问题,因为学习的模型针对反向三元组进行了优化,而反向三元组无法推广到实际应用中。

文章[1]注意到了FB15k存在的上述问题,并通过去除反向关系构造了新的数据集FB15k-237。为了进一步研究FB15k中冗余数据的影响,我们进行了一些实验,比较了FB15k与FB15k-237上的几种嵌入模型的结果,下表显示了这些模型在不同指标上的结果。

             

通过实验得出的总体观察结果如下:

1. 删除反向关系后,所有方法的性能都会大大降低。正如下面的雷达图所示,在FB15k-237上嵌入模型的性能大大降低。该结果验证了基于嵌入的方法只能在反向关系上表现良好,然而,基于反向关系推理的直接方法可以实现相当甚至更高的精度。

             

2. 先前的很多工作认为一些基于TransE的改进方法明显优于TransE,我们在FB15k上的实验也证实了这一点,但在FB15k-237上它们的差距并不大。我们认为这些模型主要在反向和重复三元组上提升了结果,因此在删除这些三元组后,它们没有表现出明显的优势。这个假设可以通过我们的发现得到验证,这些模型能够正确预测而TransE未能正确预测的大多数三元组,在训练集中都有反向或重复的三元组。

WN18 & WN18-RR

WN18也存在反向关系的问题,WN18中共有18种关系,其中14种关系构成了7对反向关系对,例如(europe, has_part, republic_of_estonia)和(republic_of_estonia, part_of, europe)是反向三元组,它们涉及到的反向关系是has_part和part_of。与此同时,WN18中还有三种自反关系,分别是verb_group、similar_to和derivationally_related_form。训练集中约有93%的关系三元组,而测试集中有93%的三元组,在训练集种存在反向三元组。

为了消除WN18反向关系,文章[2]通过保留每对反向关系中的一个关系,构造了新的数据集WN18-RR。我们比较了在WN18和WN18-RR上嵌入模型的结果,得出的结论与在FB15k和FB15k-237上观察到的结论相同。具体结果如下表所示。

            

YAGO3-10 & YAGO3-10-DR

YAGO3-10具有37种关系,其中isAffiliatedTo (r1)和playsFor (r2)这两个关系所涉及到的三元组,在训练集种分别占35%和30%。在现实世界的语义上,r1包含r2,但由于它们的(subject, object)对基本上重叠,因此它们在此数据集中以重复关系出现。根据我们的实验,各种模型在r1和r2上取得的结果比其他关系要强得多。通过删除YAGO3-10中的冗余数据,本文构造了一个新的数据集YAGO3-10-DR。通过对比YAGO3-10和YAGO3-10-DR,我们得出的结论与在其他数据集上观察到的结论相同。

三、笛卡尔积关系

本文还在FB15k上发现了另一个问题,本文称为笛卡尔积关系(Cartesian product relations)问题,这个问题会导致嵌入模型的现有性能指标与实际不符。对于一个笛卡尔关系,其所涉及到的三元组中的subject-object对构成了对应的笛卡尔积。例如,关系climate是一个笛卡尔积关系,因为(a, climate, b)对于每个可能的城市a和月份b,都是有效的三元组。再例如,关系position也是一个笛卡尔积关系,因为在确定的职业体育联盟中的每个队伍都有相同的位置。对于这样的关系,链接预测问题就变成了预测一个城市是否有其一月份的气候,或者某支NFL球队是否有四分卫位置。这些关系的存在变相提高了模型的精度,而且这样的预测任务意义不大。与我们观察到的反向关系相同,FB15k中笛卡尔积关系也是人为构建的。实际上,60%的笛卡尔积关系是由特殊的“中介节点”造成的。如果要对笛卡尔积关系进行链接预测,一种简单的方法比学习复杂的嵌入模型更有效。我们实现了一种简单的方法来查找笛卡尔积关系,并在这些关系上进行链接预测任务。我们在FB15k中的9个笛卡尔积关系上进行了实验,使用简单方法获得的平均FHits@10↑ 为98.3%,高于TransE的效果(96.3%)。

 

参考文献

[1]Toutanova, Kristina , and D. Chen. "Observed Versus Latent Features for Knowledge Base and Text Inference." Workshop on Continuous Vector Space Models & Their Compositionality 2015.

[2]Tim, Dettmers, and Pasquale, Minervini, and Pontus, Stenetorp, and Sebastian, Riedel. "Convolutional 2D Knowledge Graph Embeddings." AAAI 2018.


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479173.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android组件化方案及组件消息总线modular-event实战

背景 组件化作为Android客户端技术的一个重要分支,近年来一直是业界积极探索和实践的方向。美团内部各个Android开发团队也在尝试和实践不同的组件化方案,并且在组件化通信框架上也有很多高质量的产出。最近,我们团队对美团零售收银和美团轻收…

我,大学没毕业,在OpenAI搞AI,想教教你如何提升“研究品味”

文 | 蒋宝尚源 | AI科技评论在AI圈里有这么一个人,虽然大学没有毕业,但却做过谷歌大脑研究员,担任过OpenAI团队的领导人。他被人称作“怪胎”,也被人称作神童。他的名字叫做Chris Olah。在众人眼里,他的成长树在一开始…

LeetCode 889. 已知前序后序 求二叉树(不唯一)

1. 题目 返回与给定的前序和后序遍历匹配的任何二叉树。 pre 和 post 遍历中的值是不同的正整数。 示例:输入:pre [1,2,4,5,3,6,7], post [4,5,2,6,7,3,1] 输出:[1,2,3,4,5,6,7]来源:力扣(LeetCode) 链…

论文浅尝 | TANDA: Transfer and Adapt Pre-Trained Transformer Models

论文笔记整理:王春培,天津大学硕士。链接:https://arxiv.org/pdf/1911.04118.pdf动机这篇文章聚焦的是问答系统(Q&A)中的一个问题:回答句子选择(Answer Sentence Selection,AS2&…

深入浅出排序学习:写给程序员的算法系统开发实践

引言 我们正处在一个知识爆炸的时代,伴随着信息量的剧增和人工智能的蓬勃发展,互联网公司越发具有强烈的个性化、智能化信息展示的需求。而信息展示个性化的典型应用主要包括搜索列表、推荐列表、广告展示等等。 很多人不知道的是,看似简单的…

从ScrollView嵌套EditText的滑动事件冲突分析触摸事件的分发机制以及TextView的简要实现和冲突的解决办法

本篇文章假设读者没有任何的触摸事件基础知识,所以我们会从最基本的触摸事件分发处说起。 ScrollView为什么会出现嵌套EditText出现滑动事件冲突呢?相信你会有这种疑问,我们来看这么一种情况: 有一个固定高度的EditText&#xff…

LeetCode 1185. 一周中的第几天

1. 题目 给你一个日期,请你设计一个算法来判断它是对应一周中的哪一天。 输入为三个整数:day、month 和 year,分别表示日、月、年。 您返回的结果必须是这几个值中的一个 {“Sunday”, “Monday”, “Tuesday”, “Wednesday”, “Thursda…

使用NLP和ML来提取和构造Web数据

原文链接:https://blog.csdn.net/fendouaini/article/details/109374462 作者|Conner Brew 编译|VK 来源|Towards Data Science 介绍 在本文中,我们将创建一个基于战争研究所(ISW)的结构化文档数据库。ISW为外交和情报专业人员提供…

如何评价一个推荐系统的好坏?

文 | Nemo知乎本文已获作者授权,禁止二次转载现如今,推荐系统几乎无处不在。电商购物,有猜你喜欢。资讯阅读,有个性推荐。听歌看电影,都能识别你的兴趣。就连工作社交,也会提示你可能认识的人...推荐系统火…

论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks

论文笔记整理:毕祯,浙江大学硕士,研究方向:知识图谱、自然语言处理。动机消息传递神经网络(MPNN)已成功应用于现实世界中的各种应用中。但是MPNN聚合器的两个基本弱点限制了它们表示图结构数据的能力&#…

ScrollView嵌套EditText联带滑动的解决办法

本篇文章的相关内容需结合上文:从ScrollView嵌套EditText的滑动事件冲突分析触摸事件的分发机制以及TextView的简要实现和冲突的解决办法 在说完了如何解决ScrollView嵌套EditText的滑动事件冲突之后,我们接下来说一下如何实现它们两者之间的联带滑动。什…

数据库智能运维探索与实践

从自动化到智能化运维过渡时,美团DBA团队进行了哪些思考、探索与实践?本文根据赵应钢在“第九届中国数据库技术大会”上的演讲内容整理而成,部分内容有更新。 背景 近些年,传统的数据库运维方式已经越来越难于满足业务方对数据库的…

论文浅尝 | PAKDD2020 - 利用支持集中匹配信息的 few shot 事件分类方法

论文笔记整理:申时荣,东南大学博士生。来源:PAKDD 2020链接:https://arxiv.xilesou.top/pdf/2002.05295.pdf1.介绍:事件分类是一个重要的信息抽取任务,其目的是根据事件的提及实例对事件类别进行分类。目前…

梯度下降法的神经网络容易收敛到局部最优,为什么应用广泛?

文 | Summer Clover知乎本文已获作者授权,禁止二次转载这是Deep Learning Theory里很基本也很核心的一个问题。在这个问题上,初学者容易被入门教学误导,非此研究方向的业内人士也容易有过时的认知。首先问题描述不够准确。更准确的说法是&…

机器学习在美团配送系统的实践:用技术还原真实世界

在2018 AI开发者大会(AI NEXTCon)上,美团配送AI方向负责人何仁清,分享了美团在即时配送领域中机器学习技术的最新进展,以及如何通过大数据和机器学习手段,建立对线下真实世界各种场景的感知能力&#xff0c…

LeetCode 99. 恢复二叉搜索树(中序遍历)

1. 题目 二叉搜索树中的两个节点被错误地交换。 请在不改变其结构的情况下,恢复这棵树。 你能想出一个只使用常数空间的解决方案吗? 2. 解题 循环中序遍历(栈),记录不满足的节点,交换其valO(n)O(n)O(n)…

AAAI21 | Seq2Seq模型成为“复读机”的原因找到了?

文 | 苏剑林编 | Sheryc_王苏单位 | 追一科技去年笔者写过博文《如何应对Seq2Seq中的"根本停不下来"问题?》[1],里边介绍了一篇论文中对Seq2Seq解码不停止现象的处理,并指出那篇论文只是提了一些应对该问题的策略,并没有…

论文浅尝 | ICLR 2020 - 图神经网络的预训练策略

论文笔记整理:杨帆,浙江大学计算机学院。动机现有的用于图结构的预训练方法要么只关注node-level,导致在图表示空间没有区分度,要么只关注graph-level,导致在节点表示空间没有区分度。一种优质的节点表示应该保证不仅在…

常见的距离算法和相似度计算方法

原文链接:https://zhuanlan.zhihu.com/p/138107999 首发于算法加油站写文章常见的距离算法和相似度计算方法奋发的菜鸟酱​华东师范大学 计算机技术博士在读91 人赞同了该文章注:不定时更新1.常见的距离算法1.1 欧几里得距离(Euclidean Dista…

美团AI全景图:吃喝玩乐背后的黑科技

很多人都会发现日常生活已经越来越离不开美团了,这个互联网平台涵盖了吃、住、行、游、购、娱……能帮我们做很多事情,非常接地气。黄色的美团外卖骑手,橙色的摩拜单车,还有美团和大众点评的Logo……会不时出现在各个角落&#xf…