论文浅尝 | Temporal Knowledge Graph Completion Using Box Embeddings

eb8a10731ca98ac9589837727c5234f4.png

笔记整理:杨露露,天津大学硕士

论文链接:https://www.aaai.org/AAAI22Papers/AAAI-6210.MessnerJ.pdf

动机

时态知识图谱补全(TKGC)中的主要挑战是额外学习时间戳嵌入,以便嵌入模型根据关系、实体和时间戳嵌入联合执行评分。本文提出了BoxTE,一个用于TKGC的盒子嵌入模型,建立在静态知识图谱嵌入模型BoxE之上。

亮点

本文的亮点主要包括:

(1)表明 BoxTE 具有充分的表达能力,并且具有很强的归纳能力,可以捕获丰富的推理模式和跨时间推理模式。

(2)首次在 TKGC 的背景下对归纳能力进行了全面分析。

(3)进行了详细的实验评估,并表明即使在参数有限的情况下, BoxTE 在几个 TKGC 基线上实现了最先进的性能。

模型表示

BoxTE建立在静态BoxE模型的基础上,并用时间表示法对其进行了扩展,这允许额外捕获跨时间的推理模式(具体证明请看原文),并对某些时间关系信息进行建模。

除了实体和关系表示,BoxTE定义:

(1)对于每个时间戳   、一组  维嵌入,由矩阵  表示。

每个时间戳  和关系0f60fc1a817ecd0ccbf2226003f8cf9f.png,相应的time bump为:

1a66060e124822a3498503518d7fbe9d.png

其中,  是  维标量。对于时态事实0f611bc1ee6bdcec14a29e2581b49518.png,h和t的最终实体表示为:

ec24ff043332f152351cdecad8a71197.png

然后类似于 BoxE 进行评分。直观地说,time bumps在每个时间戳都会产生不同的最终嵌入。然而,在这个时间戳中,每个关系也可能会引发不同的实体表示。特别是,由于关系r和s的不同标量表示,time bumps导致事实bd13982157397824e9bde58494b36112.png9c886a4f71f27578b8f2f650f1bdf278.png的h和t的不同最终嵌入。因此,BoxTE 中的time dumps是通过学习适当的标量  来表示特定于关系的时间动态。

举个例子来说明BoxTE,如下图所示。假设3a03a2779c43dad064957711dc9b7286.png,其中将单个时间戳称为5a734dc0a288af02468714649e135f55.png,以反映自然时间顺序。图的左侧和右侧分别显示了时间戳07da4fd360fc3c2edfbb9cf881bbeb39.png457586949b36b9e5af13dbe39b09e361.png处的BoxTE配置。关系r和s分别用黑色和红色进行颜色编码。

bf6f59233bcaecf4a6e299dbca4cf983.png

实验

本文根据TKG基准ICEWS14、ICEWS15和GDELT评估BoxTE。本文使用平均秩(MR)、平均倒数排名(MRR)和Hits@{1,3,10}评估BoxTE,具体来说,使用集合{2,3,5}中的k值进行实验,并使用验证来调整嵌入维数d、训练批大小和负样本数。此外,还使用TNTComplEx的时间平滑正则化器进行了实验,并考虑了时间嵌入的因子分解以鼓励参数共享。最后,使用交叉熵损失训练BoxTE,主要使用了Adam优化器,模型具体对比结果如下图所示。

dafc546b19ac4e46a727d130a25d2b8a.png

可以看出,BoxTE在GDELT上实现了最先进的性能,在MRR方面轻松超过了TeMP。此外,BoxTE在ICEWS14和ICEWS15上也表现出色。在ICEWS14上,BoxTE也优于TeMP,与TNTComplEx和ChronoR竞争。这一趋势也影响到ICEWS15,尽管数据集稀疏,但BoxTE仍然很强。

一方面,GDELT涉及显著的时间可变性:一些事实在多个连续的时间戳中持续存在,而另一些则是暂时的和稀疏的。因此,GDELT需要强大的时间感应能力。事实上,在GDELT上,大多数TKGC模型都无法击败简单的基于规则的系统TED,进一步突出了该数据集中时间模式的普遍性。因此,BoxTE的强大性能表明,该模型捕获了时间模式,并利用这些信息来超越现有模型。

另一方面,两个ICEWS数据集都提供了有限的时间信息。事实上,这些数据集中的关系相当稀疏,通常以有限的(如果有的话)规律性编码一次性模式,例如官方访问、谈判、声明。因此,ICEWS数据集的时间丰富性和可变性大大降低,而更多地依赖实体驱动的预测。同样的TKGC模型在GDELT上表现不佳,现在在ICEWS14和ICEWS5-15上大大优于TED,这一事实进一步突显了这一点。因此,两个ICEWS数据集都包含很少的时间模式供BoxTE捕捉,这大大降低了该模型相对于其竞争对手的归纳优势。

另外,就相对于k的性能而言,在ICEWS14上,当k=2时,BoxTE表现最好,而在ICEWS5-15和GDELT上,最佳k值均为5。这可以归因于ICEWS5-15中的时间步长显著增加。事实上,ICEWS5-15包含4017个时间戳,而ICEWS14仅包含365个。因此,需要更多的灵活性来学习这些时间戳中充分不同的时间行为,这与BoxTx对高k优势的直觉相一致。GDELT结果还强调了高k的重要性,因为它们证实了需要更灵活的能力来适应它提供的丰富事实集。

最后,当在所有基准上进行训练时,BoxTE是鲁棒的,因为即使没有时间平滑正则化的补充,它也保持了强大的性能。相比之下,TNTComplEx和ChronoR在没有正则化的情况下受到了很大的影响。这进一步突出了BoxTE的归纳能力,它可以从数据中自主学习时间特性,并表明该模型是一种强大的自然选择,适用于未知正则化或与数据不兼容的新型数据集。

总结

本文提出了BoxTE,一种时间知识图嵌入模型,并表明该模型具有充分的表达能力,并捕获了丰富的时间推理模式。然后,根据经验评估了BoxTE,并表明该模型在TKGC方面实现了最先进的性能,并从其感应能力和鲁棒性中受益匪浅。与 BoxE 类似,BoxTE 自然适用于更高元的知识库。不幸的是,尽管它具有巨大的潜力和广泛的适用性,但没有建立更高数量的时态知识图完成的基准。因此,为时态知识库补全引入新的基准,涉及更高数量的事实来研究 BoxTE 以及其他模型在此设置中的性能是个有趣的研究方向。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

3ea1e0168f3b88cd1963fc432399747e.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477488.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

别再无脑wwm了,在下游任务中不一定有效

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

逻辑斯谛回归模型( Logistic Regression,LR) 最大熵模型(Max Entropy,ME)

文章目录1. Logistic Regression 模型1.1 logistic 分布1.2 二项逻辑斯谛回归模型1.3 模型参数估计1.4 多项逻辑斯谛回归1.5 Python代码2. Maximum Entropy 模型2.1 最大熵原理2.2 最大熵模型的定义2.3 最大熵模型的学习2.4 例题3. 模型学习的最优化算法4. 鸢尾花LR分类实践1. …

Spring Cloud构建微服务架构:服务注册与发现(Eureka、Consul)【Dalston版】

已经有非常长的时间没有更新《Spring Cloud构建微服务架构》系列文章了,自从开始写Spring Cloud的专题内容开始就获得了不少的阅读量和认可,当然也有一些批评,其中也不乏一些很中肯的意见和深度的问题,对我来说也是进一步提高的契…

虚拟专辑丨知识图谱

虚 拟 专 辑 “武大学术期刊”的“虚拟专辑” 旨在将已发表在武汉大学科技期刊中心旗下期刊的论文以时下热点领域按主题重新组合,集中推送,以方便不同专业领域的读者集中查阅、追踪最新研究成果。此次推送的“知识图谱”虚拟专辑,为近几年发…

prompt你到底行不行?

文 | 马杀鸡三明治 源 | 知乎 很久之前老板下任务要试试prompt这个大风,但是玩完后发现太菜了所以连文章都没写,刚好今天工作比较闲就来写写了。 先上结论,连续prompt为运用大模型提供了一种思路,其实这种思路早就见过不少了。。。…

LeetCode 1323. 6 和 9 组成的最大数字

1. 题目 给你一个仅由数字 6 和 9 组成的正整数 num。 你最多只能翻转一位数字,将 6 变成 9,或者把 9 变成 6 。 请返回你可以得到的最大数字。 示例 1: 输入:num 9669 输出:9969 解释: 改变第一位数字…

Spring Cloud实战小贴士:Zuul统一异常处理(二)

在前几天发布的《Spring Cloud实战小贴士:Zuul统一异常处理(一)》一文中,我们详细说明了当Zuul的过滤器中抛出异常时会发生客户端没有返回任何内容的问题以及针对这个问题的两种解决方案:一种是通过在各个阶段的过滤器…

论文浅尝 | Explainable Link Prediction in Knowledge Hypergraphs

笔记整理:陈子睿,天津大学硕士论文链接:https://dl.acm.org/doi/10.1145/3511808.3557316动机知识超图链接预测已被认为是各种知识使能下游应用的关键问题。然而,大多数现有方法主要以黑盒方式执行链接预测,它们学习实…

吴恩达入驻知乎,涨粉秒过万!知乎首答:如何系统学习机器学习

文 | 卖萌酱大家好,我是卖萌酱。昨天在知乎timeline上刷到一个问题:虽然卖萌酱已经不需要系统学习机器学习了,但无意间发现最高赞的id竟然叫“吴恩达”??好家伙,看了看回答日期,是4月8号。戳进去…

学术会议|第六届知识图谱论坛CNCC-知识图谱赋能大数据大算力

CNCC2022将于12月8日至10日在贵州省贵阳市国际生态会议中心举办,今年CNCC技术论坛数量达到122个,内容涵盖了“计算行业、人工智能、云计算、教育、安全”等30个方向。本文特别介绍将于12月9日举行的【第六届知识图谱论坛-知识图谱赋能大数据大算力】。报…

LeetCode 第 18 场双周赛(188/587,前32%)

文章目录1. 比赛结果2. 题目LeetCode 1331. 数组序号转换 easyLeetCode 1328. 破坏回文串 mediumLeetCode 1329. 将矩阵按对角线排序 mediumLeetCode 1330. 翻转子数组得到最大的数组值 hard1. 比赛结果 做出来了1, 2, 3题,第4题提交超时 2. 题目 LeetCode 1331.…

Spring Cloud实战小贴士:Zuul统一异常处理(一)

在上一篇《Spring Cloud源码分析(四)Zuul:核心过滤器》一文中,我们详细介绍了Spring Cloud Zuul中自己实现的一些核心过滤器,以及这些过滤器在请求生命周期中的不同作用。我们会发现在这些核心过滤器中并没有实现error…

ACL’22 | 为大模型定制的数据增强方法FlipDA,屠榜六大NLU 数据集

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

技术动态 | 面向可解释性的知识图谱推理研究

导读:本次演讲的主题是面向可解释性的知识图谱推理研究,报告分为以下 5 个部分:研究背景前沿进展研究动机近期研究研究展望分享嘉宾|万国佳 武汉大学 计算机学院 博士后编辑整理|xiaomei出品平台|DataFunTa…

LeetCode 1332. 删除回文子序列

1. 题目 给你一个字符串 s,它仅由字母 ‘a’ 和 ‘b’ 组成。每一次删除操作都可以从 s 中删除一个回文 子序列。 返回删除给定字符串中所有字符(字符串为空)的最小删除次数。 「子序列」定义:如果一个字符串可以通过删除原字符…

Spring Cloud源码分析(四)Zuul:核心过滤器

通过之前发布的《Spring Cloud构建微服务架构(五)服务网关》一文,相信大家对于Spring Cloud Zuul已经有了一个基础的认识。通过前文的介绍,我们对于Zuul的第一印象通常是这样的:它包含了对请求的路由和过滤两个功能&am…

预训练再次跨界!百度提出ERNIE-GeoL,地理位置-语言联合预训练!

源 | 百度NLP本文介绍『文心大模型』的一项最新工作:“地理位置-语言”预训练模型ERNIE-GeoL。论文链接:https://arxiv.org/abs/2203.09127实践中的观察近年来,预训练模型在自然语言处理、视觉等多个领域都取得了显著效果。基于预训练模型&am…

LeetCode 1333. 餐厅过滤器(Lambda排序)

1. 题目 给你一个餐馆信息数组 restaurants,其中 restaurants[i] [idi, ratingi, veganFriendlyi, pricei, distancei]。你必须使用以下三个过滤器来过滤这些餐馆信息。 其中素食者友好过滤器 veganFriendly 的值可以为 true 或者 false,如果为 true …

Spring Cloud实战小贴士:Zuul处理Cookie和重定向

由于我们在之前所有的入门教程中,对于HTTP请求都采用了简单的接口实现。而实际使用过程中,我们的HTTP请求要复杂的多,比如当我们将Spring Cloud Zuul作为API网关接入网站类应用时,往往都会碰到下面这两个非常常见的问题&#xff1…

论文浅尝 | Language Models (Mostly) Know What They Know

笔记整理:程思源、梁孝转,浙江大学在读硕士,研究方向为知识图谱的表示学习,自然语言处理,预训练对于一个语言模型,我们最终希望得到一个“诚实”的人工智能系统,即语言模型需要准确并且忠实地评…