论文浅尝 - AAAI2021 | 从历史中学习:利用时间感知拷贝生成网络建模时态知识图谱...

笔记整理 | 朱珈徵,天津大学硕士


链接:https://arxiv.org/pdf/2012.08492.pdf

动机

大型知识图通常会增长以存储时态事实,这些时间事实对实体沿时间线的动态关系或交互进行建模。因为这样的时态知识图经常遭受不完全性的困扰,所以开发有助于推断缺失的时态事实的时间感知表示学习模型是很重要的。虽然时间事实通常是不断演变的,但据观察,许多事实往往沿着时间线呈现出重复的模式,例如经济危机和外交活动。这一观察表明,一个模型可能从历史上出现的已知事实中学到很多东西。为此,作者基于一种新颖的时间感知拷贝生成机制,提出了一种新的时态知识图表示学习模型——CyGNet。CyGNet不仅能够从整个实体词汇中预测未来的事实,而且能够通过重复识别事实,并相应地参考过去已知的事实来预测未来的事实。实验使用五个基准数据集在知识图完成任务上评估了所提出的方法。大量的实验证明了CyGNet预测未来重复事实和从头预测事实的有效性。


CyGNet的亮点主要包括:

(1)研究重复的时间事实的潜在现象,并建议在TKGs(temporal knowledge graphs,时态知识图谱)中学习推断未来事实时参考历史上已知的事实;

(2)作者通过时间感知复制生成机制提出了一个新的TKG嵌入模型CyGNet,它结合了两种推理模式,基于历史词汇或整个实体词汇进行预测,因此更符合前面提到的TKG事实的演化模式。

概念及模型

CyGNet模型主要结合了两种推理模式,即复制模式和生成模式,前者试图从特定的历史词汇中选择实体,形成历史中的重复事实,而后者从整个实体词汇中预测实体。模型整体框架如下:

  • 复制模式

复制模式旨在通过重复来识别事实,并通过从历史上已知的事实中复制来相应地预测未来的事实。对于一个四元组(s, p,?, tk) 复制模式首先用MLP生成一个索引向量Vq

然后CyGNet通过添加索引向量Vq和改变的multi-hot指示向量来界定候选空间,最小化不感兴趣实体的概率,然后用softmax函数估计历史词汇中对象实体的概率:

p(c)是一个向量,其大小等于整个实体词汇的大小,并且表示历史词汇上的预测概率。最终,p(c)的最大维度表示要从历史词汇中复制的对象实体。复制模式的优点是,它能够从一个比整个实体词汇表更分隔的候选空间中学习预测。然而,事实也可以在即将到来的快照中出现。因此,需要一个生成模式来预测这些事实。

  • 生成模式

给定相同的前述查询(s, p,?, tk),生成模式负责通过从整个实体词汇中选择对象实体来预测事实。由生成模式做出的预测将预测的事实视为完全新的事实,而不参考历史。与复制模式类似,生成模式还生成一个索引向量gq,其大小等于候选空间的大小,并使用softmax函数进行归一化以进行预测:

类似于Copy模式中的p(c),p(g)表示整个实体词汇上的预测概率。p(g)中的最大值表示作者通过生成模式在整个实体词汇表中预测的对象实体。“生成”模式是对“复制”模式的补充,具有从头预测事实的能力。

  • 学习目标

当给定一个查询时预测(对象)实体(s, p,?, tk)可以看作是一个多类分类任务,其中每个类对应一个对象。学习目标是最小化训练期间存在的TKG快照的所有事实的交叉熵损失:

  • 推论

为了确保候选空间中所有实体的概率和等于1,引入了系数α来调整复制模式和生成模式之间的权重。CyGNet将复制模式和生成模式的概率预测相结合,将这两种模式给出的每个实体的概率相加。最终预测结果将是获得最高组合概率的实体,定义如下:

理论分析

实验

在这一部分,作者用五个公开的TKG数据集证明了CyGNet的有效性,公开数据集进行实验,分别是:ICEWS18,ICEWS14, GDELT, WIKI 和 YAGO。模型的评价指标为:MRR和Hits@1/3/10 (排名在前1/3/10的正确测试结果的比例)。作者还实施了已在先前工作中广泛采用的过滤评估约束。

如图所示,CyGNet在所有情况下都能获得最佳性能。静态KGE方法通常展现足够的结果,而很大程度上落后于表现最好的TKGE方法,因为它们没有捕捉时间动态。还可以观察到,所有静态KGE方法的性能通常都优于TransE和HyTE。作者认为这是由于TransE和HyTE为每个快照独立学习表示,而不是捕获长期依赖。CyGNet在ICEWS18、ICEWS14和GDELT上的表现明显优于其他基线方法。特别是在GDELT上,因为GDELT在每个快照中比其他数据集具有更密集的训练事实,并且具有更完整的历史信息。在另外两个数据集上CyGNet也始终超越静态的KGE和TKGE方法。这意味着CyGNet通过从历史中学习,从零开始识别和预测新的事实,有效地预测未来的事实。


为了帮助理解CyGNet不同模型成分的贡献,作者还进行了一个消融研究。根据表中的结果,作者发现复制模式和生成模式都很重要。取消复制模式可能会导致MRR下降7.66%,以及其他指标的大幅下降,这表明通过参考过去已知的事实来学习预测未来的事实可能会有所帮助。另一方面,生成模式的取消导致MRR下降了5.71%,这也是该模型重新进行事实预测的能力丧失的原因之一。这些结果进一步解释了CyGNet的良好表现是由于从历史中学习的能力,以及从零开始识别和预测新事实的能力。

总结

表征和推断时态知识是一个具有挑战性的问题。在本文中,作者第一次利用复制机制来解决这个问题,基于一个假设,即未来的事实可以从历史事实中预测。提出的CyGNet不仅能够预测整个开放世界的事实,还能够重复识别事实,并根据过去出现的已知事实相应地选择未来的事实。在五个基准数据集上给出的结果证明了CyGNet在预测TKGs未来事实方面的良好表现。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478482.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 96. 不同的二叉搜索树(DP)

1. 题目 给定一个整数 n,求以 1 … n 为节点组成的二叉搜索树有多少种? 示例:输入: 3 输出: 5 解释: 给定 n 3, 一共有 5 种不同结构的二叉搜索树:1 3 3 2 1\ / / / \ \3 2 1 1 3 2/ …

Android漏洞扫描工具Code Arbiter

目前Android应用代码漏洞扫描工具种类繁多,效果良莠不齐,这些工具有一个共同的特点,都是在应用打包完成后对应用进行解包扫描。这种扫描有非常明显的缺点,扫描周期较长,不能向开发者实时反馈代码中存在的安全问题&…

领域应用 | OMAHA联盟发布“疾病临床表现”、“中毒”知识图谱及OMAHA知识库

转载公众号 | OMAHA联盟资源发布OMAHA已建立“七巧板”医学术语集、“汇知”医学知识图谱、元数据等资源,将于每月发布其中一项。具体各项发布时间为:“七巧板”术语集于每季度第一个月20日发布, “汇知”图谱于每季度第二个月20日发布&#…

聊聊推荐系统中的偏差

文 | 成指导源 | 知乎背景推荐系统中大量使用用户行为数据,作为系统学习的标签或者说信号。但用户行为数据天生存在各式各样的偏差(bias),如果直接作为信号的话,学习出的模型参数不能准确表征用户在推荐系统中的真实行…

云端的SRE发展与实践

本文根据作者在美团点评第21期技术沙龙的分享记录整理而成。 SRE(Site Reliability Engineering)是Google于2003年提出的概念,将软件研发引入运维工作。现在渐渐已经成为各大互联网公司技术团队的标配。 美团点评作为综合性多业务的互联网生活…

一种单独适配于NER的数据增强方法:DAGA

链接:http://www.elecfans.com/d/1468784.html 本文首先介绍传统的数据增强在NER任务中的表现,然后介绍一种单独适配于NER的数据增强方法,这种方法生成的数据更具丰富性、数据质量更高。0 前言 在NLP中有哪些数据增强技术?这一定是…

LeetCode 80. 删除排序数组中的重复项 II

1. 题目 给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素最多出现两次,返回移除后数组的新长度。 不要使用额外的数组空间,你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。 来源:力扣…

技术沙龙 | 图神经网络(GNN)最新研究进展分享

由于深度学习在可推理和可解释性方面的局限性,结合图计算与深度学习的图神经网络 ( GNN ) 成为近期学术界和工业界研究的热点新方向之一,并在社交网络、推荐系统等领域得到了广泛的应用。本次技术沙龙,由北京邮电大学 GAMMA Lab 博士生纪厚业…

科研福利!国内TOP3的超算中心,免费领2000核时计算资源

长久以来,超级计算机一直是各国竞相角逐的科技制高点,也是国家综合科技实力的体现,尤其是近几年,中国和美国在超算领域的竞争已经进入“白热化”。2020年,我国超级计算机在《全球超级计算机500强榜单》中首次超越美国&…

深度学习在美团推荐平台排序中的运用

美团作为国内最大的生活服务平台,业务种类涉及食、住、行、玩、乐等领域,致力于让大家吃得更好,活得更好,有数亿用户以及丰富的用户行为。随着业务的飞速发展,美团的用户和商户数在快速增长。在这样的背景下&#xff0…

LeetCode 451. 根据字符出现频率排序(map+优先队列)

1. 题目 给定一个字符串,请将字符串里的字符按照出现的频率降序排列。 输入: "tree"输出: "eert"2. 优先队列解题 先用map统计字符出现次数再将字符何其次数插入优先队列出队 struct cmp { //写在类内也可以,写在函数里也行bool…

论文浅尝 - AAAI2020 | 小样本知识图谱补全

笔记整理 | 刘克欣,天津大学硕士链接:https://arxiv.org/pdf/1911.11298.pdf动机知识图谱对于许多下游应用(例如搜索,知识问答和语义网)至关重要。然而,现有知识图谱面临不完整的问题。知识图谱补全工作能让…

ACL 2021|美团提出基于对比学习的文本表示模型,效果提升8%

文 | 渊蒙 如寐 思睿等尽管基于BERT的模型在NLP诸多下游任务中取得了成功,直接从BERT导出的句向量表示往往被约束在一个很小的区域内,表现出很高的相似度,因而难以直接用于文本语义匹配。为解决BERT原生句子表示这种“坍缩”现象,…

Android远程调试的探索与实现

作为移动开发者,最头疼的莫过于遇到产品上线以后出现了Bug,但是本地开发环境又无法复现的情况。常见的调查线上棘手问题方式大概如下: 方法优点缺点联系用户安装已添加测试日志的APK方便定位问题需要用户积极配合,如果日志添加不全…

超硬核 ICML’21 | 如何使自然语言生成提速五倍,且显存占用减低99%

文 | 炼丹学徒编 | 小轶我们忽略掉引言和介绍,直接把工作的效果丢上来,相信就足够令自然语言生成的相关同学心动——对于任何一个已有的Transformer生成模型,只需根据本文算法更改attention的计算顺序,就可以实现成倍速度提升&…

论文浅尝 | Convolutional 2D knowledge graph embedding

笔记整理 | 孙悦,天津大学1. 介绍:知识图的链接预测是预测实体之间缺失关系的任务。先前有关链接预测的工作集中在浅,快速的模型上,这些模型可以缩放到大型知识图例如基于基于平移变换的 TransE 系列。但是,这些模型比…

sysbench在美团点评中的应用

如何快速入门数据库?以我个人经验来看,数据库功能和性能测试是一条不错的捷径。当然从公司层面,数据库测试还有更多实用的功能。这方面,美团点评使用的是知名工具sysbench,主要是用来解决以下几个问题: 统一…

[中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab

[中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab: ACL 2018DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Labeled Training DataAuthorHang Yang, Yu…

论文浅尝 - ACL2020 | 通过集成知识转换进行多语言知识图谱补全

笔记整理 | 谭亦鸣,东南大学博士生概述预测图谱中缺失的事实(fact)是知识图谱构建与推理中的一个重要任务,近年来也被许多KG embedding研究的关注对象。虽然目前的KG embedding方法主要学习和预测的是单个图谱中的事实,但是考虑到KG之间不同规…