论文浅尝 | 变分知识图谱推理:在KG中引入变分推理框架

本文转载自公众号:机器之心



推理知识图谱中缺失的连接已经吸引了研究界的广泛关注。在本论文中,加州大学圣塔芭芭拉分校的王威廉等研究者在知识图谱推理中引入了变分推理框架,并将路径搜索和路径推理紧密结合从而进行联合推理,这种方法提升了知识图谱推理模型的稳定性。

自动推理(Automated reasoning)作为计算系统根据观察到的证据做出新推论的一种能力,已经引起了很多研究团体的关注。近年来,人们对为复杂推理任务设计机器学习算法的兴趣一浪高过一浪,尤其在大型知识图谱(KGs)方面,数不清的实体和连接让传统基于逻辑的算法面临巨大挑战。具体来说,我们将研究定位于这种大型知识图谱多跳(multi-hop)推理的情境,目标是设计一个自动推理模型,以完善大型知识图谱中现有实体间缺失的连接。例如,若知识图谱中包含「总统」(贝拉克·奥巴马,美国)及其配偶(米歇尔,贝拉克·奥巴马)这两个实体,我们要让机器来自动完善隐藏其中的连接(米歇尔,美国)。实现该任务的系统在解答复杂问题的应用中必不可少。

为了处理多跳连接推测的问题,人们提出过各种各样的方法。一些诸如 PRA(Path Ranking Algorithm,路径排序算法)(Lao et al., 2011; Gardner et al., 2014, 2013) 的早期研究使用可重复启动的有界深度(bounded-depth)随机游走来获取路径。最近 DeepPath (Xiong et al., 2017) 和 MINERVA (Das et al., 2017) 将路径搜索问题设置为一个马尔可夫决策过程(MDP)并利用强化学习(RL)将预期的返回值最大化。与我们的工作同时进行的另一项工作是「推理链」(Chain-of-Reasoning,Das et al., 2016) 和复合推理 (Compositional Reasoning,Neelakantan et al., 2015) 的研究,即以 PRA 学习到的多跳链为输入来推断其关系。

这里我们将 KG 推理任务设置为两个子步骤,即「路径搜索」和「路径推理」。我们发现大多数相关研究只专注于其中一步,且其主要缺陷在于忽视了两个步骤间的交互。更确切地说,DeepPath (Xiong et al., 2017) 和 MINERVA (Das et al., 2017) 可以被理解为「路径搜索」步骤的优化,而复合推理 (Neelakantan et al., 2015) 和推理链 (Das et al., 2016) 可被认为是「路径推理」这一步的优化。DeepPath 经训练以用来使两个给定实体间的路径搜索更有效率,但无法得知实体对之间的联系存在与否;相对地,给定一对查询实体,MINERVA 会学习到达目标节点,但又无法得知搜索路径的质量。相比来说,推理链和复合推理仅仅是推断给定关系的路径,但无法得知路径搜索程序的过程。缺乏交互使得模型无法理解更多样化的输入,而且对噪声和对抗样本非常敏感。

为了提高现有 KG 推理模型的稳定性并处理更多有噪声的环境,我们打算从潜变量图模型的视角,将两个步骤结合为一个整体。这个图模型在给定实体对的条件下将路径视为离散的潜变量,将关系看作显变量,这样路径搜寻模块可以被视为使用先验分布来推断 KG 中的底层连接。与之相对,路径推理模块可被视为把底层连接划分为不同类别的似然分布。在这一假设下,我们引入近似后验,并设计了一个变分自编码 (Kingma and Welling, 2013) 算法以最大化下界。这个变分架构将两个模块紧密结合为统一的整体,并对其同时进行训练。通过积极合作和交互,路径搜索可以考虑到搜索到路径的价值并使用更有意义的路径。与此同时,路径推理模块会收到路径搜索模块传来的多样性路径,从而更好地归纳未知的情境。我们的贡献在于以下三点:

  • 在 KG 推理中引入了变分推理框架,将路径搜索和路径推理紧密结合从而进行联合推理。

  • 成功地在训练中加入反面样本,同时提高了现有 KG 推理模型的稳定性。

  • 本文的模型可以扩展到大型 KG,并在两项任务中得到最高水平的结果。

论文的其它部分结构如下:在第 2 部分我们将概述 KG 嵌入、多跳推理以及变分自编码的相关研究;在第 3 部分描述我们的变分知识推理工具 DIVA;第 4 部分展示了试验结果;第 5 部分为结论。

640?wx_fmt=png

图 1:本文所提出的方法的概率图模型。虚线框内的箭头代表整个连接空间中以多项分布建模的近似后验。实线框内的箭头代表先验和似然分布。

640?wx_fmt=png

图 2:CNN 路径推理机概览。

640?wx_fmt=png

图 3:路径搜索模型概览。注意,在近似后验中存在 r_q 而在路径搜索模型中不存在 r_q

640?wx_fmt=png

表 2:基于 NELL 数据集的 MAP 结果。鉴于 MINERVA (Das et al., 2017) 只取用了 12 个初始关系中的 9 个,我们在此展示了 NELL-995 数据集两个版本的结果。

640?wx_fmt=png

表 3:基于 FB15k 数据集的结果,请注意,MINERVA 的结果是由我们实现获取的。

640?wx_fmt=png

图 5:NELL 和 FB15k 连接推理任务的误差分析。由于 FB15k 数据集将占位符也作为实体,我们无法分析出误差是否来源于 KG 的噪声。

论文:变分知识图谱推理

640?wx_fmt=png

论文链接:https://arxiv.org/abs/1803.06581

推理知识图谱中缺失的连接已经吸引了研究界的广泛关注。在本文中,我们处理了一类包含推理给定实体对间关系的实际查询任务。我们将这类问题设计为一个概率图模型下的推理问题并试图从变分推理的视角解决它。为了建立查询实体对的关系模型,我们假设 KG 中存在潜变量(所有连接这两个节点的路径集合),即它们之间的联系。但由于大型 KG 内的关联问题难以解决,我们提出用变分推理来使 ELBO 最大化。更确切地说,我们的框架(DIVA)由三个模块组成——后验近似、先验(路径搜索)以及似然估计(路径推理)。通过变分推理方法,我们成功将三者紧密结合为一个统一的架构,同时对其联合优化以实现 KG 推理。随着伴随子模块间的积极交互,DIVA 可以更好地处理噪声并应付更复杂的推理情境。为评估我们的方法,我们基于 NELL-995 和 FB15k 数据集执行了连接推理任务试验,而在两个数据集下的表现都达到了很高的水准。640?wx_fmt=png


本文为机器之心编译,转载请联系该公众号获得授权



OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480764.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器学习中的最优化算法总结

https://zhuanlan.zhihu.com/p/42689565 机器学习中的最优化算法总结对于几乎所有机器学习算法,无论是有监督学习、无监督学习,还是强化学习,最后一般都归结为求解最优化问题。因此,最优化方法在机器学习算法的推导与实现中占据中…

以jieba为首的主流分词工具总结

工具篇 下面列了几个较为主流的分词工具(排名不分先后,大家自行试用),相关的paper请在订阅号「夕小瑶的卖萌屋」后台回复【中文分词】领取。 1 Jieba 说到分词工具第一个想到的肯定是家喻户晓的“结巴”中文分词,主…

mikechen详谈架构师成长之3大步骤

本文作者:陈睿|mikechen,优知学院创始人 这是架构师系列的第二篇文章 前文谈到架构师核心技能架构设计的重要性,如果你对架构师这个职位从技能的角度有比较清晰的认识,本篇文章将为你继续揭示架构师这个职位的成长周期。 在国内…

论文浅尝 | 二维卷积知识图谱嵌入

链接:https://arxiv.org/pdf/1707.01476.pdf本文主要关注 KG Link prediction 问题,提出了一种多层卷积神经网络模型 ConvE,主要优点就是参数利用率高(相同表现下参数是 DistMult 的8分之一,R-GCN 的 17 分之一&#x…

如何成为架构师?3条有效的实战经验

“ 希望你看完这一篇,能充分认知和了解架构师,认知对了,事就好办了。 01 架构师的准确定义 架构师的职责应该是立足于技术和业务之间的中间角色或者平衡点, 在针对业务深刻理解的基础上,针对业务中存在诸多变数&am…

ArchSummit2016干货分享+美团:即时物流调度平台实践+一点资讯:兴趣引擎-深度融合搜索和推荐+阿里-智能问答系统的实践

** 2015年7月 ** 加入滴滴打车3个半月,感觉遇到和解决的技术问题超过之前1年的。写在这里给大家分享。 滴滴这边负责所有策略算法设计的是“策略组”,大概有20几个员工。由于滴滴的业务线越来越多(出租车,专车,快车&…

论文浅尝 | 使用变分推理做KBQA

Yuyu Zhang, Hanjun Dai, Zornitsa Kozareva, Alexander J.Smola, and Le Song: Variational Reasoning for Question Answering with KnowledgeGraph. AAAI 2018链接:https://arxiv.org/abs/1709.04071本文提出了一个可端到端训练的 KBQA 框架,可以在模…

史上最全Git学习教程

Git是世界上最先进的分布式版本控制系统,没有之一。 —— Git爱好者 Git 是一个「分布式版本管理工具」,其具备太多的优点:更方便的 Merge、更方便的管理、更健壮的系统、对网络的依赖性更低、更少的“仓库污染” 等等,这使得Git…

阿里P8架构师谈:深入探讨HashMap的底层结构、原理、扩容机制

摘要 HashMap是Java程序员使用频率最高的用于映射(键值对)处理的数据类型。 随着JDK(Java Developmet Kit)版本的更新,JDK1.8对HashMap底层的实现进行了优化,例如引入红黑树的数据结构和扩容的优化等。本文…

深入解析GBDT二分类算法(附代码实现)

目录: GBDT分类算法简介 GBDT二分类算法 2.1 逻辑回归的对数损失函数 2.2 GBDT二分类原理 GBDT二分类算法实例 手撕GBDT二分类算法 4.1 用Python3实现GBDT二分类算法 4.2 用sklearn实现GBDT二分类算法 GBDT分类任务常见的损失函数 总结 Reference 本文的主要…

论文浅尝 | 动态词嵌入

Citation: Bamler R, Mandt S. Dynamic word embeddings.InInternational Conference on Machine Learning 2017 Jul 17 (pp. 380-389).URL:http://proceedings.mlr.press/v70/bamler17a/bamler17a.pdf动机语言随着时间在不断演化,词语的意思也由于文化的…

滴滴 KDD 2018 论文详解:基于强化学习技术的智能派单模型

国际数据挖掘领域的顶级会议 KDD 2018 在伦敦举行,今年 KDD 吸引了全球范围内共 1480 篇论文投递,共收录 293 篇,录取率不足 20%。其中滴滴共有四篇论文入选 KDD 2018,涵盖 ETA 预测 (预估到达时间) 、智能派单、大规模车流管理等…

Keyword-BERT——问答系统中语义匹配的杀手锏

引子 问&答 是人和人之间非常重要的沟通方式,其关键在于:我们要理解对方的问题,并给出他想要的答案。设想这样一个场景,当你的女朋友or老婆大人在七夕前一晚,含情脉脉地跟你说 亲爱的,七夕快到了&…

阿里P8架构师谈:Docker简介、组成架构、使用步骤、以及生态产品

Docker简介 Docker是DotCloud开源的、可以将任何应用包装在Linux container中运行的工具。 Docker基于Go语言开发,代码托管在Github上,目前超过10000次commit。 基于Docker的沙箱环境可以实现轻型隔离,多个容器间不会相互影响;D…

研讨会 | 知识图谱前沿技术课程暨学术研讨会(武汉大学站)

知识图谱作为大数据时代重要的知识表示方式之一,已经成为人工智能领域的一个重要支撑。4月28日,“武汉大学信息集成与应用实验室”与“复旦大学知识工场实验室”联合举办“知识图谱前沿技术课程暨学术研讨会”,将结合知识图谱学界研究与业界应…

LayerNorm是Transformer的最优解吗?

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

观点 | 滴滴 AI Labs 负责人叶杰平教授:深度强化学习在滴滴的探索与实践+关于滴滴智能调度的分析和思考+滴滴派单和Uber派单对比

AI 科技评论按:7 月 29 日,YOCSEF TDS《深度强化学习的理论、算法与应用》专题探索报告会于中科院自动化所成功举办,本文为报告会第一场演讲,讲者为滴滴副总裁、AI Labs 负责人叶杰平教授,演讲题为「深度强化学习在滴滴…

消息中间件系列(二):Kafka的原理、基础架构、以及使用场景

一:Kafka简介 Apache Kafka是分布式发布-订阅消息系统,在 kafka官网上对 kafka 的定义:一个分布式发布-订阅消息传递系统。 它最初由LinkedIn公司开发,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。Kafka是一种快速、…

丁力 | cnSchema:中⽂知识图谱的普通话

本文转载自公众号:大数据创新学习中心。3月10日下午,复旦大学知识工场联手北京理工大学大数据创新学习中心举办的“知识图谱前沿技术课程暨学术研讨会”上,OpenKG联合发起⼈、海知智能CTO丁力博士分享了以“cnSchema:中⽂知识图谱…

详解ERNIE-Baidu进化史及应用场景

一只小狐狸带你解锁 炼丹术&NLP 秘籍Ernie 1.0ERNIE: Enhanced Representation through Knowledge Integration 是百度在2019年4月的时候,基于BERT模型,做的进一步的优化,在中文的NLP任务上得到了state-of-the-art的结果。它主要的改进是…