论文浅尝 \ 联合知识图谱实例和本体概念的通用表示学习

论文笔记整理:周虹廷,浙江大学研究生。研究方向:知识图谱,图表示学习等。


      

论文链接:

http://web.cs.ucla.edu/~yzsun/papers/2019_KDD_JOIE.pdf

 

本文是发表在KDD 2019上的关于知识图谱表示学习的论文。现有知识图谱表示模型通常只关注在单一视图,即实例层面或是本体层面,本文认为两个层面的信息存在相互增强促进的作用,因此一种新颖的双视图(联合)知识图谱表示模型被提出来生成更好的节点和关系的表示。在三元组补全任务和实体分类任务上,本文的模型结果明显优于已存在的模型。

 

1、Motivation

现有的知识图谱可被分别两类:(1)实例视图的知识图谱,(2)本体视图的知识图谱,并且在两个视图间存在跨视图的链接,如图1所示。

            

现有的模型通常只关注于单一层面的建模,而从上述的两个层面共同学习表示毫无疑问会提供更全面的视角。一方面,实例表示为其相应的本体表示提供详细而丰富的信息。另一方面,概念表示提供了其实例的高级总结,这对于处理观察不充分的实体时将提供极大的帮助。

因此本文提出通过两个视图分别的三元组以及跨视图链接联合建模,有效地将知识图谱两个视图上的表示学习技术有效地结合在一起。

2、Model

本文提出的JOIE模型包含两个模型组件,可从两个视图中学习嵌入:跨视图关联模型通过捕获来自相应概念实体的实例来实现两个视图之间的连接和信息流,而视图内模型则关注知识库的每个视图上的实体/概念以及关系/元关系。这些模型组件用于学习KB的不同方面。我们首先讨论每个视图的跨视图关联模型和视图内模型,然后将它们组合为JOIE的各类变体模型。

  1. 跨视图关联模型

跨视图关联模型的目标是基于KB中的跨视图链接,捕获实体嵌入空间与概念嵌入空间之间的关联,这是本文的主要贡献。本文基于两种不同的假设提出了两种对此类关联进行建模的技术:跨视图分组(CG)和跨视图转换(CT)。

             

(a) 跨视图分组(CG)

假设两个视图的知识图谱可以在同一个向量空间中被表示,并且让实例视图中所有的实体e靠近本体视图中其相关联(链接)的概念c。该方法要求两个视图中节点表示的纬度相同, loss函数如下:

             

 

(b) 跨视图转换(CT)

不同于跨试图分组方法,跨视图转换方法试图在实体嵌入空间和概念空间之间转换信息,并且不要求两个视图中节点的表示具有相同的纬度。即在转换之后,实例将被映射为本体视图空间中的表示,该表示应与其相应概念的表示接近,loss函数如下:

             

  1. 视图内模型

视图内模型的目的是在两个向量空间中分别保留知识图谱的每个视图中的原始结构信息。由于实例视图中的关系和本体视图中的元关系的语义含义不同,因此为每个视图提供单独的处理,而不是将它们组合为单个表示模式将更为合理,从而提高下游任务的性能。

我们采用了三种已有的对知识图谱进行表示的方法,即TransE,DistMult,HolE。

由于观察到在本体视图中还存在层级结构因此本文进一步提出本体的层次感知内部视图模型。与跨视图转换相似,在给定概念对(c_l,c_h)的情况下,通过以下方式将此类层次结构建模为粗略概念和关联的细微概念之间的非线性转换,loss函数更新为:

             

  1. 双视图知识库联合训练

两个视图的loss联合函数如下,ω>0作为两部分的平衡系数:

             

本文并没有直接训练J,而是在每个epoch的连续两步中的分别计算 J_intra和 J_cross,并利用ω区分视图内和交叉视图损失的学习率。

 

3、Experiment

1. 数据集

由于现存的知识图谱数据集仅覆盖了单视图,因此作者分别从YAGO和DBpedia中抽取数据,并分别提出了两个新的数据集YAGO26K- 906 and DB111K-174,具体统计信息如下

             

2. 实验结果

本文基于两组任务来评估JOIE模型:实例视图和本体视图KG上的三元组补全任务,以及桥接知识库的两个视图的实体分类任务。结果显示,在两个任务上,由于双视图信息的相互补充,得到了更好的表示结果,从而有效提升了结果表现。

                           

 

3.Case Study

本文还提供了有关本体填充和长尾关系分类的案例研究如下:

             

             

             

 

4、结论

本文通过提出一种新颖的模型JOIE共同表示现实世界的实体和本体论概念。通过描述了一个双视图的知识库,在向量空间中共同捕获了每个视图的结构化知识,以及将两个视图联系起来的跨视图链接。基于KG完成和实体分类任务的大量实验表明,我们的模型JOIE可以成功地从KB的两个视图中捕获潜在特征,并且胜过各种最新的基准

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479225.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

手握顶会顶刊论文,自信满满面试算法岗竟被刷?

2020国内深度学习框架领域百花齐放。各大公司也都陆续推出了自己的框架,大大推动了深度学习的发展。深度学习俨然已经渗入到我们生活中的每个角落,给生活带来极大便利。深度学习能够针对生产生活所面临的复杂问题,给出高准确率、操作简易、成…

爬取热门网站的热榜,集中展示

爬取热门网站的热榜,集中展示;Integrate and display hot billboard or ranked topic from hot Chinese websites 抓取知乎热榜数据存入列表 #!/usr/bin/env python # encoding: utf-8__author__ HZTimport requests import re from bs4 import Beaut…

Android官方开发文档Training系列课程中文版:分享文件之请求一个共享文件

原文地址:http://android.xsoftlab.net/training/secure-file-sharing/request-file.html 当APP需要访问一个被其它APP所共享的文件时,这个APP通常需要发送一个请求给共享文件的那个APP(服务端),在大多数的情况下,这个请求会启动…

LeetCode 110. 平衡二叉树(二叉树高度)

1. 题目 给定一个二叉树,判断它是否是高度平衡的二叉树。 本题中,一棵高度平衡二叉树定义为: 一个二叉树每个节点 的左右两个子树的高度差的绝对值不超过1。 示例 1: 给定二叉树 [3,9,20,null,null,15,7]3/ \9 20/ \15 7 返回 true 。…

人物志 | 美团技术委员会前端通道主席洪磊:爱折腾的斜杠青年

洪磊,2013年加入美团,目前是美团外卖事业部终端组的负责人,也是美团技术委员会前端通道主席。在加入美团之前,洪磊的职业生涯可以用“跌宕起伏”来形容。他就读于中南财经政法大学,曾任职于雅虎中国,先后担…

论文浅尝 | 可建模语义分层的知识图谱补全方法

本文转载自公众号:PaperWeekly。论文作者:蔡健宇,中国科学技术大学,研究方向:知识图谱近些年,知识图谱(Knowledge Graph)在自然语言处理、问答系统、推荐系统等诸多领域取得了广泛且…

美团背后的商业模式是什么?后疫情时代该走向何方?

文 | King James知乎本文已获作者授权,禁止二次转载2020年的疫情,让10年前的一部剧再次进入人们的视线中,那就是《我的团长我的团》传统社区团购和各大互联网巨头都广发英雄帖招聘社区团购的团长,感觉回到了10年前那场“百团大战”…

Android官方开发文档Training系列课程中文版:分享文件之获取文件信息

原文地址:http://android.xsoftlab.net/training/secure-file-sharing/retrieve-info.html 之前的课程讲述了客户端APP试图与含有文件的URI一同运行,APP可以请求服务端APP的文件信息,包括文件的数据类型以及文件的大小。这些数据类型可以帮助…

LeetCode 783. 二叉搜索树结点最小距离(中序遍历)

1. 题目 给定一个二叉搜索树的根结点 root, 返回树中任意两节点的差的最小值。 示例:输入: root [4,2,6,1,3,null,null] 输出: 1 解释: 注意,root是树结点对象(TreeNode object),而不是数组。给定的树 [4,2,6,1,3,null,null] 可表示为下图…

Kubernetes 1.20 版本开始将弃用 Docker,是时候拥抱 Containerd 和 Podman 了!

Kubelet 中对 Docker 支持被弃用,并将在以后的版本中删除。Kubelet 使用一个名为 dockershim 的模块,该模块实现了对Docker的 CRI 支持,在此PR后续版本将删除dockershim。 Kubectl 弃用 --delete-local-data 参数。 名词解释 上面中提到两个名…

开源开放 | OpenKG 更新发布新冠概念、防控和流行病等多个知识图谱

近日,OpenKG 继续更新发布多个新冠知识图谱,其中包括哈尔滨工业大学构建的新冠概念图谱,武汉科技大学与东南大学联合构建的新冠防控图谱。同时,更新了由 IBM 中国研究院构建的流行病学图谱 V1.1。OpenKG 发布的所有新冠知识图谱都…

客户端单周发版下的多分支自动化管理与实践

背景 目前,互联网产品呈现出高频优化迭代的趋势,需求方希望尽早地看到结果,并给予及时反馈,所以技术团队需要用“小步快跑”的姿势来做产品,尽早地交付新版本。基于以上背景,美团客户端研发平台适时地推行了…

无意中发现了一位清华大佬的代码模版

对于刷题相关的文章,在之前我也推荐过不少,今天在给大家推荐一份算法刷题笔记,这份笔记与以往的刷题有所区别,作者把 Leetcode 一千多道题都进行了系统的整理,并且对于每一道题的代码,都要求 beat 100%。作…

Android官方开发文档Training系列课程中文版:通过NFC共享文件之发送文件到另一台设备

原文地址:http://android.xsoftlab.net/training/beam-files/index.html 导言 Android允许你通过Android Beam文件传输特性在两台设备之间传送大文件。这个特性拥有一个简单的API,允许用户通过简单的设备接触来启动一个传输进程。在响应端,…

LeetCode 998. 最大二叉树 II

1. 题目 向最大二叉树插入一个值; 如果该值大于根节点,则子树必须在该值的左边; 如果该值小于根节点,则该值必须在根节点的右子树 2. 解题 class Solution { public:TreeNode* insertIntoMaxTree(TreeNode* root, int val) {if(…

科大讯飞2020完整事件抽取系统(bert+数据集)

科大讯飞2020完整事件抽取系统(bert数据集) 事件抽取将非结构化文本中的事件信息展现为结构化形式,在舆情监测、文本摘要、自 动问答、事理图谱自动构建等领域有着重要应用。在真实新闻中,由于文本中可能存在句式 复杂,主被动转换&#xff0…

应用实践 | 网络智能运维下的知识图谱

本文转载自公众号:网络人工智能园地。让AI更智能,谷歌要用知识图谱让AI像人一样理解世界。让AI更智能,我们要用知识图谱让AI像网络专家一样了解网络。知识图谱引领人工智能从感知阶段演进到认知阶段,成为当前的热点技术之一&#…

还在买白酒?算法工程师们,量化投资了解一下

文 | 阿财知乎 本文已获作者授权,禁止二次转载赚取你认知中的Alpha坚持用量化的观点去看待宇宙的终极问题:买不买,卖不卖。很多人的在互联网这一片方寸之地,表现出来的行为是矛盾的。举个例子,相信技术指标在交易实践毫…

Android官方开发文档Training系列课程中文版:通过NFC共享文件之从其它设备接收文件

原文地址:http://android.xsoftlab.net/training/beam-files/receive-files.html Android Beam文件传输系统会将文件拷贝到接收设备的指定目录中。它还会使用Android媒体扫描器扫描被拷贝的文件,并会将媒体文件的入口信息添加到MediaStore提供者中去。 …

LeetCode 969. 煎饼排序

1. 题目 给定数组 A&#xff0c;我们可以对其进行煎饼翻转&#xff1a;我们选择一些正整数 k < A.length&#xff0c;然后反转 A 的前 k 个元素的顺序。我们要执行零次或多次煎饼翻转&#xff08;按顺序一次接一次地进行&#xff09;以完成对数组 A 的排序。 返回能使 A 排…