论文浅尝 | AutoETER: 用于知识图谱嵌入的自动实体类型表示

论文链接:https://arxiv.org/pdf/2009.12030.pdf


动机

传统的KGE使用附加的类型信息改善实体的表示,但是这些方法完全依赖于显式类型,或者忽略了特定于各种关系的不同类型表示,并且这些方法目前都不能同时推断出对称性、反演和组成的所有关系模式,以及1-N、N-1和N-N关系的复杂性质。所以为了探索任何知识图谱的类型信息,我们提出了通过将每个关系作为具有关系感知投影机制的两个实体类型之间的转换操作来学习每个实体的潜在类型嵌入。此外,我们设计的模型是一个可插拔模块,因此可以很容易地与任何KGE模型合并。

亮点

1)从特定实体的三元组和特定类型的三元组中学习实体、关系和实体类型的嵌入。类型嵌入可以与实体嵌入一起合并以进行推理。

2)首次建模和推断所有的关系模式,包括对称、反转和组成,以及KG推理的1-N、N-1和N-N的复杂关系。

概念以及模型

       提出的模型是AutoETER,它的目的是自动学习一种语义上兼容各种关系的类型表示的变体,并推断出所有的关系模式和复杂关系。整个流程分为四个部分,分别是:1. 通过具有超平面投影策略的实体特定的三重编码器将实体和关系嵌入到复杂空间中。2. 特定类型的三重编码器来学习与关系感知投影机制相结合的类型嵌入。3. 提出了受相关关系导出的相似性约束。4. 提出了具有实体特定的三重表示和类型特定的三重表示的总体优化目标和类型嵌入的相似性约束。

       模型整体结构如下图所示。

实体的三重编码器

       我们将实体和关系嵌入到复杂空间中,并将关系视为从头实体到尾实体的旋转操作。为了推断复杂关系,我们将实体投影到其相关关系超平面中,以确保每个实体都有关于特定关系的各种表示。根据实体三元组(h,r,t),得到能量函数E1(h,r,t):

       由于特定于实体的三元组的嵌入,我们的模型可以通过从头到尾实体的旋转操作来推断出所有的关系模式。

关系的三重编码器

       给定实体e和关系r,首先利用关系感知投影机制学习类型和关系嵌入。

因此在特定类型的三元组所涉及的能量函数定义为

关于等式中的能量函数我们期望这样:

此外,随着在真实空间中学习的类型和关系嵌入,我们的模型将花费更少的参数建模和推断所有的关系模式。

定理1:我们的模型可以通过特定类型的三重嵌入来推断对称的关系模式。

证明过程:如果关系r为对称的,则将保留两个三元组(h、r、t)和(t、r、h),根据等式5可知:

根据等式6可推理得到:

 

证明了对称关系的嵌入应为零向量,头尾实体的类型嵌入应相等。

定理2:我们的模型能够通过特定类型的三重嵌入来推断出反演的关系模式

证明过程:对于反关系r1和r2,两个三元组(h、r1、t)和(t、r2、h)保持不变。根据等式3,4,5可得到:

 

然后我们定义一个转移矩阵P:

把等式9带入等式10中可得到:

 

再把等式11带入8中可得到:

 

因此我们的模型可以通过特定类型的三重嵌入来推断出反演的关系模式。

     定理3:我们的模型能够通过特定类型的三重嵌入来推断组成的关系。

       证明过程:由于组合模式r3(a、c)⇐r1(a、b)∧r2(b、c)的关系,对应的三元组(a、r1、b)、(b、r2、c)和(a、r3、c)保持不变。根据等式3,4,5可得到:

 

然后我们定义一个转移矩阵P和Q:

将等式16带入13,17带入14中,我们可以得到:

 

把等式18带入19中,可以得到:

 

结合等式15和20,我们可以将组合模式的关系嵌入之间的相关性建模为:

 

因此证明了我们的模型能够通过特定类型的三重嵌入来推断组成的关系。

类型编码相似度约束

       具有相同关系的三元组中涉及的头实体的类型嵌入彼此更接近(与尾实体的类型嵌入相同)。因此,对于两个具有相同关系的三元组,我们希望:

任意两个三元组(h1、r1、t1)和(h2、r2、t2),我们设计了能量函数来评估类型嵌入的差异为:

 

优化目标

       我们根据一个三分量的目标函数来优化我们的模型:

 

L1和L2是两个成对损失函数,分别对应于实体特定的三重编码器和类型特定的三重编码器,L3是用于约束类型嵌入的三重损失函数。α1和α2表示在实体特定的三重、类型特定的三重和类型相似度约束之间的权衡的L2和L3的权重。其中,L1,L2,L3的具体定义为:

实验

       使用了四个标准数据集来进行链路预测任务,分别是FB15K、WN18、YAGO3-10、FB15K-237。

模型的评估指标是

MR:正确三元组的平均排名

MRR:正确三元组的平均顺向排名

Hits@n:前候选三元组中正确三元组的比例。

实验结果如下图所示:

这些结果证明了用我们的模型来建模和推断所有关系模式和复杂关系的优越性。

   因为FB15K存在更多不同的关系,我们选择FB15K通过映射1-1、1-N、N-N和N-N关系来评估链路预测性能。结果见下图。我们的模型在头实体预测和尾实体预测方面都比其他基线特别是RotatE取得了更好的性能,这说明了捕获针对关系感知投影机制的不同关系的不同表示来表示实体类型的优越性。


总结和未来工作

在本文中,我们引入了两类编码器来学习实体特定的三重嵌入和类型特定的三重嵌入,它可以建模和推断所有对称、反转和组成的关系模式,以及复杂的1-N、N-1和N-N关系。我们还根据类型的相似性来约束类型嵌入。在未来的工作中,我们打算扩展我们的方法,以获得包含本体监督的更好的类型表示。

 


 

OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478158.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 1029. 两地调度(贪心)

文章目录1. 题目2. 贪心1. 题目 公司计划面试 2N 人。第 i 人飞往 A 市的费用为 costs[i][0],飞往 B 市的费用为 costs[i][1]。 返回将每个人都飞到某座城市的最低费用,要求每个城市都有 N 人抵达。 示例: 输入:[[10,20],[30,2…

百面机器学习-第一章特征工程

原文链接:https://www.jianshu.com/p/355c4001ca42 前言 如果你能找到这里,真是我的幸运~这里是蓝白绛的学习笔记,本集合主要针对《百面机器学习——算法工程师带你去面试》这本书。主要记录我认为重要的知识点,希望对大家有帮助。…

推荐几个NLP出论文的好方向!!

如果你准备发NLP方向的论文,或准备从事科研工作或已在企业中担任NLP算法岗的工作。那么我真诚的向大家推荐,贪心学院《自然语言处理高阶研修班》,目前全网上应该找不到类似体系化的课程。课程精选了四大主题进行深入的剖析讲解,四…

Android热更新方案Robust

美团是中国最大的O2O交易平台,目前已拥有近6亿用户,合作各类商户达432万,订单峰值突破1150万单。美团App是平台主要的入口之一,O2O交易场景的复杂性决定了App稳定性要达到近乎苛刻的要求。用户到店消费买优惠券时死活下不了单&…

会议研讨 | TF45: 知识图谱新技术、新场景、新应用

基于“新基建”面向新产业、新业态和新模式的背景下,知识图谱作为人工智能的重要基石正在火热发展中。新的知识图谱技术在新的场景和应用中使人工智能从感知智能逐渐向认知智能过渡。知识图谱与产业的结合愈加紧密,除了在搜索与推荐、知识问答等通用领域…

LeetCode 653. 两数之和 IV - 输入 BST(二叉搜索树迭代器双指针)

文章目录1. 题目2. 解题1. 题目 给定一个二叉搜索树和一个目标结果,如果 BST 中存在两个元素且它们的和等于给定的目标结果,则返回 true。 案例 1: 输入: 5/ \3 6/ \ \ 2 4 7Target 9 输出: True案例 2: 输入: 5/ \3 6/ \ \ 2 4 7Tar…

盘点来自工业界的GPU共享方案

文 | 阎姝含源 | 极市平台进年来工业界一直孜孜不倦地寻求提升GPU利用率的方案,能被更多用户理解和使用的GPU共享走进工程师的视野中。本文将总结目前有公开PR的、来自工业界的部分GPU容器计算共享方案,看看工业界对GPU共享的定位和需求。本文将依旧着眼…

百面机器学习|第二章模型评估知识点 蓝白绛

前言 如果你能找到这里,真是我的幸运~这里是蓝白绛的学习笔记,本集合主要针对《百面机器学习——算法工程师带你去面试》这本书。主要记录我认为重要的知识点,希望对大家有帮助。 第二章 模型评估 1、评估指标的局限性 准确率(Accuracy)&…

美团外卖订单中心的演进

美团外卖从2013年9月成交第一单以来,已走过了三个年头。期间,业务飞速发展,美团外卖由日均几单发展为日均500万单(9月11日已突破600万)的大型O2O互联网外卖服务平台。平台支持的品类也由最初外卖单品拓展为全品类。 随…

论文浅尝 | 基于知识图谱的智能调研方法(DI佳作)

转载公众号 | 数据智能英文刊题目:A Knowledge Graph Based Approach to Social Science Surveys引用:Z. Pan, Z.J., et al.: A Knowledge Graph Based Approach to Social Science Surveys. Data Intelligence 3(3). doi: 10.1162/dint_a_00107文章摘要…

NYU Google: 知识蒸馏无处不在,但它真的有用吗?

文 | 小伟编 | 小轶导师: 小伟,听说你对知识蒸馏比较了解,你来给我说说知识蒸馏有什么用?我: 知识蒸馏是一种很典型的模型压缩的方法,我们可以用它来有效地从大型教师模型学习小型学生模型,并且学生模型的性能也很不错…

pyscript+py-env实现python+html效果

参考链接:https://developer.aliyun.com/article/976083?spma2c6h.12873581.group.dArticle976083.3a8057c73DINVs 今天我们要介绍的东西,叫做PyScript,使用它,不需要安装任何软件。只要有一个记事本,就能写一段HTMLP…

美团的DBProxy实践

本文整理自美团技术沙龙第10期:数据库技术架构与实践。 美团技术沙龙由美团技术团队主办,每月一期,每期沙龙邀请美团及其它互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 本次沙龙主要围绕数据库相关的主题&a…

LeetCode 606. 根据二叉树创建字符串(递归)

文章目录1. 题目2. 递归解题1. 题目 你需要采用前序遍历的方式,将一个二叉树转换成一个由括号和整数组成的字符串。 空节点则用一对空括号 “()” 表示。而且你需要省略所有不影响字符串与原始二叉树之间的一对一映射关系的空括号对。 示例 1: 输入: 二叉树: [1,…

论文浅尝 | 面向开放域的无监督实体对齐

笔记整理 | 谭亦鸣,东南大学博士生来源:DASFAA’21链接:https://arxiv.org/pdf/2101.10535.pdf概述与动机知识图谱对齐的目的是建立两个不同知识图谱之间实体的对应关系,如图1,本文作者发现现有的实体对齐方法依赖于标…

聊聊推荐系统

这两天,有种把某宝卸载的冲动,它的“猜你喜欢”推荐简直是我肚子里的蛔虫,每次看都忍不住剁手,钱包就这么日渐消瘦……但从技术的角度想想,不得不说阿里的推荐系统的确做得不错。其实,除了电商平台&#xf…

LeetCode 695. 岛屿的最大面积(图的BFS/DFS)

文章目录1. 题目2. 解题2.1 BFS广度优先搜索2.2 DFS深度优先搜索1. 题目 给定一个包含了一些 0 和 1的非空二维数组 grid , 一个 岛屿 是由四个方向 (水平或垂直) 的 1 (代表土地) 构成的组合。你可以假设二维矩阵的四个边缘都被水包围着。 找到给定的二维数组中最大的岛屿面…

Neo4j:入门基础(一)之安装与使用

原文链接:https://blog.csdn.net/sinat_36226553/article/details/108541370 # 图数据库 链接:什么是原生(Native)图数据库 一般认为具有“无索引邻接”特性的图数据库才称为原生图数据库 链接:常用的图数据库 图存储可以分为属性图、三元组…

论文浅尝 | 问题多样性对于问答的帮助

笔记整理 | 毕胜 东南大学在读博士,研究方向:自然语言处理 知识图谱问题生成通过生成一些合成的问题作为训练语料有效提高了问答系统的效果,本文的研究点是:在QG中,生成问题的文本多样性是否对下游的QA有帮助&#xf…

RDS平台介绍

本文整理自美团点评技术沙龙第10期:数据库技术架构与实践。 美团点评技术沙龙由美团点评技术团队主办,每期沙龙邀请美团点评及其它互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 本次沙龙主要围绕数据库相关的主题&#…