论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

论文笔记整理:陈名杨,浙江大学直博生。


Introduction

知识图谱(KGs)在很多NLP的下游应用中起着越来越重要的作用。但是知识图谱常常是不完整的,所以解决知识图谱补全的任务也非常重要。主要有三种方法来完成知识图谱补全的任务,基于规则(Rule-Based)的方法,基于潜入(Embedding-Based)的方法和基于路径(Path-Based)的方法。、

当前,也有一些工作考虑使用深度强化学习来解决预测缺失链接的问题,例如DeepPath,是第一个将深度强化学习引入知识图谱推理的工作。但该工作也有很多缺陷,第一,DeepPath缺少memory相关的部分,导致需要一定的监督学习进行与训练,该预训练可能导致模型过拟合;第二,对不同的关系都使用相同的超参数并没有考虑实体间多样性的链接;第三,当agent选择了一条无效的路径后,会停下来并重新选择,这样会导致持续选择无效路径最终被困在一个节点。

本文提出了一个新的使用模型(AttnPath)来解决上面提到的问题,该模型使用LSTM和图注意力机制作为memory部分从而不需要预训练,提出了两个度量MSR和MRR,提出了一定的机制使得agent每一步都向前走从而不会被困在某一个点。

 

Method (AttnPath)

      因为该方法使用强化学习作为训练方法,所以先介绍该方法强化学习的框架:

  1. 环境(Environment):整个知识图谱,除了当前正在query的关系和其反关系;

  2. 状态(State):agent的state由三部分连接而成,分别是嵌入部分,LSTM部分和图注意力部分;

    a) 嵌入部分。类似于DeepPath,本文的嵌入部分包含了当前节点的嵌入,以及target节点嵌入减去当前节点的嵌入,区别于DeepPath使用TransE作为嵌入方法,这里使用TransD作为嵌入方法把每个节点的嵌入映射到当前query的关系的相关平面上。则嵌入部分的 M_t 表示如下:


       b) LSTM部分。这里使用一个三层的LSTM来对agent之前走过的路径进行编码:

       c) 图注意力部分。对于每一个entity都有不同的方面,也就是说希望agent可以更多关注和当前query有关的关系和邻居节点,因此引入来GAT,对一个节点的周围节点,采用不同的权重并且相加,如下:

所以最终的状态表示如下

3. 动作(Action):在KG推理的任务中,动作指的是agent选择一个关系然后前进一步。动作也分为有效和无效,有效指的是在当前的节点中有这样的关系从该节点出去,反之亦然;

4. 奖励(Reward):奖励是对agent的反馈,根据选择的relation是否是有效的,以及一系列的动作是否能走到最终真正的尾实体;

 

整个过程的优化使用REFORENCE算法,更新参数如下:

AttnPath的模型如下所示:

 

Mean Selection / Replace Rate

对于不同的关系,需要悬链不同的模型,但是不同关系的困难程度不同,也就是说有些关系有较多的替代关系,agent可以很容易的找到一条替代的路径从头实体走到尾实体。这里提出两个度量方法,MeanSelection Rate和Mean Replacement Rate来度量每个关系的困难程度。

对于关系r的Mean Select Rate(MSR)表示如下:

MSR越低,表示r越难学习,因为连接r的实体有很多的方面(aspect),也就说对于这些entity,r只是其中的一小部分。

            对于关系的MeanReplacement Rate(MRR)表示如下:

MRR越高表示这个当前的关系有更多的可以替代的relation,所以更容易学习到一个新的路径因为agent可以直接选一个替代的relation到达尾实体。

            在本文中,对于学习起来有不同难易程度的关系采用不同程度的正则化。例如对于具有比较高的MSR和MRR的关系,因为学习起来比较容易,则采用更多的正则化来防止过拟合,反之亦然。

 

Experiments

Fact Predict:

Link Prediction:


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479327.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聊聊如何提升推荐系统的结果多样性

文 | 洪九(李戈)源 | 知乎个性化推荐系统的出现为处理信息过载问题提供了一个有效的工具,已经成为互联网各大平台(电商、信息流等)的标配,并在技术(个性化召回、个性化排序等)上取得了长足的发展,逐渐从传统模型过度到深度学习时代。但是&…

论文浅尝 | GNN with Generated Parameters for Relation Extraction

论文笔记整理:申时荣,东南大学博士生。地址:https://arxiv.org/pdf/1902.00756.pdf来源:ACL2019在许多自然语言处理任务(例如关系提取)中,多跳关系推理是必不可少的,而图神经网络&am…

大众点评信息流基于文本生成的创意优化实践

1. 引言 信息流是目前大众点评除搜索之外的第二大用户获取信息的入口,以优质内容来辅助用户消费决策并引导发现品质生活。整个大众点评信息流(下文简称点评信息流)围绕个性化推荐去连接用户和信息,把更好的内容推荐给需要的用户。…

LeetCode 701. 二叉搜索树中的插入操作(二叉查找树/插入)

1. 题目 给定二叉搜索树(BST)的根节点和要插入树中的值,将值插入二叉搜索树。 返回插入后二叉搜索树的根节点。 保证原始二叉搜索树中不存在新值。 注意,可能存在多种有效的插入方式,只要树在插入后仍保持为二叉搜索…

docker的简单操作和端口映射

docker的简单操作和端口映射:https://www.cnblogs.com/lixaingyang/p/11976827.html docker的简单操作和端口映射 一:简介 Docker镜像 在Docker中容器是基于镜像启动的 镜像是启动容器的核心 镜像采用分层设计,最顶层为读写层 使用快照COW技…

Android官方开发文档Training系列课程中文版:管理Activity的生命周期之启动一个Activity

原文地址 : http://android.xsoftlab.net/training/basics/activity-lifecycle/index.html 导言 用户通过导航退出或者返回应用的时候,应用中Activity的生命周期会在不同的状态之间变换。举个例子,当Activity初次启动的时候,它会来到系统的…

论文浅尝 | 利用多语言 wordnet 上随机游走实现双语 embeddings

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答。来源:Knowledge Based System链接:https://www.sciencedirect.com/science/article/abs/pii/S0950705118301412?via%3Dihub双语word embedding将两种语言…

实践中学到的最重要的机器学习经验!

文 | 微调源 | 知乎问答今天我们讨论一个很有实际意义的问题:你在实践中学到的最重要的机器学习经验是什么?以下回答来自知乎优秀答主微调。1.永远保持怀疑机器学习是最容易得到错误结论的一种解决方案。和编程、做表格、或者纯粹的数学建模不同&#xf…

Android官方开发文档Training系列课程中文版:管理Activity的生命周期之暂停和恢复Activity

原文地址 : http://android.xsoftlab.net/training/basics/activity-lifecycle/pausing.html 在APP的正常使用过程中,在前台工作的Activity有时可能会被其他的可视化组件挡住,而引起Activity进入Paused状态。举个例子,当一个半透明的Activit…

Leaf:美团分布式ID生成服务开源

Leaf是美团基础研发平台推出的一个分布式ID生成服务,名字取自德国哲学家、数学家莱布尼茨的一句话:“There are no two identical leaves in the world.”Leaf具备高可靠、低延迟、全局唯一等特点。目前已经广泛应用于美团金融、美团外卖、美团酒旅等多个…

LeetCode 658. 找到 K 个最接近的元素(二分查找)

1. 题目 给定一个排序好的数组,两个整数 k 和 x,从数组中找到最靠近 x(两数之差最小)的 k 个数。返回的结果必须要是按升序排好的。如果有两个数与 x 的差值一样,优先选择数值较小的那个数。 示例 1:输入: [1,2,3,4,…

负数的开方到底等于多少?

文:杨树森知乎编:小鹿鹿lulu负数的开方到底等于多少?举个栗子拿出小本本, 一通变换,得到:Really? 且看下面详解乘方来源于乘法,我们可以归纳地定义,设 是一个域,, 则上述的域 可以是有理数域 , 实数域, 或复数域 前两…

综述 | 知识图谱实体链接:一份“由浅入深”的综述

本文转载自公众号:PaperWeekly。 作者丨Nicolas单位丨追一科技 AI Lab 研究员研究方向丨信息抽取、机器阅读理解本文介绍实体链接(Entity Linking)这一技术方向&#xff0…

Android官方开发文档Training系列课程中文版:管理Activity的生命周期之停止和重启Activity

原文地址 : http://android.xsoftlab.net/training/basics/activity-lifecycle/stopping.html#Start 在activity的生命周期内,适当的停止和重新启动activity是一个非常重要的过程,它可以确保用户能感觉到APP一直是存活状态,并且不会丢失他们…

selenium.common.exceptions.WebDriverException: Message: ‘chromedriver’解决

selenium.common.exceptions.WebDriverException: Message: chromedriver’解决: https://blog.csdn.net/weixin_44318830/article/details/103339273 今天在做selenium测试的时候,可能是很久没用了,直接报了这个异常! 相信很多第一次学习selenium的同学们也对这个异…

活动 Web 页面人机识别验证的探索与实践

在电商行业,线上的营销活动特别多。在移动互联网时代,一般为了活动的快速上线和内容的即时更新,大部分的业务场景仍然通过 Web 页面来承载。但由于 Web 页面天生“环境透明”,相较于移动客户端页面在安全性上存在更大的挑战。本文…

利用python提取网站曲线图数据

文章目录数据1数据2数据1 数据目标:曲线图 F12,如图位置输入JSON.stringify(dataSeries.dataPoints) copy,粘贴到data.txt 数据是一个列表,里面是多个字典 编写程序如下: import json as js datafile data1.txt…

论文浅尝 | HEAD-QA: 一个面向复杂推理的医疗保健数据集

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答。来源:ACL2019本文构建了一个面向复杂推理任务的多选问答数据集 HEAD-QA,该数据集中的问题来自一个西班牙的医疗保健专业测试,对于具备该方向专业…

Poor Man's BERT: 更小更快的Transformer模型

文 | sliderSun源 | 知乎NLP模型的大小不断增加,随之而来的是可用性降低,TinyBERT,MobileBERT,和DistilBERT都提出了一个独特的知识蒸馏框架,其共同目标是在保持性能的同时减小模型大小。尽管所有这些方法都以各自的方…

LeetCode 429. N叉树的层序遍历(queue)

1. 题目 返回其层序遍历:[[1],[3,2,4],[5,6] ]2. 解题 queue队列解题 /* // Definition for a Node. class Node { public:int val;vector<Node*> children;Node() {}Node(int _val, vector<Node*> _children) {val _val;children _children;} }; */ class Solu…