论文浅尝 | ​ADRL:一个基于注意力机制的知识图谱深度强化学习框架

论文笔记整理:谭亦鸣,东南大学博士。


来源:Knowledge-Based Systems 197 (2020) 105910

链接:https://www.sciencedirect.com/science/article/abs/pii/S0957417419306839

概要与动机

知识图谱推理是图谱构建的关键技术之一,它在包括垂直搜索和智能问答等应用场景中有着重要作用。推理的目标是根据已知实体和关系推断所需的未知实体。现有的推理方法主要基于embedding实现(即对所有的实体和关系做整体embedding,然后利用向量相似度推断实体间的关系或者给定三元组是否为真)。但是在真实的应用场景中,我们需要一个清晰且可解释的实体作为输出。本文提出一种基于注意力机制的知识图谱深度强化学习框架ADRL,用于学习多跳关系路径,通过深度学习及强化学习结构化感知,从而提高传统方法效率,泛化能力及可解释性。

贡献

本文的主要贡献包括:

1.提出了一个面向知识图谱推理的基于深度学习的新框架,相较传统方法,该框架科研有效提升性能及可解释性

2.设计了一个关系模型,作为推理框架的通用插件,其中的self-attention能够循环推断实体之间的关系以引导一个model-free的策略,这一做法相对前人工作更有助于agent推断关系路径

3.利用actor-critic方法有效解决了奖励系数问题,其中奖励取决于价值函数,并将同策略一起被训练和优化

模型与算法

本文提出框架的整个过程如下图所示,其过程大体可以描述为:

1.首先将知识图谱的agent环境输入卷积神经网络(CNN);

2.利用深度CNN将其映射到低维向量,且可以在每个级别可以传递信息

3.接着使用LSTM(使用校正的线路单ReLU激活函数),用于储存生成的历史轨迹,构成策略与价值函数

4.上述步骤的输出被输入进一个关系模型,模型中包含一个self-attention模块用于推断和分享实体向量及关系向量的权值

5.利用一个特征感知的最大池化层对关系模型的输出进行聚合,最后传递给一个MLP接着是ReLU激活函数用于产生一个策略以及一个基准标量价值函数,可以被用作一个agent奖励

在优化算法方面,作者考虑到基于梯度下降的方法效率较低,而蒙特卡洛抽样依赖于大量积极奖励(尤其是学习初始阶段),为了解决这些问题,作者选择Actor-Critic,一种结合策略梯度和顺序差异学习的强化学习方法。Actor-Critic算法可以执行单步更新参数,使用值函数作为基础函数来减少策略梯度的差异,而无需等待回合结束,并且在训练过程中可以同时学习策略和价值函数,算法流程如下图:

实验与结果

实验数据:

本文实验所使用的数据是目前较为流行的KG推理数据集(WN18RR,FB15K-237,NELL-995),其统计信息如表1.

表2是linkprediction实验结果,本文方法展现出了更好的性能,作者认为是共享的实体及关系权值带来了更佳的性能表现。

表3是factprediction的结果,作者认为本文方法的优势在于“the reason is that our model is more complex than the previous model, introducing more state-of-the-art methods”

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479049.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新年第二弹|卖萌屋私藏书单大公开

夕本尊 &夕小瑶 推荐作为一个互联网人,不仅要懂技术,还应该了解行业的基本运作原理。这其中一个重要的问题是:为什么互联网产品(基本)都是免费的,甚至纷纷给用户送钱,它们却能有这么强的盈利…

LeetCode 437. 路径总和 III(双重递归)

1. 题目 给定一个二叉树,它的每个结点都存放着一个整数值。 找出路径和等于给定数值的路径总数。 路径不需要从根节点开始,也不需要在叶子节点结束,但是路径方向必须是向下的(只能从父节点到子节点)。 二叉树不超过…

2020年美团技术团队最受欢迎的16篇技术文章

2020年美团技术团队最受欢迎的16篇技术文章:https://tech.meituan.com/2021/01/01/2020-summary.html

论文浅尝 - ESWA | 知识图谱的自动扩充方法

论文笔记整理:谭亦鸣,东南大学博士。来源:ESWA141(2020)链接:https://www.sciencedirect.com/science/article/abs/pii/S0957417419306839为了使计算机理解人类语言,并且实现推理,人类知识需要被表示并储存…

美团大脑:知识图谱的建模方法及其应用

作为人工智能时代最重要的知识表示方式之一,知识图谱能够打破不同场景下的数据隔离,为搜索、推荐、问答、解释与决策等应用提供基础支撑。美团大脑围绕吃喝玩乐等多种场景,构建了生活娱乐领域超大规模的知识图谱,为用户和商家建立…

Android官方开发文档Training系列课程中文版:连接无线设备之通过P2P搜索网络服务

原文地址:http://android.xsoftlab.net/training/connect-devices-wirelessly/nsd-wifi-direct.html 本阶段的第一节课 Using Network Service Discovery 展示了如何搜索本地网络服务。然而,使用WI-FI P2P搜索服务可以直接搜索附近的设备,而…

全栈深度学习第2期: 开发套件与工具篇

一起追剧鸭简介Berkeley全栈深度学习追剧计划是由夕小瑶的卖萌屋发起的优质公开课打卡项目,通过微信群为同期追剧的小伙伴提供交流平台。关于该计划的详请见这里。1. Berkeley深度学习追剧群目前已有1000小伙伴加入,公众号后台回复口令 深度学习追剧 入群…

LeetCode 700. 二叉搜索树中的搜索

1. 题目 给定二叉搜索树(BST)的根节点和一个值。 你需要在BST中找到节点值等于给定值的节点。 返回以该节点为根的子树。 如果节点不存在,则返回 NULL。 2. 解题 class Solution {//递归写法TreeNode *ans NULL; public:TreeNode* searchB…

NLP-美团技术团队(搜索-推荐-召回排序-Bert)

NLP-美团技术团队:https://tech.meituan.com/tags/nlp.html

iOS系统中导航栏的转场解决方案与最佳实践

背景 目前,开源社区和业界内已经存在一些 iOS 导航栏转场的解决方案,但对于历史包袱沉重的美团 App 而言,这些解决方案并不完美。有的方案不能满足复杂的页面跳转场景,有的方案迁移成本较大,为此我们提出了一套解决方案…

论文浅尝 - WSDM20 | 基于弱监督及逐步推理的多关系知识图谱问答

论文笔记整理:刘晓臻,东南大学计算机科学与工程学院本科生。来源:WSDM ’20链接:https://dl.acm.org/doi/abs/10.1145/3336191.3371812动机知识图谱问答(KG-QA)系统大多包含两个步骤:链接问题中的topic entity到KG&…

Android官方开发文档Training系列课程中文版:网络操作之网络连接

原文地址:http://android.xsoftlab.net/training/basics/network-ops/index.html 引言 这节课将会学习最基本的网络连接,监视网络连接状况及网络控制等内容。除此之外还会附带描述如何解析、使用XML数据。 这节课所包含的示例代码演示了最基本的网络操…

算法工程师的落地能力具体指的是什么?

文 | 桔了个仔知乎本文已获作者授权,禁止二次转载大家好,这里是桔了个仔,目前是一名Data Scientist(不太想翻译成数据科学家,毕竟感觉自己就是个工程师),过去几年在做基于机器学习的风控与合规系统&#xf…

国内外自然语言处理(NLP)研究组

2015年国内外自然语言处理(NLP)研究组: https://blog.csdn.net/wangxinginnlp/article/details/44890553 补充: 名称 地址 最近更新 HanLP https://github.com/hankcs/HanLP 2天前 腾讯开源深度学习文本分类工具 https://github.com/Tencent/NeuralNLP-…

Android官方开发文档Training系列课程中文版:网络操作之网络管理

原文地址:http://android.xsoftlab.net/training/basics/network-ops/managing.html 这节课将会学习如何对网络资源的使用情况拥有更细粒度的控制力。如果应用程序经常执行大量的网络操作,那么程序应当提供一项设置,以便用户可以控制应用的数…

LeetCode 728. 自除数

1. 题目 自除数 是指可以被它包含的每一位数除尽的数。 例如,128 是一个自除数,因为 128 % 1 0,128 % 2 0,128 % 8 0。 还有,自除数不允许包含 0 。 给定上边界和下边界数字,输出一个列表&#xff0…

论文浅尝 - AAAI2020 | 通过句子级语义匹配和答案位置推断改善问题生成

论文笔记整理:王春培,天津大学硕士。链接:https://arxiv.org/pdf/1912.00879.pdf动机本文主要聚焦问答系统(Q&A)的反问题---问题生成(Question Generation,Q&G)。问题生成的…

美团深度学习系统的工程实践

背景 深度学习作为AI时代的核心技术,已经被应用于多个场景。在系统设计层面,由于其具有计算密集型的特性,所以与传统的机器学习算法在工程实践过程中存在诸多的不同。本文将介绍美团平台在应用深度学习技术的过程中,相关系统设计的…

一个程序员的理财观

文 | 王喆你好,我叫王喆,看过我技术文章的朋友知道,我是一个搞推荐系统的机器学习工程师,不熟悉的同学也没关系,就当我是一名普普通通的程序员就好。但今天我们不谈技术,也不谈996这些烦人的话题&#xff0…

Android官方开发文档Training系列课程中文版:网络操作之XML解析

原文地址:http://android.xsoftlab.net/training/basics/network-ops/xml.html 扩展标记语言(XML)是一系列有序编码的文档。它是一种很受欢迎的互联网数据传输格式。像需要频繁更新内容的网站来说,比如新闻站点或者博客,需要经常更新它们的X…