论文浅尝 | 一种用于多关系问答的可解释推理网络

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答。



640?wx_fmt=png

来源:COLING 2018

链接:https://www.aclweb.org/anthology/C18-1171

 

问题背景与动机

多关系问答(multi-relationquestion answering)是知识问答的一个重要任务,多关系指的是问题中包含多个关系和实体信息,为了回答这类问题,需要对知识库中多个事实三元组进行分析和推理。

 

现有的方法主要可以分为两类:基于语义分析;基于embedding

 

基于语义分析的方法主要依赖于人工特征与标注,但是泛化能力较弱。

基于embedding的方法一般利用弱监督机制训练得到end-to-end问答模型,但是现有的方法主要依赖于相似度计算而在推理方面有所欠缺。

 

在这篇文章中,作者提出可解释推理网络(Interpretable Reason NetworkIRN)模型用于解决多关系问答。通过多跳推理的形式完成多关系问题的问答过程。

 

贡献

1.    提出面向多关系问答的IRN模型,并在性能上取得了state-of-art

2.   相对于现有推理网络,这篇文章提出的方法更具可解释性,多跳推理的过程可以清晰的反映答案生成的过程


模型


640?wx_fmt=png

IRN的整体框架如图所示,其中包含三个子模型:Input Module; ReasoningModule; Answer Module,分别用于问句的embedding,三元组推理以及答案的生成。

以问题‘Howold is Obama’s daughter?’ 为例,问题的解析、推理和回答过程包含三跳(3 hops),每个hop包含的过程相同,描述如下:

1.    Input Module:输入问题(仅初始),得到问题的embedding形式q

2.    Reasoning Module:输入q,以及对问题NER得到的实体信息e1,找到对应的关系r1

3.    Input Module:将已识别关系信息r1q中去除,得到更新的q’,用于下一步推理

4.    Answer Module:根据已得到的e1r1从知识库中找到对应的答案信息

5.    Reasoning Module:将已分析实体信息e1与关系信息r1融合,并用于下一步推理

 

其中,获取关系r的计算过程如以下公式所示:

640?wx_fmt=png

实验

实验数据

640?wx_fmt=png

本文实验所使用的数据基于WorldCup2014,数据集的统计信息由表1所示。

 

实验结果

对比模型说明:

1.    Embed (Bordes et al., 2014b):利用embedding空间将问题和答案进行匹配的方法

2.    Subgraph (Bordes et al., 2014a):在Embed基础上利用实体子图加强答案实体的表达

3.   Seq2Seq (Sutskever et al., 2014):使用基于LSTMencoder-decoder实现的语义解析模型

4.   MemN2N (Sukhbaatar et al., 2015):使用记忆网络构建的end2end模型,其中记忆单元包含了相关的三元组信息

5.   KVMemN2N (Miller et al., 2016):在MemN2N的基础上,将记忆单元划分为键-值两个部分,键为头实体及关系,值为尾实体

6.    IRN-weak (This paper)


 

640?wx_fmt=png


可解释性分析

640?wx_fmt=png

3反映了IRN在多跳过程中识别关系和实体的精准度,r1/e1 -> rn/en -> a

 



OpenKG


开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479914.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蚁群优化算法 ACO

群体智能(swarm intelligence) 定义: 由单个复杂个体完成的任务可由大量简单个体组成的群体合作完成,而后者往往更具有健壮性、灵活性等优势。在没有集中控制,不提供全局模型的前提下,为寻找复杂问题解决…

量化投资交易 vn.py

前言:当初接触到vnpy,一开始当然是按照该项目在GitHub上的指南,开始安装,配置,阅读Wiki,但是作为一个python新手,并不能马上利用vnpy来写策略回测甚至实盘。所以我决定还是从源码看起&#xff0…

掌握神经网络,我应该学习哪些至关重要的知识点?

人工智能作为计算机科学领域的一个分支,在互联网和大数据的时代浪潮中显现出其巨大的潜力和蓬勃的活力,类似电子医生、无人驾驶等新名词纷纷涌现。人工智能凭借着它无与伦比的发展优势,推动了各大产业和技术的革命与创新,使得生产…

LeetCode 32. 最长有效括号(栈DP)

文章目录1. 题目信息2. 栈 解题3. 动态规划 解题1. 题目信息 给定一个只包含 ‘(’ 和 ‘)’ 的字符串,找出最长的包含有效括号的子串的长度。 示例 1:输入: "(()" 输出: 2 解释: 最长有效括号子串为 "()" 示例 2:输入: ")()())" 输…

消息中间件系列(四):消息队列MQ的特点、选型、及应用场景详解

前面集中谈了分布式缓存Redis系列: 高并发架构系列:分布式锁的由来、特点、及Redis分布式锁的实现详解 高并发架构系列:Redis并发竞争key的解决方案详解 高并发架构系列:Redis缓存和MySQL数据一致性方案详解 Redis的高可用详解…

基金定投

https://www.zhihu.com/question/19909886 相信我,这篇攻略能让你彻底搞懂基金,每年大概率能赚10%左右的收益!基金定投核心要搞懂两个问题:买什么基金,什么时候买。今天我给大家一篇文章讲透这两个问题!我说…

卖萌屋学术站发布!通往高效刷论文之路

文 | 夕小瑶编 | 兔子酱学术站诞生好久没有冒泡啦,大家还记得雁栖湖畔的夕小瑶吗!(划掉(*/ω\*)趁着国庆假期,跟卖萌屋小伙伴们终于把拖延已久的《Arxiv神器》翻新了,零零星星做了几个月,最近终…

消息中间件系列(五):MQ消息队列的12点核心原理总结

消息队列已经逐渐成为分布式应用场景、内部通信、以及秒杀等高并发业务场景的核心手段,它具有低耦合、可靠投递、广播、流量控制、最终一致性 等一系列功能。 无论是 RabbitMQ、RocketMQ、ActiveMQ、Kafka还是其它等,都有的一些基本原理、术语、机制等&…

征稿 | 2019年全国知识图谱与语义计算大会(CCKS2019)投稿时间延长

全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专业委员会组织和承办。全国知识图谱与语义计算大会是两个全国性会议的合并:中文知识图谱研讨会the Chines…

LeetCode 641. 设计循环双端队列

文章目录1. 题目信息2. 解题1. 题目信息 设计实现双端队列。 你的实现需要支持以下操作: MyCircularDeque(k):构造函数,双端队列的大小为k。 insertFront():将一个元素添加到双端队列头部。 如果操作成功返回 true。 insertLast()&#xff…

代码逆流成河,深入C++如何又快又有效?

虽然编程语言有很多,但在需要顶级性能的项目上,基本都会使用C。尤其是机器人、自动驾驶、AI等嵌入和实时系统,都是C的主要应用方向,在这种层面,几乎没有竞争者。比如熊厂的搜索引擎、推荐引擎等核心产品,鹅…

论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

论文笔记整理:余海阳,浙江大学硕士,研究方向为知识图谱、自然语言信息抽取。链接:https://www.aaai.org/Papers/AAAI/2019/AAAI-GaoTianyu.915.pdf动机现有的关系分类方法主要依赖于远程监控(DS)&#xff0…

消息中间件系列(七):如何从0到1设计一个消息队列中间件

消息队列作为系统解耦,流量控制的利器,成为分布式系统核心组件之一。 如果你对消息队列背后的实现原理关注不多,其实了解消息队列背后的实现非常重要。 不仅知其然还要知其所以然,这才是一个优秀的工程师需要具备的特征。 今天…

LeetCode 239. 滑动窗口最大值(双端队列+单调栈)

文章目录1. 题目信息2. 解题2.1 暴力法2.2 双端队列法1. 题目信息 给定一个数组 nums,有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。 返回滑动窗口中的最大值。 示例:输入: n…

Airbnb搜索:重排序阶段如何优化搜索结果多样性?

文 | 谷育龙Eric编 | QvQ我是谷育龙Eric,研究方向有深度学习、搜索推荐,喜欢为大家分享深度学习在搜索推荐广告排序应用的文章。本文将基于Airbnb KDD 2020年的论文,介绍Airbnb搜索排序中在重排序阶段如何解决多样性的问题,对工业…

肖仰华 | 做个“有知识”的机器人

本文转载自公众号:知识工场。肖仰华博士,复旦大学计算机科学与技术学院教授,博士生导师,知识工场实验室负责人。本文是肖仰华教授应《中国计算机学会通信》邀请所撰写的特邀文章,全文见 CCCF 2019 年第 5 期。摘要:时下…

消息中间件系列(九):详解RocketMQ的架构设计、关键特性、与应用场景

内容大纲: RocketMQ的简介与演进 RocketMQ的架构设计 RocketMQ的关键特性 RocketMQ的应用场景 RocketMQ的简介 RocketMQ一个纯java、分布式、队列模型的开源消息中间件,前身是MetaQ,是阿里研发的一个队列模型的消息中间件,后开…

LeetCode 151. 翻转字符串里的单词(栈)

文章目录1. 题目信息2. 解题1. 题目信息 给定一个字符串,逐个翻转字符串中的每个单词。 示例 1:输入: "the sky is blue" 输出: "blue is sky the" 示例 2:输入: " hello world! " 输出: "world! hel…

推荐系统架构与算法流程详解

文 | yijiapan腾讯 WXG 数据分析师推荐算法的理解如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,推荐系统可以更有效率的连接用户与内容和服务,节约了大量的时间和成本。如果把推荐系统简单拆开来看&#xff0…

论文浅尝 | 将字面含义嵌入知识图谱表示学习

论文笔记整理:吴桐桐,东南大学博士生,研究方向为知识图谱,自然语言处理。链接:https://arxiv.org/pdf/1802.00934.pdf本文主要关注知识图谱中的链接预测问题,在既有的知识图谱表示学习模型的基础上提出了一…