论文浅尝 | 利用 RNN 和 CNN 构建基于 FreeBase 的问答系统

640?wx_fmt=png&wxfrom=5&wx_lazy=1

Qu Y,Liu J, Kang L, et al. Question Answering over Freebase via Attentive RNN withSimilarity Matrix based CNN[J]. arXiv preprint arXiv:1804.03317, 2018.


概述


随着近年来知识库的快速发展,基于知识库的问答系统(KBQA )吸引了业界的广泛关注。该类问答系统秉承先编码再比较的设计思路,即先将问题和知识库中的三元组联合编码至统一的向量空间,然后在该向量空间内做问题和候选答案间的相似度计算。该类方法简单有效,可操作性比较强,然而忽视了很多自然语言词面的原始信息。因此,本文中提出了一种 Attentive RNN with Similarity Matrix based CNNAR-SMCNN)模型,利用 RNNCNN 自身的结构特点分层提取有用信息。文中使用 RNN 的序列建模本质来捕获语义级关联,并使用注意机制同时跟踪实体和关系。同时,文中使用基于 CNN 的相似矩阵和双向池化操作建模数据间空间相关性的强度来计算词语字面的匹配程度。此外,文中设计了一种新的实体检测启发式扩展方法,大大降低了噪声的影响。文中的方法在准确性和效率上都超越了SimpleQuestion基准测试的当前最好水平。

 

模型


640?wx_fmt=png

模型如上图所示,假设单关系问题可以通过用单一主题和关系论证来查询知识库来回答。因此,只需要元组(sr)来匹配问题。只要sr的预测都是正确的,就可以直接得到答案(这显然对应于o)。根据上述假设,问题可以通过以下两个步骤来解决:

  1. 确定问题涉及的Freebase中的候选实体。给定一个问题 Q,我们需要找出实体提及(mentionX,那么名称或别名与实体提及相同的所有实体将组成实体候选E.现在E中的所有实体都具有相同的实体名称,因此我们暂时无法区分他们。具体地,模型中将命名实体识别转换成了基于 Bi-LSTM 完成的序列标注任务。

  2. 所有与 E 中的实体相关的关系都被视为候选关系,命名为 R. 我们将问题转换为模式 P,它是通过用<e>替换问题中的提及而创建的。为了找出与问题真正相关的关系,我们将 PR 中的每个关系进行比较并对它们进行评分,然后将得分最高的关系作为最终结果。为了更高的进行关系匹配,模型从单词字面表达和语义两个层面对自然语言进行了建模。具体操作如下图所示:

640?wx_fmt=png

图中所示的 AR-SMCNN 模型,输入是经替换 mention 后的问题模版(patternP 和候选关系 rk。模型左边的部分是结合了 attention 机制的 BiGRU,用于从语义层面进行建模。右边的部分是CNN上的相似性矩阵,用于从字面角度进行建模。最终将特征

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480730.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

positional encoding位置编码详解:绝对位置与相对位置编码对比

本文转载自公众号“夕小瑶的卖萌屋”&#xff0c;专业带逛互联网算法圈的神操作 -----》我是传送门 关注后&#xff0c;回复以下口令&#xff1a; 回复【789】 &#xff1a;领取深度学习全栈手册&#xff08;含NLP、CV海量综述、必刷论文解读&#xff09; 回复【入群】&#xf…

## 作为多目标优化的多任务学习:寻找帕累托最优解+组合在线学习:实时反馈玩转组合优化-微软研究院+用于组合优化的强化学习:学习策略解决复杂的优化问题

NIPS 2018&#xff1a;作为多目标优化的多任务学习&#xff1a;寻找帕累托最优解多任务学习本质上是一个多目标问题&#xff0c;因为不同任务之间可能产生冲突&#xff0c;需要对其进行取舍。本文明确将多任务学习视为多目标优化问题&#xff0c;以寻求帕累托最优解。而经过实验…

手把手教你求职进入BAT

“ 最近利用部分的时间&#xff0c;帮助了好几位读者朋友进入了自己心仪的公司&#xff0c;以下我会谈到&#xff0c;求职简历方面给到他们的建议。 如果你本身具备很强的实力&#xff0c;不要因为对求职简历细节不重视&#xff0c;反而痛失良机。 求职加薪&#xff0c;除了…

one-hot(独热)、bag of word(词袋)、word-Embedding(词嵌入)浅析

目录 词袋模型 one-hot word-embedding 我们知道&#xff0c;传统的数据挖掘任务面向的是结构化数据。结构化数据很好理解&#xff0c;就是很有结构的数据嘛。 比如下面这张银行客户数据库中的表格&#xff1a; 编号 姓名 年龄 年收入 职业 有无欠贷 01 夕小瑶 16(…

德勤发布《 2020 亚太四大半导体市场的崛起》报告,美国收入占比达到47%,中国大陆仅占 5%

德勤发布《 2020 亚太四大半导体市场的崛起》报告&#xff08;以下简称《报告》&#xff09;&#xff0c;《报告》指出&#xff1a; 亚太地区半导体市场正在全球加速崛起&#xff0c;中国大陆、日本、韩国和中国台湾&#xff0c;占据全球半导体总收入前六大国家/地区的四席。美…

干货 | 机器学习算法在饿了么供需平衡系统中的应用

干货 | 机器学习算法在饿了么供需平衡系统中的应用 image:url(https://ask.qcloudimg.com/avatar/1292807/6341kxs4h2.png?imageView2/2/w/72)">用户1292807发表于携程技术中心订阅830作者简介陈宁&#xff0c;饿了么人工智能与策略部高级算法专家&#xff0c;负责供…

研讨会 | “人工智能与行业知识图谱技术实战”研讨会

人工智能时代2017年7月&#xff0c;国务院《新一代人工智能发展规划》明确提出“建立新一代人工智能关键共性技术体系”的重点任务和设立“新一代人工智能重大科技项目以及“1N”人工智能项目群”&#xff0c;特别强调“研究跨媒体统一表征、关联理解与知识挖掘、知识图谱构建与…

Sigmoid函数与Softmax函数的区别与联系

目录 缘起逻辑回归 Sigmoid Softmax 缘起逻辑回归 逻辑回归模型是用于二类分类的机器学习模型&#xff08;不要说逻辑回归可以做多类分类啊喂&#xff0c;那是二类分类器的组合策略问题&#xff0c;而与逻辑回归分类器本身的构造没有半毛钱关系啊&#xff09;。 我们知道&…

数据挖掘算法(logistic回归,随机森林,GBDT和xgboost)-腾讯云社区

机器学习就是样本中有大量的x&#xff08;特征量&#xff09;和y&#xff08;目标变量&#xff09;然后求这个function。&#xff08;了解更多可以看&#xff1a; https://zhuanlan.zhihu.com/p/21340974?refermlearn &#xff09; 求函数的方法&#xff0c;基于理论上来说&am…

阿里P8高级架构师教你如何通过BAT面试顺利拿到offer

“ 在开始面试之旅之前还是要多说几句&#xff0c;选公司是要看时机的 &#xff0c;建议先去小公司试试水&#xff0c;找找感觉&#xff0c;其次建议选熟人内推&#xff0c;也是对面试成功率有帮助的&#xff0c;那么就开始今天的面试之旅吧。 一&#xff1a;招聘方式 BAT技术…

论文浅尝 | SenticNet 5: 借助上下文嵌入信息为情感分析发现概念级别的原语

Citation: Cambria E, Poria S, Hazarika D, et al.SenticNet 5: discovering conceptual primitives for sentiment analysis by meansof context embeddings[C]//AAAI. 2018.概述目前大部分的人工智能的研究都集中在基于统计学习的方法&#xff0c;这些方法需要大量的训练数据…

文本匹配(语义相似度)综述

本文转载自公众号“夕小瑶的卖萌屋”&#xff0c;专业带逛互联网算法圈的神操作 -----》我是传送门 关注后&#xff0c;回复以下口令&#xff1a; 回复【789】 &#xff1a;领取深度学习全栈手册&#xff08;含NLP、CV海量综述、必刷论文解读&#xff09; 回复【入群】&…

大型网站架构设计

“ 大型网站的架构设计&#xff0c;涉及到的面非常多&#xff0c;并不像大家想象的那样&#xff0c;就是一个网站这么简单&#xff0c;今天抛砖引玉&#xff0c;希望能给想从事互联网行业的同学一点初步的概念。 架构设计&#xff0c;其实就要清楚整个大型网站技术架构的演变…

强化学习之原理与应用

PaddlePaddle原创2019/02/20 17:23强化学习之原理与应用强化学习特别是深度强化学习近年来取得了令人瞩目的成就&#xff0c;除了应用于模拟器和游戏领域&#xff0c;在工业领域也正取得长足的进步。百度是较早布局强化学习的公司之一。这篇文章系统地介绍强化学习算法基础知识…

论文浅尝 | 基于多原型mention向量的文本-实体联合学习

链接&#xff1a;http://anthology.aclweb.org/P/P17/P17-1149.pdf概述在知识库和文本的联合表示中&#xff0c;歧义是个困扰的难题。同一个 mention 可能在不同的语境下表述不同实体&#xff0c;同一个实体又有多种 mention 表示&#xff0c;如下图。本文提出了一个新的表示方…

NLP预训练模型综述:从word2vec, ELMo到BERT

目录 前言 word2vec 模型 负采样 char-level与上下文 ELMo BERT 深层双向的encoding 学习句子与句对关系表示 简洁到过分的下游任务接口 前言 还记得不久之前的机器阅读理解领域&#xff0c;微软和阿里在SQuAD上分别以R-Net和SLQA超过人类&#xff0c;百度在MS MARCO…

一篇文章了解架构设计的本质

“ 大型网站的架构设计&#xff0c;涉及到的面非常多&#xff0c;并不像大家想象的那样&#xff0c;就是一个网站这么简单&#xff0c;今天抛砖引玉&#xff0c;希望大家正确看待架构设计。 什么是架构设计的本质&#xff1f; 任何系统&#xff0c;自然情况下&#xff0c;都是…

看完这篇Linux基本的操作就会了

只有光头才能变强这个学期开了Linux的课程了&#xff0c;授课的老师也是比较负责任的一位。总的来说也算是比较系统地学习了一下Linux了~~~ 本文章主要是总结Linux的基础操作以及一些简单的概念~如果不熟悉的同学可下个Linux来玩玩(或者去买一个服务器玩玩【学生版的不是很贵】…

论文浅尝 | 基于知识图的问答变分推理

Zhang Y, Dai H, Kozareva Z, et al. Variational Reasoning for Question Answering with Knowledge Graph. Proceedings of 32th AAAI 2018动机传统的知识图谱问答主要是基语义解析的方法&#xff0c;这种方法通常是将问题映射到一个形式化的逻辑表达式&#xff0c;然后将这个…

阿里P8架构师谈:分布式架构设计(文章合集)

Docker容器 阿里P8架构师谈&#xff1a;Docker简介、组成架构、使用步骤、以及生态产品 阿里P8架构师谈:Docker容器的原理、特征、基本架构、与应用场景 消息中间件 阿里P8架构师谈&#xff1a;消息中间件介绍、典型使用场景、以及使用原则 阿里P8架构师谈&#xff1a;分布…