论文浅尝 | 基于RNN与相似矩阵CNN的知识库问答

640?wx_fmt=png

链接:https://arxiv.org/pdf/1804.03317.pdf


概述


当前大部分的 kbqa 方法为将 kb facts 与 question 映射到同一个向量空间上,然后计算相似性. 但是这样的做法会忽视掉两者间原本存在的单词级别的联系与交互. 所以本文提出一种网络结构 ARSMCNN,既利用到语义的信息, 又利用到单词级别的交互.


模型


640?wx_fmt=png


作者提出一种称为 attentive recurrent neural network with similarity matrix based convolutional neural network 网络结构,同时运用 attentive rnn 以及 cnn 来得到 question 与 kb facts 之间的相似度从而给出匹配得分. 上图为完整的流程示意图.


首先假设⼀个三元组(subject, relation, object)为⼀个 fact, 并且当 subject 与 relation 确定后,答案也会被确定下来.从而可以将问答任务分为两个阶段: entity detection 与 relation detection.


1) Entity Detection

640?wx_fmt=png

⾸先利用 bilstm 训练模型,输入一个问句,如果是关键词则标记为 1,否则标记为 0. 然后将标记为1的词拿出来进行 entity dectction. 作者提出了一种选取 entity candidates 的方法, 大致分为四个步骤:
a) 将标记为 1 且距离小于等于 1 的单词拼接成一个句子 s,如果有多个,则取长度最长的那一个.
b) 在知识库中寻找能够完美匹配的实体, 如果找到,则返回实体集合,如果没有则进行下一步.
c) 基于在 s 中最有可能存在 entity mention 的假设, 可以通过 s 生成知识库中的对应实体 x. 所以, 以 s 为中心通过expand或者 narrow 最多两个单词来构成s’,然后利用s’取寻找 entity. 如果找到了则返回实体集合,否则进行下一步
d) 如果仍然没有找到 match, 则利用 S 中的每个单词来寻找包含该单词的实体. 保证两者有最大公共子串.

经过实验作者发现进入到第四步的概率仅为 0.2%


2) Relation Detection

640?wx_fmt=png

首先将问句中的实体用<s>替换, 然后进过两个部分进行match score的计算.


a) semantic level:
利用 attentive rnn 作为 encoder compare 的框架, 将 question 作为输入到 bigru中,并于 relation 做一个 attention:

640?wx_fmt=png

然后利用 p 和 r 计算 match score:

640?wx_fmt=png

b) literal level:

640?wx_fmt=png

将单词映射到 embedding 空间后,先计算相似矩阵:

640?wx_fmt=png

随后对这个相似矩阵进行卷积运算:

640?wx_fmt=png

然后在两个方向上做最大池化

640?wx_fmt=png

(其中的d1,d2分别为问句和 relation 的长度)
最后再经过一个全联接层得到literal层面上的 match socre:

640?wx_fmt=png

c) 将两个层面的得分综合起来作为最后的match socre:

640?wx_fmt=png

训练过程中使用 margin ranking loss, 保证正确的relation与问句的匹配得分比负例要高:

640?wx_fmt=png


实验结果:


在simple question上做实验:

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

笔记整理: 陈佳奥,浙江大学本科生, 研究方向为 KB-QA, NLP。



OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。

 

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480666.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

斯坦福大学最甜网剧:知识图谱CS520面向大众开放啦!

一只小狐狸带你解锁炼丹术&NLP秘籍受本次疫情的影响&#xff0c;斯坦福大学的2020春季知识图谱课程——CS520面向公众线上开放啦&#xff01;连课名都是爱你的形状&#xff01;简单翻译一下重点&#xff1a;今年的CS520面向公众开放&#xff0c;大家可以通过远程视频软件Zo…

一篇文章详解大数据技术和应用场景

“ 本文作者 陈睿 &#xff0c;优知学院创始人 新技术、新趋势往往趋之若鹜却又很难说的透彻&#xff0c;希望这篇文章能让大家完整的理解什么是大数据:该篇包含&#xff1a;大数据、技术、场景应用以及大数据的岗位。 什么是大数据 说起大数据&#xff0c;估计大家都觉得只…

对话周明:回望过去,展望未来,NLP有哪些发展趋势?

HomeBlog 对话周明&#xff1a;回望过去&#xff0c;展望未来&#xff0c;NLP有哪些发展趋势&#xff1f; 2019年2月15日 by 打不死的小强 AI 新闻 0 comments 周明博士是微软亚洲研究院副院长、国际计算语言学协会&#xff08;ACL&#xff09;主席、中国计算机学会理事、中…

阿里P8架构师谈:MongoDB、Hbase、Redis等NoSQL优劣势、应用场景

NoSQL的四大种类 NoSQL数据库在整个数据库领域的江湖地位已经不言而喻。在大数据时代&#xff0c;虽然RDBMS很优秀&#xff0c;但是面对快速增长的数据规模和日渐复杂的数据模型&#xff0c;RDBMS渐渐力不从心&#xff0c;无法应对很多数据库处理任务&#xff0c;这时NoSQL凭借…

研讨会 | 知识图谱助力图书馆知识管理与智慧服务研讨会

知识图谱是大数据时代重要的知识表示方式之一&#xff0c;也是人工智能技术的重要支撑&#xff0c;在智能检索、数据分析、自动问答、知识推荐、知识管理等领域有着广泛的应用前景&#xff0c;为知识创新管理带来了新机遇。由于知识图谱实现了对象识别、文本理解、关系推理、机…

高效利用无标注数据:自监督学习简述

一只小狐狸带你解锁 炼丹术&NLP 秘籍 作者&#xff1a;huyber来源&#xff1a;https://zhuanlan.zhihu.com/p/108906502BERT的大热让自监督学习成为了大家讨论的热点&#xff0c;但其实word2vec和自编码器也都属于自监督学习范畴。本文通过整理自监督学习的一系列工作&…

TI-RTOS实时操作系统开发之功耗测试

文章目录写在前面CCS&#xff08;code composer studio&#xff09;开启Energy Trace配置电池参数设置测量时间在电流曲线图处点击右键开始测量写在前面 要测试一个产品的电流功耗方式有很多种&#xff1a; 1、电流转电压&#xff0c;通过在供电回路中串联10Ω电阻&#xff0c…

程序员真的只能干到35岁?——我的35岁危机度过之道!

“ 在我还是25岁的时候&#xff0c;我和很多程序员一样&#xff0c;其实都有同样的担心&#xff0c;老了以后怎么办&#xff1f;写代码难道还能写到35岁&#xff1f; 难道我这一辈子就做一个程序员就完了吗&#xff1f;难道这条路就不能走出更多的张小龙&#xff08;foxmail开…

研讨会 | 知识工程与问答技术研讨会 (KEQA2018)

人工智能的迅速发展将深刻改变人类社会&#xff0c;而知识工程是人工智能领域中的一个重要研究主题。随着机器学习、自然语言处理和语义网技术的快速发展&#xff0c;知识获取与处理的能力得到了极大的提升&#xff0c;包括自然语言问答技术在内的智能应用也备受关注。本次研讨…

统计学-自然语言处理

摘要&#xff1a;主成分分析&#xff08;英语&#xff1a;Principal components analysis&#xff0c;PCA&#xff09;是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数&#xff0c;同时保持数据集中的对方差贡献最大的特征。常常应用在文本处理、人脸识别、…

在K40小破卡训练50层BERT Large的宝藏trick

前言 虽然TPU的显存令人羡慕&#xff0c;但是由于众所周知的原因&#xff0c;绝大部分人还是很难日常化使用的。英伟达又一直在挤牙膏&#xff0c;至今单卡的最大显存也仅仅到32G&#xff08;参考V100、DGX-2&#xff09;。然而&#xff0c;训练一个24层的BERT Large模型的时候…

领域应用 | 推荐算法不够精准?让知识图谱来解决

本文转载自公众号&#xff1a;微软研究院AI头条。 编者按&#xff1a;我们几乎每天都会接收到各种各样的推荐信息&#xff0c;从新闻、购物到吃饭、娱乐。个性化推荐系统作为一种信息过滤的重要手段&#xff0c;可以依据我们的习惯和爱好推荐合适的服务。但传统的推荐系统容易出…

BERT重计算:用22.5%的训练时间节省5倍的显存开销(附代码)

一只小狐狸带你解锁 炼丹术&NLP 秘籍作者&#xff1a;夕小瑶、rumor酱前言虽然TPU的显存令人羡慕&#xff0c;但是由于众所周知的原因&#xff0c;绝大部分人还是很难日常化使用的。英伟达又一直在挤牙膏&#xff0c;至今单卡的最大显存也仅仅到32G&#xff08;参考V100、D…

去腾讯等BAT面试完的Mysql面试55题总结,含答案大赠送!

【BAT面试&#xff1a;mysql 面试55题】 1、一张表里面有ID自增主键&#xff0c;当insert了17条记录之后&#xff0c;删除了第15,16,17条记录&#xff0c;再把mysql重启&#xff0c;再insert一条记录&#xff0c;这条记录的ID是18还是15 &#xff1f; 2、mysql的技术特点是什…

这十套练习,教你如何使用Pandas做数据分析

这十套练习&#xff0c;教你如何用Pandas做数据分析Pandas是入门Python做数据分析所必须要掌握的一个库。本文内容由科赛网翻译整理自Github&#xff0c;建议读者完成科赛网 从零上手Python关键代码 和 Pandas基础命令速查表 教程学习的之后&#xff0c;点击本篇Notebook右上角…

预训练模型超全知识点梳理与面试必备高频FAQ

一只小狐狸带你解锁 炼丹术&NLP 秘籍作者&#xff1a;JayLou娄杰来源&#xff1a;https://zhuanlan.zhihu.com/p/115014536预训练模型(Pre-trained Models,PTMs)的出现将NLP带入了一个全新时代。2020年3月18日&#xff0c;邱锡鹏老师发表了关于NLP预训练模型的综述《Pre-tr…

阿里P8架构师谈:MySQL数据库的索引原理、与慢SQL优化的5大原则

MySQL凭借着出色的性能、低廉的成本、丰富的资源&#xff0c;已经成为绝大多数互联网公司的首选关系型数据库。虽然性能出色&#xff0c;但所谓“好马配好鞍”&#xff0c;如何能够更好的使用它&#xff0c;已经成为开发工程师的必修课&#xff0c;我们经常会从职位描述上看到诸…

论文浅尝 | 利用类比推理优化知识图谱向量表示

链接&#xff1a;https://arxiv.org/pdf/1705.02426.pdf本文的主要创新点就是把类比推理应用到 KG embedding 中&#xff0c;通过对模型的 score function 添加某些约束来捕获 KG 中类比结构的信息&#xff0c;进而优化 KG 中实体和关系的 embedding 表示&#xff0c;并在 FB15…

推荐 10 个饱受好评且功能独特的开源人工智能项目

来自&#xff1a;开源中国链接&#xff1a;https://my.oschina.net/editorial-story/blog/1592254推荐 10 个饱受好评且功能独特的开源人工智能项目关于人工智能的项目&#xff0c;相信大家都看过或者用过不少了&#xff0c;但它们的大多数看上去都十分“高大上”&#xff0c;让…

如何以初学者角度写好一篇国际学术论文?

一只小狐狸带你解锁 炼丹术&NLP 秘籍人工智能顶会论文之争越来越激烈了&#xff0c;CVPR、AAAI、ICLR等各大会议虽然录取率逐年降低&#xff0c;但是投稿论文数量却在逐年增加。虽说发论文不是衡量一位学者的学术能力的唯一标准&#xff0c;但确是极为重要的标准。一篇好的…