论文浅尝 | 常识用于回答生成式多跳问题

640?wx_fmt=png

链接:https://arxiv.org/pdf/1809.06309.pdf

 

AnsweringTasks

多跳问题一般需要模型可以推理、聚合、同步上下文中不同的信息。就需要理解那些人类通过背景知识可以理解的限制关系。本文提出了一个很强的baseline模型(multi-attention + pointer-generator decoder);引入了一个评分函数评价从ConceptNet知识库中抽取多跳知识(pointwise mutual information + term-frequency );并有效的利用提取的常识信息填补上下文的推理中( selectivelygated attentionmechanism)。

介绍

Machine Reading Comprehension: MRC 长期以来一直是评估模型理解和推理语言能力的任务。

Commonsense/Background Knowledge: 将常识知识作为外部数据库中的关系三元组或特征添加。

Incorporation of External Knowledge: 尝试使用外部知识来提高任务模型性能。

模型

640?wx_fmt=png

Embedding Layer: ELMo(Peters et al., 2018)).

Reasoning Layer: context embedding 通过kresoning cell 模拟一步推理。每一步都通过queryBiDAF attention(Seo et al., 2017)更新 context representation

Self-Attention Layer:  self-attention (Cheng et al., 2016) 解决 long-term dependencies and co-reference within the context.

Pointer-Generator Decoding Layer:  (See et al.,2017) 生成答案。

引入常识

 

640?wx_fmt=png

这部分是关键,主要分为两步:

a.    在常识知识库中找出多跳动候选路径, 形成树结构.

·    C1是问句中的常识词.

·    C2C1通过一跳可以达到而且出现在 context . [Direct]

·    C3C2通过一跳可以到达而且出现在 context. [Multi-Hop]

·    C4C3的邻居,不必出现在 context. [OutsideKnowledge 获取更多信息]

·    C5C4的邻居,需要出现在 context. [Context-Grounding. 确保信息有用]

b.    给候选路径打分筛选

·    节点初始分

1.  C1\C2\C3重要的概念总是经常在上下文中出现,利用术语在上下文中的频率近似它概念的重要性.

640?wx_fmt=png

|C|是上下文的长度\\count(c)是单词c出现的次数。

 

2.    C4 不在上下文中,但在启发式的方法下,重要的概念经常在不同的路径里重复出现。

利用 Pointwise Mutual Information (PMI):

PMI(c4, c13) = log( P (c4, c13)/ P (c4) P(c13))

 

640?wx_fmt=png

640?wx_fmt=png

 

3.    不同分支、不同层级的节点不存在竞争,所以最后可以求一个标准化:

640?wx_fmt=png

·      节点累计分

  因为添加的常识信息包括多跳,所以计算评分的时候不止需要当前节点的得分,还要考虑其树的后代。

 自底向上计算:其中f是这个节点得分最高的两个子节点平均得分。

    c-score(cl) =n-score(cl) + f(cl)

·      路径选择

·      自顶向下选择每个节点得分最高的两个。最多有2^4=16条路径。

实验

本文中在generative NarrativeQA (Kocisk ˇ y` et al., 2018) (summary subtask) extractive QAngaroo WikiHop 这两个数据集上进行了实验,实验结果显示本文机制能够较大的提高模型的性能。

640?wx_fmt=png

640?wx_fmt=png

论文笔记整理:张晶尧,东南大学硕士生,研究方向为问答系统中复杂问题理解。



OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。

 

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480297.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中国智能投顾行业

原文地址: 中国智能投顾行业 一、概要 财富管理与新兴金融科技的结合,使得财富管理行业正在进入新的阶段——智能财富管理。近几年全球出现的智能投顾模式已然成为智能财富管理的一大热点。智能投顾,简而言之,就是基于投资者的投…

别让数据坑了你!用置信学习找出错误标注(附开源实现)

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | JayLou娄杰(NLP算法工程师,信息抽取方向)编 | 北大小才女小轶美 | Sonata1 前言在实际工作中,你是否遇到过这样一个问题或痛点:无论是通过哪种…

助力句子变换:35W抽象、43W同义、13W简称三大知识库对外开源

句子变换,是指根据给定中文句子,借助某种语言处理手段,扩展出一定数据规模的中文句子集合,是一个从1到N的过程,目的在于解决搜索(查询扩展)、分类(样本扩充)、抽取&#…

数据结构--红黑树 Red Black Tree

文章目录1.概念2.操作2.1 左旋、右旋(围绕某个节点的左/右旋)2.2 插入2.3 删除3. 代码1.概念 二叉树在频繁动态增删后,可能退化成链表,时间复杂度由 O(lgn) 变成 O(n)。(不平衡)平衡二叉树,树中…

深度学习在用户画像标签模型中的应用

原文地址:https://blog.csdn.net/chaishen10000/article/details/79324016 最近一段时间都在学习深度学习,想着在用户画像标签模型中看能不能用上,终于,用了一个多月的时间,结合实际的场景和数据,搭建了一套…

最强京东Java面试题(共现场4面)

一面(基础面:约1个小时) 自我介绍,主要讲讲做了什么和擅长什么 springmvc和spring-boot区别 Autowired的实现原理 Bean的默认作用范围是什么?其他的作用范围? 索引是什么概念有什么作用?MyS…

工业界求解NER问题的12条黄金法则

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | JayLou娄杰,夕小瑶编 | 可盐可甜兔子酱美 | Sonata众所周知,命名实体识别(Named Entity Recognition,NER)是一项基础而又重要的NLP词法分析任…

POJ 1577 Falling Leaves(二叉查找树)

题目链接:http://poj.org/problem?id1577 题目大意: 二叉查找树按照叶子节点,从下往上抹去该树,给出抹除字符序列,求该二叉树,并前序打印 解题思路: 最后抹除的是根节点,把抹除的…

最新阿里内推高级Java面试题

阿里Java一面题目 osi七层网络模型,五层网络模型,每次层分别有哪些协议 死锁产生的条件, 以及如何避免死锁,银行家算法,产生死锁后如何解决 如何判断链表有环 虚拟机类加载机制,双亲委派模型&…

智能投顾-用户画像、投资组合选择、推荐引擎、大数据挖掘

智能投顾面面观之AI慕课 原文地址:https://www.jianshu.com/p/437c895794e0?utm_campaignharuki&utm_contentnote&utm_mediumreader_share&utm_sourceweixin “最后编辑于 2017.11.14 21:49”>2017.11.13 11:47* 自我介绍 大家好,我是…

论文浅尝 | KG Embedding with Iterative Guidance from Soft Rules

论文链接:https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/16369/16011发表会议:AAAI 2018摘要知识图谱表示学习旨在将实体和关系嵌入到向量空间,同时保留知识图谱的内在结构。传统方法主要基于关系三元组学习知识图谱的嵌入…

人工智能轨道交通行业周刊-第69期(2023.12.11-12.24)

本期关键词:集装箱智能管理、智慧工地、智能应急机器人、车辆构造、大模型推理 1 整理涉及公众号名单 1.1 行业类 RT轨道交通人民铁道世界轨道交通资讯网铁路信号技术交流北京铁路轨道交通网上榜铁路视点ITS World轨道交通联盟VSTR铁路与城市轨道交通RailMetro轨…

可信知识实证在UGC时代情报应用中的思考与探索

可信知识实证在UGC时代情报应用中的思考与探索 在当前互联网高度发达、可发布信息源和信息渠道猛增且多元化的大背景下,信息形态变得广泛且多模。从传统的纸质文档,到中期的电子结构化文档、电子非结构化文本,再到如今的语音信息、图片信息、…

Google | 创造Youtube单次上线最高收益!解决推荐中的信息茧房困境

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 江城编 | 夕小瑶今天分享一下Google在WSDM 2019的一篇将强化学习应用于Youtube推荐的论文,作者宣称是获得了Youtube近两年来单次上线的最高收益。文章仔细介绍了RL在Youtube上的实践方案细节…

POJ 2785 有多少种4个数相加等于0的方案(二分查找 or hash)

文章目录1.二分查找法1.1 思路:1.2 AC代码2.hash查找法2.1 思路:2.2 Wrong Answer 代码2.3 Time Limit Exceeded 代码2.4 偷懒失败,hash_map在poj中不存在2.5 哈希表二叉查找树(超时)2.6 AC代码(哈希数组法…

2018最新阿里Java技术三面(已拿Offer):JVM+高并发性能+单点登录+微服务

一面 1.自我介绍 2.谈一个你觉得你学到最多的项目,使用了什么技术,挑战在哪里 3.Spring的bean的作用域?(比如:singleton,prototype等) 4.Spring的IOC实现原理?没有无参构造函数能…

论文浅尝 | 基于局内去噪和迁移学习的关系抽取

动机在远程监督任务中,除了语料的错误标注问题,还存在句内噪声单词过多的问题,即多数句子都存在一些与表达关系无关的词汇,这个问题未有人关注。当前研究的另一个问题是,句子特征抽取器采用随机初始化的方法&#xff0…

关于知识图谱,我们接下来该研究什么?斯坦福教授们给出了答案

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 舒意恒(南京大学硕士生,知识图谱方向)编 | 北大小才女小轶本文整理了斯坦福大学 CS 520 知识图谱研讨会课程的第 10 集的内容,主要是关于知识图谱未来的研…

POJ 2967 (水题,考察putchar()按位输入)

题目链接:http://poj.org/problem?id2967 题目大意: 给定系列长度,求是否有规定的三角形 (不是所有的都可以组成三角形&&有至少一种组合可以组成三角形)-> 打印通过,否则打印拒绝。 题目有时…

四大银行(工建农中)大数据进展如何?

原文地址:https://cloud.tencent.com/developer/article/1052576 中国建设银行中国建设银行信息技术管理部资深经理林磊明▼▼1、银行压力越来越大从十二五走到十三五期间,银行业面临的各方面的压力越来越大,从我们的年报数字可以看出去年四大…