论文浅尝 - EMNLP | 通过元强化学习实现少样本复杂知识库问答

笔记整理 | 谭亦鸣,东南大学博士生


来源:EMNLP 2020

链接:https://www.aclweb.org/anthology/2020.emnlp-main.469.pdf

本文关注聚合型复杂知识图谱问答任务,这类复杂问题的答案通常需要经过一些集合操作得到,例如:选择Selecting,计数Counting,比较Comparing,交并集Interp&Union,Boolean等,一个比较经典的问题就是 “有多少条河流同时经过中国和印度?”(下表描述了其他一些类型的复杂问题),该问题答案可以通过”Select(China, flow, river), Interp(India, flow, river), Count”得到。

在当前的研究中,复杂知识图谱问答任务存在两个主要挑战:

1.不平衡的数据分布以及不稳定的模型性能:基于现有的CQA数据集,作者发现,不同类别的问题在训练数据中的占比极不平衡(例如简单问题占比约48.9%,而其他类型,诸如比较仅占比4.3%,其他类型的占比论文中也已给出,这里不再赘述。);另一方面,不同类型的问题难度差异明显。

2.面向全类别问答的单一模型性能不够:现有的问答模型难以适用于这类包含固有类型差异的问题。

因此这篇论文的主要贡献是:

1.作者提出了一个Meta Reinforcement Learning方法,可以自适应的对于新问题生成新参数;

2.建立了一个非监督检索器,用于找到适用的支撑集;

3.在仅使用1%训练样本的情况下使模型达到了具有竞争力的结果

4.在CQA任务上达到了当前性能最佳(state-of-the-art)

方法

目标是构建一个端到端模型,将复杂的自然语言问题转换为一系列的动作。通过执行这些动作,知识库中相关的三元组被取出并用于获取问题的答案。为了解决上述挑战,作者采用了few-shot mate reinforcement learning方法用于减少模型对于数据集标注的依赖,并提升不同类型问题上的问答准确性。

图1是论文方法的主要框架,作者将每个新的训练问题视作伪任务上的测试样本,目标是学习到一个专门处理这个任务的模型。当模型遇到一个问题qmate,首先使用检索器从训练集中找到与之最为相似的N个样本sqmate,并将该问题视作元学习测试数据,用于评估模型。因此,mate样本与问题构成了上述伪任务。

在mate-learning阶段,主要包含三个目标:

1.找到优化初始参数

2.使初始参数足够敏感

3.对每个任务生成合适的参数集

作者通过以下方式完成上述目标:

1.找到支撑集

2.使用支撑集调整programmer

3.使用微调后的programmer作用于测试样本

4.使用测试样本的损失更新初始参数

对应的算法如下所示:

训练过程在强化学习的设定下完成,以batch=1为例,每个时间阶段t,agent根据前置的action(t时刻之前),输入序列,从策略π产生一个action at(这里指词,或者字符),θ则表示模型的参数(例如带有注意力机制的LSTM模型的参数)。关联到知识库上的自然语言问题将会作为LSTM模型编码器的输入,一系列action则由解码器输出。

每组生成的action序列被作者视为一个轨迹(trajectory),借由它可以执行答案的生成,之后即可得到生成答案与事实答案的相似性(similarity),该相似性被作为强化学习框架中的对应轨迹的reward R,并反馈给agent。

问题检索器Retriever

为了从在训练和测试阶段从训练数据中找到支撑样本,作者提出了一个非监督的相关性函数,考虑了以下两个方面:其一是知识库相关元素的数量(包括实体,关系和类型);其二则是问题的语义相似度

前者的计算方式为:

1.问题结构相似计算公式:

,其中qe代表实体的数量

2.类型相似

3.以及关系型数据相似性计算

语义相似度上,作者基于Jaccard相似性建立了一个非监督的语义相似性公式。

假设问题q1,q2各包含一个词集合,对于q1中的每个词,基于一个给定的余弦相似性阈值,从q2中找到相似性最高的对应词,两者构成词对集合:

接着从两个句子中移除具有高相似关联的词汇,余下部分被称为remain,代表着两个问题之间的差异,基于这些remain,可以计算出两个问题之间差异性:

由此可以给出两个问题语义相似计算公式为:

通过融合上述两者,最终得到相似计算公式为:

实验

本文实验所使用的数据为CQA数据集,包含944K/100K/154K的训练集/验证集/测试集,每个QA对包含一个复杂自然语言问题以及它的正确答案,但是并没有给出问题对应的标准action序列。考虑到这一点,作者随机的筛选了1%的训练集数据,使用BFS算法构建为其标准了伪标准action序列。在问题的表示学习方面,作者使用了带有注意力机制的LSTM。

CQA任务的评价指标为F1-值

对比的baseline包括:

1.HRED+Kvmem记忆网络

2.NSM

3.CIPITR-All

4.CIPITR-Sep

实验结果如下表所示,纵向为各种问题类型,横向对比了不同模型的性能水平。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478396.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

写了一篇关于 NLP 综述的综述!

文 | 小轶综述,往往是了解一个子领域最为高效的起点。然而,对于AI这样一个日新月异高速发展的行业,时效性也自然地成为了我们选择综述的衡量指标之一。即使一篇 AI 综述具有超高 citation,如果它写于 20 年前,那对今天…

美团点评容器平台HULK的调度系统

本文是美团点评基础架构系列文章之一。这个系列将全面介绍支撑数亿用户、超千万日订单的美团点评平台诸多业务的公共基础架构相关技术。系列已经发布的文章包括: - 《分布式会话跟踪系统架构设计与实践》 - 《Leaf——美团点评分布式ID生成系统》 - 《深度剖析开源分…

论文浅尝 | 利用跨内和跨间信息的预训练实体关系编码器

笔记整理 | 朱珈徵,天津大学硕士链接:https://www.aclweb.org/anthology/2020.emnlp-main.132.pdf动机从自由文本中提取实体和关系是自然语言处理中的一项重要任务。它的目标是识别具有特定类型(实体)和这些实体(关系)之间的语义关系的文本。本文主要研究…

python的环境变量设置

程序和可执行文件可以在许多目录,而这些路径很可能不在操作系统提供可执行文件的搜索路径中。 path(路径)存储在环境变量中,这是由操作系统维护的一个命名的字符串。这些变量包含可用的命令行解释器和其他程序的信息。 Unix 或 Windows 中路径变量为 P…

LeetCode 76. 最小覆盖子串(滑动窗口)

1. 题目 给你一个字符串 S、一个字符串 T,请在字符串 S 里面找出:包含 T 所有字母的最小子串。 示例: 输入: S "ADOBECODEBANC", T "ABC" 输出: "BANC"说明: 如果 S 中不存这样的子串&#xff…

推荐一个可交互的 Attention 可视化工具!我的Transformer可解释性有救啦?

本文首发于微信公众号”夕小瑶的卖萌屋“文 | Sherry源 | 夕小瑶的卖萌屋视觉是人和动物最重要的感觉,至少有80%以上的外界信息是经过视觉获得的。我们看论文的时候,通过图表来确定文章的大致内容往往也是一个更高效的 说到深度神经网络的可视化&#xf…

机器学习中模型优化不得不思考的几个问题

本文根据美团点评算法工程师胡淏4月22日在“携程技术沙龙”上的分享整理而成。文字综合了“携程技术中心”微信公众号的版本和胡淏本人在微博上发表的文章,并有少量编辑加工。 图1 机器学习工程师的知识图谱 图1列出了我认为一个成功的机器学习工程师需要关注和积累…

【美团语音交互部】 NLP/知识图谱/语音识别等算法职位开放招聘!

致力于连接最靠谱的算法岗与最强的求职者招聘贴投放请联系微信xixiaoyao-1部门介绍:语音交互部负责美团语音和智能交互技术及产品研发,面向美团业务和生态伙伴,提供对语音和口语数据的大规模处理及智能响应能力。团队以建设业界一流的语音交互…

LeetCode 289. 生命游戏(位运算)

文章目录1. 题目2. 解题2.1 复制数组解法2.2 原地解法2.3 位运算1. 题目 链接&#xff1a;289. 生命游戏 2. 解题 2.1 复制数组解法 很简单&#xff0c;按照题意模拟即可 class Solution { public:void gameOfLife(vector<vector<int>>& board) {if(board…

论文浅尝 | S3QLRDF: 用于大规模RDF数据分布式SPARQL查询的关系分割架构

笔记整理 | 孙磊&#xff0c;天津大学硕士。动机RDF形式的语义网的繁荣对高效、可伸缩以及分布式的存储和高可用和容错并行策略都有着要求。RDF数据的飞速增长提升了在分布式数据管理系统上高效划分策略的需求来提升SPARQL查询性能。亮点本文提出了新的用于RDF的关系分割架构Pr…

美团DSP广告策略实践

近年来&#xff0c;在线广告在整个广告行业的比重越来越高。在线广告中实时竞价的广告由于其良好的转化效果&#xff0c;占有的比重逐年升高。DSP&#xff08;Demand-Side Platform&#xff09;[1]作为需求方平台&#xff0c;通过广告交易平台&#xff08;AdExchange&#xff0…

推荐几个出论文的好方向

如果你准备发AI方向的论文&#xff0c;或准备从事科研工作或已在企业中担任AI算法岗的工作。那么我真诚的向大家推荐&#xff0c;贪心学院《高阶机器学习研修班》&#xff0c;目前全网上应该找不到类似体系化的课程。课程精选了四大主题进行深入的剖析讲解&#xff0c;四个模块…

LeetCode 414. 第三大的数

1. 题目 给定一个非空数组&#xff0c;返回此数组中第三大的数。如果不存在&#xff0c;则返回数组中最大的数。要求算法时间复杂度必须是O(n)。 示例 1: 输入: [3, 2, 1] 输出: 1 解释: 第三大的数是 1.示例 2: 输入: [1, 2] 输出: 2 解释: 第三大的数不存在, 所以返回最大的…

论文浅尝 - ICLR2021 | BERTology 遇上生物学:在蛋白质语言模型中解释注意力

来源&#xff1a;ICLR2021链接&#xff1a;https://arxiv.org/abs/2006.15222v3一.动机Transformer架构已经被证明可以学习有用的蛋白质分类和生成任务表示。然而&#xff0c;在可解释性方面存在挑战。二.亮点本文通过attention分析蛋白质Transformer模型&#xff0c;通过atten…

Vuex框架原理与源码分析

Vuex是一个专为Vue服务&#xff0c;用于管理页面数据状态、提供统一数据操作的生态系统。它集中于MVC模式中的Model层&#xff0c;规定所有的数据操作必须通过 action - mutation - state change 的流程来进行&#xff0c;再结合Vue的数据视图双向绑定特性来实现页面的展示更新…

在错误的数据上,刷到 SOTA 又有什么意义?

文 | Severus编 | 小轶小编注&#xff1a;前段时间&#xff0c;小屋介绍了吴恩达老师近期发起的以数据为中心的 AI 竞赛&#xff08;参见《吴恩达发起新型竞赛范式&#xff01;模型固定&#xff0c;只调数据&#xff1f;&#xff01;》&#xff09;。吴恩达老师认为&#xff1a…

论文浅尝 | BoxE:一种基于Box的知识图谱表示学习模型

笔记整理 | 耿玉霞&#xff0c;浙江大学直博生。研究方向&#xff1a;知识图谱&#xff0c;零样本学习等。论文链接: https://arxiv.org/pdf/2007.06267.pdf本文是发表在NeurIPS 2020上的一篇基于Box的知识图谱表示学习模型的文章。在以往知识图谱表示学习&#xff08;KG Embe…

LeetCode 127. 单词接龙(图的BFS/双向BFS)

文章目录1. 题目2. 图的BFS解题2.1 单向BFS2.2 双向BFS &#xff01;厉害了1. 题目 给定两个单词&#xff08;beginWord 和 endWord&#xff09;和一个字典&#xff0c;找到从 beginWord 到 endWord 的最短转换序列的长度。 转换需遵循如下规则&#xff1a; 每次转换只能改变…

Leaf——美团点评分布式ID生成系统

在复杂分布式系统中&#xff0c;往往需要对大量的数据和消息进行唯一标识。如在美团点评的金融、支付、餐饮、酒店、猫眼电影等产品的系统中&#xff0c;数据日渐增长&#xff0c;对数据分库分表后需要有一个唯一ID来标识一条数据或消息&#xff0c;数据库的自增ID显然不能满足…

@开发者,第二届马栏山杯国际音视频算法大赛高分攻略请查收,心动大奖等你来战!...

一秒让墙上的广告消失&#xff0c;保留完整墙面&#xff1b;户外大屏幕显示LOGO被擦除后&#xff0c;背景毫不违和……欢迎来到魔法世界——停&#xff01;这其实并不是什么魔法&#xff0c;而是由弗吉尼亚理工大学提出的基于流的视频补全算法FGVC的一项应用。作为视频的“橡皮…