论文浅尝 | 基于动态记忆的原型网络进行元学习以实现少样本事件探测

本文转载自公众号:浙大KG。 


论文题目:Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event Detection

本文作者:邓淑敏,浙江大学在读博士,研究方向为低资源条件下知识图谱自动化构建关键技术研究

发表会议:WSDM 2020

论文链接:https://arxiv.org/abs/1910.11621

FewEvent数据集链接: https://github.com/231sm/Low_Resource_KBP

    事件抽取(EE是一项旨在从非结构化文本中提取结构事件信息的任务,它可以分两个子任务:事件检测(event detection)与元素抽取(argument extraction)。事件检测需要找到事件描述文本中的触发词,并将其对应到指定的事件类型,元素抽取需要找到事件的参与元素,并划分它们在事件中扮演的角色。本文基于目前事件抽取数据集的稀疏问题,以及考虑到现实世界中的新事件层出不穷,重新审视了事件检测任务。在元学习的设置下,将事件检测建模成少样本学习任务(遵循N-Way-K-Shot的实验设定),称之为少样本事件检测(FSED

图1: 模型架构

本文提出了一个基于动态记忆的原型网络(DMB-PN),该网络利用动态记忆网络(DMN)为事件学习更好的原型,模型架构如上图所示。传统的原型网络简单地通过平均计算事件描述(event mention)文本的编码来表示事件原型,这样的做法只会用一次event mention的编码。考虑到每个事件的样本比较少,我们希望尽可能多地利用样本的信息,因此区别于传统的原型网络,DMB-PN整合了DMN,会多次从event mention中提取上下文信息,也就是说DMB-PN会多次使用event mention的编码,并且进行记忆存储和更新。我们分别在固定事件类别数N的设置下进行K-Shot的评估,以及在固定每个事件类样本数K的设置下进行N-Way的评估。实验表明,DMB-PN不仅比原型网络处理样本稀疏性的性能更好,而且在类型数目增多和样本数目减少的时候性能更加稳定。

此外,动态记忆网络还用于学习模型中的事件原型和句子编码。具体来说,我们在典型的DMN模块中使用触发词作为问题来产生存储向量,从而产生对触发词更敏感的句子编码。由于DMN的多跳机制,使得它更有利于充分利用事件实例,因此基于DMN的模型在句子编码方面更健壮,特别是在少样本场景中。

部分实验结果如下所示:

表1: 5-Way-X-Shot的实验结果比较

表2: 10-Way-X-Shot的实验结果比较

图2: X-Way-15-Shot的实验结果比较

总而言之,这篇文章研究工作的主要贡献是:

(1)正式定义和提出“少样本事件检测”的新问题,并生成了一个专门针对该问题名为FewEvent的新数据集;

(2)提出了一个基于动态记忆的原型网络的新框架DMB-PN,该框架利用动态记忆网络不仅可以为事件类型学习更好的原型,还可以为事件描述文本生成更健壮的句子编码;

(3)实验表明,与记忆机制集成的原型网络的性能优于一系列的传统模型,特别是当事件类型的种类相对较多且样本数量非常少时,这是因为它具有从事件实例中多次提取上下文信息的能力。

如果对本文的工作感兴趣,欢迎大家阅读原文,也欢迎大家和我们交流。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479380.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

字节跳动破局联邦学习:开源Fedlearner框架,广告投放增效209%

本文介绍了字节跳动联邦学习技术团队自研的联邦学习平台 Fedlearner ,分享了该平台的技术实现与落地应用体验,向读者展示了字节跳动如何联邦学习落地难题的突破点。作为分布式的机器学习范式,联邦学习能够有效解决数据孤岛问题,让…

软硬兼施极限轻量BERT!能比ALBERT再轻13倍?!

文 | Sheryc_王苏这个世界上有两种极具难度的工程:第一种是把很平常的东西做到最大,例如把语言模型扩大成能够写诗写文写代码的GPT-3;而另一种恰恰相反,是把很平常的东西做到最小。对于NLPer来说,这种“小工程”最迫在…

论文浅尝 | 基于事理图谱的脚本事件预测

论文笔记整理:邱圣广,南京大学硕士,研究方向为自然语言处理。链接:https://www.ijcai.org/proceedings/2018/0584.pdf绪论1. 脚本事件预测脚本事件预测这个任务最早是由Chambers andJurafsky于2008年提出来的,要求给定…

美团集群调度系统HULK技术演进

本文根据美团基础架构部/弹性策略团队负责人涂扬在2019 QCon(全球软件开发大会)上的演讲内容整理而成。本文涉及Kubernetes集群管理技术,美团相关的技术实践可参考此前发布的《美团点评Kubernetes集群管理实践》。 一、背景 HULK是美团的容器…

LeetCode 1079. 活字印刷(全排列回溯)

文章目录1. 题目2. 解题类似题目 78 子集、 90 子集 II1. 题目 你有一套活字字模 tiles,其中每个字模上都刻有一个字母 tiles[i]。返回你可以印出的非空字母序列的数目。 示例 1:输入:"AAB" 输出:8 解释:…

EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?

文 | Sheryc_王苏本文首发于NLP宝藏公号【夕小瑶的卖萌屋】,疯狂暗示!这个世界上有两种极具难度的工程:第一种是把很平常的东西做到最大,例如把语言模型扩大成能够写诗写文写代码的GPT-3;而另一种恰恰相反,…

论文浅尝 | 用于开放领域的问题生成

作者 | 黄焱晖单位 | 东南大学硕士研究方向 | 自然语言处理,知识图谱Learning to AskQuestions in Open-domain Conversational Systems with Typed Decoders动机本文的问题生成用于开放领域的问题生成,与传统的问题生成不同的是,在开放领域对…

Android官方开发文档Training系列课程中文版:构建第一款安卓应用之创建用户界面

原文地址:http://android.xsoftlab.net/training/basics/firstapp/building-ui.html 在这节课中,你会创建一个xml的布局文件,它包含一个Text成员和一个Button成员。在下节课中,你会学习到当Button按下后启动并发送Text成员的内容…

字节码增强技术探索

1.字节码 1.1 什么是字节码? Java之所以可以“一次编译,到处运行”,一是因为JVM针对各种操作系统、平台都进行了定制,二是因为无论在什么平台,都可以编译生成固定格式的字节码(.class文件)供JVM…

LeetCode 1137. 第 N 个泰波那契数

文章目录1. 题目2. 解题1. 题目 泰波那契序列 Tn 定义如下: T0 0, T1 1, T2 1, 且在 n > 0 的条件下 Tn3 Tn Tn1 Tn2 给你整数 n,请返回第 n 个泰波那契数 Tn 的值。 示例 1:输入:n 4 输出:4 解释&#…

Calibration: 一个工业价值极大,学术界却鲜有研究的问题!

文 | kid丶(知乎作者)编 | 夕小瑶尽管深度学习给工业界带来了一波上线春天,但是总有很多比较难的业务,模型反复迭代后准确率依然达不到预期的产品标准,难以满足用户期望。以下为工业界常见讨(si)论(b&#…

肖仰华 | 大规模、高质量的金融知识图谱,如何自动化构建?

本文转载自公众号:恒生技术之眼。◆本文根据2019恒生技术开放日肖仰华教授演讲整理◆肖仰华:复旦大学教授、博士生导师,复旦大学知识工场实验室创始人。知识图谱(Knowledge Graph, KG)本质上是一种大规模语义网络&…

Android官方开发文档Training系列课程中文版:构建第一款安卓应用之启动另一个Activity

原文地址:http://android.xsoftlab.net/training/basics/firstapp/starting-activity.html#CreateActivity 在完成了上一节课之后,你有了一个带有输入框和按钮的单屏幕Activity。在这节课中,你将会在MyActivity中添加一些代码,以…

美团点评Kubernetes集群管理实践

背景 作为国内领先的生活服务平台,美团点评很多业务都具有非常显著、规律的”高峰“和”低谷“特征。尤其遇到节假日或促销活动,流量还会在短时间内出现爆发式的增长。这对集群中心的资源弹性和可用性有非常高的要求,同时也会使系统在支撑业务…

论文浅尝 | 基于知识图谱 Embedding 的问答

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答。来源:WSDM 2019链接:https://dl.acm.org/citation.cfm?doid3289600.3290956目前知识图谱问答(本文简写为QA-KG,question answeri…

NeurIPS 2020 | 没有乘法的神经网络,照样起飞?

文:苏剑林编:兔子酱单位:追一科技今天给大家介绍一篇1962年的论文《Computer Multiplication and Division Using Binary Logarithms》[1],作者是John N. Mitchell,他在里边提出了一个相当有意思的算法:在二…

LeetCode 1160. 拼写单词

文章目录1. 题目2. 解题1. 题目 给你一份『词汇表』(字符串数组) words 和一张『字母表』(字符串) chars。 假如你可以用 chars 中的『字母』(字符)拼写出 words 中的某个『单词』(字符串&…

MTFlexbox自动化埋点探索

1. 背景 跨平台动态化技术是目前移动互联网领域的重点关注方向,它既能节约人力,又能实现业务快速上线的需求。经过十年的发展,美团App已经变成了一个承载众多业务的超级平台,众多的业务方对业务形态的快速迭代和更新提出了越来越高…

Android官方开发文档Training系列课程中文版:添加ActionBar之设置ActionBar

导言- 添加ActionBar 原文地址:http://android.xsoftlab.net/training/basics/actionbar/index.html ActionBar是很多重要的特性之一,你可以用它实现用户的自定义行为。它提供了若干的用户界面特性,以便你的应用可以很快的提供与其它应用很…

论文浅尝 | 具有图卷积网络和顺序注意力机制的应用于目标导向的对话系统

论文笔记整理:吴涵,天津大学硕士,研究方向:自然语言处理。来源:2019 Association for Computational Linguistics论文链接:https://www.mitpressjournals.org/doi/full/10.1162/tacl_a_00284开放源码&#…