论文浅尝 - ACL2021 | 探讨跨句事件联合抽取问题

转载公众号 | 浙大KG


论文题目:MLBiNet: A Cross-Sentence Collective Event Detection Network

本文作者:娄东方、廖智霖、邓淑敏、张宁豫、陈华钧(浙江大学)

接收会议:ACL 2021

论文链接:https://arxiv.org/pdf/2105.09458.pdf

开源代码:https://github.com/zjunlp/DocED

欢迎转载,转载请注明出处

引言

跨句事件抽取旨在研究如何同时识别篇章内多个事件。我们提出多层双向网络MLBiNet(Multi-Layer Bidirectional Network)融合跨句语义和关联事件信息,从而增强内各事件提及的判别。首先,为建模句子内部事件关系,我们提出双向解码器用于同时捕捉前向和后向事件依赖;然后,我们利用信息聚合器汇总句子语义和事件提及信息;最后,通过迭代多个由双向解码器和信息聚合器构造的单元,并在每一层传递邻近句子的汇总信息,最终感知到整个文档的语义和事件提及信息。实验表明,跨句语义信息和事件依赖关系对事件抽取有效,我们的方法在ACE05数据集上取得最优表现。

一、前言

事件抽取包括事件触发词检测(识别事件触发词,并明确所触发事件的类型)和属性抽取(识别触发事件的属性,并标注各属性对应角色)两个子任务。例如,“He died in hospital”中“died”作为一个Die类型事件的触发词,该事件中,属性“He”的角色为Person, “hospital”的角色为Place. 本文主要探讨事件触发词检测任务中的跨句触发词联合抽取问题。

图1  ACE05样例

当下,事件触发词检测任务面临的挑战主要包括:(1)句子上下文表示及篇章级信息整合[1],[2]。候选触发词类型的判定一般需要结合上下文信息,包括关联实体信息(类型等)、其他候选触发词等。例如,图1中句子3中的“firing”可能是开枪(触发Attack事件)或离职(触发End_Position事件),Attack事件的确立需要融合句子2,4等的信息。(2)句内和句间事件关联性建模[1],[3]。句4包含事件触发词fight和death,ACE05数据集中超过40%触发词如此共现;类似句2、句3和句4中的连续关联事件同样普遍。因此,建模事件之间依赖对于同时抽取句子、跨句多事件尤为重要。

现有方法主要专注于句子级事件抽取,忽略了存在于其他句子中的信息。通过对事件抽取benchmark数据集ACE05的分析,我们得出如下结论。(1)可将事件触发词检测任务视为一个Seq2Seq任务,其中,source序列为文本篇章或句子,target序列是事件标签序列。对应基于RNN的encoder-decoder框架能有效处理该类问题,其中encoder建模丰富的上下文语义信息,decoder在解码过程中捕捉标签的依赖性。(2)对于当前句子,与之关联最密切的信息主要存在于邻近句子,相距较远的文本影响较小。

基于上述现象和结论,我们提出基于encoder-decoder框架的多层双向网络MLBiNet,尝试融合跨句语义和事件信息以提升事件触发词检测效果。

二、方法

模型包括四部分:语义编码器、双向解码器、信息整合层、多层双向打标器等。其中,语义编码层由BiLSTM和自注意力机制构成;双向解码层融合前向解码和后向解码,有助于捕捉双向事件依赖关系;信息整合层基于简单LSTM结构整合句子内部事件标签信息和语义信息;多层双向打标器则逐层传递邻近句子信息,最终捕捉更大邻域范围内的语义和事件信息,进而实现跨句事件联合抽取。

具体而言,双向解码器(给定输入文本,target序列的长度已知,它与输入文本等长)表达如下:

其中,编码器和解码器定义为

对于多层双向打标器,它的结构主要约束包括:(1)信息传递只发生在相邻句子间;(2)当前句子中的所有token可见跨句信息是相同的;(3)随着层数增加,较远距离的句子信息可被当前句子获取到;(4)每层的双向打标器都由一个双向解码器和一个信息整合层构成。对于第k层事件标签向量信息计算方法为:

其中, 

 表示邻近句子在上一层中整合得到的信息。最终事件标签向量 

 .

三、实验

我们在ACE05数据集上进行了试验,如下两个表所示,我们的方法在不同维度都能取得较好的效果。双向解码器有效,它在1层时较之于HBTNGMA更优;跨句信息整合有意义,多层网络下,我们的方法在单事件句子和多事件句子的抽取效果都得到提升。

模块剖析进一步了验证双向解码器和信息整合层的作用。具体而言,双向解码器较之于单向方法显著更优;层数增加情况下,不同解码机制下的效果都能得到提升;不同信息整合机制也能引起一定表现变动。

四、总结与展望

在本文中,我们提出了一种跨句事件触发词联合识别方法MLBiNet,它能同时实现篇章信息整合和跨句事件依赖建模,最终实验证明该方法能有效提升事件触发词识别效果。接下来,我们可尝试将该方法的推广到其他篇章级信息抽取任务(Docred, NER等),整合跨句语义信息,并建模标签关系。

[1] Collective event detection via a hierarchical and bias tagging networks with gated multi-level attention mechanisms. EMNLP2018

[2] Document embedding enhanced event detection with hierarchical and supervised attention. ACL2018

[3] Jointly multiple events extraction via attention-based graph information aggregation. EMNLP2018

[4] Event extraction via dynamic multi-pooling convolutional neural networks. ACL2015

[5] Edge-enhanced graph convolution networks for event detection with syntactic relation. EMNLP2020

[6] Meta-learning with dynamic-memory-based prototypical network for few-shot event detection. WSDM2020

[7] Event extraction as multi-turn question answering. EMNLP2020

[8] A joint neural model for information extraction with global features. ACL2020

[9] Exploiting the ground-truth: An adversarial imitation based knowledge distillation approach for event detection. AAAI2019

[10] Exploiting argument information to improve event detection via supervised attention mechanisms. ACL2017

[11] Graph convolutional networks with argument-aware pooling for event detection. AAAI2018

[12] Event detection with multi-order graph convolution and aggregated attention. EMNLP2019

[13] Ontoed: Low-resource event detection with ontology embedding. ACL2021

[14] Docred: A large-scale document-level relation extraction dataset. ACL2019


 

OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478230.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 343. 整数拆分(DP)

1. 题目 给定一个正整数 n,将其拆分为至少两个正整数的和,并使这些整数的乘积最大化。 返回你可以获得的最大乘积。 示例 1: 输入: 2 输出: 1 解释: 2 1 1, 1 1 1。示例 2: 输入: 10 输出: 36 解释: 10 3 3 4, 3 3 4 36。 说明: 你可以假设 …

python-dotenv解析env文件

python-dotenv解析env文件 最简单和最常见的用法是在应用程序启动时调用load_dotenv,从当前目录或其父目录中的.env文件或指定的路径加载环境变量,然后调用os.getenv提供的与环境相关的方法 .env 文件内容写法 ADMIN_HOST https://uat-rm-gwaaa.cn A…

HDFS NameNode内存详解

前言 《HDFS NameNode内存全景》中,我们从NameNode内部数据结构的视角,对它的内存全景及几个关键数据结构进行了简单解读,并结合实际场景介绍了NameNode可能遇到的问题,还有业界进行横向扩展方面的多种可借鉴解决方案。 事实上&am…

组队瓜分百万奖金池,资深算法工程师带你挑战飞桨论文复现赛!

你是否正在焦虑找不到好的论文?好不容易找到了paper,无法复现出code?缺少科研同行交流,只能独自一人闭门造车?是的,论文复现是要想最快的学习和了解AI领域的方式,复现困境也被叫做“徘徊在 AI 上…

开源开放 | Beyond 预训练语言模型,NLP还需要什么样的知识?

近年来,深度学习技术已广泛应用于NLP领域,但实际应用效果往往受限于缺乏大规模高质量监督样本。2018年底,预训练语言模型横空出世,极大缓解了这个问题,通过“超大规模无监督语料上的预训练语言模型相对少量的监督样本进…

Docker把容器打包成镜像并提交到harbor仓库

Docker把容器打包成镜像并提交到harbor仓库 如果你想要保存当前容器的状态,就可以通过commit来提交获得一个镜像,就好我们虚拟机的时候创建快照,想要回滚到某一个版本 一、首先创建要给tomcat 的本地容器,镜像指定tomcat-alpine:8…

LeetCode 139. 单词拆分(DP)

1. 题目 给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict,判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词。 说明: 拆分时可以重复使用字典中的单词。 你可以假设字典中没有重复的单词。 示例 1: 输入: s "…

外卖排序系统特征生产框架

背景 图1 外卖排序系统框架 外卖的排序策略是由机器学习模型驱动的,模型迭代效率制约着策略优化效果。如上图所示,在排序系统里,特征是最为基础的部分:有了特征之后,我们离线训练出模型,然后将特征和模型一…

征稿 | “健康知识图谱”投稿通道开启

Data Intelligence正在与语义网国际知名学者Deborah McGuinness以及Oshani Seneviratne等专家一道组织“个人健康知识图谱”专辑。欢迎投稿!DI专辑Special Issue on Personal Health Knowledge Graphs This special issue at Data Intelligence Journal seeks origi…

清华提出LogME,无需微调就能衡量预训练模型的下游任务表现!

文 | 游凯超源 | THUML引言在深度学习时代,神经网络的参数量越来越大,从头开始训练(train from scratch)的成本也越来越大。幸运的是,在计算机视觉、自然语言处理等人工智能应用的主要领域,人们能够采用迁移学习的预训练-微调范式…

好的代码标准

需求分析文档需要用精确的数字来描述,避免量变导致质变

LeetCode 140. 单词拆分 II(DP+回溯)

1. 题目 给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict,在字符串中增加空格来构建一个句子,使得句子中所有的单词都在词典中。返回所有这些可能的句子。 说明: 分隔时可以重复使用字典中的单词。 你可以假设字典中没有重复的…

论文浅尝|简单高效的知识图谱表示学习负样本采样方法

笔记整理 | 陈名杨,浙江大学在读博士生,主要研究方向为知识图谱表示学习Introduction研究知识图谱表示学习(KnowledgeGraph Embedding)可以解决当前很多应用的基本问题,这些方法旨在将知识图谱中的实体(Ent…

常见性能优化策略的总结

本文要感谢我职级评定过程中的一位评委,他建议把之前所做的各种性能优化的案例和方案加以提炼、总结,以文档的形式沉淀下来,并在内部进行分享。力求达到如下效果: 1. 形成可实践、可借鉴、可参考的各种性能优化的方案以及选型考虑…

微软中山大学开源超强的视觉位置编码,涨点显著

文 | 小马源 | 极市平台1.写在前面由于Transformer对于序列数据进行并行操作,所以序列的位置信息就被忽略了。因此,相对位置编码(Relative position encoding, RPE)是Transformer获取输入序列位置信息的重要方法,RPE在自然语言处理任务中已被…

LeetCode 63. 不同路径 II(DP)

1. 题目 一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为“Start” )。 机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为“Finish”)。 现在考虑网格中有障碍物。那么从左上角到…

技术动态 | 去中心化知识图谱协作平台建设实践

转载公众号 | DataFunTalk文章作者:Epik 铭识协议出品平台:DataFunTalk导读:1月10日,由EpiK铭识协议主办的“2021开源知识运动”主题活动为业界带来了一场知识图谱开放与互联的智慧盛宴。活动吸引了包括清华大学信息技术研究院副…

权威赛事来了!千言-文本生成评测启动,聚焦NLG技术痛点

自然语言生成是人工智能的重要前沿技术,该技术在落地时会面临一个难题:如何保证模型生成的文本与输入具有事实层面的一致性,即避免生成错误、臆想的信息?为推动相关研究,中国中文信息学会自然语言生成专委会与千言开源…

CRM系统新思维

客户关系管理系统(CRM系统)是管理公司当前以及未来潜在客户的系统,其主要目的是通过优化客户关系实现公司销售业绩的长期增长,它是企业信息系统的核心之一。目前,移动互联网、大数据以及人工智能技术发展日新月异&…