论文浅尝 | PAKDD2020 - 利用支持集中匹配信息的 few shot 事件分类方法

论文浅尝 | PAKDD2020 - 利用支持集中匹配信息的 few shot 事件分类方法

news/2025/4/22 9:31:48/文章来源:https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/105445242

论文笔记整理：申时荣，东南大学博士生。

来源：PAKDD 2020

链接：https://arxiv.xilesou.top/pdf/2002.05295.pdf

1.介绍：

事件分类是一个重要的信息抽取任务，其目的是根据事件的提及实例对事件类别进行分类。目前事件分类的主要方法是基于监督学习的方法。包括依据语义语法特征的分类和依据深度神经网络编码实例特征的分类。

监督学习中的训练数据包括预定义的有限事件类型，以及对应的实例集合，这种方法存在明显的弊端。当事件类型固定后模型就不可扩展，无法处理训练数据中未出现的事件类型。而如果需要针对新的事件类型进行预测，就要重新标记数据并重新训练模型。

事件数据的标记需要很大的成本，事实上，当前的事件抽取更类似于few-shot任务。每个实例依据少量的支撑数据作为证据进行分类，这种方法也更接近人类的思维模式。Few-shot的具体做法就是依据带有类别标记的支撑集作为预测依据，典型的通过生成原型特征向量和基于度量的分类方法对每个query选择最合适类别进行预测。目前在事件分类领域还没有使用few-shot方法训练模型的先例。

但是目前的few-shot方法在训练过程中只考虑到使用支撑集和查询集之间的匹配关系进行训练，这种方法是低效的。由于本身样本的稀少这种方法不能很好的利用支撑集的信息。同时由于支撑集内部的每个实例之间存在差异，之前的方法并没有很好的利用这些信息。

于是本文将事件分类抽象为few-shot任务，并且在传统的训练方法上增加了支撑集内部的交互来提升训练过程中支撑集数据的利用效率。并且在两个典型的时间抽取数据集上都取得了提升。

2.方法：

首先，本文将事件分类定义为few-shot任务：

其中数据格式如下：

K表示了每个类对应的shot数（训练实例数），t表示了对应的类别标记，a表示了每个实例中trigger 的位置，s是实例序列（句子）。

本文的模型包括三个模块：实例编码模块、原型模块和分类模块。

实例编码模块包括嵌入（预训练的词嵌入和位置嵌入）和编码器两个部分组成。其中本位为了对比不同编码器的影响，使用了CNN和Transformer两种编码器。

原型模块主要是通过支撑集中某一类所有的句子向量来计算当前类的原型向量。目前有两种主流的原型向量计算方法，一种是简单平均所有句向量：

另一种是通过注意机制方法：

最后是分类模型，分类模型通过metric得到实例特征和原型的得分来预测其属于哪个类别：

对应的损失函数是：

本文使用而来三种度量学习方法进行比较，分别是余弦距离，欧式距离和CNN生成距离。

此外，为了充分利用支持集，在训练过程中，除了上述的损失之外，额外的支撑集为辅助支撑集和辅助查询集，并且按照之前的模式计算损失，保证使用部分支撑集预测剩余支撑集中的样本的正确性，对应损失为：

3.实验：

作者在ACE2005和TAC KBP两个数据集上进行了实验，结果如下

可以看出,增加支撑集内部的交互对实验结果有绝对提升。

OpenKG

开放知识图谱（简称 OpenKG）旨在促进中文知识图谱数据的开放与互联，促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文，进入 OpenKG 博客。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/479157.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

梯度下降法的神经网络容易收敛到局部最优，为什么应用广泛？

梯度下降法的神经网络容易收敛到局部最优，为什么应用广泛？

文 | Summer Clover知乎本文已获作者授权，禁止二次转载这是Deep Learning Theory里很基本也很核心的一个问题。在这个问题上，初学者容易被入门教学误导，非此研究方向的业内人士也容易有过时的认知。首先问题描述不够准确。更准确的说法是&…

阅读更多...

Android官方开发文档Training系列课程中文版：打印内容之图像打印

Android官方开发文档Training系列课程中文版：打印内容之图像打印

原文地址：http://android.xsoftlab.net/training/printing/index.html 引言 Android用户会很频繁的浏览设备上的内容，但是有部分情况例外，当屏幕没有足够的方式可以分享信息的时候。那么可以打印Android应用上的内容便给用户提供了一种方式…

阅读更多...

机器学习在美团配送系统的实践：用技术还原真实世界

机器学习在美团配送系统的实践：用技术还原真实世界

在2018 AI开发者大会（AI NEXTCon）上，美团配送AI方向负责人何仁清，分享了美团在即时配送领域中机器学习技术的最新进展，以及如何通过大数据和机器学习手段，建立对线下真实世界各种场景的感知能力&#xff0c…

阅读更多...

机器学习算法应用场景实例六十则

机器学习算法应用场景实例六十则

原文链接：https://blog.csdn.net/liulingyuan6/article/details/53648273本文整理了60个机器学习算法应用场景实例，含分类算法应用场景20个、回归算法应用场景20个、聚类算法应用场景10个以及关联规则应用场景10个。包含了天池、DataCastle、DataFountai…

阅读更多...

LeetCode 99. 恢复二叉搜索树（中序遍历）

LeetCode 99. 恢复二叉搜索树（中序遍历）

1. 题目二叉搜索树中的两个节点被错误地交换。请在不改变其结构的情况下，恢复这棵树。你能想出一个只使用常数空间的解决方案吗？ 2. 解题循环中序遍历（栈），记录不满足的节点，交换其valO(n)O(n)O(n)…

阅读更多...

Android官方开发文档Training系列课程中文版：打印内容之HTML文档打印

Android官方开发文档Training系列课程中文版：打印内容之HTML文档打印

原文地址：http://android.xsoftlab.net/training/printing/html-docs.html 在Android中打印内容要比打印照片要复杂一些，它要求将文本与图像整合到一个文档中。不过Android框架提供了一种实现方式，这种方式需要使用HTML来整合文档并打印&…

阅读更多...

AAAI21 | Seq2Seq模型成为“复读机”的原因找到了？

AAAI21 | Seq2Seq模型成为“复读机”的原因找到了？

文 | 苏剑林编 | Sheryc_王苏单位 | 追一科技去年笔者写过博文《如何应对Seq2Seq中的"根本停不下来"问题？》[1]，里边介绍了一篇论文中对Seq2Seq解码不停止现象的处理，并指出那篇论文只是提了一些应对该问题的策略，并没有…

阅读更多...

论文浅尝 | ICLR 2020 - 图神经网络的预训练策略

论文浅尝 | ICLR 2020 - 图神经网络的预训练策略

论文笔记整理：杨帆，浙江大学计算机学院。动机现有的用于图结构的预训练方法要么只关注node-level，导致在图表示空间没有区分度，要么只关注graph-level，导致在节点表示空间没有区分度。一种优质的节点表示应该保证不仅在…

阅读更多...

常见的距离算法和相似度计算方法

常见的距离算法和相似度计算方法

原文链接：https://zhuanlan.zhihu.com/p/138107999 首发于算法加油站写文章常见的距离算法和相似度计算方法奋发的菜鸟酱华东师范大学计算机技术博士在读91 人赞同了该文章注：不定时更新1.常见的距离算法1.1 欧几里得距离（Euclidean Dista…

阅读更多...

美团AI全景图：吃喝玩乐背后的黑科技

美团AI全景图：吃喝玩乐背后的黑科技

很多人都会发现日常生活已经越来越离不开美团了，这个互联网平台涵盖了吃、住、行、游、购、娱……能帮我们做很多事情，非常接地气。黄色的美团外卖骑手，橙色的摩拜单车，还有美团和大众点评的Logo……会不时出现在各个角落&#xf…

阅读更多...

Android官方开发文档Training系列课程中文版：打印内容之自定义文档打印

Android官方开发文档Training系列课程中文版：打印内容之自定义文档打印

原文地址：http://android.xsoftlab.net/training/printing/custom-docs.html 对于一些应用，比如绘图类APP，版面设计类APP以及其它APP，这些APP都关注图形的输出，有一个漂亮的打印页面是它们的关键特性。在这种情况下&a…

阅读更多...

LeetCode 547. 朋友圈（图的遍历BFS DFS）

LeetCode 547. 朋友圈（图的遍历BFS DFS）

文章目录1. 题目2. 解题2.1 BFS 广度优先2.2 DFS 深度优先1. 题目问有几个连通网络 2. 解题 2.1 BFS 广度优先参考图的数据结构 class Solution { public:int findCircleNum(vector<vector<int>>& M) {int n M.size(), groups 0, i;bool visited[n] …

阅读更多...

开源开放 | 《大词林》开源 75 万核心实体和围绕核心实体的细粒度概念、关系列表...

开源开放 | 《大词林》开源 75 万核心实体和围绕核心实体的细粒度概念、关系列表...

1《大词林》简介《大词林》(http://101.200.120.155/)是由哈尔滨工业大学社会计算与信息检索研究中心推出，由我中心秦兵教授和刘铭副教授主持开发，是一个自动构建的大规模开放域中文知识库。自2014年11月推出第一版《大词林》，《大词林》共经…

阅读更多...

推荐几个不错的CUDA入门教程（非广告）

推荐几个不错的CUDA入门教程（非广告）

文 | godweiyang最近因为项目需要，入坑了CUDA，又要开始写很久没碰的C了。对于CUDA编程以及它所需要的GPU、计算机组成、操作系统等基础知识，我基本上都忘光了，因此也翻了不少教程。这里简单整理一下，给同样有入门需求的…

阅读更多...

logging.getLogger(logger)

logging.getLogger(logger)

https://www.cnblogs.com/bjdxy/archive/2012/12/03/2799322.html logging模块学习笔记：logger 对象、日志等级 logger：日志对象，logging模块中最基础的对象，用logging.getLogger(name)方法进行初始化，name可以不填。通…

阅读更多...

Android官方开发文档Training系列课程中文版：高效显示位图之加载大位图

Android官方开发文档Training系列课程中文版：高效显示位图之加载大位图

原文地址：http://android.xsoftlab.net/training/displaying-bitmaps/index.html 引言学习如何使用一种常规的手段来处理及加载Bitmap对象，这种方式除了使用户界面是可响应的之外，还会避免超出内存的限制。如果你不小心点的话，…

阅读更多...

美团DB数据同步到数据仓库的架构与实践

美团DB数据同步到数据仓库的架构与实践

背景在数据仓库建模中，未经任何加工处理的原始业务层数据，我们称之为ODS(Operational Data Store)数据。在互联网企业中，常见的ODS数据有业务日志数据（Log）和业务DB数据（DB）两类。对于业务DB数…

阅读更多...

论文浅尝 | AAAI2020 - 基于生成对抗的知识图谱零样本关系学习

论文浅尝 | AAAI2020 - 基于生成对抗的知识图谱零样本关系学习

论文笔记整理：耿玉霞，浙江大学直博生。研究方向：知识图谱，零样本学习等。来源：AAAI2020论文链接：https://arxiv.org/pdf/2001.02332.pdf本文是发表在AAAI2020上的一篇基于生成对抗网络进行知识图谱零样本关…

阅读更多...

LeetCode 1184. 公交站间的距离

LeetCode 1184. 公交站间的距离

1. 题目环形公交路线上有 n 个站，按次序从 0 到 n - 1 进行编号。我们已知每一对相邻公交站之间的距离，distance[i] 表示编号为 i 的车站和编号为 (i 1) % n 的车站之间的距离。环线上的公交车都可以按顺时针和逆时针的方向行驶。返回乘客从出发点…

阅读更多...

【python】详解类class的继承、__init__初始化、super方法

【python】详解类class的继承、init初始化、super方法

原文链接; https://blog.csdn.net/brucewong0516/article/details/79121179?utm_mediumdistribute.pc_relevant_t0.none-task-blog-BlogCommendFromBaidu-1.control&depth_1-utm_sourcedistribute.pc_relevant_t0.none-task-blog-BlogCommendFromBaidu-1.control 通过之前…

阅读更多...

最新文章