visual paradigm 表示选择关系_知识获取的新挑战—远程监督关系抽取

cc1d909438a3a304a1fc87aa41bea6a4.png

本文主要介绍远程监督关系抽取任务上两个最新的工作。远程监督(Distantly Supervised)是关系抽取(Relation Extraction)的一种主要实现方法。关系抽取是指获得文本中的三元组(triple),包括实体对和它们之间的关系,在自然语言理解中扮演着一个至关重要的角色。一般的方法采用完全监督的模式、需要大量的人工标注,这些是高成本且费时的。为了缓解这样的情况,研究人员企图构建远程监督关系提取器,将已有的知识库(比如 freebase)对应到非结构化的文本数据中,生成大量的训练数据来提高模型的训练效果。尽管远程监督节省了成本与时间,但是句子级的RE其包含大量噪声的问题亟需解决。

Fine-tuning Pre-Trained Transformer Language Models to Distantly Supervised Relation Extraction

论文地址:

https://www.aclweb.org/anthology/P19-1134

论文动机

远程监督关系提取广泛用于从文本中提取关系事实,但存在标签噪声问题。目前的关系提取方法主要是通过多实例学习和提供语言和上下文信息的支持,以更有效地指导关系分类。在获得最先进的结果时,作者观察到这些模型偏向于识别有限的高精度关系,而忽略了长尾关系。本文的扩展点在于通用结构引入额外的背景知识或者进行深度语言模型表示处理。

论文贡献

  • 论文使用改进的GPT模型来处理袋级、多实例的远程监督数据集,通过融合语句级信息和选择性注意机制得到袋级预测。除了从词法句法的角度解决问题外,也更注重大量的常识知识。
  • 作者在NYT10数据集上评估所提出的微调语言模型,与RESIDE模型和PCNN+ATT模型相比,该模型实现了最先进的AUC。
  • 作者对预测结果进行了人工分析,结果表明该模型预测得到更多样化的关系,并且表现出更高的召回率。

模型

82323c6e3aad85313e83db9f294a45c2.png

1. contextualized representations 语言模型学习方法

780908ab38b8dca2cc403b4771bb1311.png

无监督预训练语言表示模型采用最大似然估计作为损失函数,Transformer模型目标函数:

621c9f4bdf1b6f0af93897e5a9040d24.png

整个优化过程采用随机梯度下降,该结果是对于每一个词的概率分布用于下游任务的输入序列。

2. Transformer多示例学习

这部分介绍了我们对原始transformer体系结构的扩展,支持远程监督数据集上的袋级多实例学习。文章假设一个标记的数据可以表示为

183800431f9802b3741e4ca4397329c9.png

选择注意力可以学习那些带有明显特征表示某个关系的句子同时不重视那些包含噪音的句子,权重计算公式如下:

92942c62c1bce18d952184f924e7c3d0.png

最终优化目标如下:

fd292171327c74a0d085835ff29ed887.png

c3d3b88e70f9b52c6718faee86f42693.png

由于引入语言模型在微调过程中有助于改善泛化能力实现快速收敛,故:

24a0ec3c15c2ecdbdbb48bf6b7639152.png

模型表现

9d67e5c05313c041be8c5c0a0815365f.png

文章在结果上强调P-R曲线的balance问题,即整体表现良好(AUC面积最好),这可能具备很高的应用价值,而baselines方法都体现出在高召回率下drop early现象。


Cross-relationCross-bag Attention for Distantly-supervised Relation Extraction

论文地址:

https://arxiv.org/abs/1812.10604

论文动机

尽管远程监督节省了成本与时间,但是远程监督方法是上下文无关的,对于句子级的RE包含大量噪声。因此,生成的训练数据通常包含大量噪音,可能导致在常规的监督学习中表现不佳。选择性注意力机制企图为句子分配注意力权重之后结合包内所有句子用于训练。然而,句子级选择性注意力(ATT)独立生成每种关系类型的权重而忽略了关系类型间的关联。

论文贡献

  • 文章提出Cross-relation Attention,在考察所有关系类型之间的相互影响后产生注意力权重,并考虑了一个训练实例包含多个实体对的特殊情况。
  • 本文提出Cross-bag Attention结合不同的句子包,将这种组合结构称为superbag,并将其作为训练示例代替句子包,这使得模型更加关注高质量的句子包,减少知识库中过时或未表示的信息带来的噪声。
  • 文章采用句子级选择注意力机制减少噪声以及不匹配句子的影响,同时利用关系间的相关性来提高注意权重的质量。此外,不同于之前将所有实体对看作是等价的,文章采用注意力机制关注更高质量的关系对。

模型

本文模型(C2SA)的提出通过考虑关系间的相关性提高句子级注意力的效果,并在另一个注意力层级筛选包级别特征。多示例学习方法有助于减少噪声增强模型鲁棒性,多示例学习把句子包视为基础的训练示例,每个包中的一组句子被标记为相同的知识库事实。通过包内选择,模型可以更加关注高质量的句子减少对噪音句子关注。

f9afa5832e9515ff165e73dac2a94ea9.png

如图1所示,关系抽取器包含两个组件:一个神经网络特征抽取器和一个输出层。模型训练过程整个分为四个步骤:首先为每个句子构建表示。之后,cross-relation选择性注意结合句子表征并生成句子包的表征。相似地,cross-bag选择注意力结合句子包表示生成超级包表示。最终loss基于superbag特征指导关系抽取器学习。

1. 神经网络特征抽取器

对于神经网络特征抽取器,它可以抽取有用的特征进行关系分类,并可以使用任何的神经网络结构包括CNN与RNN。文章采用piecewise-CNN,由卷积层和分段最大池化层。卷积层,输出结果c计算方法如下:

5af9cf7eb91a6f9a78dd846217813ccf.png

2. 输出层

基于抽取特征,输出层对关系类型做出预测。为计算每个关系的置信度,本文采用线性投影与softmax函数计算条件概率,采用droput策略防止过拟合。

3. Cross-relation Cross-bag Selective Attention

570e7c400338ed9c0182ce0ab9cb3d46.png

Cross-relation Selective Attention其目的旨在减少噪声或错误匹配句子的影响,计算选择注意力基于句子与关系间的相似性:

c1f399428d6b0cbf9d3f99eec1e341c4.png

为了捕获关系之间的相关性,文中使用bayes规则计算期望注意权重:

352cfcae4bb813503d66560357fdf6bb.png

Cross-relation Selective Attention不仅仅依赖于目标关系句子的相似性,也依赖于其他关系。该机制假设在包中至少一句话表达实体对的某种关系,远程监督在句子包级别存在噪音,可能大量关系对不能发现知识库中给定的表达,这种实体对会导致句子级关系抽取存在不匹配或噪声训练示例。针对上述问题,本文结合几个包含相同关系类型的句子包,将注意力集中到更高质量的部分,采用attention layer结合包,公式如下:

ae7924e76da3c318f265406fc403f812.png

f8c09519c0c668ee2b28fcdd694c4a36.png

最终模型目标函数训练采用负对数似然实现,Cross-bag Selective Attention机制如下图,

3799bb38529593ff02c5b5ec063f91b0.png

模型表现

使用NYT10作为训练集,53个分类,数据集包含522611个句子,281270实体对和18252知识库事实。

8f20213889508fb8600b16e99e940994.png

实验结果反映了两个重要信息:(1)本文提出的cross-relation与cross-bag对模型效果的提升都有效;(2)余弦相似度代替点乘作为评分函数的一部分是非常有效的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/501343.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Android studio的Activity详解

Activity就相当于我们的手机界面,里面包含着各个组件 Activity 的4种状态 运行状态:屏幕可视,且可以进行操作 暂停状态:返回退出的时候,询问是否退出运行状态,此时属于暂停状态 ------------------------…

arraylist 的扩容机制_每天都用ArrayList,你读过它的源码么?

作者:陌北有棵树,玩Java,架构师社区合伙人!【一】关于扩容如果没有指定初始容量,则设置为10/** * Default initial capacity. */private static final int DEFAULT_CAPACITY 10;ArrayList的扩容比较简单,容…

JAVA入门级教学之(IDEA工具的快捷键和简单设置)

1.字体font file-->settings-->输入font-->设置字体样式以及字号大小 2.快速生成main方法 psvm 3.快速输出Systm.out.println(); sout 4.删除一行 ctrly 5.怎么运行 代码删右键run 或者点击右上角箭头 shiftf10(不同电脑可能不一样) 6.左侧窗口中的列表怎么展开…

java selenium_selenium 常见面试题以及答案(Java版)

1.怎么 判断元素是否存在?判断元素是否存在和是否出现不同, 判断是否存在意味着如果这个元素压根就不存在, 就会抛出NoSuchElementException这样就可以使用try catch,如果catch到NoSuchElementException 就返回false2.如何判断元素…

关于HTML的盒子的一些小问题

最近在开发的时候发现一个小问题&#xff0c;<DIV>我们很熟悉的一个盒子元素 关于他的描述 1.按照我们正常人的思维逻辑 编写好一个DIV盒子&#xff0c;然后再在盒子里面添加边框border、内边距padding、内容&#xff0c;这是我们的思维逻辑 但是DIV的编写会随着你添加…

语义网络分析图怎么做_怎么去分辨化工壶,光说可能大家还是会有疑惑,所以做了几个图...

网友们经常会拿一些壶出来&#xff0c;拍图给我看&#xff0c;问我会不会是化工壶&#xff0c;说到底&#xff0c;还是不放心自己手头上的紫砂壶&#xff0c;怕对自身健康造成影响&#xff0c;在这里&#xff0c;小编特地编辑这一段&#xff0c;教大家怎么去分辨化工壶&#xf…

CSS3特效之转化(transform)和过渡(transition)

CSS3特效之转化&#xff08;transform&#xff09;和过渡&#xff08;transition&#xff09; 在对动画深入之前&#xff0c;我们需要先了解它的一些特性&#xff0c;CSS3的转化&#xff08;transform&#xff09;和过渡&#xff08;transition&#xff09;。有人可能会有疑…

java如何保证redis设置过期时间的原子性_分布式锁用 Redis 还是 Zookeeper

在讨论这个问题之前&#xff0c;我们先来看一个业务场景&#xff1a;系统A是一个电商系统&#xff0c;目前是一台机器部署&#xff0c;系统中有一个用户下订单的接口&#xff0c;但是用户下订单之前一定要去检查一下库存&#xff0c;确保库存足够了才会给用户下单。由于系统有一…

转 安卓解决 IDEA 下 struts.xml 中 extends=“struts-default“ 报红的问题

解决 IDEA 下 struts.xml 中 extends"struts-default" 报红的问题 现象 在IDEA中配置struts.xml时 extends"struts-default" 报红&#xff0c;配置拦截器时属性无预选项提示&#xff0c;也爆红。 struts.xml本身的配置并没有错误。 解决办法 CtrlShiftAl…

系统新模块增加需要哪些步骤_人工智能之父的问题解决策略:模块化

最近主题阅读马文明斯基(Marvin Minsky) 和西摩佩珀特(Seymour Papert)两位人工智能大师&#xff0c;关于思维&#xff0c;关于教育的书籍。其中马文被称为「人工智能之父」。两人都非常重视过程模块化。复杂问题的解决需要系统性&#xff0c;也很少一次做对&#xff0c;要通过…

小白学Linux(一:开门见山)

目录 1.javaEE&#xff0c;先搭环境再敲码 2.Linux大数据 3.Python 4. Linux的学习方向 5. Linux的进阶段位 6.下面开始进入实际操作环节 第一步.安装虚拟机软件 第二步.在虚拟机里面安装一个别人开发好的Centos系统&#xff08;可以在此系统中写Linux指令&#xff0c;…

vb net 模拟 ctrl+c_8款优秀的.NET开发工具,收藏了

NET是一个重要的应用程序开发平台&#xff0c;因为它安全、稳定、易于学习和实现。今天小编给就给大家介绍8款优秀的.NET开发工具&#xff0c;有需要的小伙伴可以收藏转发哦。1、ChocolatyChocolaty是一个Windows软件包管理器&#xff0c;这个工具的重要之处在于&#xff0c;它…

卸载后以前拍的视频会删除吗_可立拍!苹果自己的视频编辑App是一个被忽视的好工具...

手机预装应用总是不如三方产品&#xff1f;看到这个问题&#xff0c;你是不是会下意识反驳&#xff1a;iPhone自带 app 就很好用啊&#xff01;的确如此&#xff0c;iPhone 的《Pages》《备忘录》&#xff0c;这些 app 的优秀表现改变了不少人「拿到新机就想卸载预装应用」的想…

解决:Linux中的CentOS 7的火狐浏览器不能访问服务器

今天安装CentOS 7的时候配置好环境&#xff0c;发现火狐不能连网 分析了一些可能是我的虚拟机网络配置没开&#xff0c;因此我总结了两个方法 1.检查虚拟机的编辑--》虚拟网络编辑器--》看看是否是NAT连接 2.搜索计算机的服务--》找到VMware DHCP Service和VMware NAT Servi…

pyqt5 自定义控件_PyQt5学习笔记(十六)Pyinstaller打包与SQLite数据库

终于到了最后一章了QAQ&#xff0c;第一次写4万字以上的笔记分享&#xff0c;最近也在忙科创和CV的比赛&#xff0c;所以笔记会显得比较粗糙。其实吧分享这个笔记很大一部分是为了让自己记得更牢&#xff0c;网上翻阅自己的笔记也方便&#xff0c;如果有讲解注释不清楚的地方欢…

依赖第三方库时出现的问题:Manifest merger failed : uses-sdk:minSdkVersion 15 cannot be smaller than version 16

导入第三方库时出现了sdk版本不兼容问题 为我们app的module所支持的sdk最低版本与依赖module的sdk最低版本不一致 把15--》16即可

Linux基本目录结构

上一步我们已经搭建好实验环境了&#xff0c;这一节就来实际操作一下&#xff0c;到底什么是CentOS&#xff0c;到底什么是Linux操作系统&#xff0c;写什么&#xff0c;如何去做&#xff0c;如何去打开&#xff0c;下面我们带着这些疑惑展开这一节 1.打开终端&#xff0c;有些…

解决:VMware DHCP Service 服务无法启动

今天在布置项目的时候发现VMware DHCP Service 服务无法启动&#xff0c;连网络也连接不了 解决办法是 搞定 解决后验证Linux又可以连接上网络了

bmp文件格式_一次性解决CAD转换成BMP格式图片的问题

关于BMP格式图片&#xff0c;可能很多小伙伴都遇到得比较多&#xff0c;但在这里还是稍微解释一下吧。它是Windows操作系统中的标准图像文件格式&#xff0c;大家都知道BMP格式的图片都非常大&#xff0c;那是因为它没有经过任何压缩。当然&#xff0c;关于BMP文件当中蕴含着哪…

Linux如何配置网络IP地址

首先&#xff0c;脑子思路一定要清晰我们为什么要配置ip地址&#xff0c;我们的电脑一般是一个物理网卡&#xff0c;那么按照正常情况&#xff0c;我们的虚拟机里的Linux是和windows共享同一个物理网卡的&#xff0c;所以很正常&#xff0c;一个物理网卡不可能仅仅只有一个ip地…