论文浅尝 | 用异源监督进行关系抽取:一种表示学习方法


Citation: Liu, L., Ren, X., Zhu, Q., Zhi, S., Gui, H., Ji, H., & Han, J.(2017). Heterogeneous Supervision for Relation Extraction: A RepresentationLearning Approach. Retrieved from http://arxiv.org/abs/1707.00166

 

动机


现有的关系抽取方法严重依赖于人工标注的数据,为了克服这个问题,本文提出基于异种信息源的标注开展关系抽取模型学习的方法,例如知识库、领域知识。这种标注称作异源监督(heterogeneous supervision),其存在的问题是标注冲突问题,即对于同一个关系描述,不同来源的信息标注的结果不同。这种方法带来的挑战是如何从有噪声的标注中推理出正确的标签,以及利用标注推理结果训练模型。

例如下面的句子,知识库中如果存在<Gofraid,born_in, Dal Riata>这个三元组,则将下面的句子标注为born_in关系;而如果使用人工模板“* killed in*”进行匹配,则会将该句子标注为kill_in关系。

 

Gofraid(e1) died in989, said to be killed in Dal Riata(e2).

 

为了解决这个问题,本文提出使用表示学习的方法实现为关系抽取提供异源监督。

 

创新点


本文首次提出使用表示学习的方法为关系抽取提供异源监督,这种使用表示学习得到的高质量的上下文表示是真实标签发现和关系抽取的基础。

 

方法


文章方法框架如下:

图 关系描述表示方法

 

1)文本特征的向量表示。从文本上下文中抽取出文本特征(基于pattern得到),简单的one-hot方法会得到维度非常大的向量表示,且存在稀疏的问题。为了得到更好的泛化能力,本文采用表示学习的方法,将这些特征表示成低维的连续实值向量;

2)关系描述的向量表示。在得到文本特征的表示之后,关系描述文本依据这些向量的表示生成关系描述的向量表示。这里采用对文本特征向量进行矩阵变换、非线性变换的方式实现;

3)真实标签发现。由于关系描述文本存在多个可能冲突的标注,因此发现真实标签是一大挑战。此处将每个标注来源视为一个标注函数,这些标注函数均有其“擅长”的部分,即一个标注正确率高的语料子集。本方法将得到每种标注函数擅长的语料子集的表示,并以此计算标注函数相对于每个关系描述的可信度,最后综合各标注函数的标注结果和可信度,得到最终的标注结果;

4)关系抽取模型训练。在推断了关系描述的真实标签后,将使用标注的语料训练关系抽取器。

 

值得指出的是,在本方法中,每个环节不是各自独立的,真实标签发现与关系抽取模型训练会相互影响,得到关系上下文整体最优的表示方法。

 

 

实验结果


本文使用 NYT Wiki-KBP 两个数据集进行了实验,标注来源一方面是知识库,另一方面是人工构造的模板。每组数据集进行了包含 None 类型的关系抽取,和不包含 None 类型的关系分类。结果如下表所示,可见本文的方法相比于其他方法,在两个数据集的四组实验中均有较明显的性能提升。


论文笔记整理:刘兵,东南大学博士,研究方向为自然语言处理。

 



OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。


点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480781.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SQuAD文本理解挑战赛十大模型解读

教机器学会阅读是近期自然语言处理领域的研究热点之一&#xff0c;也是人工智能在处理和理解人类语言进程中的一个长期目标。得益于深度学习技术和大规模标注数据集的发展&#xff0c;用端到端的神经网络来解决阅读理解任务取得了长足的进步。 转载&#xff1a;https://blog.cs…

万字长文,知识图谱构建技术综述

文章来源:丁香大数据 前言 知识图谱&#xff0c;即一种特殊的语义网络&#xff0c;它利用实体、关系、属性这些基本单位&#xff0c;以符号的形式描述了物理世界中不同的概念和概念之间的相互关系。为什么说知识图谱对于信息检索、推荐系统、问答系统中至关重要&#xff0c;我…

查理·芒格:分享12个顶级思维模型

网络资料整理&#xff0c;另见&#xff1a;https://blog.csdn.net/UFv59to8/article/details/79695476

技术如何转型产品经理

我知道很多做技术的朋友在积极寻找转型的机会&#xff0c;从程序员转型到产品经理&#xff0c;或者程序员转型到运营、市场等。 怎样转&#xff1f; 转型前后的心态等&#xff1f;有没有具体的方法或者步骤?也许本文能帮你理清不少思路。 做技术出身的朋友很多&#xff0c;最…

基于BERT的多模学习——VL-BERT篇

前言 BERT的出现让NLP发展实现了一个大飞跃&#xff0c;甚至有大佬说NLP已经没有可以做的啦&#xff0c;后面就是拼机器拼money了。但是&#xff0c;我认为任何领域的进步之后都会有更苛刻的要求&#xff0c;科研没有尽头&#xff0c;需求也永远无法满足。而多模态&#xff0c…

从程序员到阿里技术总监之路

第一步&#xff1a;高级研发工程师开始 掌握技术基础 技术语言基础和高级知识&#xff0c;常用算法、常用工具、框架原理、代码运行周期、内存回收机制等等&#xff0c;类似这些基础知识。 第二步&#xff1a;技术主管 需要掌握一定的项目管理常识&#xff0c;掌握一定的架构…

咨询笔记:麦肯锡7步成诗

麦肯锡7步成诗&#xff0c;用于咨询中的关键因素分析。有不少版本&#xff0c;细节各有不同 这个是自己整理的&#xff1a;

架构师的主要职责是什么?

进阶成为架构师是大多数java程序员们的梦想&#xff0c;架构师从广义上可分为软件架构师、系统架构师&#xff0c;软件架构师是程序员最容易突破、最可能进阶的一条职业发展路径&#xff0c;我这次主要分享软件架构师的相关知识点。 一&#xff1a;架构师的定义 架构师&#…

ELECTRA模型精讲

本文转载自公众号“夕小瑶的卖萌屋”&#xff0c;专业带逛互联网算法圈的神操作 -----》我是传送门 关注后&#xff0c;回复以下口令&#xff1a; 回复【789】 &#xff1a;领取深度学习全栈手册&#xff08;含NLP、CV海量综述、必刷论文解读&#xff09; 回复【入群】&#xf…

深度学习最全优化方法总结比较(SGD,Adagrad,Adadelta,Adam,Adamax,Nadam)

深度学习最全优化方法总结比较&#xff08;SGD&#xff0c;Adagrad&#xff0c;Adadelta&#xff0c;Adam&#xff0c;Adamax&#xff0c;Nadam&#xff09;ycszenSemantic Segmentation / changqianyu.me​关注他1,520 人赞同了该文章前言 &#xff08;标题不能再中二了&#…

常用分词算法总结(字典、统计、神经网络)

本文转载自公众号“夕小瑶的卖萌屋”&#xff0c;专业带逛互联网算法圈的神操作 -----》我是传送门 关注后&#xff0c;回复以下口令&#xff1a; 回复【789】 &#xff1a;领取深度学习全栈手册&#xff08;含NLP、CV海量综述、必刷论文解读&#xff09; 回复【入群】&#xf…

阿里架构师进阶23期精讲:Redis、Kafka、Dubbo、Docker等

史上最全Redis面试49题&#xff08;含答案&#xff09;:哨兵复制事务集群持久化等 高并发架构系列&#xff1a;Redis缓存和MySQL数据一致性方案详解 Redis的高可用详解&#xff1a;Redis哨兵、复制、集群的设计原理&#xff0c;以及区别 高并发架构系列&#xff1a;Redis为…

论文浅尝 | 变分知识图谱推理:在KG中引入变分推理框架

本文转载自公众号&#xff1a;机器之心。推理知识图谱中缺失的连接已经吸引了研究界的广泛关注。在本论文中&#xff0c;加州大学圣塔芭芭拉分校的王威廉等研究者在知识图谱推理中引入了变分推理框架&#xff0c;并将路径搜索和路径推理紧密结合从而进行联合推理&#xff0c;这…

机器学习中的最优化算法总结

https://zhuanlan.zhihu.com/p/42689565 机器学习中的最优化算法总结对于几乎所有机器学习算法&#xff0c;无论是有监督学习、无监督学习&#xff0c;还是强化学习&#xff0c;最后一般都归结为求解最优化问题。因此&#xff0c;最优化方法在机器学习算法的推导与实现中占据中…

以jieba为首的主流分词工具总结

工具篇 下面列了几个较为主流的分词工具&#xff08;排名不分先后&#xff0c;大家自行试用&#xff09;&#xff0c;相关的paper请在订阅号「夕小瑶的卖萌屋」后台回复【中文分词】领取。 1 Jieba 说到分词工具第一个想到的肯定是家喻户晓的“结巴”中文分词&#xff0c;主…

mikechen详谈架构师成长之3大步骤

本文作者&#xff1a;陈睿|mikechen&#xff0c;优知学院创始人 这是架构师系列的第二篇文章 前文谈到架构师核心技能架构设计的重要性&#xff0c;如果你对架构师这个职位从技能的角度有比较清晰的认识&#xff0c;本篇文章将为你继续揭示架构师这个职位的成长周期。 在国内…

论文浅尝 | 二维卷积知识图谱嵌入

链接&#xff1a;https://arxiv.org/pdf/1707.01476.pdf本文主要关注 KG Link prediction 问题&#xff0c;提出了一种多层卷积神经网络模型 ConvE&#xff0c;主要优点就是参数利用率高&#xff08;相同表现下参数是 DistMult 的8分之一&#xff0c;R-GCN 的 17 分之一&#x…

如何成为架构师?3条有效的实战经验

“ 希望你看完这一篇&#xff0c;能充分认知和了解架构师&#xff0c;认知对了&#xff0c;事就好办了。 01 架构师的准确定义 架构师的职责应该是立足于技术和业务之间的中间角色或者平衡点&#xff0c; 在针对业务深刻理解的基础上&#xff0c;针对业务中存在诸多变数&am…

ArchSummit2016干货分享+美团:即时物流调度平台实践+一点资讯:兴趣引擎-深度融合搜索和推荐+阿里-智能问答系统的实践

** 2015年7月 ** 加入滴滴打车3个半月&#xff0c;感觉遇到和解决的技术问题超过之前1年的。写在这里给大家分享。 滴滴这边负责所有策略算法设计的是“策略组”&#xff0c;大概有20几个员工。由于滴滴的业务线越来越多&#xff08;出租车&#xff0c;专车&#xff0c;快车&…

论文浅尝 | 使用变分推理做KBQA

Yuyu Zhang, Hanjun Dai, Zornitsa Kozareva, Alexander J.Smola, and Le Song: Variational Reasoning for Question Answering with KnowledgeGraph. AAAI 2018链接&#xff1a;https://arxiv.org/abs/1709.04071本文提出了一个可端到端训练的 KBQA 框架&#xff0c;可以在模…