论文学习18-Relation extraction and the influence of automatic named-entity recognition(联合实体关系抽取模型,2007)

文章目录

  • abstract
  • 1.introduction
  • 3.问题形式化
  • 4.系统架构
  • 5. 命名实体识别
  • 6.关系抽取(核方法)
    • 6.1global context kernel
    • 6.2 local context kernel
    • 6.3 shallow linguistic kernel
    • 7实验

Giuliano, C., et al. “Relation extraction and the influence of automatic named-entity recognition.” Acm Transactions on Speech & Language Processing 5(1): 1-26.
http://portal.acm.org/citation.cfm?doid=1322391.1322393

abstract

我们提出了一种从自然语言文档中提取命名实体之间关系的方法。该方法仅基于浅层语言处理,例如标记化,句子拆分,词性标记和词形化。它使用内核功能的组合来集成两个不同的信息源:(i)有关系出现的整个句子,以及(ii)交互实体周围的局部上下文。我们介绍了从新闻专线文档数据集中提取五种不同类型关系的实验结果,并表明每个信息源都为识别任务提供了有用的帮助。通常,组合内核相对于基本内核会显着提高精度,有时会以召回率略低为代价。此外,我们进行了一组实验,以评估命名实体识别的准确性对关系提取算法性能的影响。使用正确的命名实体(即,在语料库中手动注释的实体)和嘈杂的命名实体(即,由基于机器学习的命名实体识别器生成的实体)进行此类实验。结果表明,我们的方法大大改善了先前在同一数据集上获得的结果。

  • 该方法仅基于浅层语言处理
  • 使用内核函数(kernel function)集成连个信息源
    • 句子
    • 交互实体周围的局部上下文
  • 组合内核>基本内核

1.introduction

  • ner:使用线性链CRFs [Lafferty et al. 2001]来执行NER。
  • 关系提取:我们采用了Giuliano等人[2006]的方法(仅仅基于浅层的语言处理)–核
    • (i)实体出现的全局上下文和
    • (ii)交互实体周围的本地上下文。
  • 组合的核:将上两步分类器的结果组合起来,输出与全局概率推断相结合。

3.问题形式化

我们首先描述一些关于输入数据的假设。首先,这些实体已经被识别并作为输入提供给我们。请注意,以下生成过程既适用于自动识别命名实体时,也适用于手动识别它们时(即,取自金本位)。在本文中,我们提供了这两种情况下的实验结果。第二,只考虑同一句话内的实体之间的关系;虽然在不同的句子中可能存在实体之间的关系,但在用于评价的语料库中没有注释。因此没有考虑这个问题。我们将在下面看到,这种假设限制了数据集的大小。第三,我们不考虑自我关系。因为它们在语料库中没有注释。最后,每一种关系类型都是独立学习的,因此需要在不同的数据集上进行训练和测试。

  • 关系分类中的候选实体:同一句子中的实体的排列组合。—不平衡,有关系的是少数。(有关系+1,无则-1)
    • 改进:只考虑组合,不考虑排列(无序)
      • 在本例中,如果两个候选实体之间存在关系,则根据关系的方向将示例标记为1或2;否则,标记为0。
      • 关系的两个实体可分为
        • 两个实体是同类的
        • 两个实体是不同类的
      • 满足头实体尾实体的类型约束(生成候选实体时)

4.系统架构

在这里插入图片描述
首先,从指定的带注释的语料库脱机学习两个模型,一个用于实体识别(参见第5节),另一个用于关系提取(参见第6节)。然后,将这些模型应用到管道中以标记新文档。

  • 管道方法??
    • 用实体部分预测的实体标签来进行关系抽取,而非用标注的标签(在训练中也是)

5. 命名实体识别

在这里插入图片描述

  • CRFs
  • 训练两个模型
    • 实体分类
    • 实体提取+分类
    • 都用五折交叉验证

6.关系抽取(核方法)

在这里插入图片描述

  • 输入X–》embedding
  • kernel function:X,X->R
  • 学习算法可以用SVM
  • 两个核函数:global context kernels and local context kernels在这里插入图片描述

6.1global context kernel

  • R–关系
    在这里插入图片描述
    在这里插入图片描述
    where KFB, KB and KBA are n-gram kernels that operate on the Fore-Between, Between and Between-After patterns, respectively.

6.2 local context kernel

候选实体的局部上下文可以为检测关系的方向以及关系本身的存在提供有用的线索。与实体识别一样,我们使用以下基本特性来表示每个本地上下文

  • L=t-w,…,t0,t1,…tw
    在这里插入图片描述
    在这里插入图片描述
    where Kleft and Kright are defined by substituting the embedding ofthe left and right local context into Equation (1), respectively.

6.3 shallow linguistic kernel

在这里插入图片描述

7实验

(1) MO|K. The correct entities are used during relation extraction training and testing;
(2) MC|K. The entity predictions given by the MC model are used as input to the relation extraction algorithm when it is run on the test set;
(3) MR&C|K. The entity predictions given by the MR&C model are used as input to the relation extraction algorithm when it is run on the test set.
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481556.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nature:进化新方式?线粒体DNA会插入我们的基因组

来源:生物通科学家们惊讶地发现,每4000个新生儿中就有一个会将线粒体中的一些遗传密码插入到我们的DNA中,这为人类的进化方式提供了新见解。剑桥大学和伦敦玛丽女王大学的研究人员表明,线粒体DNA也会出现在一些癌症DNA中&#xff…

论文学习19-Structured prediction models for RNN based sequence labeling in clinical text(LSTM_CRF,2016)

文章目录abstract1. Introduction2.相关工作3.方法3.1 Bi-LSTM (baseline)3.2BiLSTMCRF3.3 BiLSTM_CRF with pairwise modeling3.4 Approximate Skip-chain CRF5.实验Jagannatha, A. and H. Yu “Structured prediction models for RNN based sequence labeling in clinical te…

「深度学习表情动作单元识别」 最新2022研究综述

来源:专知基于深度学习的表情动作单元识别是计算机视觉与情感计算领域的热点课题.每个动作单元描述了一种人脸局部表情动作,其组合可定量地表示任意表情.当前动作单元识别主要面临标签稀缺、特征难捕捉和标签不均衡3个挑战因素. 基于此,本文将…

为什么物理诺奖颁给量子信息科学?——量子信息的过去、现在和未来

导语10月4日,2022年诺贝尔物理学奖授予 Alain Aspect, John F. Clauser 和 Anton Zeilinger,表彰他们“用纠缠光子实验,验证了量子力学违反贝尔不等式,开创了量子信息科学”。他们的研究为基于量子信息的新技术奠定了基础&#xf…

论文学习20-End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF(序列标注,2016ACL

文章目录abstract1.introduction2.Architecture2.1 CNN for Character-level Representation2.2 BiLSTM2.2.1 LSTM单元2.2.2BiLSTM2.3CRF2.4BiLSTM-CNNs-CRF3.训练Ma, X. and E. Hovy “End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF.”abstract 最先进的序列…

可溶解光开关利用光控制神经元

ISTOCK来源:IEEE电气电子工程师大约20年前,出现了一种称为光遗传学的策略,用激光控制大脑活动。它利用病毒将基因插入细胞,使其对光敏感。光遗传学给研究人员提供了一种精确的方法来刺激或抑制大脑回路,并阐明它们在大…

生成式AI无敌了: 大神微调Stable Diffusion,打造神奇宝贝新世界

来源:大数据文摘授权转载自AI科技评论作者:李梅、施方圆编辑:陈彩娴作为一个强大、公开且足够简单的模型,最近大火的 Stable Diffusion 在文本生成图像之外,给了大家无限的创作可能性。最近,来自 Lambda La…

论文学习21-Globally Normalized Transition-Based Neural Networks(2016,标签偏差问题

文章目录abstract1.introduction2.Model2.1 Transition System2.2 全局和局部归一化3.训练3.2标签偏差问题abstract 介绍了一种基于全局规范化转换的神经网络模型,该模型实现了最先进的词性标注、依存分析和句子压缩结果。我们的模型是一个简单的前馈神经网络&#…

推翻单一干细胞理论:哺乳动物大脑中发现了第二种干细胞

来源:生物通在成年哺乳动物的大脑中,神经干细胞保证了新的神经细胞,即神经元的不断形成。这个过程被称为成年神经发生,帮助鼠维持它们的嗅觉。一个研究小组最近在鼠大脑中发现了第二种干细胞群,它主要参与成年鼠嗅球中…

论文阅读课1-Attention Guided Graph Convolutional Networks for Relation Extraction(关系抽取,图卷积,ACL2019,n元)

文章目录abstract1.introduction1.1 dense connectionGCN1.2 效果突出1.3 contribution2.Attention Guided GCNs2.1 GCNs2.2 Attention Guided Layer2.3 Densely Connected Layer2.4 线性层2.5 AGGCN for RE3.实验3.1 数据集3.2 设置3.3 n-ary3.4 句子级4.ablation Study4.相关…

Nat. Rev. Genet. | 通过可解释人工智能从深度学习中获得遗传学见解

编译 | 沈祥振审稿 | 夏忻焱今天为大家介绍的是来自Maxwell W. Libbrecht,Wyeth W. Wasserman和Sara Mostafavi的一篇关于人工智能对于基因组学的可解释性的研究的综述。基于深度学习的人工智能(AI)模型现在代表了基因组学研究中进行功能预测…

复杂系统的逆向工程——通过时间序列重构复杂网络和动力学

导语蛋白质相互作用网络、生态群落、全球气候系统……很多复杂系统都可以抽象为一个相互作用的网络和其上的动力学。传统的研究主要关注在如何构建网络动力学模型,从而产生和实验观测数据具有相似统计特征的结果。所谓的复杂系统逆向工程,就是反其道而行…

关系提取论文总结

文章目录1.模型总结1.1 基于序列的方法1.2 dependency-based(基于依赖的)(有图)1.2.2 句间关系抽取1.5 自动学习特征的方法1.4 联合抽取模型1.6 RNN/CNN/GCN用于关系提取1.7 远程监督1.8句子级关系提取1.9MCR(阅读理解&#xff09…

邬贺铨:“物超人”具有里程碑意义,五方面仍需发力

来源:人民邮电报作者:邬贺铨我国正式迈入“物超人”时代。据工业和信息化部最新数据显示,截至8月末,我国三家基础电信企业发展移动物联网终端用户16.98亿户,成为全球主要经济体中率先实现“物超人”的国家。“物超人”…

深度:计算机的本质到底是什么?

来源:图灵人工智能来源:www.cnblogs.com/jackyfei/p/13862607.html作者:张飞洪 01 抽象模型庄子说过吾生有崖,知无涯。以有限的生命去学习无尽的知识是很愚蠢的。所以,学习的终极目标一定不是知识本身,因为…

中科大郭光灿院士团队发PRL,量子力学基础研究取得重要进展

来源:FUTURE | 远见选编:FUTURE | 远见 闵青云 中国科学技术大学郭光灿院士团队在量子力学基础研究方面取得重要进展。该团队李传锋、黄运锋等人与西班牙理论物理学家合作,实验验证了基于局域操作和共享随机性(LOSR, Local operat…

论文阅读课2-Inter-sentence Relation Extraction with Document-level (GCNN,句间关系抽取,ACL2019

文章目录abstract1.introduction2.model2.1输入层2.2构造图2.3 GCNN层2.4MIL-based Relation Classification3.实验设置3.1 数据集3.2 数据预处理3.3 基线模型3.4 训练3.5结果4.相关工作4.1 句子间关系抽取4.2 GCNN5. 结论相关博客Sahu, S. K., et al. (2019). Inter-sentence …

量子并不总意味着小尺度,量子物理学家用它探索系外行星生命

来源:机器之心除了量子计算,量子物理学的应用范畴还很广。近日,美国东北大学物理学教授 Gregory Fiete 探讨了量子研究的广泛应用。量子物理学家研究的世界与普通人每天生活的世界是同一个,唯一的区别是它被科学家「缩放」到了无法…

论文阅读课3-GraphRel: Modeling Text as Relational Graphs for(实体关系联合抽取,重叠关系,关系之间的关系,自动提取特征)

文章目录abstract1.Introduction2.相关工作3.回顾GCN4.方法4.1第一阶段4.1.1 Bi-LSTM4.1.2 Bi_GCN4.1.3 实体关系抽取4.2 第二阶段4.2.1 构建关系权图4.3训练4.4 inference5.实验5.1 settings5.1.1数据集5.2 baseline and evaluation metrics5.3 Quantitative Results5.4 细节分…

大脑是如何编码外界各种信息的?

来源:知乎链接:https://www.zhihu.com/question/532956044/answer/2494267009大脑将外部信息编码成心智模型。编码方式分为三种神经链接、语言逻辑和数学。心智模型理论是成型于上世纪九十年代的认知科学理论,代表人物就是著名学者史蒂芬平克…