CASREL:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction(关系抽取,ACL2020,重叠关系)

文章目录

  • 1.介绍
  • 2.相关工作
  • 3.The CASREL Framework
    • 3.1 Bert
    • 3.2 cascade decoder
  • 4.实验
  • 5.结果
  • 参考

1.介绍

在这里插入图片描述

  • 做重叠关系的少

  • 重叠关系:

    • Zeng et al. (2018) :seq2seq+强化学习改善提取顺序
    • Fu et al. (2019):(GraphRel)GCNs将文本建模为关系图
  • 以前的做法

    • 将关系当做离散的标签分配给实体对—这个做法对机器学习来说很难
    • 问题
      1. 类别分布不平衡
        • 多数提取出来的实体对之间无关系
      2. 同一实体参与多个有效关系(重叠三元组),分类器可能会混淆
        • 如果没有足够的训练样例,分类器难以区分(!!有的多标签分类难以工作就是因为这个)
  • 改变f(s,o)→rf(s,o) \rightarrow rf(s,o)r(原来的做法)到fr(s)→of_r(s)\rightarrow ofr(s)o

    • f(s,o)→rf(s,o) \rightarrow rf(s,o)r:实体对找关系
    • fr(s)→of_r(s)\rightarrow ofr(s)o:现在,学习关系函数下,给定头实体,预测尾实体
      • 如果不存在尾实体,则无此关系
  • 本文做法CASREL

    • 编码器:Bert
    • 序列标注:抽出头实体
    • 关系特定的尾实体标注:对每一个头实体,针对其可能的关系抽取其尾实体fr(s)→of_r(s)\rightarrow ofr(s)o
  • 效果

    • Bert不预训练,效果也最好
    • 预训练了当然更好
      • 有丰富的先验知识
  • 贡献

    1. 从新的角度建模了一个通用的重叠关系框架(在设计上就可以用于重叠关系
    2. 模型为Bert+标注:可以使用预训练中的先验
    3. 效果好:F1 增加17.5 30.2(远远优于当前的)
  • 一个疑问:对于大多数的头实体和关系而言,尾实体应该是不存在的?也存在一个类别不平衡问题

2.相关工作

  • pipeline:有传递误差
  • 联合模型
    • 以前:传统的特征工程,手工流程多
    • 神经模型:
      • Miwa and Bansal, 2016
        • 共享实体、关系模型的参数实现联合,无联合解码、流程上仍然是把实体对pipeline到关系抽取中
        • (也有共用解码器的)
        • –并没有学习到实体、关系之间的依赖
      • Zheng et al. (2017)
        • 共用解码器,以统一的模式解码关系和实体
        • 序列到序列的标注问题
      • 以上进展很好,但不能解决重叠关系抽取
  • 重叠关系
    • Zeng et al. (2018) :
      • seq2seq+强化学习改善提取顺序
      • 通过拷贝机制解决
    • Fu et al. (2019):(GraphRel)
      • GCNs将文本建模为关系图

3.The CASREL Framework

  • 在三元组层面上建模

    • 以前的工作都没有:都是单独定义关系和实体,没有在三元组层次上集成
  • 最大化的目标函数
    在这里插入图片描述
    在这里插入图片描述

  • 公式2:概率的链式法则

  • 公式3:利用了一个事实,所有与s相关的关系必然有o,而其他关系则无o。

  • 该公式的优点

    • 该似然是开始于三元组级别的,优化也是在三元组级别上
    • 对于复数三元组如何在句中共享实体没有假设,通过设计来处理三元组问题
    • 公式3分解而来的启发:先得到s,再对关系r,找到其对应的o
    • 这种模式:允许一次性提取多个三元组
      • the subject tagger:找到所有的头实体s
      • relation-specific
        object taggers:先再对每一个s,特定于关系,寻找对应关系下,s所对应的o
      • 这两个模块,可以任意替代,但本文中是Bert+binary taggers

3.1 Bert

在这里插入图片描述

  • 因为输入单句,所以没有sementation embedding
    • 输入
      • 输入嵌入分别是token embeddings(WsW_sWs), segmentation embeddings 和position embeddings(WpW_pWp) 的总和

在这里插入图片描述

3.2 cascade decoder

  • Cascade Decoder
    • a subject tagger:抽取头实体
    • a set of relation specific object taggers:对于特定关系,抽取头实体所对应的尾实体fr(s)→of_r(s)\rightarrow ofr(s)o
      在这里插入图片描述
    • vsubkv_{sub}^kvsubk由实体包含词的token平均获得
      在这里插入图片描述

4.实验

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

5.结果

  • 处理重叠关系上表现优异
  • f(s,o)→o转变到fr(s)→of(s,o)\rightarrow o转变到f_r(s)\rightarrow of(s,o)ofr(s)o
  • 在处理句内多关系上表现优秀
  • 实验效果好

参考

code
论文

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481478.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器学习数学本质的理解

来源:计算机视觉与机器学习近日,国际数学家大会丨鄂维南院士作一小时大会报告:从数学角度,理解机器学习的“黑魔法”,并应用于更广泛的科学问题。鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenary talk)…

Exploiting the Syntax-Model Consistency for Neural Relation Extraction(关系抽取,语法模型,跨领域关系抽取

文章目录1.Introductiony1.1 神经网络的关系抽取1.2使用依赖树的关系抽取1.2.2 依赖树的一般树1.3 本文做法2. 相关工作2.1核方法2.2 深度学习方法2.2.1 CNN2.2.2 RNN2.2.3 transformer2.2.4 依赖树3.模型3.1CEON-LSTM3.1.1 LSTM3.1.2ON-LSTM3.1.2.1 公式3.1.2.2the master gat…

从500亿缩水到167亿!自动驾驶芯片第一股“流血上市”

来源:数据观综合编辑:蒲蒲美股年内最后一次大规模IPO,MobilEye首日大涨近40%。美国时间10月26日,英特尔旗下自动驾驶子公司 Mobileye 正式登陆纳斯达克,股票代码为“MBLY”,首日上涨37.95%,报收…

[ACL2020]Generalizing Natural Language Analysis through Span-relation Representations

文章目录1 介绍2 span-relation representations2.1未涉及句子级任务3.span-relation model3.1 span representation3.2 span and relation label prediction3.3 应用到不同任务3.5 多任务学习MTL4 GLAD Benchmark基准 and Results4.1 实验4.2 证明通用模型有效4.3 MTL4.3.2 任…

为什么生成式AI这么火?OpenAI刚刚被曝估值已接近200亿美金

“生成式 AI 提醒我们,很难做出有关于人工智能的预测。十年前,传统观点认为:人工智能首先会影响体力劳动;然后,是认知劳动;然后,也许有一天它可以做创造性工作。现在看起来,它会以相…

报告预告:北斗网格码国家标准与城市大脑网格底座探讨

来源:中国指挥与控制学会中国指挥与控制学会“百名专家、百场讲座”第十七讲——城市大脑系列学术报告(第八期)主办单位:中国指挥与控制学会承办单位:中国指挥与控制学会城市大脑专业委员会远望智库报告人:…

{ACL2020}In Layman’s Terms: Semi-Open Relation Extraction from Scientific Texts(关系抽取,半开放关系抽取)

半开放关系抽取 用FOBIE训练一个narrow IE训练一个OpenIE用narrowIE矫正OpenIE 1.Introduction 标注困难、 跨领域标注更难 TRADE-OFF relations 随着干燥度的增加,木质部的安全性增加和效率降低的广泛模式是明显的,有一些证据表明在针叶树种或个体之…

马斯克成功收购推特,开除CEO等多名高管,还派特斯拉工程师进驻总部审查代码...

来源:AI前线作者:刘燕这场连环反转“大戏”,终于落幕。靴子终于落地10 月 28 日,据 《纽约时报》、CNBC 、《 华尔街日报》、《华盛顿邮报》 等多家外媒报道,马斯克收购推特的交易已经完成。这笔 440 亿美元的收购案终…

【ACL2020】Reasoning with Latent Structure Refinement for Document-Level Relation Extraction

1. 问题 句间关系 很多约等于文档级关系抽取 文档级关系抽取 句子间关系多 生物医药领域尤其多 需求/困难 整合同一文档不同句子间的信息处理句间实体复杂的交互 2.相关工作 文档级别关系抽取 结论: 实体mention之间的交互促进推理过程(文档级关系抽…

孤独的宇宙中,人类是个例外吗?

© Movie Content Plus来源:人工智能学家利维坦按:爱因斯坦曾说,“宇宙的永恒之谜在于其可理解性,宇宙能被理解是个奇迹。”不过,就可理解性(comprehensibility)来说,该如何定义…

红杉资本谈生成式AI:预计AI的杀手级应用将出现,比赛正在进行

来源:硅发布13年前,我采访Wolfram|Alpha的创始人、美国计算机科学家史蒂芬.沃尔弗拉姆时,大吃一惊。当时Wolfram|Alpha刚推出,使命是:让每一个人都可以在搜索引擎里搜出计算机计算的结果。比如说,输入"…

Transformer and set Trasformer

1.Transformer multihead attention block:MAB(X,Y)LayerNorm(HrFF(H))HLayerNorm(Xmultihead(X,Y,Y;ω)MAB(X,Y)LayerNorm(HrFF(H))\\ HLayerNorm(Xmultihead(X,Y,Y;\omega)MAB(X,Y)LayerNorm(HrFF(H))HLayerNorm(Xmultihead(X,Y,Y;ω) * Attention:Att(Q,K,Vl;ω)ω(QKT)VAtt…

「图神经网络复杂图挖掘」 的研究进展

来源:专知图神经网络对非欧式空间数据建立了深度学习框架,相比传统网络表示学习模型,它对图结构能够实施更加深层的信息聚合操作.近年来,图神经网络完成了向复杂图结构的迁移,诞生了一系列基于复杂图的图神经网络模型. 然而,现有综述文章缺乏对复杂图神经网络全面、…

知识复习:nlp算法面试汇总

文章目录2.相似度3.正则化3.1 L13.2 过拟合和欠拟合3.2.1 dropout3.3 欠拟合4. 激活函数4.1 sigmoid5.Bert5.1 Bert原版5.1.2 bert的训练5.2改进5.2.1缺点改进5.2.2任务改进5.3 参数量5.3 transformer5.3.1 多头注意力机制6.搜索6.1pagerank6.2 文本匹配7.神经网络基础7.1Norm7…

光子深度学习:编码到光波上的机器学习模型的组件

编辑 | 萝卜皮由于功率、处理和内存的限制,高级机器学习模型目前无法在智能传感器和无人机等边缘设备上运行。麻省理工学院的研究人员介绍了一种基于跨网络的离域模拟处理的机器学习推理方法。在这种被称为 Netcast 的方法中,基于云的「智能收发器」将重…

【实体对齐·综述】A Benchmarking Study of Embedding-based Entity Alignment for Knowledge Graphs

文章目录模板的简述简述1.Introduction2. preliminatries2.1 literature review2.1.1 knowledge graph embedding2.1.2 Conventional Entity Alignment2.1.3 embedding-based entity alignment2.2 Categorization of Techniques2.2.1 Embedding Module2.2.1.1 关系嵌入2.2.1.2 …

深度学习优化背后包含哪些数学知识?

来源:图灵人工智能深度学习中的优化是一项极度复杂的任务,本文是一份基础指南,旨在从数学的角度深入解读优化器。深度学习中的优化是一项极度复杂的任务,本文是一份基础指南,旨在从数学的角度深入解读优化器。一般而言…

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

来源:FUTURE远见选编:FUTURE | 远见 闵青云 文:AI科技评论 近日,剑桥大学的2022年 AI 全景报告(《State of AI Report 》)出炉!报告汇总和聚焦了过去一年里 AI 行业中炙手可热的事件&#xff0c…

实体对齐汇总

文章目录1.综述2.技术论文3.汇总3.1定义定义统一EA3.2 评价指标3.3 数据集3.4 数据预处理技术3.5 索引3.6 对齐3.6.1 按属性相似度/文本相似度做:成对实体对齐3.6.2 协同对齐:考虑不同实体间的关联3.6.2.1 局部实体对齐3.6.2.2 全局实体对齐3.6.3 基于em…

博后出站即任985教授!他致力于寻找人类五感世界的最后一块拼图

来源:iNature两年前,闫致强从底蕴深厚的复旦大学生命科学学院“跳”到尚处于新生期的深圳湾实验室,“蜗居”在一栋商业大楼里,和团队在这里寻找人类感知世界的最后一块拼图。在亚里士多德定义的五种感官中,介导嗅觉、味…