【实体对齐·HGCN】Jointly Learning Entity and Relation Representations for Entity Alignment

文章目录

  • 1.动机
  • 2.输入输出
  • 3.相关工作
  • 4.模型
    • 4.1 GCN
  • 4.2 approximating relation representations
    • 4.3 joint entity and relation alignment

  1. HGCN: “Jointly Learning Entity and Relation Representations for Entity Alignment”.
    Yuting Wu, Xiao Liu, Yansong Feng, Zheng Wang, Dongyan Zhao. (EMNLP 2019) [paper][code]
  • 推荐结论:
    • entity name的方法中效果好的一波
  • 短评
    • 优点:entity name中效果好,且返回的是排名
    • 缺点:HGCN的GCN虽然使用了highway gate,但不是GAT,大图可能不友好
  • 类别:
    • 实体对齐
    • 基于embedding的实体对齐
    • BootEA的bootstrapping方法
    • transE系列–特定于实体对齐的embedding+swap
  • 数据集:
    • DWY100k
    • DBP15k
    • DBP-FB
    • SRPRS
  • 图谱
    • wikidata/DBpedia/yago3
    • 规模:15k/100k
  • 底层模型:
    • 嵌入模块:GCN+highway gate
    • 对齐模块:calibration(学习一个embedding)
    • 相似度:实体L2,关系L1
    • 损失函数:
      • 无embedding loss:
      • 对齐 loss:d=|e1-e2|,margin-based loss
        • 负采样:k-近邻
    • entity alignment+entityname
    • entity name用于model 初始化
  • 速度
    • 比boostrapping的方法慢
  • 开源软件情况:[code],不在OpenEA里
  • 评估质量:
    • DBP15k:
      • 在使用entity name的模型中仅次于CEA
    • SRPRS:在使用entity name的模型中仅次于CEA
    • DWY100:在使用entity name的模型中仅次于CEA
  • 输入:2个KG的关系三元组(seed entity alignment)
  • 输出:实体对齐对(也有排名),关系对齐(有排名)

1.动机

  • 动机
    • 没用关系表达
      • 关系和实体密切相关,所以应该有增益
    • 用了关系的:需要关系对齐的seed
      • eg JAPE,IPTransE,MTransE
    • TransE:可以直接训练entity,rel表达式
    • GCN:不能直接使用关系表达式–GCN是无向无标签的图
      • RGCN:
        • 多关系图
        • 但需要非常多的参数去建模
  • 目标:
    • 用上关系表达,且不需要关系对齐的seed
  • 方式
    • 用实体表示估计关系表示(仅用seed entity alignment)
    • 新的joint 实体表示:实体的关系信息+邻居
      • 可以进一步提升性能

2.输入输出

  • 输入:seed 实体对齐+2KG
  • 输出:关系对齐+实体对齐

3.相关工作

  • TransE系列

    • JE
      • 在一个向量空间里学习两个KG的embedding
    • MTransE
      • 每个KG单独学一个embedding
      • 学一个两者之间的转移矩阵
      • 输出:rel alignment+entity alignment
    • BootEA
      • bootstrapping
    • SEA
      • 对度敏感的KG embedding model
    • KDCoE
      • 半监督:co-training
      • 跨语言
      • entity description
  • GCN

    • RDGCN:
      • dual relation graph:建模关系信息
      • 原始图和对偶图多轮互动–>引入复杂的关系信息到entity 表达中
      • 问题:集中于entity embedding,忽略了relation的表达可以提供帮助
      • R-GCNs:需要超多参数
  • NTAM

    • 输出:rel alignment+entity alignment
  • 输出:rel alignment+entity alignment

    • NTAM
    • MTransE
    • 但需要rel align seed

4.模型

在这里插入图片描述

  • GCNs+highway network
    • 多层stacked GCN layers
  • 模块
    • preliminary entity alignment
      • 不同KG的entity嵌入到同义空间中
    • approximating relation representations
      • 用entity的表示估计relation的表示
    • joint entity and relation alignment
      • 将关系的表示引入到实体embedding–》 joint entity embedding
      • GCN:迭代地整合邻居结构信息
  • entity name:利用entity name做模型初始化

4.1 GCN

* GCN

在这里插入图片描述

  • highway gates

在这里插入图片描述

  • 对齐
    在这里插入图片描述
  • margin-based scoring function
    • 这个margin loss不是embedding的,是alignment
    • 负采样:K-近邻(只有细微的差别)
    • 在这里插入图片描述

4.2 approximating relation representations

  • 先估计一个关系的表达
    • head
    • tail
    • 依赖于统计信息:head和tail的关系影响他们之间的语义
      • reasonable assumption
    • f=W⋅concate(avg(head,tail))f=W\cdot concate(avg(head,tail))f=Wconcate(avg(head,tail)),W-可学习参数
    • 在这里插入图片描述
  • 关系相似度
    • 在这里插入图片描述
    • 在这里插入图片描述

4.3 joint entity and relation alignment

  • pretrain entity alignment model(4.1)–stable

    • asumption: pre-trained entity 和approx relation 表达
      • 可以为他们自己提供丰富的信息
  • joint entity representation

    • 融合了rel信息的entity表达
    • e=concate(e,sum(Re))
    • 在这里插入图片描述

    在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481450.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Science:海马中如何实现选择性地招募神经元来巩固记忆?

来源:brainnews作者:brainnews创作团队神经元网络活性的标志是选择性地将神经元招募到活跃的集合中,形成暂时稳定的活动模式。在哺乳动物的海马体中这种神经元集合在ripples(~200Hz)振荡期间反复激活,支持空…

往年笔试题

文章目录1 概率1.1 条件概率.每天9点到10点,小明和小红在同一个车站乘坐公交车上班。小明坐101路公交车,每5分钟一班{9:00, 9:05, 9:10, …};小红坐102路公交车,每10分钟一班{9:00, 9:10, 9:20, …},问小明和小红每天相…

量子生物学的未来:量子理论如何帮助理解生命?

导语2022年诺贝尔物理学奖授予了关于量子信息科学的基础性研究。一百多年前,量子革命为我们带来了晶体管和激光,今天,基于量子信息的新技术正在让我们进入一个新的量子信息时代。事实上,已有研究表明,在生命过程中也存…

【量化投资1】

文章目录0.相关包及常识1.股票买卖收益分析2.双均线策略2.1 均线2.2 双均线2.2.1 金叉死叉的获取量化投资0.相关包及常识 股票的买入卖出:最少为一手,100股 tushare open:开盘价格,close:收盘价格 1.股票买卖收益分析 每次至少买入1手最后…

超高效人工光电神经元成真?速度比自然神经元快3万倍,研究登Nature子刊

来源:悦智网作者:Charles Q. Choi翻译:机器之心原文链接:https://spectrum.ieee.org/neuromorphic-computing-superconducting-synapseAI系统越来越受限于为实现其功能的硬件。现在,一种新的超导光子电路问世&#xff…

2022年工业机器人的5大应用行业

来源:工业机器人前言截止至2022年,在中国60%的工业机器人应用于汽车制造业,其中50%以上为焊接机器人;在发达国家,汽车工业机器人占机器人总保有量的53%以上。‍本文梳理了五大应用行…

【java spring学习1】IOC理论,spring用DI实现IOC

狂神说java spring:让java 开发更容易 IOC:控制反转 AOP:面向切面编程(业务面) 2. spring组成和扩展 2.1spring 组成 Sprint AOP ORM:对象关系映射 Context:UI界面、邮件验证等 2.4 拓展 学习路线: spring boot:构…

深度学习以最佳纳米尺度分辨率解决重叠单个分子的3D方向和2D位置,生成蛋白质图片...

编辑 | 萝卜皮偶极扩散函数 (DSF) 工程重塑了显微镜的图像,可以最大限度地提高测量偶极状发射器 3D 方向的灵敏度。然而,严重的泊松散粒噪声、重叠图像以及同时拟合高维信息(包括方向和位置)使单分子定向定位显微镜(SM…

【大数据学习-hadoop1】大数据如何处理

文章目录1. 大数据启蒙1.1 意义1.1.1 查找元素1.1.2 单机处理大数据问题1.2 历史1.3 hadoop1. 大数据启蒙 学习视频 大数据多,复杂度很重要, 内存不够,分治处理IO仍成为瓶颈,多机器并行多机器间通信也可以并行,但仍是…

自动驾驶数据之争,走向合规

报道数字经济 定义转型中国撰文 | 泰伯网 编辑 | 鹿野2015年12月,一辆百度无人车从京新高速到五环进行了最高时速达100公里的全自动行驶,将国内自动驾驶推向大众视野。当自动驾驶产业随时间沉淀驶入商业落地的下半场,百度对这场自动驾驶持久…

【推荐系统算法学习笔记1】基本架构、专有名词、构建流程

文章目录1.架构1.1 大数据框架:lambda 架构的1.2.基本概念2. 推荐模型构建流程2.1 数据2.1.1 数据来源2.1.2 数据清洗、处理2.2 特征工程2.3 算法(机器学习)来源1.架构 推荐算法架构 召回 协同过滤基于内容的基于隐语义的 排序 召回决定了推…

DeepMind专题之创始人访谈|DeepMind创始人Demis Hassabis:AI 的强大,超乎我们的想象...

来源:图灵人工智能作者:黄楠、王玥编辑:陈彩娴导读:DeepMind,位于英国伦敦,是由人工智能程序师兼神经科学家戴密斯哈萨比斯(Demis Hassabis)等人联合创立的Google旗下 前沿人工智能企业。其将机…

世界首个!Meta AI开放6亿+宏基因组蛋白质结构图谱,150亿语言模型用两周完成...

来源:ScienceAI编辑:陈萍、杜伟如今,在蛋白质结构预测领域,各大厂也出现了「百家争鸣,百家齐放」。今年,DeepMind 公布了大约 2.2 亿种蛋白质的预测结构,它几乎涵盖了 DNA 数据库中已知生物体的…

谷歌用AI研发「乒乓球机器人」,4分钟对拉300多次,还能指哪打哪!

一个人怎么练习乒乓球?或许这事你可以问问谷歌。最近,谷歌又玩新花样,这回是乒乓球机器人AI 项目,号称和人类对战时能够连续接球340次?!要知道,让解说员激动到破音的「乒乓球史上最疯狂一球」—…

【网络搜索】学习资料

文章目录1.综述2.相关技术3.课程4. 论文4.1综述召回预训练4.2 相关模型及论文5.书6. 博客6.1 电商搜索QP:Query Processor相关性1.综述 微软综述视频,较老但不过时 2.相关技术 相关技术目录 3.课程 北邮《网络搜索原理》2020 4. 论文 sigir 4.1综…

论文新鲜出炉 - 数学家张益唐攻克 Landau-Siegel 零点猜想(2022-11-05)

来源:北大大纽约校友会感谢钱朝晖师兄、贾德星师兄的分享。张益唐老师厉害,出来了!虽然还有待数学权威机构认定,但以张老师的性格,没有攻克他不会轻易公开。看了一下PDF时间戳,是昨天的:2022-11…

神奇!一篇不足700字的论文,竟然能发表在Science上

来源:彭聃龄科学网博客 作者:彭聃龄(北京师范大学教授)文字:南方配图:南方排版 :南方一篇不足700单词的文章为什么能发表在国际顶级期刊 Science 杂志上?刊登在 Science 上的这篇文…

【搜索/推荐排序】FM,FFM,AFM,PNN,DeepFM:进行CTR和CVR预估

文章目录1.FM1.1代码-是否点击预测效果和参数量级1.3 和其他模型的比较SVMMF2. FFMone-hot的比较eg训练注意事项效果和参数量级实现3. AFM4.FNN/PNN4.1 FNN4.2 PNN5. DeepFM与Wide&Deep比较与NFMFM 本来就可以在稀疏输入的场景中进行学习,为什么要跟 Deep 共享稠…

科学家首次3D生物打印出血管化肿瘤,并成功使用免疫疗法治疗

近些年,癌症治疗领域不断取得了突破性进展,但仍缺乏标准化和生理相关的体外测试平台。一个关键性障碍是肿瘤微环境和免疫反应之间复杂的相互作用。因此,该领域研究人员不得不依赖临床试验来测试治疗效果,最终限制了抗癌治疗药物的…

【搜索/推荐排序】总结

文章目录1.进化路线2. 公式比较1.进化路线 LR:没有较叉项->FM:LR交叉项,一个特征一个向量->FFM:一个特征对每一个field(属性名)的交互有一个向量,一个特征有一个特征矩阵。->AFM:每个内积都有一个权重&#…