论文浅尝 | 用于低资源条件下知识图谱补全的关系对抗网络

论文作者: 邓淑敏,浙江大学在读博士,研究方向为低资源条件下知识图谱自动化构建关键技术研究。


            

Ningyu Zhang, Shumin Deng, Zhanlin Sun, Jiaoyan Chen, Wei Zhang, Huajun Chen. Relation Adversarial Network for Low Resource Knowledge Graph Completion.

本论文已被WWW 2020接收.

 

论文链接:https://arxiv.org/abs/1911.03091

 

知识图谱补全(Knowledge Graph Completion,KGC),通过链接预测或关系抽取来补充知识图谱缺失的连接,主要困难之一是资源不足问题。KG中存在很多实例很少的关系,而且那些新添加的关系通常没有许多已知的训练样本。比如下图中展示的,KG大部分关系的样本都比较少,呈现出长尾分布,比起样本较多的关系,长尾关系的预测和抽取性能显著降低。(a)关系的链接预测结果与它们在KG中的频率高度相关,KG中频率较高的关系明显优于频率较低的关系;(b)关系抽取的效果,随着每个关系的样本数目减少而下降。本文的任务是在低资源条件下,预测KG中新的三元组,包括链接预测和关系抽取两个子任务。

 

典型的KGC任务中的资源不足问题示例(链接预测、关系抽取)

本文提出了一个加权关系对抗网络(Weighted Relation Adversarial Network,wRAN)的通用框架,该框架利用对抗过程,将从资源丰富的关系中学到的知识/特征,去适应不同但相关的低资源关系。wRAN框架综合考虑了三部分问题:对抗迁移学习(Adversarial Transfer Learning),核心思想是通过对抗性学习过程提取领域不变性特征,该过程能够减少源域和目标域之间的分布差异;关系对抗网络(Relation Adversarial Network),学习通用的关系不变性特征,以此弄清不同关系背后的语言变化因素,并缩小相关关系之间的语言差异;负迁移(Negative Transfer),区别于标准的domain adaption源域和目标域之间的标签空间完全相同且共享,wRAN考虑从多个源关系到一个或多个目标关系的适应,并且考虑了不同的关系可能对迁移产生不同的影响,离群的源关系在与目标关系做判别时可能导致负迁移。比如下图所示,wRAN可以从三个源关系(place_of_death,place_of_birth,country)中学习通用的位置信息,然后将隐含的知识应用于目标关系(place_of_burial)以提高其预测性能,而capital关系则会导致负迁移。

Relation Adaptation示例

具体地说,wRAN框架利用关系判别器来区分来自不同关系的样本,并以此学习从源关系到目标关系易于迁移的关系不变性特征,主要包含三个模块:

(1)实例编码器(Instance Encoder),学习可转移的特征,这些特征可以弄清关系之间的语言变化因素。考虑到模型性能和时间效率,本文使用CNN实现实例编码。其他神经架构,例如RNN和BERT也可以用作编码器。

(2)对抗性关系适应(Adversarial Relation Adaptation),寻找可以区分具有不同关系分布的关系判别器。对抗学习有助于学习一个神经网络,该网络可以将目标样本映射到特征空间,从而使判别器不再将其与源样本区分开。

(3)加权关系适应(Weighed Relation Adaptation),可以识别无关的源关系并自动降低其重要性,以解决负迁移问题并鼓励正迁移。通过两个角度来评估每个源关系/样本对目标关系的重要性:关系间相关性实例迁移能力。并提出关系门控机制,学习和控制细粒度的关系/样本权重。

 

模型架构

本文通过低资源条件下链接预测和关系抽取两种KGC任务评估wRAN的性能。两类任务共享相同的对抗性学习框架,但具有不同类型的实例编码器。前者对一个关系的三元组编码,而后者学习句子特征。

本文的部分实验结果如下。

数据集:

本文的数据集情况

             

链接预测实验:

实体预测的实验结果比较

            

三元组分类的实验结果比较

             

关系抽取实验:

关系抽取的F1值比较(ACE05数据集下标准和部分的关系适应)

             

无监督和监督关系适应的前100、200和500个句子的关系抽取的精度值

             

 

无监督适应的关系抽取的实验结果比较

 

有监督适应的关系抽取的实验结果比较

总而言之,这篇文章研究工作的主要贡献是:

(1)率先提出将对抗迁移学习应用于解决低资源条件下知识图谱补全问题;

(2)提出加权的关系对抗网络(wRAN)框架,利用关系判别器来区分来自不同关系的样本,并以此学习从源关系到目标关系易于迁移的关系不变性特征;

(3)提出一种关系门控机制,可以完全放宽共享标签空间的假设。这种机制可以挑选出离群的源关系/样本,并减轻这些不相关的关系/样本的负迁移,可以在端到端框架中对其进行训练;

(4)实验表明,wRAN框架在低资源条件下的链接预测和关系抽取两个任务上均超过了目前最优模型的性能。

如果对本文的工作感兴趣,欢迎大家阅读原文,也欢迎大家和我们交流。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479204.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot引起的“堆外内存泄漏”排查及经验总结

背景 为了更好地实现对项目的管理,我们将组内一个项目迁移到MDP框架(基于Spring Boot),随后我们就发现系统会频繁报出Swap区域使用量过高的异常。笔者被叫去帮忙查看原因,发现配置了4G堆内内存,但是实际使用…

Facebook刷新开放域问答SOTA:模型训模型!Reader当Teacher!

文 | Sherry 不是小哀编 | 小轶一部问答系统发展史就是一部人工智能发展史。早在1950年的图灵测试就提出:如果人类无法通过问答将机器和人区分开,那么这个机器就可以被认为具有智能。问答系统和人工智能有着密不可分的关系。从基于规则和结构化数据的自动…

LeetCode 1038. 从二叉搜索树到更大和树(逆中序-右根左-降序)

1. 题目 2. 解题 二叉搜索树 逆中序遍历&#xff08;右根左&#xff09;是降序的 class Solution { public:TreeNode* bstToGst(TreeNode* root) {stack<TreeNode*> stk;int sum 0;TreeNode *rootcopy root;while(root || !stk.empty()) {while(root){stk.push(root);…

Inode 导致 电脑的网络适配器和访问点出现问题

1 电脑好好的&#xff0c;由于项目原因需要安装inode去访问外网的数据集。安装好inode没有什么问题&#xff0c;网络依然可以用。然后不小心重启了一下电脑&#xff0c;发现电脑所有的网络均不正常。网络诊断是电脑的适配器和访问点出现故障。根据网络上的解决方案&#xff0c;…

应用实践 | 南方科技大学研发基于新型冠状病毒知识图谱模式挖掘系统

本文转载自公众号&#xff1a;南方科技大学计算机科学与工程系。随着新型冠状病毒疫情的不断发展&#xff0c;有关疫情的各类信息也在不断更新&#xff0c;如何利用知识图谱从大量新型冠状病毒肺炎信息中高效挖掘相关频繁模式&#xff08;如病毒的宿主、传播途径&#xff09;成…

java.lang.NoClassDefFoundError: * : Landroid/support/v7/gridlayout/R$styleable 异常终极解决办法

该问题解决办法适用于任何类似问题。 问题的标准异常描述为&#xff1a;java.lang.NoClassDefFoundError: Failed resolution of: Landroid/support/v7/gridlayout/R$styleable 今天由于项目需要&#xff0c;想在项目中使用GridLayout&#xff0c;无奈&#xff0c;标准库中的…

训练一个130亿参数的模型要用几个GPU?微软:一个就够

文&#xff5c;蛋酱、张倩源&#xff5c;机器之心现在的模型动辄数百、数千亿参数&#xff0c;普通人训不动怎么办&#xff1f;前不久&#xff0c;谷歌发布了参数量为 1.6 万亿的语言模型Swith Transformer&#xff0c;将 GPT-3 创下的参数量记录&#xff08;1750 亿&#xff0…

技术年货:美团技术沙龙合辑大放送——85个演讲,70+小时视频

你好&#xff0c;2019 再见&#xff0c;2018 又到了一年辞旧迎新的时候&#xff0c;大家应该也和美美一样&#xff0c;在忙着总结回顾和展望规划吧。 按老惯例&#xff0c;我们该献上技术年货了。今年首先出场的&#xff0c;是我们的技术沙龙大套餐&#xff01; 美团技术沙龙是…

LeetCode 442. 数组中重复的数据

1. 题目 给定一个整数数组 a&#xff0c;其中1 ≤ a[i] ≤ n &#xff08;n为数组长度&#xff09;, 其中有些元素出现两次而其他元素出现一次。 找到所有出现两次的元素。 你可以不用到任何额外空间并在O(n)时间复杂度内解决这个问题吗&#xff1f; 示例&#xff1a;输入:…

如何恢复在 PyCharm 中误删的整个项目文件

如何恢复在 PyCharm 中误删的整个项目文件 方案1: 在误删项目的原始文件地址下新建相同文件名的空文件夹,即新文件夹与被误删项目的路径相同. 在 PyCharm 中打开该新文件夹,右键文件夹,点击 Local History 下的 Show History. 页面左侧为删除的文件信息(时间等),点击文件名右…

征稿 | ​2020年全国知识图谱与语义计算大会

China Conference on Knowledge Graph and Semantic Computing(CCKS 2020)www.sigkg.cn/ccks2020征稿启事&#xff08;第二轮&#xff09;2020年8月15日-18日&#xff0c;南昌征稿截止: 2020年5月21日第十四届全国知识图谱与语义计算大会&#xff08;CCKS: China Conference o…

新手福利:百度官方中文教程,过年也要深度学习!

很多小伙伴在后台给我留言&#xff0c;零基础如何入门深度学习&#xff1f;想要做算法工程师&#xff0c;自学了python基础&#xff0c;现在还来得及吗&#xff1f;这个问题很大。很难说一篇文章几句话就能解决这个问题。今天我给大家说一下自己的一些个人经验&#xff0c;比较…

LeetCode 232. 用栈实现队列(双栈法-队列)

1. 题目 使用栈实现队列的下列操作&#xff1a; push(x) – 将一个元素放入队列的尾部。 pop() – 从队列首部移除元素。 peek() – 返回队列首部的元素。 empty() – 返回队列是否为空。 来源&#xff1a;力扣&#xff08;LeetCode&#xff09; 链接&#xff1a;https://le…

论文浅尝 | Tree-to-sequence 学习知识问答

论文笔记整理&#xff1a;谭亦鸣&#xff0c;东南大学博士生&#xff0c;研究兴趣&#xff1a;知识图谱问答。来源&#xff1a;Neurocomputing 372: 64-72 (2020)链接&#xff1a;https://sciencedirect.xilesou.top/science/article/abs/pii/S0925231219312639对于知识图谱问答…

别再搞纯文本了!多模文档理解更被时代需要!

文 | Ryan都已经2021年了&#xff0c;互联网已经今非昔比&#xff0c;20年前纯文本的日子已经一去不复返&#xff0c;文字已经满足不了网页、文章的需求&#xff0c;绝大部分都会有着精心设计的表格、图片&#xff0c;甚至视频。PDF文档这种富文本格式拥有更加复杂的结构信息&a…

iOS 覆盖率检测原理与增量代码测试覆盖率工具实现

背景 对苹果开发者而言&#xff0c;由于平台审核周期较长&#xff0c;客户端代码导致的线上问题影响时间往往比较久。如果在开发、测试阶段能够提前暴露问题&#xff0c;就有助于避免线上事故的发生。代码覆盖率检测正是帮助开发、测试同学提前发现问题&#xff0c;保证代码质量…

LeetCode 199. 二叉树的右视图(DFS 按层queue)

文章目录1. 题目2. 解题2.1 DFS2.2 queue按层从右边遍历1. 题目 给定一棵二叉树&#xff0c;想象自己站在它的右侧&#xff0c;按照从顶部到底部的顺序&#xff0c;返回从右侧所能看到的节点值。 示例:输入: [1,2,3,null,5,null,4] 输出: [1, 3, 4] 解释:1 <--…

论文浅尝 | 中科院百度微软等学者最新综述论文40+最新方法阐述知识图谱提升推荐系统准确性与可解释性...

本文转载自公众号&#xff1a;先知。【导读】近来&#xff0c;知识图谱用于推荐系统是关注的焦点&#xff0c;能够提升推荐系统的准确性与可解释性。如何将知识图谱融入到推荐系统呢? 最近中科院计算所百度微软等学者最新综述论文《A Survey on Knowledge Graph-Based Recomm…

美团酒旅起源数据治理平台的建设与实践

背景 作为一家高度数字化和技术驱动的公司&#xff0c;美团非常重视数据价值的挖掘。在公司日常运行中&#xff0c;通过各种数据分析挖掘手段&#xff0c;为公司发展决策和业务开展提供数据支持。 经过多年的发展&#xff0c;美团酒旅内部形成了一套完整的解决方案&#xff0c;…

LeetCode 1103. 分糖果 II

1. 题目 排排坐&#xff0c;分糖果。 我们买了一些糖果 candies&#xff0c;打算把它们分给排好队的 n num_people 个小朋友。 给第一个小朋友 1 颗糖果&#xff0c;第二个小朋友 2 颗&#xff0c;依此类推&#xff0c;直到给最后一个小朋友 n 颗糖果。 然后&#xff0c;我…