论文浅尝 | PASSLEAF: 一个用于不确定知识图谱嵌入的基于样本池的半监督学习框架...

1d0a20421a62e9d10935cd6706dd70fd.png

笔记整理:杨露露,天津大学硕士

链接:https://ojs.aaai.org/index.php/AAAI/article/view/16522/16329

动机

在不确定知识图谱的嵌入中,实体之间的每个关系都有一个置信度。鉴于现有的嵌入方法可能会丢弃不确定性信息,或只加入特定类型的得分函数,或在训练中造成大量的假的负样本,本文提出PASSLEAF框架来解决上述问题。

亮点

PASSLEAF框架的亮点主要包括:

1.提出结合不同类型的评分函数来预测关系置信分数的模型。2.提出通过利用与估计的置信分数相关的正负样本的半监督学习模型。

此外,PASSLEAF利用样本池作为生成样本的中转站,进一步增强了半监督学习。实验结果表明,本文提出的框架在置信度评分预测和尾实体预测方面都具有较高的准确率,能够更好地学习嵌入。

概念及模型

PASSLEAF框架主要包括两个主要部分:不确定性预测模型的建立和基于池的半监督学习。

不确定性预测模型的目标是利用现有的知识嵌入评分函数来预测(h, r, t)样本的置信度。本文分别为基于翻译距离和基于语义的方法设计了相应的分数映射函数,并为其配备了损失函数,以形成一个置信度感知的嵌入模型。

基于池的半监督学习框架提供了一种更好的处理未见过样本的方法来缓解假的负样本问题,不仅将不可见的样本作为负样本处理,而且重新评估其潜在的置信度。

此外,本文维护了一个最新的半监督样本池,利用过去的学习经验,使嵌入的学习质量更好。

模型整体框架如下:

bc9243242e98690528467dfaa82b2f2d.png

•模型构建流程

给定一个评分函数,PASSLEAF通过两步构建一个新的模型。

首先,根据评分函数是基于语义还是基于翻译距离的,评分函数将根据公式(1)和(5)所示的映射进行映射。

其次,评分函数和MSE损失共同构成模型。

9b4b2996a0fb022949808b92891f1cf7.png

27cc1818271e89b8f833c857561be356.png

•半监督学习

半监督样本的选取方法与随机抽取的负样本相同,即破坏训练集三元组的头实体或尾实体。不同之处在于,每个半监督样本的置信度评分将由当前模型估计和指定,而不是归零。因此,它们可以是正样本的,也可以是负样本。这种半监督样本的选取方法缓解了假的负样本问题。

好处就是:一方面,随机抽取的负样本的重要性被稀释了;另一方面,半监督样本有望更好地估计未见过的三元组的真实置信度得分。此外,它还用作数据增强工具,特别是对于正样本。

半监督样本的MSE损失D_semi如下所示。

db4fe5e0f45db5a2439dab533ba2b770.png

负样本和半监督样本的混合会带来最好的性能提升。因此,整体损失函数具体如下。

812c59379a81d001abcb0d6397cbffd6.png

本文不使用上一步生成的半监督样本进行训练,而是应用一个样本池作为样本的中转站。

•样本池

PASSLEAF 维护一个样本池来保存 C 个最新的半监督样本。对于训练阶段i,需要采取两个步骤。首先,应生成 N_new (i) 个样本并将其存储到样本池中。

其次,根据(10)所示的损失函数,从池中随机抽取 N_semi (i) 样本与N_gen-N_semi (i) 随机抽取负样本一起训练模型。为了减少计算开销,将在样本池中选择一个连续的样本带,而不是一个一个地抽取。

本文N_new设计为一个相对于时间的阶跃函数,将N_semi设计为一个剪切线性函数,它从零开始,线性递增,直到给定的最大值,具体如下。

b685d9635263aa4e3b665bf9fe584326.png

其中,T_(NEW SEMI)和T_(NEW TRAIN)分别是开始生成半监督样本的时期和开始从池中获取样本的时期;M_SEMI是每一步半监督样本的最大数量;α决定了半监督样本数量达到最大值所需的时间。合理地说,T_(NEW TRAIN)必须大于T_(NEW SEMI),以积累足够的半监督样本用于训练。

不同时间步骤生成的半监督样本保留了从不同随机抽取的负样本中积累的经验。因此,基于池的设计可以看作是过去模型的集合,进一步增强了半监督样本的有效性。

实验

本文在三个开放的不确定知识图谱上评估模型:PPI5K、NL27K、CN15K,此外,还在两种流行的确定性知识图谱, WN18RR和FB15K237进行评估。主要使用置信度预测(CSP)和尾实体预测(TEP)两个任务进行评估。

在三个数据集上的TEP结果如下表所示。在所有数据集上,具有半监督样本的模型在所有指标上都持续改进。特别是在NL27K上,采用基于池的半监督训练,U RotatE-的WMR降低了约50%,U ComplEx的nDCG提高了近4%。在CN15K上,有半监督训练的最佳模型的WMR接近无半监督训练的UKGE logi的一半。

359181ea05e63dee60cb0d24896433ca.png

对CSP的评估结果如下表。pos和neg分别为数据集内的正样本和随机抽取的负样本的MSE。+SS表示对上一行的模型进行半监督训练后的模型。

在应用半监督样本后,数据集内正样本的MSEs在所有模型和数据集上提高了五分之一以上。研究结果表明,基于池的半监督训练可以有效地缓解假的负样本带来的噪声,并进一步提高数据集内未见过的正样本的预测精度。

76010b8f7675886d3754ad3f086a28ac.png

另一方面,负样本的MSE值在半监督样本训练后略有增加。这个结果是在意料之中的,因为这个实验的数据是随机抽取的负样本,本文认为这很容易出现假的负样本。事实上,稍高的MSE值可能意味着该模型能够检测假的负样本,这会引发人们对过度误报预测的担忧。然而,TEP的表现解除了这种担忧。可以说,这表明了其避免假的负样本和过去经验集合的优点超过了其潜在的误报影响。为了进一步支持这一论点,本文做了一个实验来确定负样本的MSE的界限。实验结果如下图。

d0720cb1fddffcbd4a909bbfcc85d78d.png

这个扩展实验是为了找到潜在误报的上限。在不同的每步最大半监督样本数M_SEMI下,测试不确定的ComplEx模型。第一列中的值表示 M_SEMI 在每步生成的样本数中的比例,默认值为 0.8,值为0表示没有半监督样本。相反,在 M_SEMI=1.0下,在给定的训练步骤之后不会使用随机抽取的负样本,这是最极端的情况,容易出现误报。结果表明,即使在极端情况下,负样本的MSE仍然是可控的。

同时,本文以不确定的ComplEx模型为例来展示 PASSLEAF 模型发现的一些缺失的三元组。实验结果如下图,如果不应用半监督样本,就找不到它们。尽管假的负样本预测似乎很多,但通过基于池的半监督训练发现了更多的缺失三元组。

2b3243e994a2d694567a2bc29012c862.png

为了评估样本池对改进的贡献,本文将基于池的半监督训练与没有样本池的朴素方法进行比较,其中半监督样本在上一步生成。两种模型具有相同数量的N_semi。基线是一个没有任何半监督样本和朴素方法的消融模型。CSP和TEP的结果分别见下表。

78fc62349086307862938ce0ee0d1168.png

5685c8e88a0080d28af6dcb0ab30d8bb.png

为了证明不确定知识图谱量身定做的模型确实超过了不确定知识图谱上的确定性模型。本文将PASSLEAF方法与它们的确定性的对应方法进行比较。应用确定性的知识图谱方法需要进行二值化。因此,对每个阈值都要训练单独的模型,而只有一个不确定的嵌入模型。下图显示了几个二值化阈值下的结果。为了简单起见,只显示了不确定的ComplEx和ComplEx。

ee061a33714b5f0a9c5fc19d1eeb3af0.png

在NL27K和PPI5K上,不确定的ComplEx在大多数指标和阈值上一直优于ComplEx,这支持了PASSLEAF模型能够更好地处理不确定性的观点。此外,除了PPI5K,它们在WH@K和nDCG中的性能差距保持相对稳定。然而,在WMR中,在大多数数据集上,随着阈值的增加,差距扩大了。本文认为这是因为PASSLEAF模型保留了低可信度的三元组作为额外的信息来源。

总结

PASSLEAF概括了建立不确定的知识图谱嵌入模型的过程,并通过避免假的负样本和整合之前的时间步骤学习的经验来提高性能。未来的研究可能基于样本池样本大小函数的设计、超参数的选择和更复杂的损失函数。此外,本篇论文的想法也可能有利于确定性的知识图谱,这是另一个值得研究的课题。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

86c30a8933c3d6c1337d08df76e3a5f7.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477573.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 60. 第k个排列(回溯 康托展开)

文章目录1. 题目2. 解题2.1 回溯2.2 数学-康托展开1. 题目 给出集合 [1,2,3,…,n],其所有元素共有 n! 种排列。 按大小顺序列出所有排列情况,并一一标记,当 n 3 时, 所有排列如下: “123” “132” “213” “231” “312” “…

我在谷歌实习时发现了一个模型 bug,于是有了这篇 ACL

文 | AlbertYang编 | 小轶表格的自动理解与检索已经成为 NLP 以及多模态任务中重要的一环。如果我们给模型一个冬奥会的奖牌榜并且问,“哪个国家的金牌最多?”,现有的模型已经可以毫不费力地输出正确的答案(通常都是表格首行的国家…

Spring Cloud Zuul的fallback优化

如何在Zuul中使用fallback功能 我们在项目中使用Spring cloud zuul的时候,有一种这样的需求,就是当我们的zuul进行路由分发时,如果后端服务没有启动,或者调用超时,这时候我们希望Zuul提供一种降级功能,而不…

技术动态 | 「新一代知识图谱关键技术」最新2022进展综述

转载公众号 | 专知链接:https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.20210829近年来,国内外在新一代知识图谱的关键技术和理论方面取得了一定进展,以知识图谱为载体的典型应用也逐渐走进各个行业领域,包括智能问答、推荐系统、个人助手…

LeetCode 397. 整数替换(递归 贪心)

文章目录1. 题目2. 解题2.1 递归2.2 记忆化递归2.3 贪心1. 题目 给定一个正整数 n,你可以做如下操作: 如果 n 是偶数,则用 n / 2替换 n。如果 n 是奇数,则可以用 n 1或n - 1替换 n。 n 变为 1 所需的最小替换次数是多少&#…

搭配对比学习,万能的 prompt 还能做可控文本生成

文 | ZenMoore编 | 小轶可控文本生成,旨在让语言模型的输出带有我们想要的某种属性。比如情感、主题、三元组等。一般我们习惯采用 CTRL[1] 或者 PPLM[2] 等方式。但是,CTRL 是对整个语言模型进行 Finetuning, PPLM 因为需要在生成的过程中迭代更新 hidd…

Eureka Client注册到Eureka Server的秘密

前言 我们知道Eureka分为两部分,Eureka Server和Eureka Client。Eureka Server充当注册中心的角色,Eureka Client相对于Eureka Server来说是客户端,需要将自身信息注册到注册中心。本文主要介绍的就是在Eureka Client注册到Eureka Server时R…

论文浅尝-综述 | 基于强化学习的知识图谱综述

转载公众号 | 人工智能前沿讲习论文来源:https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.20211264摘要:知识图谱是一种用图结构建模事物及事物间联系的数据表示形式,是实现认知智能的重要基础,得到了学术界和工业界的广泛关注.…

AI当下要破局,不能没有知识图谱!

AI或AI赋能已是传统行业智能化升级和转型的基本模式。近年来越来越多的传统行业的核心战略转移到人工智能领域,但随着大数据红利的消失殆尽,以深度学习为代表的感知智能水平日益接近其“天花板”(来自肖仰华老师分享)。数据驱动的…

LeetCode 495. 提莫攻击

1. 题目 在《英雄联盟》的世界中,有一个叫 “提莫” 的英雄,他的攻击可以让敌方英雄艾希(编者注:寒冰射手)进入中毒状态。现在,给出提莫对艾希的攻击时间序列和提莫攻击的中毒持续时间,你需要输…

Spring Cloud Config的配置中心获取不到最新配置信息的问题

本篇源于Spring Cloud Config的一个问题,但这个问题并非所有人都会遇到。如果您遇到了,那必须得看看这篇,如果没有遇到您也应该看看,防患于未然! 问题描述 之前有朋友提出Spring Cloud Config的配置中心在运行一段时间…

图谱实战 | 京东基于时序知识图谱的问答系统

转载公众号 | DataFunSummit分享嘉宾:商超博士 京东硅谷研究院 研究员编辑整理:张存旺 北航杭州创新研究院出品平台:DataFunTalk导读:本文将分享Temporal Knowledge Graphs方向的一个最新尝试,如何在时序知识图谱上去做…

请不要吸开源的血

文 | 琴梨梨源 | 知乎今天无聊刷GitHub看到一个让我血压上来的项目乍一看,2.4k star,应该不像是什么小项目应该是比较有用的项目,但接下来的事情属实是让我气的很对于开源项目我是不喜欢下载预构建的成品的,我更喜欢自己动手从源代…

LeetCode 357. 计算各个位数不同的数字个数(DP)

1. 题目 给定一个非负整数 n&#xff0c;计算各位数字都不同的数字 x 的个数&#xff0c;其中 0 ≤ x < 10n。 示例: 输入: 2 输出: 91 解释: 答案应为除去 11,22,33,44,55,66,77,88,99 外&#xff0c;在 [0,100) 区间内的所有数字。来源&#xff1a;力扣&#xff08;Lee…

SpringCloud实战小贴士:Zuul的路径匹配

路径匹配 不论是使用传统路由的配置方式还是服务路由的配置方式&#xff0c;我们都需要为每个路由规则定义匹配表达式&#xff0c;也就是上面所说的path参数。在Zuul中&#xff0c;路由匹配的路径表达式采用了Ant风格定义。 Ant风格的路径表达式使用起来非常简单&#xff0c;…

技术动态 | 一文读懂事件知识图谱

转载公众号 | 普适极客文章来源 | 中国科学院网络数据重点实验室【导读】随着事件这类动态知识得到越来越多的关注&#xff0c;学术界涌现出许多事件知识图谱相关的概念。但究竟事件知识图谱是怎么发展而来的&#xff1f;什么是事件知识图谱&#xff1f;它和其他相关概念之间有…

华为开源CTR Benchmark,学术界SOTAs的照妖镜?

文 | 卖萌酱大家好&#xff0c;我是卖萌酱。众所周知&#xff0c;与CV、NLP不同&#xff0c;搜索、广告、推荐领域的学术界paper在很多问题上喜欢各玩各的&#xff0c;缺乏一个统一可比的benchmark。就推荐/广告中核心的CTR预估问题来讲&#xff0c;从传统的LR、FM到Wide&D…

LeetCode 376. 摆动序列(贪心 动态规划)

文章目录1. 题目2. 解题2.1 贪心2.2 动态规划1. 题目 如果连续数字之间的差严格地在正数和负数之间交替&#xff0c;则数字序列称为摆动序列。第一个差&#xff08;如果存在的话&#xff09;可能是正数或负数。少于两个元素的序列也是摆动序列。 例如&#xff0c; [1,7,4,9,2…

Spring Cloud实战小贴士:Zuul的饥饿加载(eager-load)使用

上一篇我们介绍了如何使用Ribbon的earger-load配置加速Spring Cloud中对服务接口的第一次调用。可是这样只是解决了内部服务间的调用&#xff0c;另外一个问题依然经常困扰我们&#xff0c;那就是网关到内部服务的访问。由于Spring Cloud Zuul的路由转发也是通过Ribbon实现负载…

论文浅尝 | ESimCSE:无监督句子表示对比学习的增强样本构建方法

笔记整理&#xff1a;高超尘&#xff0c;中国科学院信息工程研究所硕士动机对比学习在学习无监督句向量方面引起了广泛的关注。其中最受关注的无监督方法是unsup-SimCSE&#xff08;Gao et al., EMNLP 2021)。Unsup-SimCSE使用Dropout作为数据增强方法&#xff0c;将相同的输入…