论文浅尝 | Explainable Link Prediction in Knowledge Hypergraphs

de76c34c92a472536151592c923ca880.png

笔记整理:陈子睿,天津大学硕士

论文链接:https://dl.acm.org/doi/10.1145/3511808.3557316

动机

知识超图链接预测已被认为是各种知识使能下游应用的关键问题。然而,大多数现有方法主要以黑盒方式执行链接预测,它们学习实体关系的低维嵌入进行推理,无法提供人类用户可理解的解释。本文提出了HyperMLN,一个多元、混合、可解释的框架,它用一阶谓词逻辑解释路径推理过程,提供一个知识增强的可解释预测框架,其中逻辑规则中的领域知识用于提升嵌入模型的推理性能,而嵌入空间中的语义信息可以反向优化逻辑规则的权重大小。为给可解释性链接预测方法提供基准规则集,在每个知识超图与知识图谱数据集中挖掘了三种元逻辑规则来解释结果。在实现可解释性的同时,与最先进的知识超图嵌入方法相比,我们的框架在Hits@1指标上平均实现了3.2%的性能提升。

亮点

HyperMLN的亮点主要包括:

(1)探索通过带权重值的逻辑规则构建马尔科夫毯的方式完成对推理结果的解释,包括相关实体及关系对隐藏元组成立的贡献度;

(2)采用数据与知识混合驱动的方式,同时利用向量空间中的语义信息与逻辑规则中的领域知识,完成对隐藏元组的推理。

概念及模型

HyperMLN的关键思想是使马尔科夫逻辑网络适应于多元关系的表示,包括马尔科夫网络中的变量和势函数。接着定义元组的联合分布,通过将知识超图嵌入模型与马尔科夫逻辑网络相结合以完成推理。该组合模型可以通过变分EM算法进行有效训练,其中逻辑规则中编码的领域知识和向量空间中学习的语义信息可以收敛,以提高预测性能。此外,最终的预测结果可以由逻辑规则和相应的马尔可夫毯来解释。

HyperMLN具体由三部分组成:

①基于多元关系的马尔科夫逻辑网络:无需采用star-to-clique转换即可基于逻辑规则将知识超图构建为马尔科夫网络。

②训练与预测:采用变分EM算法同时优化知识超图嵌入模型参数及马尔科夫逻辑网络的逻辑规则权重。

③结果解释:抽取预测元组的马尔科夫毯,基于逻辑规则及权重值解释元组的推理路径。

模型整体框架如图1所示:

ad7f5ece0220affc366948044800c244.png

图1 模型框架图

(1)基于多元关系的马尔科夫逻辑网络

随着知识超图中关系元数的增长,基于二元关系的马尔科夫逻辑网络在采用star-to-clique分解框架处理知识超图数据时受到了根本性的限制。为此,提出一个基于多元关系的马尔科夫逻辑网络,可直接表示基于多元关系的元组及逻辑规则。该网络使用直接建模的方式表示知识超图,避免分解操作导致的数据冗余及信息丢失,并允许势函数直接使用基于多元谓词构建的规则进行表示。给定一个逻辑规则集,所有元组的联合分布可由以下公式进行定义:

59f3417b0f446b6bbf9d4a1175a4df0b.png

(2)训练与预测

知识超图推理方法通过学习实体和关系在可观测元组中的嵌入来预测隐藏元组。基于这些嵌入,所有元组的联合分布可通过如下公式进行定义:

fe730fc6d1342dc44551c836add96a6c.png

马尔科夫逻辑网络引入了规则权重,以解决逻辑规则的不确定性。给定一个逻辑规则集合,所有元组的联合分布可定义为:

dc8e6b69ac4c83e086c0c1bd99a5321c.png

为了结合马尔科夫逻辑网络和知识超图推理方法,该框架转向优化如下公式所示的对数似然函数下限,因为该下限可被EM算法有效优化:

fa6e8214fad12588c68eb49447b82e34.png

为了结合马尔科夫逻辑网络和知识超图推理方法,利用如下摊销推理使变分分布与知识超图推理模型参数化,这样,知识超图推理模型所定义的联合分布可以与马尔科夫逻辑网络相结合于变分E步:

a01005554289c0186eebff940c30c816.png

该公式通过最小化变分分布和真实分布间的KL散度进行模型优化,隐藏元组的联合分布通过如下方式计算得出:

110525fd5dc87a0889df286ecc7aa4ad.png

为学习知识超图推理模型的参数,目标函数被定义为:

8565aac1794729c5dd6ddd89b4b2bccb.png(这个公式)

在M步中,为了处理配分函数Z,HyperMLN改为优化伪似然函数,固定知识超图推理模型的参数取值,利用如下公式通过最大化对数似然函数更新逻辑规则的权重:

72ff140d254945003bfa3570db4a8b97.png(这个公式)

(3)结果解释

对每个预测元组而言,在任意逻辑规则中,与预测元组同时出现的元组可在马尔科夫毯中被找到。在马尔科夫毯中出现的所有实体和关系可被合并为集合E'和集合R',每个实体e'对预测元组为真的置信度可通过如下公式计算:

d9da2a4eb02bfbcb732ee4558a0a1f4c.png

实验

采用了5个公开数据集进行实验,分别是:JF17K、M-FB15K、FB-AUTO、FB15k和WN18。模型的评价指标为:MRR和Hits@k。

3c1caeae61756a3076faa45210e07582.png

图2 数据集统计数据

HyperMLN在所有数据集下都优于目前的知识超图推理方法,其性能改进来自于逻辑规则所捕获知识的能力。在知识超图数据集上选择RAM作为所结合的知识超图推理模型。与纯RAM模型及其他知识超图推理方法相比,在所有评价指标上都取得了更好的表现,原因是知识超图推理方法只利用嵌入空间中的语义信息。同时,HyperMLN使用学习到的嵌入来标注马尔科夫逻辑网络发现的隐藏元组,并进一步更新逻辑规则的权重以达到更好的推理性能,这说明了变分 EM 算法可同时对知识超图推理模型的参数和马尔科夫逻辑网络的规则权重进行充分的训练优化,实现逻辑规则中的领域知识与向量空间中的语义信息充分融合,提高知识超图推理模型的预测性能。

f45b2f5317a3936037c212aa08189ff8.png

图3 知识超图链接预测结果

同时,也选择RAM作为知识图谱数据集上的知识超图推理模型。HyperMLN明显优于基于规则的方法,因为HyperMLN使用知识超图推理模型来提升预测性能,与知识超图上的结果类似,将 HyperMLN 应用于知识图谱中同样得到了更好的结果,证明了可解释性链接预测框架 HyperMLN 的有效性。

af6fd426559cfcf47b04aed11f087cbb.png

图4 知识图谱链接预测结果

下图分别显示了用变分EM算法及其变体(仅用变分E步)训练 HyperMLN 的结果。在变分E步中,推理模型从逻辑规则中获得领域知识,而在M步中,逻辑规则的权重值可通过学习的实体关系嵌入反向优化。如两图所示,当HyperMLN在同一数据集下结合相同推理方法时,同时使用变分E步和M步的效果一般要高于只使用变分E步的效果。这说明在变分EM训练后,同时使用推理模型和逻辑规则的效果要强于只使用推理模型进行预测的效果。在整合领域知识和语义信息的框架下,通过两者的配合可以达到最佳效果。

9b495c44313be7a5151db6f4d37918a2.png

图5 知识超图数据集采用不同训练方式的预测结果

d7208477ce2cc45d25e332f2839dbce8.png

图6 知识图谱数据集采用不同训练方式的预测结果

由于可解释性是本框架的关键目标之一,在图7中提供了一个基于本框架进行结果解释的例子。与结果相关的元组首先从马尔科夫网络中提取预测元组的马尔科夫毯获得。概率为1.0的橘黄色元组是源数据集中的可观测元组,而概率不为1.0的两个浅黄色元组是通过推断所得的可观测元组。规则l1和l2的权重分别为0.7和0.2。现在要预测蓝色隐藏元组为真的概率,以及每个关系和实体对该元组为真的置信度。首先,根据关系类型,从规则集中选择与"父亲"关系相关的规则。然后,根据隐藏元组是否存在于两个规则的闭规则集中,从马尔科夫网络中抽取与隐藏元组相关的三个变量。根据两个闭规则分别构建两个团。之后,根据结果解释章节的公式求得隐藏元组为真的概率为0.32,其中家庭和爷爷关系的置信度分别为0.725和0.275,艾伦、丹尼尔、艾玛、朱莉和简的置信度分别为0.267、0.115、0.352、0.252和0.014。

6ae9c88833f9ce23a62aedec53d6af37.png

图7  通过逻辑规则解释推理结果的示例

总结

在本文中,提出了一个新颖的框架,支持对基于多元关系的元组进行表示,将马尔科夫逻辑网络与知识超图嵌入方法相结合,基于马尔科夫毯解释推理结果。HyperMLN与大多数最先进的知识超图嵌入模型相结合,在相同的设置下可提升模型性能,并使用变分EM算法有效地学习语义和领域知识。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

60c0aa4a0385c4cc1fde3a6f954d6493.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477480.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

吴恩达入驻知乎,涨粉秒过万!知乎首答:如何系统学习机器学习

文 | 卖萌酱大家好,我是卖萌酱。昨天在知乎timeline上刷到一个问题:虽然卖萌酱已经不需要系统学习机器学习了,但无意间发现最高赞的id竟然叫“吴恩达”??好家伙,看了看回答日期,是4月8号。戳进去…

学术会议|第六届知识图谱论坛CNCC-知识图谱赋能大数据大算力

CNCC2022将于12月8日至10日在贵州省贵阳市国际生态会议中心举办,今年CNCC技术论坛数量达到122个,内容涵盖了“计算行业、人工智能、云计算、教育、安全”等30个方向。本文特别介绍将于12月9日举行的【第六届知识图谱论坛-知识图谱赋能大数据大算力】。报…

LeetCode 第 18 场双周赛(188/587,前32%)

文章目录1. 比赛结果2. 题目LeetCode 1331. 数组序号转换 easyLeetCode 1328. 破坏回文串 mediumLeetCode 1329. 将矩阵按对角线排序 mediumLeetCode 1330. 翻转子数组得到最大的数组值 hard1. 比赛结果 做出来了1, 2, 3题,第4题提交超时 2. 题目 LeetCode 1331.…

Spring Cloud实战小贴士:Zuul统一异常处理(一)

在上一篇《Spring Cloud源码分析(四)Zuul:核心过滤器》一文中,我们详细介绍了Spring Cloud Zuul中自己实现的一些核心过滤器,以及这些过滤器在请求生命周期中的不同作用。我们会发现在这些核心过滤器中并没有实现error…

ACL’22 | 为大模型定制的数据增强方法FlipDA,屠榜六大NLU 数据集

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

技术动态 | 面向可解释性的知识图谱推理研究

导读:本次演讲的主题是面向可解释性的知识图谱推理研究,报告分为以下 5 个部分:研究背景前沿进展研究动机近期研究研究展望分享嘉宾|万国佳 武汉大学 计算机学院 博士后编辑整理|xiaomei出品平台|DataFunTa…

LeetCode 1332. 删除回文子序列

1. 题目 给你一个字符串 s,它仅由字母 ‘a’ 和 ‘b’ 组成。每一次删除操作都可以从 s 中删除一个回文 子序列。 返回删除给定字符串中所有字符(字符串为空)的最小删除次数。 「子序列」定义:如果一个字符串可以通过删除原字符…

Spring Cloud源码分析(四)Zuul:核心过滤器

通过之前发布的《Spring Cloud构建微服务架构(五)服务网关》一文,相信大家对于Spring Cloud Zuul已经有了一个基础的认识。通过前文的介绍,我们对于Zuul的第一印象通常是这样的:它包含了对请求的路由和过滤两个功能&am…

预训练再次跨界!百度提出ERNIE-GeoL,地理位置-语言联合预训练!

源 | 百度NLP本文介绍『文心大模型』的一项最新工作:“地理位置-语言”预训练模型ERNIE-GeoL。论文链接:https://arxiv.org/abs/2203.09127实践中的观察近年来,预训练模型在自然语言处理、视觉等多个领域都取得了显著效果。基于预训练模型&am…

LeetCode 1333. 餐厅过滤器(Lambda排序)

1. 题目 给你一个餐馆信息数组 restaurants,其中 restaurants[i] [idi, ratingi, veganFriendlyi, pricei, distancei]。你必须使用以下三个过滤器来过滤这些餐馆信息。 其中素食者友好过滤器 veganFriendly 的值可以为 true 或者 false,如果为 true …

Spring Cloud实战小贴士:Zuul处理Cookie和重定向

由于我们在之前所有的入门教程中,对于HTTP请求都采用了简单的接口实现。而实际使用过程中,我们的HTTP请求要复杂的多,比如当我们将Spring Cloud Zuul作为API网关接入网站类应用时,往往都会碰到下面这两个非常常见的问题&#xff1…

论文浅尝 | Language Models (Mostly) Know What They Know

笔记整理:程思源、梁孝转,浙江大学在读硕士,研究方向为知识图谱的表示学习,自然语言处理,预训练对于一个语言模型,我们最终希望得到一个“诚实”的人工智能系统,即语言模型需要准确并且忠实地评…

百度AI技术盛宴来了!大咖齐聚解读CV/NLP/跨模态大模型技术!

随着人工智能步入工业大生产阶段,AI大模型正在加速走出实验室,在全球范围内逐步实现产业落地应用的突破。自2020年至今,越来越多的科技巨头和科研机构参与其中。去年12月,百度发布了全球首个知识增强千亿级大模型——鹏城-百度文心…

Spring Cloud实战小贴士:健康检查

今天在博客的交流区收到一条不错的问题,拿出来给大家分享一下。具体问题如下: 因为项目里面用到了redis集群,但并不是用spring boot的配置方式,启动后项目健康检查老是检查redis的时候状态为down,导致注册到eureka后项…

恕我直言,你的模型可能并没看懂 prompt 在说啥

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

开源开放 | 区域供冷供热系统及空调系统知识图谱

OpenKG地址:http://openkg.cn/dataset/less开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:浙江大学(赵阳,李婷婷,章超波)1、背景区域供冷供热系统及空调系统领域涉及知…

LeetCode 1334. 阈值距离内邻居最少的城市(最短路径Dijkstra)

1. 题目 有 n 个城市,按从 0 到 n-1 编号。给你一个边数组 edges,其中 edges[i] [fromi, toi, weighti] 代表 fromi 和 toi 两个城市之间的双向加权边,距离阈值是一个整数 distanceThreshold。 返回能通过某些路径到达其他城市数目最少、且…

五个同事想计算他们的平均工资,但公司不让吐露薪资,如何实现?

源 | Xpecya知乎大家好我是卖萌酱。昨天在知乎上刷到一个很有意思的问题:“五个同事决定计算他们的平均工资,在大家互相不告诉薪水的情况下,如何才能做到这一点?”。确实互联网公司是不让员工讨论薪资的,但通过一些神操…

基于Consul的分布式信号量实现

本文将继续讨论基于Consul的分布式锁实现。信号量是我们在实现并发控制时会经常使用的手段,主要用来限制同时并发线程或进程的数量,比如:Zuul默认情况下就使用信号量来限制每个路由的并发数,以实现不同路由间的资源隔离。 信号量(…

图谱实战 | 图视角下的信息抽取技术研究

导读:本次分享题目为《图视角下的信息抽取技术研究》,主要介绍:研究背景和意义国内外研究现状研究目标与内容主要成果与创新之处完成项目及发表论文情况分享嘉宾|郁博文博士 达摩院 算法专家编辑整理|王露出品平台&…