论文浅尝 - ICLR2020 | 知识图谱中数值规则的可微学习

论文笔记整理:许泽众,浙江大学博士研究生。研究方向:知识图谱,规则挖掘等。


论文链接:https://openreview.net/pdf?id=rJleKgrKwS

本文解决的是规则的学习问题,学习出来的规则可用于知识推理任务,例如链接预测等。

KG上的规则捕获了数据中可解释的模式,并且可以用于KG的清洗和补全。

可微逻辑框架TensorLog将规则推理编译成了可微的操作序列。受TensorLog的启发,Neural LP方法可用于学习参数和规则的结构。然而,它在处理age, weight, scicentific measurements等数字特征方面受限。本文提出Neural LP的扩展,可实现对数值规则的快速学习。在通用的Neural LP方法中,数值规则会导致稠密的矩阵操作,使用动态规划和累积求和运算,有效地表达了用于数值比较的操作符。同时作者还设计了否定、聚合等操作符,总体上使得规则形式更加丰富。

最后在多个KG数据集上进行了实验,证明了本文的方法和Neural LP方法相比,可以更准确地回答queries,并且比state-of-the-art的规则抽取方法准确率更高。在两个合成的真实数据集上进行了实验,证明了本文的方法可以依赖于数值信息更准确地恢复出规则,以实现在KG上进行更精准的链接预测。和纯图嵌入方法不同的是,本文的方法抽取出的规则仍然具有可解释性。

考虑图中所示的KG和如下的规则:

这个规则表示学生受有较高引用量的导师的同事的影响。

原始的Neural LP框架不能直接支持有数值的事实:简单的做法是将数值常量作为实体,但这将会非常难以处理,因为各自矩阵中非零的元素值非常非常多。类似地,朴素的处理否定原子的操作会引入操作不可行的稠密矩阵。

本文方法的主要思想是:隐式地表示必要的矩阵操作,可以使用动态规划、累积求和和排列(用于数值比较特征),也可以使用低秩分解(用于否定原子)。所谓隐式操作就是指不需要完全重现操作符的具体数据,只需要能够得到操作符和向量相乘得到的结果即可。作者设计了以下操作符:

(1)Pair-wise Comparison

这一矩阵是针对KG上所有包含p , q实体对的,因此通常是稠密的,因此朴素的具体化将超过GPU内存的限制。而且,在现实中通常不需要明确地具体化TensorLog的关系矩阵。上面提到的Neural LP推理链中,所需要做的就是有效地计算关系矩阵和表示推理链中当前概率的某个向量之间的matrix-vector积,这就是隐式的意思:

考虑到特殊的情况:p和q都以升序进行排列:


γ值可以预先在CPU上进行计算,使用动态规划可以实现线性的复杂度。

考虑一般的情况,也就是p , q没有进行排序:

(2)分类操作符

作者也考虑到了更多的一般规则,在这种规则中,不一定非要对实体的两个数值属性间进行比较,也可以对这些属性的functions进行比较。通过在之上施加聚合函数 F 去达到多个属性操作聚合作用的效果,例如下面一条逻辑表达式:

其中 F 代表的聚合操作就是由两种基础的属性比较操作的某种联合作用,聚合函数可用任意的神经网络来替换,文中使用了简单的MLP。

(3)否定操作符(Negated Operators)

使用了局部封闭世界的假设(local closed-world assumption),因为封闭世界假设不符合KG的使用场景,开放世界假设对操作符取反之后全为0没有意义。对于给定的操作符矩阵M,对那些要被翻转的元素进行了限制,即要被翻转的元素所在的行至少要有一个非零元素。

实验部分如下:

1、数据集

2、实验任务:链接预测

3、对比方法

本文的方法称为Neural-Num-LP,和以下两个baselines进行对比:

  • AnyBURL:用于学习Horn规则的自底向上的方法(Horn规则:例如只有positive atoms没有比较操作符的规则);

  • Neural-LP:可微的规则学习系统。

4、实验结果

本文的方法和baselines对比的实验结果:

实验结果可以看出,本文基于Neural-LP拓展出的方法Neural-Num-LP在自造的数据集上,达到了一种很好的效果,而另外俩个相关的baseline因为没有加入数值推理的逻辑,所以效果不行;同时,在俩个标准知识图谱上,Neural-Num-LP也能达到一个较好的效果,体现出框架的一方面很好的保存了关系推理的功能,又较好的建模了数值推理的逻辑。

总体而言,本文设计了多种操作符,丰富了规则形式,尤其是支持数值型规则的可谓学习,但是每种操作符都有一定的限制。比较操作符只能比较规则中相邻的实体的数值,否定操作符本身的部分封闭世界假设本身相比开放世界假设是有限制的,聚合操作符实际减弱了规则的可解释性。


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478588.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2021大厂面试高频100题最新汇总(附答案详解)

昨天在知乎上刷到一个热门问题:程序员需要达到什么水平才能顺利拿到 20k 无压力?其中一个最热门的回答是:“其实,无论你是前端还是后端、想进大厂还是拿高薪,算法都一定很重要。”为什么,算法会如此重要?不…

LeetCode 33. 搜索旋转排序数组(二分查找)

1. 题目 假设按照升序排序的数组在预先未知的某个点上进行了旋转。 ( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。 搜索一个给定的目标值,如果数组中存在这个目标值,则返回它的索引,否则返回 -1 。 你可以假设数…

论文浅尝 - EMNLP2020 | 低资源跨语言实体链接中的设计挑战

论文笔记整理:谭亦鸣,东南大学博士。来源:EMNLP 2020链接:https://arxiv.org/pdf/2005.00692.pdf1.背景介绍跨语言实体链接(XEL)旨在将任一非英语文本中的实体提及匹配到英语知识库上(例如Wikip…

MSON,让JSON序列化更快

问题 我们经常需要在主线程中读取一些配置文件或者缓存数据,最常用的结构化存储数据的方式就是将对象序列化为JSON字符串保存起来,这种方式特别简单而且可以和SharedPrefrence配合使用,因此应用广泛。但是目前用到的Gson在序列化JSON时很慢&a…

屠榜各大CV任务!「百度顶会论文复现营」携Swin Transformer来袭!

目标检测刷到58.7 AP!实例分割刷到51.1 Mask AP!!语义分割在ADE20K上刷到53.5 mIoU!!!......Swin Transformer持续屠榜各大CV任务,并且均名列前茅!通过分层体系结构,带来…

百度任务型对话系统小记

意图扩展阅读: 古月哲亭: AAAI 2021 | 清华提出深度对齐聚类用于新意图发现:https://mp.weixin.qq.com/s/9dNs8TTERPdxmrVc3tF1zw 相关项目地址:https://github.com/thuiar/OKD-Reading-List 古月哲亭: 意图知识图谱的构建与应用&#xff1a…

论文浅尝 - EMNLP2020 | 跨媒体关键词预测: 多模态多头注意力和图像文本的统一框架...

论文笔记整理:柏超宇,东南大学硕士。文章链接:https://arxiv.org/pdf/2011.01565.pdf来源:EMNLP 2020动机社交媒体每天都会产生大量的内容。为了帮助用户快速捕捉所需内容,关键词预测受到越来越多的关注。尽管如此&…

从实际案例聊聊Java应用的GC优化

当Java程序性能达不到既定目标,且其他优化手段都已经穷尽时,通常需要调整垃圾回收器来进一步提高性能,称为GC优化。但GC算法复杂,影响GC性能的参数众多,且参数调整又依赖于应用各自的特点,这些因素很大程度…

LeetCode 162. 寻找峰值(二分查找)

1. 题目 峰值元素是指其值大于左右相邻值的元素。 给定一个输入数组 nums,其中 nums[i] ≠ nums[i1],找到峰值元素并返回其索引。 数组可能包含多个峰值,在这种情况下,返回任何一个峰值所在位置即可。 你可以假设 nums[-1] n…

谷歌:CNN击败Transformer,有望成为预训练界新霸主!LeCun却沉默了...

文 | ????????????????这几年,大家都说深度学习进入了预训练时代。作为一个入行不久的小白,我一直以为各类基于 Transformers 结构的预训练模型是 NLP 的巨大里程碑,CNN、RNN 老矣,只配作为手下败将。大家的文章似…

新词发现简介

原文链接:https://blog.csdn.net/weixin_43378396/article/details/103848628 新词发现是 NLP 的基础任务之一,通过对已有语料进行挖掘,从中识别出新词。新词发现也可称为未登录词识别,严格来讲,新词是指随时代发展而新…

论文浅尝 - AAAI2020 | 利用自然语言推断生成人称一致的对话

链接: https://arxiv.org/pdf/1911.05889.pdf动机虽然最近几年通过利用社交网络上大量人人交互数据训练开放域对话模型取得了很大的成功,但是这些数据驱动的对话系统仍然无法很自然的与人类对话,其中的一个主要问题就是对话系统缺乏一致的角色…

智能投放系统之场景分析最佳实践

美团点评作为业内最大的O2O的平台,以短信/push作为运营手段触达用户的量级巨大,每日数以千万计。 美团点评线上存在超过千万的POI,覆盖超过2000城市、2.5万个后台商圈。在海量数据存在的前提下,实时投放的用户在场景的选择上存在一…

7个提升PyTorch性能的技巧

文 | William Falcon源 | AI公园在过去的10个月里,在PyTorch Lightning工作期间,团队和我已经接触过许多结构PyTorch代码的风格,我们已经发现了一些人们无意中引入瓶颈的关键地方。我们非常小心地确保PyTorch Lightning不会对我们为你自动编写…

论文浅尝 - EMNLP2020 | 基于规则引导的协作 agent 知识图谱推理学习

论文笔记整理:叶橄强,浙江大学在读硕士,研究方向为知识图谱的表示学习和预训练。来源:EMNLP 2020现有的大多数基于行走的模型通过在提供可解释的决策的同时获得良好的性能,在知识图谱推理中显示出其优势。但在遍历过程…

Shield——开源的移动端页面模块化开发框架

一直以来,如何能更高效地开发与维护页面是Android与iOS开发同学最主要的工作和最关心的问题。随着业务的不断发展,根据特定业务场景产生的定制化需求变得越来越多。单一页面往往需要根据不同业务、不同场景甚至不同用户展示不同的内容。在这样的背景下&a…

1年排名前进13位 ,这个论题成顶会新宠!

写过论文的同学都知道,写久了真的会头秃,其中耗发量最高的当属论题和创新点。今天分享一套方法,这个方法已经帮助近3000位同学成功发(拯)表(救)论(头)文(发&a…

LeetCode 50. Pow(x, n)(二分查找)

文章目录1. 题目2. 二分查找2.1 递归2.2 循环1. 题目 实现 pow(x, n) &#xff0c;即计算 x 的 n 次幂函数。 示例 输入: 2.00000, 10 输出: 1024.00000 示例 输入: 2.00000, -2 输出: 0.25000 解释: 2-2 1/22 1/4 0.25 说明: -100.0 < x < 100.0 n 是 32 位有符号…