论文浅尝 | 基于迭代的概率规则约束的知识图谱分布式表示

640?wx_fmt=png&wxfrom=5&wx_lazy=1

Citation:Shu Guo, Quan Wang, Lihong Wang, Bin Wang, Li Guo.Knowledge Graph Embeddingwith Iterative Guidance from Soft Rules. AAAI 2018.

动机


图谱的分布式表示旨在将知识图谱中的体和关系表示到连续的向量空中,本文考问题是如何将知识库的分布式表示和逻辑规则结合起来,并提出了一个新的表示学方法 RUGE(Rule-Guided Embedding)。


贡献


(1)本文提出了一种新的知识图谱表示学方法 RUGE,RUGE 在向量表示(embeddings)的学习过程中迭代地而非一次性地加入了逻辑规则束。

(2)本文使用的是已有算法自挖掘的规则,RUGE 的有效性明了算法自挖掘的规则的有效性。

(3)本文提出的方法 RUGE 具有很好的通用型,于不同的逻辑规则和不同置信度的规则棒性


方法 RUGE


1. RUGE 方法的入有三个部分:

1) 已标记的三原:知识库中已有三元

2) 未标记的三元:知识库中不存在的三元。在文中未标记的三元只考了能逻辑规则出的三元

3) 概率逻辑规则:本文主要考了一阶谓词逻辑规则,每一个逻辑规则有一个成立的概率实验中使用的概率规则来自于规则挖掘系AMIE+。

 

2. 模型核心想法如下:

640?wx_fmt=png

3. 三元表示

本文采用了 ComplEx 作为基础的知识库分布式表示学的模型,在ComplEx中,每一个体和关系都被表示为一个复数向量,一个三元 (e_i,r_k,e_j) 的得分函数设计如

640?wx_fmt=png

其中 Re<x> 表示取 x 实部的值,bar{e}_j 为 e_j 的共轭向量。正确的三元组得分函数值会较高而不正确的三元组得分函数的值会较低。


4. 逻辑规则的表示

本文借鉴了模糊逻辑的核心思想,将规则的真值看作其组成部件真值的组合。例如一个已经实例化的规则 (e_u, e_s,e_v) =(e_u, e_t,e_v) 的真值将由 (e_u, e_s,e_v) 和 (e_u, e_t,e_v) 的真值决定。根据(Guo et al. 2016)的工作,不同逻辑算子的真值计算如下:

640?wx_fmt=png

由上三式可推出规则值计算公式:

640?wx_fmt=png此规则计算公式是后面规则应用的一个重要依据。


5. 未标记三元组标签预测

这一步是整个方法的核心,目的在于标记三元标签进预测,并将些三元添加到知识图谱中,再次行知识图谱的分布式表示学习训练,修正向量果。标签预测程主要由两个目

       i.     一:预测标签值要尽可能接近其真的真。由于预测的三元都是未标记的,本文将由当前表示学的向量果按照得分函数算出的果当作其真的真

      ii.      二:预测的真要符合对应逻辑规则束,即通过规则公式算出的真要大于一定的。其中用的规则计算公式如下:

640?wx_fmt=png

其中 φ(e_u, e_s,e_v) 是当前向量表示算的果,s(e_u, e_t,e_v) 是要预测的真。真值预测训练如下:

640?wx_fmt=png

过对上式 s(x_u) 导等于 0 可得到 s(x_u) 算公式:

640?wx_fmt=png

6. 向量表示果的修正

预测标签的三元添加到知识图谱中,和已由的三元一起训练,来修正向量学化的失函数目如下:

640?wx_fmt=png

上式前半部分是识图谱中真存在的三元束,后半部分为对预测标签的三元束。

 

上步骤在模型训练过程中迭代进行。


实验


链接预测:

640?wx_fmt=png

实验结果可以看出,规则用提升了表示学果。

 

论文笔记整理:张文,浙江大学博士在,研究方向知识图谱的分布式表示与推理。




OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。


点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480702.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

笔记:毫米波雷达传感器,优势、应用和产业规模

信息来源&#xff1a;https://www.sohu.com/a/314806539_465219 优势 非接触式传感&#xff0c;可检测物体的距离、速度和角度信息&#xff0c;唯一可以“全天候全天时”工作的传感器系统组件(比如天线)的尺寸可以做到很小穿透性&#xff1a;穿透塑料、墙板和衣服等特殊材料高…

「优知学院」淘宝架构的前世今生(下)

“ 淘宝技术架构前世今生就是一部架构活教材&#xff0c;今天仍然由陈睿mikechen为大家解读淘宝架构。 我稍微把前面淘宝架构的三个阶段简短总结&#xff1a; 淘宝1.0 采用LAMP mysql读写操作 淘宝2.0 把mysql替换为oracle,为了使用oracle的连接池&#xff0c;php采用代理连…

学习排序 Learning to Rank:从 pointwise 和 pairwise 到 listwise,经典模型与优缺点

Ranking 是信息检索领域的基本问题&#xff0c;也是搜索引擎背后的重要组成模块。本文将对结合机器学习的 ranking 技术——learning2rank——做个系统整理&#xff0c;包括 pointwise、pairwise、listwise 三大类型&#xff0c;它们的经典模型&#xff0c;解决了什么问题&…

论文浅尝 | 从 6 篇顶会论文看「知识图谱」领域最新研究进展 | 解读 代码

本文内容源自往期「论文浅尝」&#xff0c;由 PaperWeekly 精选并重新排版整理&#xff0c;感谢 PaperWeekly。ISWC 2018■ 链接 | http://www.paperweekly.site/papers/1912■ 源码 | https://github.com/quyingqi/kbqa-ar-smcnn■ 解读 | 吴桐桐&#xff0c;东南大学博士生&a…

互联网(IT)大厂面试技巧(面经)

目录 前言 面试的正确姿势 实战 最后的总结 前言 虽然资历尚浅&#xff0c;但是也面过不少试&#xff0c;有Google、微软等外企大佬&#xff0c;也有BAT等国内巨头&#xff0c;工作的这几年也有幸当过几次面试官&#xff0c;小鹿这里呢就结合自己的亲身经历&#xff0c;聊…

「优知学院」淘宝技术架构的前世今生(上)

“ 淘宝技术架构经历从最初的LAMP架构&#xff0c;到IOE架构&#xff0c;再到分布式架构&#xff0c;再到去IOE&#xff0c;最后到现在的云计算平台架构这一变化过程在不断解决上面的技术问题&#xff0c;可以说淘宝技术架构的演变就是活生生的一本架构教科书。 这次为大家带…

十大双跨平台整体发展情况盘点

在2019年国家级双跨平台发布一年之际和新一轮遴选开场之前&#xff0c;相关媒体“从战略演进、平台发展、资源汇聚及行业应用四个维度九个细分指标”&#xff0c;对十大双跨平台整体发展情况通过“一张图”的形式做了一次盘点&#xff08;图略&#xff09;。 我们通过对图中指…

机器学习中的范数规则化之(一)L0、L1与L2范数

机器学习中的范数规则化之&#xff08;一&#xff09;L0、L1与L2范数 zouxy09qq.com http://blog.csdn.net/zouxy09今天我们聊聊机器学习中出现的非常频繁的问题&#xff1a;过拟合与规则化。我们先简单的来理解下常用的L0、L1、L2和核范数规则化。最后聊下规则化项参数的选择问…

模型训练慢和显存不够怎么办?GPU加速混合精度训练

目录 混合精度训练 理论原理 三大深度学习框架的打开方式 Pytorch Tensorflow PaddlePaddle 混合精度训练 一切还要从2018年ICLR的一篇论文说起。。。 《MIXED PRECISION TRAINING》 这篇论文是百度&Nvidia研究院一起发表的&#xff0c;结合N卡底层计算优化&#x…

陈睿:架构设计之数据库拆分六大原则

架构设计之数据库拆分原则 数据拆分前其实是要首先做准备工作的&#xff0c;然后才是开始数据拆分&#xff0c;我先讲拆分前需要做的事情&#xff1a; 第一步&#xff1a;采用分布式缓存redis、memcached等降低对数据库的读操作。 第二步&#xff1a;如果缓存使用过后&#xf…

模式识别之特征提取算法

说明&#xff1a;此处暂时简单介绍下各种特征提取算法&#xff0c;后续完善。 前言&#xff1a;模式识别中进行匹配识别或者分类器分类识别时&#xff0c;判断的依据就是图像特征。用提取的特征表示整幅图像内容&#xff0c;根据特征匹配或者分类图像目标。常见的特征提取算法…

ACL2020 | 对话数据集Mutual:论对话逻辑,BERT还差的很远

一只小狐狸带你解锁 炼丹术&NLP 秘籍本文为MuTual论文作者的特别约稿编辑&#xff1a;rumor酱、夕小瑶前言自然语言处理是人工智能领域的掌上明珠&#xff0c;而人机对话则是自然语言处理领域的最终极一环。以BERT为代表的预训练模型为自然语言处理领域带来了新的春天&…

大型网站系统的特点和架构设计

分布式架构 阿里P8架构师谈&#xff1a;淘宝技术架构从1.0到4.0的架构变迁 优知学院」淘宝技术架构的前世今生&#xff08;上&#xff09; 优知学院」淘宝架构的前世今生&#xff08;下&#xff09; 揭秘&#xff1a;一位亲历者眼中的淘宝技术架构发展之路 淘宝发展历程最具…

IDC 和浪潮联合发布了《2020-2021 中国人工智能计算力发展评估报告 》

近日&#xff0c;IDC 和浪潮联合发布了《2020-2021 中国人工智能计算力发展评估报告 》&#xff08;以下简称《报告》&#xff09;。《报告》指出&#xff0c;中国 AI 基础设施市场规模在 2020 年达到了 39.3 亿美元&#xff0c;到 2024 年预计达到 172. 2 亿美元。 《报告中》…

Linux系统中Oracle数据库使用SELECT语句检索数据(1)实例应用

Linux系统中Oracle数据库使用SELECT语句检索数据(1)实例应用 1&#xff0c;首先切换到Oracle用户&#xff0c;并进入数据库#sql / as sysdba2&#xff0c;启动数据库&#xff0c;并连接样例及表格&#xff0c;启动命令#startup&#xff0c;连接样例#conn scott/tiger3&#xff…

知乎搜索框背后的Query理解和语义召回技术

一只小狐狸带你解锁 炼丹术&NLP 秘籍前言随着用户规模和产品的发展&#xff0c; 知乎搜索面临着越来越大的 query 长尾化挑战&#xff0c;query 理解是提升搜索召回质量的关键。本次分享将介绍知乎搜索在 query term weighting&#xff0c;同义词扩展&#xff0c;query 改写…

阿里P8架构师谈:分布式架构设计12精讲

分布式架构设计包含&#xff1a; 分布式缓存 分布式消息中间件 分库分表、读写分离 单点登录等 想成为阿里160万年薪的P8架构师&#xff1f;你必须掌握如下6大技能体系&#xff01; 阿里P8架构师谈&#xff1a;分布式架构系统拆分原则、需求、微服务拆分步骤 阿里P8架构师谈…

【干货】推荐系统中的机器学习算法与评估实战

【导读】推荐系统是机器学习技术在企业中最成功和最广泛的应用之一。本文作者结合MLMU演讲【1】的Slides&#xff0c;对推荐系统的算法、评估和冷启动解决方案做了详细的介绍。 作者 | Pavel Kordk 编译 | 专知 翻译 | XiaowenMachine Learning for Recommender systems — P…

Google | 突破瓶颈,打造更强大的Transformer

一只小狐狸带你解锁炼丹术&NLP秘籍作者&#xff1a;苏剑林 (来自追一科技&#xff0c;人称“苏神”)前言《Attention is All You Need》一文发布后&#xff0c;基于Multi-Head Attention的Transformer模型开始流行起来&#xff0c;而去年发布的BERT模型更是将Transformer模…

阿里P8架构师谈:高并发网站的监控系统选型、比较、核心监控指标

在高并发分布式环境下&#xff0c;对于访问量大的业务、接口等&#xff0c;需要及时的监控网站的健康程度&#xff0c;防止网站出现访问缓慢&#xff0c;甚至在特殊情况出现应用服务器雪崩等场景&#xff0c;在高并发场景下网站无法正常访问的情况&#xff0c;这些就会涉及到分…