论文浅尝 | KGAT: 用于推荐的知识图注意力网络

笔记整理 | 李爽,天津大学


链接:https://arxiv.org/pdf/1905.07854v1.pdf


动机

为了提供更准确、多样化和可解释的推荐,必须超越对用户-项目交互的建模,并考虑辅助信息。传统的方法,如因子分解机(FM),将其视为一个有监督的学习问题,它假定每个交互都是一个独立的实例,并带有编码的辅助信息。由于忽略了实例或项目之间的关系(例如,一部电影的导演也是另一部电影的演员),这些方法不足以从用户的集体行为中提取出协同信号。在文章中,作者探讨了知识图谱(KG)的效用,它通过将项目与其属性联系起来,打破了独立的交互假设。作者提出了一种新的方法,称为知识图注意力网络(KGAT),它以端到端的方式明确地对KGAT中的高阶连接进行建模。它递归地传播来自节点邻居(可以是用户、项目或属性)的嵌入,以细化节点的嵌入,并使用注意力机制来区分邻居的重要性。对三个公共基准的实证结果表明,KGAT明显优于最先进的方法,如Neural FM和RippleNet。进一步的研究验证了嵌入传播对高阶关系建模的有效性以及注意力机制带来的可解释性优势。


亮点

KGAT在概念上优于现有的方法,因为:

(1)与基于路径的方法相比,它避免了将路径具体化的劳动密集型过程,因此使用起来更加高效和方便;

(2)与基于正则化的方法相比,它将高阶关系直接因子化到预测模型中,因此所有相关参数都被定制以优化推荐目标。

概念及模型

首先引入CKG的概念,它将用户行为和项目知识编码为一个统一的关系图。首先将每个用户行为表示为一个三元组,(u,Interact,i),其中= 1表示为用户u和项目i之间的附加关系Interact,然后基于项目-实体对齐集,用户-项目图可以与KG无缝集成为一个统一的图={(h, r, t)|h, t∈’,r∈’},其中’=’=∪{Interact}。

KGAT模型以端到端的方式利用高阶关系,模型框架如下图所示,它由三个主要组件组成:

1)嵌入层,它通过保留CKG结构将每个节点参数化为一个向量;

2)注意力嵌入传播层,其递归地传播来自节点的邻居的嵌入以更新其表示,并采用知识感知注意力机制来学习传播期间每个邻居的权重

3)预测层,其聚集来自所有传播层的用户和项目的表示,并输出预测的匹配分数。

嵌入层

知识图嵌入是一种将实体和关系参数化为向量表示的有效方法,同时保留了图的结构。这里在CKG采用了一种广泛使用的方法——TransR,如果图中存在三元组(h,r, t),它通过优化转换原则+来学习嵌入每个实体和关系。这里,, 分别是h,t,r的嵌入;, 在关系r空间中的投影表示。因此,对于给定的三元组(h,r, t),其似然性得分(或能量得分)公式如下:

TransR的训练考虑了有效三元组和断裂三元组之间的相对顺序,并通过成对的排序损失来促进它们的区分:

注意力嵌入传播层

接下来,在图形卷积网络的架构上,沿着高阶连通性递归传播嵌入信息;此外,利用图注意力网络的思想生成级联传播的注意力权重来揭示这种连通性的重要性。首先描述一个单层,它由三个部分组成:信息传播、知识感知注意力和信息聚合,然后讨论如何将其推广到多个层。

  • 信息传播:

考虑实体h,用 = {(h, r, t)|(h, r, t)∈}表示三个一组,其中h是头实体,称为ego-network。为了刻画实体h的一阶连通性结构,计算h的ego-network的线性组合:

  • 知识感知注意力:

通过关系注意力机制实现π(h, r, t),其公式如下:

此后,通过采用softmax函数来归一化与h连接的所有三元组的系数:

  • 信息聚合:

最后一个阶段是将实体表示及其ego-network表示聚合为实体h的新表示,即= f ()。使用三种类型的聚合器实现f(·):

  • GCN聚合器总结了两种表示,并应用了非线性变换,如下所示:

  • 图形聚合器(GraphSage)将两个表示连接起来,然后进行非线性转换:

  • 双向交互聚合器(Bi-Interaction)是作者精心设计的,它考虑了之间的两种功能交互,如下所示:

预测层

在执行L层之后,得到用户节点u的多个表示,即{, … , };类似于项目节点i,得到{, … , }。由于第l层的输出是以u(或i)为根的l的树结构深度的消息聚合,不同层的输出强调不同顺序的连通性信息。因此,采用层聚合机制将每一步的表示连接成一个向量,如下所示:

最后,进行用户和项目表示的内积,以预测它们的匹配分数:

模型优化

为了优化推荐模型,作者选择了BPR损失。具体来说,它假设观察到的交互(指示更多的用户偏好)应该被分配比未观察到的更高的预测值:

最后的目标函数联合学习等式(2)和上式,如下所示:

理论分析

实验

为了评估KGAT的有效性,作者使用了三个基准数据集:Amazon-book、Last-FM和Yelp2018,下表总结了三个数据集的统计数据。作者使用了ecall@K和ndcg@K两个指标。

为证明有效性,作者将提出的KGAT与SL (FM和NFM)、基于正则化(CFKG和CKE)、基于路径(MCRec和RippleNet)和基于图形神经网络(GC-MC)的方法进行了比较,比较结果如下表所示。

从表中可以看出,KGAT在所有数据集上都取得了最佳的效果。且在大多数情况下,基于规则的方法(FM和NFM)比基于内容的方法(CFKG和CKE) 性能更好,这表明基于规则的方法可能没有充分利用项目知识。

作者改变了KGAT的深度来研究多个嵌入传播层的使用效率,实验结果如下表所示。显然,增加KGAT的深度能够显著提高模型性能。

为了探索聚合器的影响,作者考虑了使用不同设置的KGAT-1变体,即之前提到的GCN、GraphSage和Bi-Interaction,实验结果如下表所示。可以看出,Bi-Interaction的性能最好。

最后,作者基于注意力分数提取连接用户-项目对的基于行为和基于属性的高阶连通,下图显示了高阶连通性的可视化。

KGAT捕捉基于行为和基于属性的高阶连通,这在推断用户偏好方面起着关键作用。检索到的路径可以被视为项目符合用户偏好的依据。


总结

在这项工作中,作者探索了CKG高阶连接与语义关系的知识感知推荐。作者设计了一个新的框架KGAT,它以端到端的方式明确地模拟了CKG的高阶连接。其核心是注意力的嵌入传播层,该层自适应地传播来自节点邻居的嵌入,以更新节点的表示。在三个真实数据集上的大量实验证明了KGAT的合理性和有效性。这项工作探索了图神经网络在推荐中的潜力,并代表了利用信息传播机制开发结构知识的初步尝试。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478446.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

对话系统答非所问?快试试这篇ACL'21的连贯性评估大法

文 | 页眉3编 | 小轶背景当我们在绞尽脑汁地想怎么设计一个对话系统的时候,我们当然希望最后训练出来的系统能越像人越好,输出的回复很连贯,很有趣,很体贴。而其中,连贯性可以说是最基本的要求之一了,毕竟不…

LeetCode 384. 打乱数组(rand)

1. 题目 打乱一个没有重复元素的数组。 示例:// 以数字集合 1, 2 和 3 初始化数组。 int[] nums {1,2,3}; Solution solution new Solution(nums);// 打乱数组 [1,2,3] 并返回结果。任何 [1,2,3]的排列返回的概率应该相同。 solution.shuffle();// 重设数组到它的初始状态[…

论文浅尝 - ACL2020 | 知识图谱补全方法的再评估

笔记整理 | 谭亦鸣,东南大学博士来源:ACL 2020链接:https://www.aclweb.org/anthology/2020.acl-main.489.pdf源码:http://github.com/svjan5/kg-reeval概述图谱补全(KGC)的目标是自动的预测大规模知识图谱…

美团数据库高可用架构的演进与设想

本文介绍最近几年美团MySQL数据库高可用架构的演进过程,以及我们在开源技术基础上做的一些创新。同时,也和业界其它方案进行综合对比,了解业界在高可用方面的进展,和未来我们的一些规划和展望。 在2015年之前,美团&…

恕我直言,很多小样本学习的工作就是不切实际的

文 | ????????????????编 | 小轶以前的小样本学习(Few-shot Learning),是需要用一个巨大的训练集训练的。测试时只给出 n-way k-shot,在这 N * k 个样本上学习并预测。我第一次看到这种任务设定的时候真是非常失望…

LeetCode 204. 计数质数(质数的倍数不是质数)

1. 题目 统计所有小于非负整数 n 的质数的数量。 示例:输入: 10 输出: 4 解释: 小于 10 的质数一共有 4 个, 它们是 2, 3, 5, 7 。2. 填表解题 2的倍数不是质数3的倍数不是质数5的倍数,7的倍数,11的倍数。。。质数的倍数不是质数 class Solution { p…

论文浅尝 | 六篇2020年知识图谱预训练论文综述

转载公众号 | AI机器学习与知识图谱本文介绍六篇有关知识图谱预训练的优秀论文,大致上可分为两类,生成学习模型和对比学习模型。其中GPT-GNN模型是生成学习模型,模型灵感来源于自然语言处理中的GPT模型;GCC,GraphCL&am…

distutils.errors.DistutilsError: Could not find suitable distribution for Requirement.parse(‘setupto

distutils.errors.DistutilsError: Could not find suitable distribution for Requirement.parse(‘setupto: 解决办法 1、安装scm:pip install setuptools-scm 2、 升级pip:pip install --upgrade pip 3、安装setuptools:pip install set…

客户端自动化测试研究

测试作为质量保证极其重要的一环,在移动App开发流程中起到非常关键的作用。从开发工程师到测试工程师,人人都应具备良好的测试意识,将隐患和风险在上线之前找出并解决,可以有效的减少线上事故。 美团和大众点评App作为美团点评平台…

视觉增强词向量:我是词向量,我开眼了!

文 | 橙橙子亲爱的读者,你是否被各种千亿、万亿模型的发布狂轰乱炸,应接不暇,甚至有点产生对大模型的审美疲劳?出于这个目的,今天来分享一篇研究静态词向量的小清新文章。希望大家可以在理性追热的同时,小冶…

会议交流 | 知识图谱前沿技术与热门应用

长按上图或点击『阅读原文』免费报名随着人工智能技术的发展与应用,知识图谱作为AI进步的阶梯越来越受到学术界和产业界的重视,并且已经在很多领域、场景中体现出自身的价值。从最初的互联网搜索、推荐、问答等ToC场景,逐渐进入到垂直行业ToB…

美团点评酒店后台故障演练系统

随着海量请求、节假日峰值流量和与日俱增的系统复杂度出现的,很有可能是各种故障。在分析以往案例时我们发现,如果预案充分,即使出现故障,也能及时应对。它能最大程度降低故障的平均恢复时间(MTTR)&#xf…

那些在家啃书自学算法的人,最后都找到工作了吗?

面试官手把手带你刷题AI岗位面试题 详解训练特惠免费0元在准备应聘的过程中,大部分同学关注点都在自己的技术水平以及项目经验是否能够比过其他人。但往往忽略了一点,你会的和你在面试中能完全讲清楚是两码事,如果不提前梳理好思路&#xff0…

论文小综 | 知识图谱中的复杂查询问答

作者 | 张文,浙江大学博士,研究兴趣为知识图谱表示与推理陈名杨,浙江大学在读博士生,研究兴趣为知识图谱表示与推理本文将介绍近两年4篇关于知识图谱中的复杂查询问答(Complex Query Answering, CQA)的研究工作。复杂查询问答的目…

LeetCode 103. 二叉树的锯齿形层次遍历(BFS / 双栈)

1. 题目 给定一个二叉树,返回其节点值的锯齿形层次遍历。(即先从左往右,再从右往左进行下一层遍历,以此类推,层与层之间交替进行)。 例如: 给定二叉树 [3,9,20,null,null,15,7],3/ \9 20/ \…

KeyError: ‘segment_ids paddlehub中出现segement_ids错误解决方案

examples.append((encoded_inputs[‘input_ids’], encoded_inputs[‘segment_ids’])) KeyError: ‘segment_ids’ 找到源代码:输出encoded_inputs 将segments_ids改成 token_type_ids解决问题

Android增量代码测试覆盖率工具

美团业务快速发展,新项目新业务不断出现,在项目开发和测试人员不足、开发同学粗心的情况下,难免会出现少测漏测的情况,如何保证新增代码有足够的测试覆盖率是我们需要思考的问题。 先看一个bug: 以上代码可能在onDesto…

ACL'21 | 多模态数值推理新挑战,让 AI 学解几何题

文 | 陈嘉奇编 | 小轶从小到大,数学都是一门令人头秃充满魅力的学科。从基本的代数、几何,到高数微积分,各类数学问题都对答题者的逻辑推理能力都有着不同程度的挑战。而逻辑推理能力一直以来都是 AI 发展的核心目标之一。学术界对于 AI 自动…

论文浅尝 - ICLR2021 | 从信息论的角度提高语言模型的鲁棒性

笔记整理 | 胡楠,东南大学来源:ICLR 2021论文下载地址:https://arxiv.org/pdf/2010.02329.pdf动机最近的研究表明,BERT和RoBERTa这种基于BERT的模型容易受到文字对抗攻击的威胁。论文旨在从信息理论的角度解决此问题并提出InfoBER…

LeetCode 74. 搜索二维矩阵(二分查找)

1. 题目 编写一个高效的算法来判断 m x n 矩阵中,是否存在一个目标值。该矩阵具有如下特性: 每行中的整数从左到右按升序排列。 每行的第一个整数大于前一行的最后一个整数。 示例 1: 输入: matrix [[1, 3, 5, 7],[10, 11, 16, 20],[23, 30, 34,…