论文浅尝 | 基于知识图谱中图卷积神经网络的推荐系统

笔记整理:王若旭,浙江大学在读硕士,研究方向为关系抽取,零样本学习。


640?wx_fmt=png

本文发表于 www2019,参考链接:https://arxiv.org/pdf/1905.04413.pdf

 

为了解决推荐系统中协同过滤方法面对的数据稀疏和冷启动的问题,很多研究者将关注点放在 user 和 item 的属性上,通过设计一些算法来探索这些辅助信息。本篇文章基于属性之间并非独立的观点提出 Knowledge Graph Convolutional Networks (KGCN),通过挖掘 item 在 KG 属性上的关系有效地捕获item内部的联系。

 

具体的做法如下(参考下图理解):

640?wx_fmt=png

1)首先,将 user-item 中的 item 和 KG 中 entity 对齐。

2)计算 user u 和 KG 中 relation r 的得分,表示用户 u 对关系 r 的重视程度,如:一些用户更注重某部电影的导演而非演员。

640?wx_fmt=png

3)通过对周围 entity e 施加不同权重,计算 item v 拓扑机构表示。其中,N(v)v 的邻接节点。

640?wx_fmt=png

640?wx_fmt=png

4)文中提出三种聚合方法来聚合item v的表示和它邻接节点的表示 640?wx_fmt=png (S(v)是为了保持每批次的计算模式固定且更高效,从N(v)中采样得到的)。

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

5)论文采用 hinge loss,考虑到算法的效率,为每个样本产生 Tu 个负样本,且样本满足均匀分布。

640?wx_fmt=png

KGCN算法流程如下

640?wx_fmt=png

数据集:包括 movieLens-20M,Book-Crossing,Last.FM,用 Microsoft Satori 进行对齐,丢掉了多个匹配的和没有匹配上的 item。数据集统计如下:   

640?wx_fmt=png

K: 感知的宽度,即考虑的邻居节点数量

d:u,v表示的维度

H: 感知的深度,即递归的次数

 

实验结果:

1整体结果

640?wx_fmt=png

2)邻居节点数量K,表示的维度d,感知的深度H对结果的影响

 640?wx_fmt=png

 


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479613.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

手写字识别调研

项目地址:https://github.com/tesseract-ocr/tesseract Google的基于Tesseract的OCR识别小程序:https://www.cnblogs.com/rui1236/p/12155405.html CRNNCTCLoss中文手写汉字识别:https://www.sohu.com/a/313374838_787107 CNN在线识别手写中…

NeurIPS 2020 | Glance and Focus: 通用、高效的神经网络自适应推理框架

文 | rainforest wang源 | 知乎本文主要介绍我们被NeurIPS 2020会议录用的一篇文章:Glance and Focus: a Dynamic Approach to Reducing Spatial Redundancy in Image Classification代码和预训练模型已经在Github上面放出:https://link.zhihu.com/?tar…

如何下载Android源码(非常详细,含自动恢复下载,编译,运行模拟器说明)

今天终于把代码下载完成,特此开一篇博文记录一下。上图: 为了下载这些源码,历时5天5夜,说为什么这么长时间,是因为太容易中断了,有时候下一晚上可能就一直没在下,在你入睡的时候它就自己断了&am…

NumPy快速入门-- Less 基础/线性代数

文章目录1. 广播(Broadcasting)规则2. 使用索引数组索引3. 使用布尔值作为数组索引4. ix_()函数5. 线性代数 简单数组操作6. 技巧和提示6.1 “自动”整形6.2 矢量堆叠1. 广播(Broadcasting)规则 Broadcasting允许通用函数以有意义…

Intel PAUSE指令变化影响到MySQL的性能,该如何解决?

MySQL得益于其开源属性、成熟的商业运作、良好的社区运营以及功能的不断迭代与完善,已经成为互联网关系型数据库的标配。可以说,X86服务器、Linux作为基础设施,跟MySQL一起构建了互联网数据存储服务的基石,三者相辅相成。本文将分…

会议 | CCKS 2019 全国知识图谱与语义计算大会在杭州隆重召开

本文转载自公众号:中国中文信息学会。2019 年全国知识图谱与语义计算大会(CCKS 2019)于 8 月 24 日至 27 日在杭州召开,由中国中文信息学会语言与知识计算专业委员会主办,浙江大学承办。本次会议主题是“知识智能”。大会吸引了来自海内外的八…

Hystrix 简介和使用

Hystrix一、概念二、使用1. 环境搭建2. 服务降级3. 异常熔断4. 自定义异常熔断器5.Hystrix仪表盘监控三、测试1. 异常熔断2. 超时熔断3. 熔断器获得异常4. 异常忽略5. 自定义异常熔断器一、概念 故障蔓延:由于一个服务变慢或没有响应导致大量请求堆积,进…

android中如何使用一张图片适配不同尺寸的APP引导页

在我们平常开发的过程中在做引导页适配的时候,有时候会犯难,怎么样作图可以将各种不同尺寸分辨率的手机都适配好也就是不变形不拉伸,官方给的说法也只是做多套图去适配不同的分辨率,遇到全屏展示引导这种问题的时候就有些力不从心…

给自由职业者和远程工作者的诚恳建议,成为自由职业者和远程工作者前要考虑的那些事儿

自由并不意味着你一定可以工作轻松赚得有多,想要赚得多,你都是要付出相应劳动或者需要其他成本。自由职业和在公司工作,是两种不同的生活模式,是你一生中的不同的选择。自由职业和远程工作,在互联网行业中,…

还在用Tensorboard?机器学习实验管理平台大盘点

文 | SisyphusBJ源 | Pytorch Lightningwandb.aicomet.mlneptune.aiallegro trainsmlflowguild.aisacredtest-tubetensorboard相信很多同学看到上面这个列表的第一印象是懵的。我们先看下机器学习实验管理平台 到底是做神马滴:一句话概括就是:&#xff0…

论文浅尝 | 利用图 Transformer 实现基于知识图谱的文本生成

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答。来源:NAACL2019链接:https://arxiv.org/pdf/1904.02342.pdf本文关注如何从信息抽取结果(特别是知识图谱)出发,生…

LeetCode 230. 二叉搜索树中第K小的元素(中序遍历)

文章目录1. 题目信息2. 解题2.1 中序递归2.2 中序循环写法1. 题目信息 给定一个二叉搜索树,编写一个函数 kthSmallest 来查找其中第 k 个最小的元素。 说明: 你可以假设 k 总是有效的,1 ≤ k ≤ 二叉搜索树元素个数。 示例 1:输入: root …

Apache Doris在美团外卖数仓中的应用实践

序言 美团外卖数据仓库技术团队负责支撑日常业务运营及分析师的日常分析,由于外卖业务特点带来的数据生产成本较高和查询效率偏低的问题,他们通过引入Apache Doris引擎优化生产方案,实现了低成本生产与高效查询的平衡。并以此分析不同业务场景…

Base64加解密的实现方式

本实现方式基于JDK 1.8 实现: import java.util.Base64; import java.util.Base64.Decoder; import java.util.Base64.Encoder;public class Main {static String src "hello,sahadev";public static void main(String[] args) {// 获取加密对象Encoder …

Feign 简介和使用

声明式服务消费Feign一、简介二、使用Feign实现服务消费者三、实现普通的服务提供者四、Feign服务调用测试五、Feign消费者测试负载均衡服务熔断一、简介 Feign是Netflix公司开发的一个声明式的REST调用客户端; Ribbon负载均衡、Hystrix服务熔断是我们Spring Cloud…

论文浅尝 | 面向自动问题生成的跨语言训练

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答。来源:ACL 2019链接:https://128.84.21.199/pdf/1906.02525.pdf动机现有问题生成方法需要大量的“文本-问题”有标注数据对作为训练数据集&#xff…

再见,Spark!Flink已成气候!

身为大数据工程师,你还在苦学Spark、Hadoop、Storm,却还没搞过Flink?醒醒吧!刚过去的2020双11,阿里在Flink实时计算技术的驱动下全程保持了“如丝般顺滑”,基于Flink的阿里巴巴实时计算平台简直强无敌。最恐…

Java线程池实现原理及其在美团业务中的实践

随着计算机行业的飞速发展,摩尔定律逐渐失效,多核CPU成为主流。使用多线程并行计算逐渐成为开发人员提升服务器性能的基本武器。J.U.C提供的线程池:ThreadPoolExecutor类,帮助开发人员管理线程并方便地执行并行任务。了解并合理使…

MD5,MD2,SHA加密的实现方式

import java.security.MessageDigest;import javax.xml.bind.annotation.adapters.HexBinaryAdapter;public class Main {static String src "Hello,sahadev!";public static void main(String[] args) {MD5();MD2();SHA();}/*** MD5加密*/public static void MD5()…