论文浅尝 - CIKM2020 | 用于推荐系统的多模态知识图谱

论文笔记整理:王琰,东南大学硕士。


来源:CIKM 2020

链接:https://doi.org/10.1145/3340531.3411947

研究背景与任务描述

为了解决推荐系统中的数据稀疏和冷启动问题,研究人员通过利用有价值的外部知识作为辅助信息,提出了基于知识图(KGs)的推荐。但是,以往大多数工作都忽略了多模态知识图谱(MMKG)中的各种数据类型(例如,文本和图像)。因此作者提出了多模态知识图谱注意力网络(MKGAT),以通过利用多模态知识来提高推荐系统的推荐效果。

多模态知识图谱表示学习有两种类型:基于特征的方法和基于实体的方法。

基于特征的方法将模态信息视为实体的辅助特征

基于实体的方法将不同类型的信息(例如文本和图像)视为结构化知识的关系三元组

主要工作:遵循基于实体的方法来构造多模式知识图,提出了多模态知识图谱注意力网络(MKGAT)

任务描述:制定基于多模态KG的推荐任务:

•输入:协同过滤知识图谱,其中包括用户-项目二部图和原始的多模态知识图谱

•输出:一种预测用户采用某项商品的概率

MKGAT model

MKGAT model由两个子模块组成: multi-modal knowledge graph embedding module 和 recommendation module.

Multi-modal knowledge graph embedding module:

知识图嵌入模块以协作知识图作为输入,利用多模态知识图谱(MKG)实体编码器和MKG注意层为每个实体学习新的实体表示。新的实体表示将汇总其邻居的信息,同时保留有关其自身的信息。然后,可以使用新的实体表示来学习知识图嵌入,以表示知识推理关系。

Multi-modal Knowledge Graph Entity Encoder

将结构化知识的实体id或关系id分别embedding;用ResNet embedding 图像; 用用Word2Vec训练单词向量,然后应用SIF模型获得句子的单词向量的加权平均值,用作句子向量来表示文字特征


Multi-modal Knowledge Graph Attention Layer

        Propagation layer
    给定候选实体h,首先通过transE模型学习知识图的结构化表示,然后把实体ℎ的多模态邻居实体信息汇总到实体h。N_h 表示直接连接到h的三元组的集合,集合了邻居实体信息,是每个三重表示形式的线性组合,计算公式为

其中 e(h, r, t) 是每个三元组 (h, r, t) 的嵌入,而 π(h, r, t) 是每个三元组e(h, r, t) 的注意力得分

e(h, r, t) 是通过对头部实体,尾部实体和关系的嵌入的串联进行线性变换得到的

通过关系注意力机制实现π(h, r, t)

在这里,选择LeakyReLU作为非线性激活函数。此后采用softmax函数对所有与将与连接的所有三元组的系数归一化:

Aggregation layer

       采用两种方法将实体表示 e^h 和对应的聚合为实体 h 的新表示

       1) Add aggregation method

      

       对初始e^h进行线性变换并将其添加到中,W3是一个权重矩阵,用于将当前表示转移到公共空间

       2) Concatenation aggregation method

      

       使用线性变换连接 e^h , 其中||是串联操作,W4是可训练模型参数

       High-order propagation

      通过堆叠更多的传播层和聚合层,探索协作知识图中固有的更高阶连接性。通常对于n层模型,传入信息是在n跳邻居上累积的

Knowledge Graph Embedding

使用translational scoring function来embedding

通过优化转换原理来学习嵌入每个实体和关系,三元组的score为:

Pairwise Ranking Loss:

是随机替换有效三元组的实体得到的

Recommendation module:

       推荐模块以实体的知识图嵌入(由知识图嵌入模块获得)和协作知识图为输入,推荐模块还使用MKG实体编码器和MKG attention layer来利用相应的邻居来丰富用户和用户的表示。最后,根据传统推荐模型来生成用户和项目之间的匹配分数

       为了保留第层的候选用户和项目的输出,使用layer-aggregation mechanism将每个步骤的表示连接成一个向量

        

其中||是连接操作,L是MKG attention layer的数目。这样不仅可以通过执行嵌入传播操作来丰富初始嵌入,还可以通过调整L来控制传播强度

       匹配分数的计算公式为:

      

       推荐预测损失为Bayesian Personalized Ranking (BPR) loss:

      

      

Experiment

       数据集:MovieLens,Dianping

       Evaluation Metrics:recall@k和ndcg@k

Baselines:基于FM的方法(NFM),基于KG的方法(CKE,KGAT),多模态方法(MMGCN)

       可以看出MKGCN在recall和ndcg方面均优于两个数据集的所有baselines

       模态的影响:

在Dianping数据集上比较了KGAT和MKGAT模型在不同模态下的结果,可以看出在KGAT和MKGAT中,具有多模式特征的方法均优于具有单模式特征的方法且视觉效果比文本效果更加重要

模型深度的影响:

对于KGE,在MovieLens中,随着MKGAT层数的增加,评估指标也增加,证明了邻域信息融合在知识图嵌入中的有效性。在Dianping数据集中,随着MKGAT层数的增加,评估指标先增大然后减小,这可能是因为点屏数据的多跳信息相对稀疏

推荐部分随着MKGAT层数的增加,评估指标首先集中增长,证明了不同跃点的KGE对于推荐系统有益。但是当层数增加到一定水平时,评估指标下降,这可能是由于数据稀疏导致了过度拟合

组合层的影响:

可以看出使用的连接层(用CONCAT标记)的方法优于添加层(用ADD标记)

Case study:

随机选择Dianping数据集中的一个用户和相关项,计算候选项目与实体之间的相关性得分,相关性得分越高,模型就认为当前实体对模型的影响越大。可以看出多模态关系在协作知识图中通常有较高评分,表明多模态实体的重要性

总结:

       作者提出了一种多模式知识图注意力网络(MKGAT),将多模态知识图谱创新地引入了推荐系统。通过学习实体之间的推理关系,并将每个实体的邻居实体信息聚合到自身,该模型可以利用多模式实体信息改进推荐效果

未来可以在多模态知识图的框架下探索更多的多模态融合方法,例如 Tensor Fusion Network(TFN)或低秩多模态融合(LMF)等

 


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478592.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FedNLP: 首个联邦学习赋能NLP的开源框架,NLP迈向分布式新时代

文 | 阿毅两周前,南加大Yuchen Lin(PhD student USC and ex-research intern GoogleAI)所在的团队在Twitter官宣开源首个以研究为导向的联邦学习赋能NLP的FedNLP框架。发布数小时内就获得了647个赞,163次转发,可见其热度。我相信大…

LeetCode 380. 常数时间插入、删除和获取随机元素(哈希+vector)

1. 题目 设计一个支持在平均 时间复杂度 O(1) 下,执行以下操作的数据结构。 insert(val):当元素 val 不存在时,向集合中插入该项。 remove(val):元素 val 存在时,从集合中移除该项。 getRandom:随机返回现…

论文浅尝 - ICLR2020 | 知识图谱中数值规则的可微学习

论文笔记整理:许泽众,浙江大学博士研究生。研究方向:知识图谱,规则挖掘等。论文链接:https://openreview.net/pdf?idrJleKgrKwS本文解决的是规则的学习问题,学习出来的规则可用于知识推理任务,…

2021大厂面试高频100题最新汇总(附答案详解)

昨天在知乎上刷到一个热门问题:程序员需要达到什么水平才能顺利拿到 20k 无压力?其中一个最热门的回答是:“其实,无论你是前端还是后端、想进大厂还是拿高薪,算法都一定很重要。”为什么,算法会如此重要?不…

LeetCode 33. 搜索旋转排序数组(二分查找)

1. 题目 假设按照升序排序的数组在预先未知的某个点上进行了旋转。 ( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。 搜索一个给定的目标值,如果数组中存在这个目标值,则返回它的索引,否则返回 -1 。 你可以假设数…

论文浅尝 - EMNLP2020 | 低资源跨语言实体链接中的设计挑战

论文笔记整理:谭亦鸣,东南大学博士。来源:EMNLP 2020链接:https://arxiv.org/pdf/2005.00692.pdf1.背景介绍跨语言实体链接(XEL)旨在将任一非英语文本中的实体提及匹配到英语知识库上(例如Wikip…

MSON,让JSON序列化更快

问题 我们经常需要在主线程中读取一些配置文件或者缓存数据,最常用的结构化存储数据的方式就是将对象序列化为JSON字符串保存起来,这种方式特别简单而且可以和SharedPrefrence配合使用,因此应用广泛。但是目前用到的Gson在序列化JSON时很慢&a…

屠榜各大CV任务!「百度顶会论文复现营」携Swin Transformer来袭!

目标检测刷到58.7 AP!实例分割刷到51.1 Mask AP!!语义分割在ADE20K上刷到53.5 mIoU!!!......Swin Transformer持续屠榜各大CV任务,并且均名列前茅!通过分层体系结构,带来…

百度任务型对话系统小记

意图扩展阅读: 古月哲亭: AAAI 2021 | 清华提出深度对齐聚类用于新意图发现:https://mp.weixin.qq.com/s/9dNs8TTERPdxmrVc3tF1zw 相关项目地址:https://github.com/thuiar/OKD-Reading-List 古月哲亭: 意图知识图谱的构建与应用&#xff1a…

论文浅尝 - EMNLP2020 | 跨媒体关键词预测: 多模态多头注意力和图像文本的统一框架...

论文笔记整理:柏超宇,东南大学硕士。文章链接:https://arxiv.org/pdf/2011.01565.pdf来源:EMNLP 2020动机社交媒体每天都会产生大量的内容。为了帮助用户快速捕捉所需内容,关键词预测受到越来越多的关注。尽管如此&…

从实际案例聊聊Java应用的GC优化

当Java程序性能达不到既定目标,且其他优化手段都已经穷尽时,通常需要调整垃圾回收器来进一步提高性能,称为GC优化。但GC算法复杂,影响GC性能的参数众多,且参数调整又依赖于应用各自的特点,这些因素很大程度…

LeetCode 162. 寻找峰值(二分查找)

1. 题目 峰值元素是指其值大于左右相邻值的元素。 给定一个输入数组 nums,其中 nums[i] ≠ nums[i1],找到峰值元素并返回其索引。 数组可能包含多个峰值,在这种情况下,返回任何一个峰值所在位置即可。 你可以假设 nums[-1] n…

谷歌:CNN击败Transformer,有望成为预训练界新霸主!LeCun却沉默了...

文 | ????????????????这几年,大家都说深度学习进入了预训练时代。作为一个入行不久的小白,我一直以为各类基于 Transformers 结构的预训练模型是 NLP 的巨大里程碑,CNN、RNN 老矣,只配作为手下败将。大家的文章似…

新词发现简介

原文链接:https://blog.csdn.net/weixin_43378396/article/details/103848628 新词发现是 NLP 的基础任务之一,通过对已有语料进行挖掘,从中识别出新词。新词发现也可称为未登录词识别,严格来讲,新词是指随时代发展而新…

论文浅尝 - AAAI2020 | 利用自然语言推断生成人称一致的对话

链接: https://arxiv.org/pdf/1911.05889.pdf动机虽然最近几年通过利用社交网络上大量人人交互数据训练开放域对话模型取得了很大的成功,但是这些数据驱动的对话系统仍然无法很自然的与人类对话,其中的一个主要问题就是对话系统缺乏一致的角色…

智能投放系统之场景分析最佳实践

美团点评作为业内最大的O2O的平台,以短信/push作为运营手段触达用户的量级巨大,每日数以千万计。 美团点评线上存在超过千万的POI,覆盖超过2000城市、2.5万个后台商圈。在海量数据存在的前提下,实时投放的用户在场景的选择上存在一…

7个提升PyTorch性能的技巧

文 | William Falcon源 | AI公园在过去的10个月里,在PyTorch Lightning工作期间,团队和我已经接触过许多结构PyTorch代码的风格,我们已经发现了一些人们无意中引入瓶颈的关键地方。我们非常小心地确保PyTorch Lightning不会对我们为你自动编写…

论文浅尝 - EMNLP2020 | 基于规则引导的协作 agent 知识图谱推理学习

论文笔记整理:叶橄强,浙江大学在读硕士,研究方向为知识图谱的表示学习和预训练。来源:EMNLP 2020现有的大多数基于行走的模型通过在提供可解释的决策的同时获得良好的性能,在知识图谱推理中显示出其优势。但在遍历过程…

Shield——开源的移动端页面模块化开发框架

一直以来,如何能更高效地开发与维护页面是Android与iOS开发同学最主要的工作和最关心的问题。随着业务的不断发展,根据特定业务场景产生的定制化需求变得越来越多。单一页面往往需要根据不同业务、不同场景甚至不同用户展示不同的内容。在这样的背景下&a…