当知识图谱遇上推荐系统之DKN模型(论文笔记一)

Deep Knowledge-Aware Network for News Recommendation

类别:依次学习

首先使用知识图谱特征学习得到实体向量和关系向量,然后将这些低维向量引入推荐系统,学习得到用户向量和物品向量。
在这里插入图片描述
[论文下载链接]https://arxiv.org/abs/1801.08284v1

1、背景

在线新闻推荐系统旨在解决新闻信息爆炸?(文章的数量对用户来说是压倒性的)和为用户制定个性化推荐。

新闻推荐领域的问题:

  1. 新闻文章是高度时间敏感的,它们的相关性在短时间内很快到期。过时的新闻经常被新的新闻取代,这使得传统的基于ID的方法(如协同过滤)效率降低。
  2. 人们在新闻阅读中对主题敏感,因为他们通常对多个特定新闻类别感兴趣。如何基于他对当前候选新闻的多样化阅读历史来动态地测量用户的兴趣是新闻推荐系统的关键。
  3. 新闻语言高度浓缩充满知识实体和常识。然而,传统的语义模型或主题模型只能根据单词的共现或聚类结构找到它们的相关性,但几乎无法发现它们潜在的知识层次的联系。结果,用户的阅读模式将缩小到有限的圆,并且不能基于现有的推荐方法合理地扩展

在本文中,提出了一种利用外部知识进行新闻推荐的新型框架,即深度知识感知网络(DKN)。

2、基础概念

知识图谱特征学习 KGE (预备知识:KGE方法)
基于CNN的句子特征提取(预备知识:CNN模型)

3、问题制定

给定用户 i
用户 i 的点击历史 {ti1,ti2,ti3,…,tiNi} ,其中 tij 是用户 i 点击过的第 j 个新闻标题,Ni 是用户点击过的新闻总数。
新闻标题词序列 t = [w1,w2,…], 其中每个单词 w 可能与知识图谱中的一个实体相关联。

问题描述:给定用户的点击历史,标题单词和知识图谱中实体的关联。我们要预测的是,用户 i 是否会点击一个之前没看过的候选新闻 tj

4、模型框架

从下往上看:
1、用户候选新闻集和用户历史点击新闻集作为输入
2、对于每一条新闻标题,用KCNN提取特征,生成其向量表示
3、使用基于注意力机制的方法匹配候选新闻和历史点击新闻,用不同的权重整合用户历史兴趣作为User embedding
4、将candidate news embedding 和 user embedding 整合放入DNN去计算用户点击候选新闻的可能性
在这里插入图片描述

4.1 知识提取(Knowledge Distillation)

知识提取的过程中将得到三方面的内容:标题中每个单词的embedding、标题中每个单词对应的实体的embedding、每个单词的上下文embedding

一、标题单词embedding

每个单词对应的embedding可以通过word2vec预训练的模型得到。

二、实体embedding
  1. 从标题中抽取KG中定义的entity,并使用Entity linking技术消除歧义
  2. 根据已有知识图谱,得到与标题中涉及的实体链接在一个step之内的所有实体所形成的子图
  3. 基于构建好的子图,使用KGE技术进行得到每个实体的embedding
  4. 得到标题中每个单词对应的实体embedding

在这里插入图片描述

三、上下文embedding

尽管最先进的知识图嵌入方法通常可以保留原始图中的结构信息,但在后续推荐中使用中,单个实体的学习嵌入的信息仍然是有限的。为了帮助识别知识图中实体的位置,为每个实体提取额外的上下文信息。

实体e的上下文是在KG中与e直接相连的entity,表示为:
在这里插入图片描述
上下文embedding用上下文实体的平均值来表示:
在这里插入图片描述

4.2 新闻特征提取(Knowledge-aware CNN)

一、简单拼接方式:

直接将单词向量和实体向量按顺序拼接在一起:
在这里插入图片描述
但这样做存在几方面的限制:

  1. 连接策略打破了单词和相关实体之间的联系,并且不知道它们的对齐方式。
  2. 单词的embedding和对应实体的embedding是通过不同的方法学习的,这意味着它们不适合在单个向量空间中将它们一起进行卷积操作。
  3. 连接策略需要单词的embedding和实体的embedding具有相同的维度,这在实际设置中可能不是最优的,因为词和实体embedding的最佳维度可能彼此不同。
二、多通道和单词-实体对其方式:
  1. 将知识提取中得到的 word embedding、entity embedding、context embedding 作为三个信道输入,分别表示为:
    在这里插入图片描述
    其中函数g可以是线性变换也可以是非线性变换。
    则新闻的输入可以如下表示:
    在这里插入图片描述

  2. 使用类似于RGB图片卷积的方式使用两个不同尺寸的filter进行卷积
    在这里插入图片描述

  3. 最大池化
    在这里插入图片描述
    将结果整合为输出新闻的特征表示向量:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

4.3 基于注意力机制的用户兴趣预测

(预备知识:小白都能看懂的softmax详解)
(预备知识:深度学习中的注意力机制)

  1. 用户对于不同新闻话题的兴趣可能是不同的,为了模拟用户的历史点击新闻对候选新闻不同的影响程度,我们采用如下公式来计算:

在这里插入图片描述
Notation:候选新闻 tj ,用户 i 的历史点击新闻 tik
先将候选新闻与历史点击新闻进行连接,再使用DNN函数H 进行计算,最后用softmax函数输出正则化影响权重。

  1. 则user embedding 可如下计算得到:

在这里插入图片描述

  1. 最后,给定user embedding:e(i) 和 candidate news tj’s embedding:e(tj),
    用户 i 点击候选新闻 tj 的可能性由另一个DNN函数g计算得到。

在这里插入图片描述

5、实验

5.1 数据集

本文的数据来自bing新闻的用户点击日志,包含用户id,新闻url,新闻标题,点击与否(0未点击,1点击)。搜集了2016年10月16日到2017年7月11号的数据作为训练集。2017年7月12号到8月11日的数据作为测试集合。使用的知识图谱数据是Microsoft Satori。以下是一些基本的统计数据以及分布。
在这里插入图片描述

新闻数据集和提取的知识图的基本统计和分布如下所示:
  • 从 a 中可以看出新闻具有时效性,大部分新闻在三天之后几乎没有了阅读量;
  • 从 b 中可以看出新闻数据的稀疏性,用户点击新闻的数量大约在5条以内,使得可供训练的数据较少;
  • c 和 d 表示新闻标题的单词数平均在7.9,新闻标题中涉及的实体数平均在3.7,表明新闻标题中平均每两个单词中就有一个实体,实体出现的高密度证明了KCNN的设计的合理性
  • e 和 f 表示新闻数据集中实体的出现时间的分布以及提取的知识图中的实体的上下文实体的数量的分布。我们可以从这两个数字中得出结论:在线新闻中实体的发生模式是稀疏的并且具有长尾(80.4%的实体发生不超过十次),但实体在知识图中通常具有丰富的上下文:平均数每个实体的上下文实体的数量是42.5,最大值是140,737。因此,上下文实体可以极大地丰富新闻推荐中单个实体的表示

在这里插入图片描述

5.2 评价指标

作者使用的评价指标为 F1-scoreAUC值

5.3 实验对比

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5.4 讨论

  • 使用实体嵌入向量可以提高几乎所有baseline的效果,KPCNN,DeepWide,YouTubeNet
    使用了实体嵌入表示以后分别有1.1%,1.8%,1.1%的提升。但是在DeepFM上提升效果很小,所以实验说明FM类的方法不能很好地利用知识实体。
  • DMF是所有模型中效果最差的一个,可能原因是新闻对时效性要求比较高,生存周期短,基于协同过滤的算法在新闻推荐中效果不佳。
  • 除DMF之外的所有神经网络推荐模型在AUC上都超过了LibFM的baseline模型,说明深度学习模型确实适合建模新闻数据中的一些非线性的关系
  • 本文提出的DKN模型在AUC指标上超过了次好的模型KPCNN,原因主要是(1)DKN使用多通道的词表示与实体表示来建模标题序列,能更好的建模词和实体之间的关系。(2)DKN使用attention机制,针对不同的候选新闻赋予user历史点击不同的权重,能更好地刻画用户的兴趣
  • 在对DKN的变体所做的对比试验中,发现TranseD效果最好。

6、总结

本文针对新闻文本时效性强,包含很多单词实体的特点,提出了DKN模型。
DKN是一种content-based的模型,非常适合用来做新闻点击率预测。其特点是融合了知识图谱与深度学习,从语义层面和知识两个层面对新闻进行表示,实体和单词的对齐机制更是融合了异构的信息源,能更好地捕捉新闻之间的隐含关系。对于不同的候选新闻,DKN使用attention机制来动态地学习用户历史点击的表示。
实验结果表示,加入的实体表示的DKN模型对baseline模型体现了显著的优越性,怎样更充分地利用知识提升深度神经网络的效果是一个重要的研究方向,值得人们探究。

7、DKN模型tensorflow实现

代码地址:https://github.com/hwwang55/DKN

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480203.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

POJ 1936 字符匹配(水题)

题目链接: http://poj.org/problem?id1936 题目大意: 给定字符a,b,问b中去掉一些字符后能不能得到a 解题思路: 暴力从前往后扫描一遍即可。 AC代码: /*** description: poj1936水题* author: michael…

领域应用 | 从数据到智慧,知识图谱如何推动金融更智能?

本文转载在公众号:恒生技术之眼。在《人工智能知识图谱:如何规整海量金融大数据?》一文中,笔者曾提到,面向人工智能的大数据治理,势必能有效支撑智能金融从感知智能向认知智能变革。这是因为目前在资本市场…

2021届秋招算法岗真的要灰飞烟灭了吗?

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 不拖更的夕小瑶2014年末入坑AI,一路见证了AI行业的快速起飞、爆炸、焦虑和冷却。小夕前几天在知乎上看到一个问题《如何看待2021年秋招算法岗灰飞烟灭》被顶上了热榜。有点感叹,怎…

万字长文:近年来学界、业界视角下的“事理图谱”发展总结与思考

一、引言 大部分技术都会经历从提出,到验证,再到修正,再到落地的这样一个过程。事理图谱这个概念从国内学者自2017年提出到现在,已经经历了近4年的时间,那么在这四年的时间里,事理图谱目前处于一个什么…

Redis系列教程(二):详解Redis的存储类型、集群架构、以及应用场景

高并发架构系列 高并发架构系列:数据库主从同步的3种一致性方案实现,及优劣比较 高并发架构系列:Spring Cloud的核心成员、以及架构实现详细介绍 高并发架构系列:服务注册与发现的实现原理、及实现优劣势比较 高并发架构系列&a…

当知识图谱遇上推荐系统之PippleNet模型(论文笔记二)

RippleNet | Propagating User Preferences on the Knowledge 类别:联合学习 将知识图谱特征学习和推荐算法的目标函数结合,使用端到端(end-to-end)的方法进行联合学习。 [论文下载链接]https://arxiv.org/abs/1803.03467 1、…

POJ 3690 找星座(2D匹配)(未解答)

文章目录1. 题目信息1.1 题目链接1.2 题目大意1.3 解题思路2. 代码2.1 Time Limit Exceeded 代码2.2 Time Limit Exceeded 代码2.3 Time Limit Exceeded 代码1. 题目信息 1.1 题目链接 http://poj.org/problem?id3690 1.2 题目大意 给定大的矩阵(天空的样子&am…

综述 | 事件抽取及推理 (上)

本文转载自公众号:知识工场。 事件概要事件是一种重要的知识,近年来,越来越多的工作关注于从开放域或领域文本中抽取结构化事件知识。同时,除了本身就很困难的…

下载 | 李宏毅:1 天搞懂深度学习,我总结了 300 页 PPT

《1 天搞懂深度学习》,300 多页的 ppt,台湾李宏毅教授写的,非常棒。不夸张地说,是我看过最系统,也最通俗易懂的,关于深度学习的文章。这份 300 页的 PPT,被搬运到了 SlideShare 上,下…

史上最全Redis面试49题(含答案):哨兵+复制+事务+集群+持久化等

最全面试题答案系列 史上最强多线程面试44题和答案:线程锁线程池线程同步等 最全MySQL面试60题和答案 史上最全memcached面试26题和答案 史上最全Spring面试71题与答案 今天主要分享redis最全答案系列 Redis主要有哪些功能? 1.哨兵(Sen…

DTW动态时间规整算法

原文地址:https://blog.csdn.net/qcyfred/article/details/53824507 https://zhuanlan.zhihu.com/p/43247215 动态时间规整(DTW)算法简介相忘天涯,深藏于心19 人赞同了该文章DTW最初用于识别语音的相似性。我们用数字表示音调高低…

POJ 3461 字符串匹配(KMP / 哈希(有推导))

文章目录1. 题目1.1 题目链接1.2 题目大意2. Accepted代码2.1 KMP解法2.2 哈希法(有推导过程)1. 题目 1.1 题目链接 http://poj.org/problem?id3461 类似题目:LeetCode 30. 串联所有单词的子串(字符串哈希) 1.2 题…

莫比乌斯:百度凤巢下一代广告召回系统

星标/置顶小屋,带你解锁最萌最前沿的NLP、搜索与推荐技术文 | 江城编 | 夕小瑶今天聊聊百度在最顶级的数据挖掘会议KDD2019的计算广告track上提出的query-ad匹配模型——莫比乌斯(MOBIUS)。这也是百度凤巢下一代广告召回系统的内部代号&#…

当知识图谱遇上推荐系统之MKR模型(论文笔记三)

Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation 类别:交替学习 将知识图谱特征学习和推荐算法视为两个分离但又相关的任务,使用多任务学习的框架进行交替学习。 1、背景 MKR是一个通用的、端对端的深度推荐框架&#xf…

关于话题演化关系网络生成的路线思考:从话题聚类到话题网络展示

话题演化关系网络生成,是实现事件演化追踪的一个重要方法。通过对文本话题进行聚类、内容处理、话题演化关联、话题演化网络的展示,能够在一定程度上为用户揭示出一个事件发展的情况。本文就笔者对该方向的实现路线思考进行总结,分享给大家。…

综述 | 事件抽取及推理 (下)

本文转载在公众号:知识工场 。 上篇事件抽取及推理的推文已经介绍了事件抽取的基本方法,本篇主要介绍事件推理的相关工作。就目前来看,事件方向相关的研究还是以事件抽取为主流任务,当前大多都是在模型的框架和优化方面进行研究。…

Redis系列教程(三):如何解决Redis缓存雪崩、缓存穿透、缓存并发等5大难题

Java相关的面试都会问到缓存的问题:史上最全Redis面试49题(含答案):哨兵复制事务集群持久化等,除此之外还会问到缓存雪崩、缓存穿透、缓存预热、缓存更新、缓存降级等不常见的问题,但却是非常重要的问题,今…

随机森林:提供银行精准营销解决方案

原文地址:https://blog.csdn.net/weixin_34233679/article/details/88480912 本例是根据科赛网练习赛进行练手,学习巩固一下随机森林建模以及应用。 赛题描述本练习赛的数据,选自UCI机器学习库中的「银行营销数据集(Bank Marketing Data Set)…

谁说2021届秋招算法岗一定要灰飞烟灭啦?

没错,这是一碗鸡汤,希望肝完这碗鸡汤的师弟师妹们就不要过度焦虑啦~理性上车,理性下车,希望萌新们都能遇到最适合自己的坑位2014年末入坑AI,一路见证了AI行业的快速起飞、爆炸、焦虑和冷却。小夕前几天在知…

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文链接:https://arxiv.org/pdf/1805.09927.pdf来源:ACL2018Motivation:远程监督是以一种生成关系抽取训练样本的方法,无需人工标注数据。但是远程监督引入了噪音,即存在很多的假正例。本文的出发点非常简单&#xff…