推荐系统的发展与简单回顾

“本文结合百度和支付宝两段推荐系统相关的实习经历,针对工业界的模型发展做了简单梳理与回顾,涵盖表示学习,深度学习,强化学习知识图谱以及多任务学习”

表示学习深度学习在推荐系统中的应用是目前工业界比较成熟的,但是与强化学习知识图谱多任务学习相结合是比较少的, 一方面此类技术与推荐结合才刚刚开始探索,背后有太多问题需要人力去挖掘和探索;另一方面在公司的业务中敢不敢上这种前沿课题的探索与实验甚至上线接大流量,部门老大的魄力很关键。

表示学习

常用类别特征的表示方法:One-Hot Encoding、Look-Up Embedding、Pre-Train Embedding

框架

美团王永康前辈的分享(https://blog.csdn.net/gamer_gyt/article/details/97985818)

序列 Sequence

图 Graph

附加信息 Side Information

Side Information框架是解决冷启动的方法之一。

多模态 Multimodal

更准确来说,这部分属于模式识别范畴,各大公司在业务稳定后基本都会成立单独的内容理解团队(在百度实习的时候隔壁就有一个专门的内容理解组),以分享到外部的资料举例,优酷团队在这方面做的很不错:《优酷在多模态内容理解上的研究及应用》(https://www.infoq.cn/article/xgP_eyfidAA2l5ShcCPp)。

模型层面的应用

此部分详细内容参考下节。

深度学习

企业级的推荐系统为了尽量提高模型的准确性,往往会使用丰富的甚至异构的内容数据。这些特征从不同的维度展现了不同的信息,而且特征间的组合通常是非常有意义的。传统的交叉特征是由工程师手动设计的,这有很大的局限性,成本很高,并且不能拓展到未曾出现过的交叉模式中。因此学者们开始研究用神经网络去自动学习高阶的特征交互模式,弥补人工特征工程带来的种种局限性。

基于深度学习的推荐系统综述(https://coladrill.github.io/2018/08/08/%E5%9F%BA%E4%BA%8E%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E7%9A%84%E6%8E%A8%E8%8D%90%E7%B3%BB%E7%BB%9F%E7%BB%BC%E8%BF%B0/)
浅梦的Github链接(https://github.com/shenweichen/DeepCTR)
最新论文导读(https://zhuanlan.zhihu.com/weichennote)

来源:https://zhuanlan.zhihu.com/p/69050253

2015-2016

  • Convolutional Click Prediction Model [CIKM 2015] A Convolutional Click Prediction Model

  • Factorization-supported Neural Network [ECIR 2016] Deep Learning over Multi-field Categorical Data: A Case Study on User Response Prediction

  • Product-based Neural Network [ICDM 2016] Product-based neural networks for user response prediction

  • Wide & Deep [DLRS 2016]Wide & Deep Learning for Recommender Systems

2017-2018

  • DeepFM [IJCAI 2017]DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

  • Piece-wise Linear Model [arxiv 2017]Learning Piece-wise Linear Models from Large Scale Data for Ad Click Prediction

  • Deep & Cross Network [ADKDD 2017]Deep & Cross Network for Ad Click Predictions

  • Attentional Factorization Machine [IJCAI 2017]Attentional Factorization Machines: Learning the Weight of Feature Interactions via Attention Networks

  • Neural Factorization Machine [SIGIR 2017]Neural Factorization Machines for Sparse Predictive Analytics

  • xDeepFM [KDD 2018]xDeepFM: Combining Explicit and Implicit Feature Interactions for Recommender Systems

2018-2019

  • AutoInt [arxiv 2018]AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks

  • Deep Interest Network [KDD 2018]Deep Interest Network for Click-Through Rate Prediction

  • Deep Interest Evolution Network [AAAI 2019]Deep Interest Evolution Network for Click-Through Rate Prediction

  • NFFM [arxiv 2019]Operation-aware Neural Networks for User Response Prediction

  • FGCNN [WWW 2019]Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction

  • Deep Session Interest Network [IJCAI 2019]Deep Session Interest Network for Click-Through Rate Prediction

  • FiBiNET [RecSys 2019]FiBiNET: Combining Feature Importance and Bilinear feature Interaction for Click-Through Rate Prediction

自动特征工程方面我即将出一篇论文,期待下~

强化学习

用户与推荐系统之间往往会发生持续密切的交互行为,强化学习中的Reward机制十分适合应用到这种模式,所以基于强化学习的推荐方法中,往往会把推荐系统看做智能体(Agent)、把用户看做环境(Environment),商品的推荐问题可以看做经典的顺序决策问题。Agent每一次排序策略的选择可以看做一次试错(Trial and Error),把用户的反馈、点击成交等作为从环境中获得的奖赏。
在支付宝实习的时候,优化CTR模型之余,针对商家线下运营策略推荐场景,主导实现了off-policy的强化学习模型(下图仅作抛砖引玉,模型细节不能公布哈)。

论文整理

  • [ICDM 2018] Self-attentive sequential recommendation

  • [arXiv 2018] Reinforcement Learning for Online Information Seeking

  • [WWW 2018] DRN:A Deep Reinforcement Learning Framework for News Recommendation

  • [SIGIR 2019] Lifelong Sequential Modeling with Personalized Memorization for User Response Prediction

  • [ICML 2019] Generative Adversarial User Model for Reinforcement Learning Based Recommendation System

  • [AAAI 2019] Large-scale Interactive Recommendation with Tree-structured Policy Gradient

  • [arXiv 2019] Reinforcement Learning to Optimize Long-term User Engagement in Recommender Systems

  • [WSDM 2019]Top-K Off-Policy Correction for a REINFORCE Recommender System

  • [arXiv 2019]Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology

机遇与挑战

  1. 离线评估与在线效果之间的巨大鸿沟

  • 离线模拟过程的泛化性问题,特别是用户端连续决策行为的建模方面。

  • 现有方法其实还是有很多问题,例如没有刻画用户反馈行为的连续性与前后相关性、没有考虑用户反馈背后的多因素影响等等。

  1. 动作空间偏大

  • 在真实的推荐系统中面临巨大无比的离散化行为空间(待推荐item集合巨大无比)。

  • 这个问题在这篇文章中已经作出了一些探索,但还没有完全解决这类问题。

  1. 在线效果容易受到其它策略的影响

  • 例如推荐端在使用RL算法,用户还在看到很多其它推荐、展示策略在其它位置、时段、平台推给他的结果,较难精确建模用户反馈与行为归因。

  1. 如何去做更好地探索

  • 因为真实场景中没有游戏环境那样丰富的样本数据,每一次探索都有巨大的显性成本或隐性成本。

  • 更快地探索、更好地采用效率是RL4Rec实际应用中的难题。

知识图谱

Personalized Recommendation Systems: Five Hot Research Topics You Must Know(https://www.microsoft.com/en-us/research/lab/microsoft-research-asia/articles/personalized-recommendation-systems/)

在多数推荐场景中,物品可能包含丰富的知识信息,而刻画这些知识的网络结构即被称为知识图谱。物品端的知识图谱极大地扩展了物品的信息,强化了物品之间的联系,为推荐提供了丰富的参考价值,更能为推荐结果带来额外的 多样性可解释性
和社交网络相比,知识图谱是一种异构网络,因此针对知识图谱的推荐算法设计要更复杂和精巧。近年来,网络特征学习 (network representation learning) 逐渐成为机器学习中的一个热门的研究方向。引入网络特征学习的方法处理推荐系统中知识图谱的相关信息,有助于增强推荐系统的学习能力,提高精确度和用户满意度。将知识图谱引入推荐系统,主要有以下两种不同的处理方式:

  • 基于特征的辅助推荐模型,核心是知识图谱特征学习的引入。即首先使用知识图谱特征学习对其进行处理,从而得到实体和关系的低维稠密向量表示。这些低维的向量表示可以较为自然地与推荐系统进行结合和交互。

  • 基于结构的全局推荐模型,更加直接地使用知识图谱的结构特征。具体来说,对于知识图谱中的每一个实体,我们都进行BFS来获取其在知识图谱中的多跳关联实体从中得到推荐结果。

2018-2019

  • [KDD 2018]Leveraging Meta-path based Context for Top-N Recommendation with A Neural Co-Attention Model

  • [WWW 2019]Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation

  • [WWW 2019]Knowledge Graph Convolutional Networks for Recommender Systems

  • [KDD 2019]KGAT: Knowledge Graph Attention Network for Recommendation

  • [KDD 2019]Knowledge-aware Graph Neural Networks with Label Smoothness Regularization for Recommender Systems

  • [DLP-KDD 2019]An End-to-End Neighborhood-based Interaction Model for Knowledge-enhanced Recommendation

  • [AAAI 2019]Explainable Reasoning over Knowledge Graphs for Recommendation

  • [SIGIR 2019]Reinforcement Knowledge Graph Reasoning for Explainable Recommendation

机遇与挑战

  1. 现有模型都属于统计学习模型,即挖掘网络中的统计学信息并以此进行推断

  • 一个困难但更有研究前景的方向是在网络中进行推理,将图推理与推荐系统相结合。

  1. 如何设计出性能优秀且运行效率高的算法,也是潜在的研究方向

  • 现有模型并不涉及计算引擎层面、系统层面甚至硬件层面的考量,如何将上层算法和底层架构进行联合设计和优化,是实际应用中一个亟待研究的问题。

  1. 现有的模型网络结构都是静态的,在真实场景中,知识图谱具有一定的时效

  • 如何刻画这种时间演变的网络,并在推荐时充分考虑时序信息,也值得我们未来研究。

在工业界中,一方面构建一张图需要花费巨大的人力;另一方面图采样等相关技术还不成熟(暴力地使用GCN、KGAT并不现实)。据目前我所了解到的,在知识图谱工业级应用方面,谷歌和百度是比较前沿的(重视程度源于索引量大且对query质量要求高时的场景需求)。

多任务学习

此部分我了解的比较少,待跟进学习。

  • [RecSys 2019]Recommending what video to watch next: A multitask ranking system

未完待续….

本文原创首发于【浅梦的学习笔记】,想了解更多关于推荐系统的内容,欢迎扫码关注公众号。回复【加群】可以加入我们的交流群一起学习!

浅梦的学习笔记】持续产出推荐/广告/搜索等算法相关技术干货和实践经验。关注公号后台回复口令推荐入门获取推荐系统入门必读的经典论文合集!

浅梦的学习笔记近期文章????

  • 万字长文梳理CTR预估模型发展过程与关系图谱

  • 推荐系统的发展与简单回顾

  • DeepMatch :用于推荐&广告的深度召回匹配算法库

  • 推荐多样性重排算法之MMR

  • 非科班如何拿到外企和国内大厂SSP Offer的?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480641.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析...

MaY, Peng H, Cambria E. Targeted aspect-based sentiment analysis via embedding commonsense knowledge into an attentive LSTM[C]//AAAI. 2018.任务简介特定目标的基于侧面的情感分析,在原来基于侧面的情感分析的基础上,进一步挖掘细粒度的信息&am…

阿里P8架构师谈:MySQL有哪些存储引擎,各自的优缺点,应用场景

经常面试都会问到MYSQL有哪些存储引擎,以及各自的优缺点。今天主要分享常见的存储引擎:MyISAM、InnoDB、MERGE、MEMORY(HEAP)、BDB(BerkeleyDB)等,以及最常用的MyISAM与InnoDB两个引擎 &#xf…

TensorFlow 全网最全学习资料汇总之TensorFlow的技术应用

谷歌于2015年11月发布了全新人工智能系统TensorFlow。该系统可被用于语音识别或照片识别等多项机器深度学习领域,主要针对2011年开发的深度学习基础架构DistBelief进行了各方面的改进,它可在小到一部智能手机、大到数千台数据中心服务器的各种设备上运行…

13个offer,8家SSP,谈谈我的秋招经验

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

领域应用 | 知识图谱的技术与应用

本文转载自公众号:贪心科技。作者 | 李文哲,人工智能、知识图谱领域专家导读:从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的…

阿里P8架构师谈:MySQL慢查询优化、索引优化、以及表等优化总结

MySQL优化概述 MySQL数据库常见的两个瓶颈是:CPU和I/O的瓶颈。 CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据时候。 磁盘I/O瓶颈发生在装入数据远大于内存容量的时候,如果应用分布在网络上,那么查询量相当大的时候那么平瓶颈就…

医药领域知识图谱快速及医药问答项目

QABasedOnMedicaKnowledgeGraph self-implement of disease centered Medical graph from zero to full and sever as question answering base. 从无到有搭建一个以疾病为中心的一定规模医药领域知识图谱,并以该知识图谱完成自动问答与分析服务。 项目介绍 本项…

一文详解深度学习在命名实体识别(NER)中的应用

近几年来,基于神经网络的深度学习方法在计算机视觉、语音识别等领域取得了巨大成功,另外在自然语言处理领域也取得了不少进展。在NLP的关键性基础任务—命名实体识别(Named Entity Recognition,NER)的研究中&#xff0…

如何做机器学习项目规划?一个事半功倍的checklist

一只小狐狸带你解锁 炼丹术&NLP 秘籍前言在接到一个新项目的时候,对其进行合理的安排和规划往往会有事半功倍的效果。下面是从规划30 多个机器学习项目的经验中,提炼出的一个简单有效的checklist。一起来看看叭~项目动机明确你的项目的更广泛的意义。…

论文浅尝 | 一种用于新闻推荐的深度知识感知网络

Citation: Wang H, Zhang F, Xie X, et al. DKN: Deep Knowledge-Aware Networkfor News Recommendation[J]. 2018.Published at: The 27th International Conference on World Wide Web (WWW18)URL:https://arxiv.org/pdf/1801.08284.pdfMotivation推荐系统最初是为…

MySQL数据库主从同步的3种一致性方案实现,及优劣比较

数据主从同步的由来 互联网的很多业务,特别是在高并发的场景下,基本都是读远远大于写,如果数据库读和写的压力都同在一台主机上,这显然不太合理。 于是,把一台数据库主机分为单独的一台写主库(主要负责写操…

中文复合(条件事件、因果事件、顺承事件、反转事件)事理图谱构建项目

ComplexEventExtraction chinese compound event extraction,中文复合事件抽取,包括条件事件、因果事件、顺承事件、反转事件等事件抽取,并形成事理图谱。 项目地址:https://github.com/liuhuanyong/ComplexEventExtraction 关于…

对话系统的简单综述及应用智能客服

https://zhuanlan.zhihu.com/p/52899436 对话系统的简单综述及应用智能客服“天猫精灵,放歌”,”送你一首好听的歌《XXX》“,《XXX》音乐响起...相信有天猫精灵的用户对此场景都不陌生,或者语音操作其他智能音箱设备,比…

硬核推导Google AdaFactor:一个省显存的宝藏优化器

一只小狐狸带你解锁炼丹术&NLP秘籍作者:苏剑林(来自追一科技,人称“苏神”)前言自从GPT、BERT等预训练模型流行起来后,其中一个明显的趋势是模型越做越大,因为更大的模型配合更充分的预训练通常能更有效…

领域应用 | 用知识图谱玩唐诗,“唐诗别苑”附庸端午节的别样风雅!

本文转载自公众号:互联网教育国家工程实验室 。 端午节在每年的农历五月初五,又称端阳节、午日节、五月节等。端午节起源于中国,是古代百越一带崇拜龙图腾的部族举行图腾祭祀的节日。五月初五也是缅…

参加完阿里蚂蚁金服Java中间件6轮面试题!6点血泪总结~

蚂蚁金服一面:分布式架构 50分钟 1、个人介绍加项目介绍20分钟 2、微服务架构是什么,它的优缺点? 3、ACID CAP BASE理论 4、分布式一致性协议,二段、三段、TCC,优缺点 5、RPC过程 6、服务注册中心宕机了怎么办&am…

特定热点事件监控与分析项目

EventMonitor Event monitor based on online news corpus built by Baidu search enginee using event keyword for event storyline and analysis,基于给定事件关键词,采集事件资讯,对事件进行挖掘和分析。 项目地址:https://g…

深度好文:2018 年 NLP 应用和商业化调查报告

、 深度好文:2018 年 NLP 应用和商业化调查报告 Debra 阅读数:7650 2019 年 1 月 11 日近年来,自然语言处理技术已经取得了长足进步,成为应用范围最广泛,也是最为成熟的 AI 技术之一。但实际上,自然语言处理…

论文浅尝 | 通过多原型实体指称向量关联文本和实体

Cao Y,Huang L, Ji H, et al. Bridge Text and Knowledge by Learning Multi-Prototype Entity Mention Embedding[C]// Meeting of the Association for Computational Linguistics. 2017:1623-1633.导读:学术界近两年来十分关注如何将文本等非结构化数据和知识库等…

【面试必备】奉上最通俗易懂的XGBoost、LightGBM、BERT、XLNet原理解析

一只小狐狸带你解锁 炼丹术&NLP 秘籍在非深度学习的机器学习模型中,基于GBDT算法的XGBoost、LightGBM等有着非常优秀的性能,校招算法岗面试中“出镜率”非常高。这些经典的机器学习算法不仅是数据科学竞赛神器,在工业界中也被广泛地使用。…