从 0 搭建一个工业级推荐系统

推荐系统从来没像现在这样,影响着我们的生活。当你上网购物时,天猫、京东会为你推荐商品;想了解资讯,头条、知乎会为你准备感兴趣的新闻和知识;想消遣放松,抖音、快手会为你奉上让你欲罢不能的短视频。

而驱动这些巨头进行推荐服务的,就是基于深度学习的推荐模型。

2019 年,阿里的千人千面系统,促成了天猫”双 11“ 2684 亿的成交额。假设通过改进天猫的商品推荐功能,使平台整体的转化率提升 1%,就能在 2684 亿元成交额的基础上,再增加 26.84 亿元。这就是推荐工程师支撑起百万年薪的主要原因。

 

但是,要在一个成熟的推荐系统上,找到提升的突破点或短板并不容易。不能仅仅满足于协同过滤、矩阵分解这类传统方法,而要建立起完整的深度学习推荐系统知识体系,加深对深度学习模型的理解和大数据平台的熟悉程度,才能实现整体效果上的优化。

 

今年上半年,因为疫情抽空看了本书叫《深度学习推荐系统》,对我启发很大,豆瓣评分也挺高的,9.3。作者是王喆,他是 Roku 资深机器学习工程师,推荐系统架构负责人,从业这些年,他一直深耕于推荐系统、计算广告领域,经验非常丰富。

 

最近,得知他和极客时间合作,开设了新的专栏《深度学习推荐系统实战》,我第一时间就订阅了,跟了学了几节,很想把这个专栏推荐给你。

 

在专栏中,他讲解了深度学习推荐系统的经典架构设计,带你掌握 Embedding 技术的主要实现方法,构建完整的推荐系统评估体系路径,搭建出一个工业级的深度学习推荐系统。

 

????扫码免费试读

早鸟+口令「tuijian66」立省 ¥30

原价 ¥99,仅限「前 50 人」有效

 

他是如何讲解这门课程的?

 

在课程设置上,他遵循了经典推荐系统的框架,将课程分为 6 个部分,每节课重点解决一个技术难点,通过 30+ 深度学习推荐系统问题,带你串联起深度学习推荐系统的知识体系,并收获了一套他实践过的深度学习推荐系统开源代码,实现一个工业级的深度学习推荐系统。

 

这是专栏里的学习图谱,方便你了解这门课程的课程设计以及所用到的技术。      



基础架构篇:从推荐系统要解决的主要问题入手,讲解我们要从 0 开始实现的推荐系统, Sparrow RecSys 的主要功能和技术架构,也会用到 Spark、Flink、TensorFlow 等业界最流行的机器学习和大数据框架。

 

特征工程篇:他会和你讨论推荐系统会用到的特征,以及主要的特征处理方式,并且把它们都实践在 Spark 上。除此之外,还会讲解深度学习中非常流行的 Embedding、Graph Embedding 技术,并带你实现 Sparrow Recsys 中的相似电影推荐功能。

 

线上服务篇:在这一部分,他会带你实打实地搭建一个推荐服务器,包括服务器、存储、缓存、模型服务等模块和相关知识,涉及 Jetty Server, Spark、Redis 的使用,带你初步掌握推荐工程师在工程领域的核心技能。

 

推荐模型篇:这一部分是整门课程的重点,带你学习深度学习推荐模型的原理和实现方法,主要包括 Embedding+MLP ,Wide&Deep,PNN 等深度学习模型的架构和 TensorFlow 实现,以及注意力机制、序列模型、增强学习等相关领域的前沿进展。

 

效果评估篇:重点学习效果评估的主要方法和指标,建立起包括线下评估、线上 AB 测试、评估反馈闭环等整套的评估体系,真正能够用业界的方法而不是实验室的指标来评价一个推荐系统。

 

前沿拓展篇:将业界巨头们的深度学习推荐系统方案进行融汇贯通,重点讲解 YouTube、阿里巴巴、微软、Pinterest 等一线公司的深度学习应用,帮你追踪业界发展的最新趋势,并找到自己技术道路的方向。

               

订阅福利

早鸟 + 口令「tuijian66」到手仅 ¥69,

立省 ¥30,仅限「前 50 人」有效。

 

订阅后生成海报发给好友,

每成功邀请 1 位,得 ¥24 返现。

 

????扫码免费试读

 

????点击「阅读原文」,

输入优惠口令「tuijian66」,

以最低价 ¥69 入手,仅限前 50 人。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479946.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文浅尝 | 虚拟知识图谱:软件系统和应用案例综述

本文转载自公众号:DI数据智能。Virtual Knowledge Graphs: An Overview of Systems and Use Cases作者:Guohui Xiao, Linfang Ding, Benjamin Cogrel & Diego Calvanese供稿:Guohui Xiao编者按:Data Intelligence 发表意大利博…

LeetCode 169. 求众数(摩尔投票)

文章目录1. 题目信息2. 解题思路3. 代码3.1 排序3.2 map计数3.3 摩尔投票1. 题目信息 给定一个大小为 n 的数组,找到其中的众数。众数是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。 你可以假设数组是非空的,并且给定的数组总是存在众数。 示例 1:输入…

阿里P8架构师谈:JVM的内存分配、运行原理、回收算法机制

不管是BAT面试,还是工作实践中的JVM调优以及参数设置,或者内存溢出检测等,都需要涉及到Java虚拟机的内存模型、内存分配,以及回收算法机制等,这些都是必考、必会技能。 JVM内存模型 JVM内存模型可以分为两个部分&…

我的BERT!改改字典,让BERT安全提速不掉分(已开源)

文 | 苏剑林编 | 小轶背景当前,大部分中文预训练模型都是以字为基本单位的,也就是说中文语句会被拆分为一个个字。中文也有一些多粒度的语言模型,比如创新工场的ZEN和字节跳动的AMBERT,但这类模型的基本单位还是字,只不…

2020年考证时间表汇总!这些证书值得拥有!

原文地址: https://zhuanlan.zhihu.com/p/100824416 2020年考证时间表汇总!这些证书值得拥有!已认证的官方帐号154 人赞同了该文章昨日之日不可留,2019年已然过去,2020年的我们不能再一成不变!快根据自身情…

征稿 | 2019年全国知识图谱与语义计算大会(CCKS2019)第二轮征稿启事

2019年全国知识图谱与语义计算大会China Conference on Knowledge Graph and Semantic Computing (CCKS 2019)2019年8月24日-27日,杭州征稿截止: 2019年5月18日全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Comp…

直通BAT必考题系列:JVM的4种垃圾回收算法、垃圾回收机制与总结

BAT必考JVM系列专题 直通BAT必考题系列:深入详解JVM内存模型与JVM参数详细配置 垃圾回收算法 1.标记清除 标记-清除算法将垃圾回收分为两个阶段:标记阶段和清除阶段。 在标记阶段首先通过根节点(GC Roots),标记所…

遗传算法及其应用实现

使用遗传算法求解函数具有最大值的点X """ Visualize Genetic Algorithm to find a maximum point in a function. """ import numpy as np import matplotlib.pyplot as pltDNA_SIZE 10 # DNA length POP_SIZE 100 # population size CROSS…

论文浅尝 | 一种嵌入效率极高的 node embedding 方式

论文笔记整理:叶群,浙江大学计算机学院,知识图谱、NLP方向。会议:WSDM 2019链接:https://dl.acm.org/citation.cfm?id3290961Motivation基于spring-electrical的模型在网络可视化中取得了非常成功的应用,一…

重要的,是那些训练中被多次遗忘的样本

文 | kid丶源 | 知乎编 | 兔子酱今天跟大家分享一篇很有意思的文章,是一篇探讨深度学习模型记忆&遗忘机制的文章,是一篇角度很新颖的题材,同时又有一定启发作用。这篇文章发表在深度学习顶会ICLR19,标题是《An empirical stud…

直通BAT必考题系列:7种JVM垃圾收集器特点,优劣势、及使用场景

直通BAT之JVM系列 直通BAT必考题系列:JVM的4种垃圾回收算法、垃圾回收机制与总结 直通BAT必考题系列:深入详解JVM内存模型与JVM参数详细配置 今天继续JVM的垃圾回收器详解,如果说垃圾收集算法是JVM内存回收的方法论,那么垃圾收集…

模拟嫁接技术

模拟嫁接技术:定义嫁接算子及策略剪接算子及策略GPOGA算法总结定义 收益和代价 对一棵生成树 T1,若将某结点的一条分枝移至另一结点作为其一条分枝后产生的生成树为 T2,考察分枝移动前后生成树的边长和的变化,则定义收益(gain)和…

HuggingFace又出炼丹神器!稀疏矩阵运算进入平民化时代!

文 | rumor酱编 | YY一提到模型加速,大家首先想到的就是蒸馏、(结构性)剪枝、量化(FP16),然而稀疏矩阵(sparse matrix)运算一直不被大家青睐。原因也很简单,一是手边没有…

章乐焱 | 用“科技”监管“科技”,知识图谱能做什么?

本文转载自公众号:恒生技术之眼。人工智能、大数据等前沿科技的爆发,推动金融科技进入了一个崭新的时代,也成为监管科技发展的重要推动力。在这个Fintech的黄金时代,前沿科技正在如何赋能监管?这方面,恒生公…

LeetCode 23. 合并K个排序链表(优先队列)

文章目录1. 题目信息2. 思路3. 代码1. 题目信息 合并 k 个排序链表,返回合并后的排序链表。请分析和描述算法的复杂度。 示例:输入: [1->4->5,1->3->4,2->6 ] 输出: 1->1->2->3->4->4->5->6来源:力扣(…

直通BAT必考题系列:JVM性能调优的6大步骤,及关键调优参数详解

JVM系列 直通BAT必考题系列:7种JVM垃圾收集器特点,优劣势、及使用场景 直通BAT必考题系列:JVM的4种垃圾回收算法、垃圾回收机制与总结 直通BAT必考题系列:深入详解JVM内存模型与JVM参数详细配置 JVM内存调优 对JVM内存的系统级…

论文浅尝 | 知识图谱三元组置信度的度量

论文笔记整理:叶橄强,浙江大学计算机学院,知识图谱和知识推理方向。https://arxiv.org/pdf/1809.09414.pdf动机在构建知识图谱的过程中,不可避免地会产生噪声和冲突。基于知识图谱的任务或应用一般默认假定知识图谱中的知识是完全…

跟小伙伴们做了个高效刷论文的小站

好久木有在知乎冒泡了,不知道还能不能出现在大家的timeline上哇QAQ正文开始之前还是先习惯性的碎碎念一下。前段时间换了研究方向,重新pick了问答和检索,为了追上相关问题的最新进展,就顾不上写文的刷了一堆paper,加上…

模拟进化与遗传算法

遗传算法是目前研究得最为广泛的一类模拟进化算法。 假定考虑全局优化问题(P)。遗传算法基于以下两条基本策略求解问题: 对于给定的目标函数F,它使用F的任一适应性函数(换言之,一个值域非负、…

消息中间件系列(六):什么是流量削峰?如何解决秒杀业务的削峰场景

流量削峰的由来 主要是还是来自于互联网的业务场景,例如,马上即将开始的春节火车票抢购,大量的用户需要同一时间去抢购;以及大家熟知的阿里双11秒杀, 短时间上亿的用户涌入,瞬间流量巨大(高并发…