推荐系统概述
- 1.数据部分
- 2.模型部分
- 2.1模型的组成
- 2.2模型的训练
- 2.3模型评估
《深度学习/推荐系统》读书笔记
推荐系统要处理的问题:对于用户U(user),在特定的场景C(context),针对海量的“物品信息”,构建一个模型f(U,I,C)f(U,I,C)f(U,I,C), 预测用户对于特定候选物品I(item)的喜好程度,再依据喜好程度对所有候选物品进行排序,生成推荐列表的问题。
推荐系统的最终优化目标包括两个维度:
- 用户体验的优化
- 公司商业利益的优化
在信息过载的时代,如何高效推荐。
推荐算法工程师要做什么:数据和模型(其实也就是推荐系统涉及的技术)
1.数据部分
收集和处理数据的三种平台,收集原数据,处理原始数据
- 客户端及服务器端实时数据处理
- 流处理平台实时数据处理
- 大数据平台离线数据处理
数据平台的数据出口:
- 模型训练样本数据
- 线上推断特征数据
- 监控系统的统计数据
2.模型部分
2.1模型的组成
召回层–海量候选集中召回用户可能感兴趣的物品
排序–对召回的候选集进行精排
补充策略及算法层–依据某些规则(兼顾多样性,新鲜度,流行性,竞价?)对候选集合进行再排序
在模型部分,最重要的是排序层算法的设计。
2.2模型的训练
离线训练–利用全部样本,逼近全局最优
在线更新–利用新的数据,反映新数据变化趋势,满足实时性需求
2.3模型评估
离线评估
线上A/B测试
(模型的迭代优化。)