推荐系统?淘宝?

目录

• 推荐系统概念

• 淘宝的数据

• 淘宝推荐系统应用场景

• 淘宝推荐系统核心算法

• 淘宝推荐系统的设计


• 推荐系统概念

• 淘宝的数据

• 淘宝推荐系统应用场景

• 淘宝推荐系统核心算法

• 淘宝推荐系统的设计

推荐系统定义

维基百科:

form or work from a specific type of information filtering system technique that attempts to recommend information items (item, music, books, news, images etc.) or social elements (e.g. people, events or groups) that are likely to be of interest to the user.

推荐系统作用

• 从用户角度: 提高用户忠诚度 帮助用户快速找到宝贝

• 从网站角度: 提高网站交叉销售能力 提高成交转化率

• 好的推荐系统更像一个有经验的网站导购 员

分类

• 个性化推荐

• 非个性化推荐

推荐与搜索

• 相同点: 帮助用户找到商品

• 不同点: 搜索是通过用户主动输入的关键字进行查询。 推荐则是用户在浏览网站的过程中,不一定需要 用户输入,根据当前网页的上下文进行个性化的 信息输出。

推荐与广告

相同点: – 基于用户行为

• 不同点: – 广告目的是帮助商家推广商品等 – 推荐系统帮助用户找到想要的商品等

推荐与SNS

相同点:它们都有基于人群的共同点产生 推荐

• 不同点:一个是机器,一个是人工

推荐系统的核心

推荐系统产品

• 同类或者相关商品、店铺推荐

• 买了还买、看来还看等

• 猜你喜欢

• 群体信息披露

• 热门排行榜

• etc

大型网站推荐系统组成

• 数据

• 算法(online & offline)

• Messaging system

• Search engine

• NoSQL

• 分布式计算

• 效果评测

数据

• explicit(显式) :能准确的反应用户对物品的真实喜好,但 需要用户付出额外的代价 用户收藏 用户评价
• Implicit(隐式):通过一些分析和处理,才能反映用户的喜 好,只是数据不是很精确,有些行为的分析存在较大的噪音 用户浏览 用户页面停留时间、访问次数

算法

• 算法计算方式 离线: 用户类目偏好、用户购买力分析、 关联性分析、相似矩阵计算等等 在线:排序、过滤、增量计算
• 算法配合大量业务规则 • 没有最好,只有更好!

Messaging system

• 大型系统不可或缺的重要组成部分

• 与其他系统解耦,消息转发

Search engine

文本分析 抽取关键词

• 作为推荐系统的一个信息检索技术 内容相 关性匹配

NoSQL

• 简单

• 高性能

• 方便定制

分布式计算

• 大规模数据统计和运算 • 大数据集合的ETL
MapReduce , Hive、Hadoop 

• 推荐系统概念

• 淘宝的数据

• 淘宝推荐系统应用场景

• 淘宝推荐系统核心算法

• 淘宝推荐系统的设计

淘宝数据特点

• 数据量巨大

数百万店铺

数亿激活用户

数亿的在线商品

数十亿的收藏信息 …… 

  • 商品问题

同一类商品多个卖家

标类

非标类

类目属性正确性

恶意收藏、刷信誉

• 推荐系统概念

• 淘宝的数据

• 淘宝推荐系统应用场景

• 淘宝推荐系统核心算法

• 淘宝推荐系统的设计

应用场景

目前覆盖大小场景60多个,

主要包括

Detail 浏览了还浏览

收藏夹弹出层推荐

  购物车弹出层推荐 

已买到宝贝 你可能感兴趣 

淘宝无线应用 

EDM(重复购买提醒) 

各个垂直频道 

个性化list排序 

开放平台api  。。。

淘宝推荐产品

• 淘宝业务产品丰富,推荐功能穿插其中

• 推荐功能涵盖的范围更广

• 很多场景推荐算法与业务规则相关

• 推荐系统概念

• 淘宝的数据

• 淘宝推荐系统应用场景

• 淘宝推荐系统核心算法

• 淘宝推荐系统的设计

淘宝推荐系统算法

• 基础算法 聚类算法,预测算法,分类算法等,主要 用于产生基础知识库 • 推荐算法 content-based,collaborative-based, Association Rules等等

基础算法

• 预测算法 logistic 回归,通过以点击率为目标,以商品,卖家等因 素作为指标,建立预测模型构建淘宝优质宝贝库

• 分类算法 朴素贝叶斯 商品性别判断(男性,女性,中性) 用户性别判断
• 聚类算法 人群,用户细分 用于降维

推荐算法

• 基于内容推荐 通过给用户和商品标注Tag,通过内容匹配算法,推荐商 品给用户
优点:简单,搜索引擎支持,解决部分冷启动问题 缺点:难以区分商品信息的品质,而且不能为用户发现新的 感兴趣的商品,只能发现和用户已有兴趣相似的商品

• 协同思想 优点:新奇特,个性化程度高 缺点:冷启动,稀疏性

• 关联规则 类目的相关性、商品相关性、人的相关性

效果评测

• 推荐系统的效果需要数据来评测 Offline:

给定输入输出,验证系统的输出 Online : ABTest
衡量指标 CTR  GMV  转换率

• 推荐系统概念

• 淘宝的数据

• 淘宝推荐系统应用场景

• 淘宝推荐系统核心算法

• 淘宝推荐系统的设计

淘宝推荐系统设计

• 提供统一的平台管理各个推荐模块

• 提供高性能分布式存储

• 提供算法的AbTest和效果统计

• 提供灵活算法配置

分布式存储

Treasure存储的数据

• 存储云梯(hadoop)上对用户、商品等原 始数据分析的结果

• 云梯周期性同步,无实时更新

• 为推荐系统提供ABTest存储支持

• 可直接存储部分推荐算法的结果供推荐使 用

• 动态部署

调度系统

• 负责周期性云梯(hadoop)任务调度

• 分布式

• 生产者 消费者

协调系统

• Zookeeper集群

• 智能路由

• 线上与线下联动通知

• Job依赖通知

• 推荐系统是需要不断创新

• 推荐系统与场景和行业相关

 

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/425862.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

android studio 无法输入中文,Android Studio 升级到3.0后输入法中文状态下无法选词的终极解决方案...

AndroidStudio终于出3.0正式版了,内置了kotlin(虽然我安了插件一直能用)。一直忍着没敢下rc版的好奇猫,总算装了正式版。当然,伴随每次大版本更新,总有一些恼人的后遗症,其中以gradle问题最多。AS3.0要求gradle版本在3…

java学习(174):constructor类反射编程

//class反射编程 //定义一个学生类 public class test124 {public String name;protected int age;double height;private double money;public void setName(String name) {this.name name;}public String getName() {return name;}public int getAge() {return age;}public …

[国密算法]一文了解国密算法

国密算法概述1 SM1对称密码2 SM2椭圆曲线公钥密码算法3 SM3杂凑算法4 SM4对称算法5 SM7对称密码6 SM9标识密码算法7 ZUC祖冲之算法总结算法名称算法类别应用领域特点SM1对称密码算法芯片分组长度、密钥长度均为 128 比特SM2公钥密码算法加密ECC椭圆曲线密码机制256位 相比RSA&a…

java学习(175):method类反射机制

//class反射编程 //定义一个学生类 public class test124 {public String name;protected int age;double height;private double money;public void setName(String name) {this.name name;}public String getName() {return name;}public int getAge() {return age;}public …

java-web的mybatis的学习

idea开发必须是把Mapper文件与配置文件放到Resources标记的classpath目录下&#xff0c;eclips好像放到哪都行指定好路径就可以了&#xff0c; maven里面做好配置resources的路径&#xff0c;不然更新依赖 工程结构标记又没了 <build> <resources> <resour…

[Leedcode][JAVA][第85题][第221题][最大正方形][动态规划]

【问题描述】[第221题][最大正方形][中等] 在一个由 0 和 1 组成的二维矩阵内&#xff0c;找到只包含 1 的最大/长方形正方形&#xff0c;并返回其面积。示例:输入: 1 0 1 0 0 1 0 1 1 1 1 1 1 1 1 1 0 0 1 0 长方形 输出: 6 正方形 输出: 4【解答思路】 1. 长方形 暴力 时间…

次时代各制作插件使用方案以及技巧 包括UV 烘焙 减面等

次世代游戏的到来&#xff0c;使游戏行业向前迈进了一大步。次世代本来代表的是拥有更高cpu硬件设施的电视游戏&#xff0c;即戴着头盔能感到wii拳击的震动、拿着拳套能感应阴森恐怖的氛围。绝对让玩家融入气氛的Xbox360的《生化危机5》还带有场景破坏&#xff0c;能打下一片墙…

java学习(177):获取应用程序的路径

import javax.tools.Tool; import java.net.URLDecoder;//获取类路径 public final class test132 {public static String getClassPath(){String pathtest132.class.getClassLoader().getResource( "" ).getPath().toString();try {return URLDecoder.decode( path…

[Leedcode][JAVA][第69题][x的平方根][二分查找][数学]

【问题描述】 实现 int sqrt(int x) 函数。计算并返回 x 的平方根&#xff0c;其中 x 是非负整数。由于返回类型是整数&#xff0c;结果只保留整数的部分&#xff0c;小数部分将被舍去。输入: 8 输出: 2 说明: 8 的平方根是 2.82842..., 由于返回类型是整数&#xff0c;小数部…

高可用的 MFS 文件分布式系统(Drdb+heartbeat+MFS )

理论拓扑 环境准备&#xff1a; N 台 Linux 测试服务器 操作系统版本 CentOS 6.5 32bit ***系统分区要求&#xff1a;需要为格式化的空分区*** IP 地址&#xff1a; mfsmaster&#xff1a;10.3.0.81 心跳 ip 192.168.1.11 mfsbackup&#xff1a;10.3.0.82 …

k-means 聚类过程演示

k-means是一种非监督 &#xff08;从下图 0 当中我们可以看到训练数据并没有标签标注类别&#xff09;的聚类算法&#xff1a; K-Means clustering intends to partition n objects into k clusters in which each object belongs to the cluster with the nearest mean. This …

html网页距离顶部50像素,HTML5 教程之CSS Padding(填充)

CSS Padding(填充)CSS Padding(填充)属性定义元素边框与元素内容之间的空间。Padding(填充)当元素的 Padding(填充)(内边距)被清除时&#xff0c;所"释放"的区域将会受到元素背景颜色的填充。单独使用填充属性可以改变上下左右的填充。缩写填充属性也可以使用&#x…

PHP在金山游戏运营中的应用

PHP在金山游戏官方网站中的应用&#xff1a; ①、PHP团队协作开发&#xff1b; ②、PHP系统架构应用。 PHP在金山游戏运营系统 Keyes 中的应用&#xff1a; ①、分层架构设计模型&#xff1b; ②、通用性API接口设计 PHP在金山游戏官方网站中的应用 PHP团队协作开发环境 PHP…

[Leedcode][JAVA][第236题][二叉树的公共祖先][后序遍历][BFS]

【问题描述】 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。百度百科中最近公共祖先的定义为&#xff1a;“对于有根树 T 的两个结点 p、q&#xff0c;最近公共祖先表示为一个结点 x&#xff0c;满足 x 是 p、q 的祖先且 x 的深度尽可能大&#xff08;一个节点也可…

html鼠标离开点击停留,Javascript DOM事件操作小结(监听鼠标点击、释放,悬停、离开等)...

本文实例总结了Javascript DOM事件操作。分享给大家供大家参考&#xff0c;具体如下&#xff1a;使用JavaScript可以对HTML页面上的各种事件进行监听&#xff0c;如鼠标点击/释放&#xff0c;鼠标悬停/离开&#xff0c;等等。效果图&#xff1a;代码&#xff1a;/p>"ht…

天猫系统的流控降级

目录 1交易应用介绍 2系统挑战及应对 3优雅降级思路 4心得总结 交易应用介绍 购物袋 下单 确认订单 系统挑战及应对 挑战 • 高并发 • 低时延 • 容量有限 • 多外部系统协力&下单信息准确 目标 • 不挂掉 – 不因为容量原因导致网站瘫痪 – 自身的容量 – 后…

[剑指offer]面试题第[68-1]题[Leedcode][JAVA][第235题][二叉搜索树的最近公共祖先][递归][BFS]

【问题描述】[第235题][二叉搜索树的最近公共祖先][简单] 给定一个二叉搜索树, 找到该树中两个指定节点的最近公共祖先。百度百科中最近公共祖先的定义为&#xff1a;“对于有根树 T 的两个结点 p、q&#xff0c;最近公共祖先表示为一个结点 x&#xff0c;满足 x 是 p、q 的祖…

天猫服务系统的架构和经验

主要内容 业务介绍 分析设计过程 过程推演 事件/流程架构及使用场景讨论 基础组件介绍 改进点 业务介绍 业务介绍-业务关键点 产品定位 买家&#xff1a;提供标准的、优质的服务体验卖家&#xff1a;整合各环节资源&#xff0c;提供便捷的产品&#xff1b;提升服务质量、降低…

[Leedcode][JAVA][第50题][Pow(x, n)][快速幂][分治][转换类型]

【问题描述】[第50题][Pow(x, n)][中等] 实现 pow(x, n) &#xff0c;即计算 x 的 n 次幂函数。输入: 2.10000, 3 输出: 9.26100 示例 3:输入: 2.00000, -2 输出: 0.25000 解释: 2-2 1/22 1/4 0.25【解答思路】 1.快速幂 时间复杂度&#xff1a;O(logN) 空间复杂度&#x…