信息流推荐多样性

信息流推荐多样性

一、问题现状

信息流产品中一个常见的问题是多样性越来越差,造成这种问题的原因在于机器学习算法本身。下面通过一副系统循环图来介绍多样性差的问题。
多样性系统循环图

  1. 资讯库随机推荐文章,由于是按照全库比例采样,娱乐占比较大,随机推荐给用户的娱乐资讯偏多。
  2. 用户点击娱乐的概率变大,算法根据用户的反馈,会更加倾向于给用户推荐娱乐类的新闻。
  3. 在选资讯入库时,由于娱乐文章的曝光大,ctr置信度高,算法会淘汰比较差的文章,保留比较好的文章,导致资讯库中娱乐类的文章保留概率大。
  4. 由于还有协同过滤算法,导致推荐给其他用户的娱乐资讯也逐渐增多。

随着时间的推移,我们的推荐系统就是娱乐app了,没有其他类别了。

下图反映了去看看比例的变化。
6月12号的资讯曝光分类占比
6月12号的资讯曝光分类占比

  11月18号的资讯曝光分类占比
11月18号的资讯曝光分类占比

由上图可以发现,娱乐占比已经从6月12日的29%上升到11月18日的45%;女人的占比从6%上升到25%。

二、解决方案

解决方案也很简单,只要将系统循环图中的正反馈切断或进行干扰即可。这里选择进行人工干扰。

在这里插入图片描述
为什么选择在资讯入库时进行干扰呢?由图中可以看到,其他推荐给用户的资讯都是算法根据用户兴趣进行计算的,进行干扰对用户体验和用户使用会产生较大的影响。资讯入库这里虽然也会对用户产生影响,但是,相对于其他途径影响较小。

具体怎样进行干扰?固定每个类别的每天资讯入库比例,按照类别比例进行选择。具体设置的类别比例如下:
在这里插入图片描述

三、多样性风险和应对策略

3.1 可能的风险

(1)人均阅读篇数和人均阅读时长下降

多样性执行加入了人工干扰,会将质量较好的娱乐类文章丢弃。预计会对目前的指标有影响,我们将这2个指标控制在下降3%之内。同时,资讯库类别占比达到预设值。

(2)新增用户对其他类别不感兴趣

多样性的改观会在一定程度上对新用户造成影响,如果新用户群体兴趣点只是娱乐,有可能会导致新用户转化降低。

(3)短时间内很难选出其他类别的高质量文章

短时间内,由于曝光不充分,在其他类别资讯选择上,置信度不是很高。选出的资讯质量并不能充分保证,其他类别的效果会明显不如娱乐。

3.2 应对策略

针对以上三种问题,应对策略如下:
(1) 逐步调整,不会一步到位,在控制类别比例的过程中,密切关注数据的变化。使得下降的幅度与多样性修正带来的好处达到一个平衡。

(2) 关注新用户的表现,新用户如果是兴趣多样性的用户,会提升新用户的点击转化。

(3) 随着时间的推移,曝光量的增加,其他类别的高质量文章选择将会越来越精确。

3.3 多样性评估

评估多样性应结合长期指标,目前列了如下,后续将继续跟踪:
在这里插入图片描述

四、 计划说明
计划12月4日与产品达成一致方案,若未按时出,则按此方案执行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/576396.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Robocode教程2——你的第一个robo,取个好名字哦

摘自:http://site.douban.com/widget/notes/7736245/note/210029011/ 你需要准备的东西:1.c语言的知识和一点点的java知识,robocode意在学习java,不要要太深的java水平,你只要理解java和c的区别就可以了。2.robocode A…

UI设计师的面试过程

Palantir Technologies是一家提供分析、整合、可视化各种数据的IT型技术公司。在该公司,前端工程师和后端工程师有同样的面试过程,前端工程师也需要的一定的编程基础。该公司技术博客Palantir TeckBlog日前发表了一篇博文《The UI Design Interview》&am…

数据在市场运营中的应用

数据在市场运营中的应用 1. 背景 目前的产品运营、用户拉新、渠道投放、留存等都是靠人工进行策略制定,有的公司和部门完全靠着以前的经验在尝试互联网产品的市场营销和运营。这样不仅效率很低,而且效果也不显著。 主要存在的问题有以下几点&#xff…

信息流项目计划和思路

目录 一、对项目的认识. 4 1.用户需求和竞品. 4 2. 项目现状. 4 3. 发展前景. 4 二、项目的业务方向和思路. 6 1. 业务方向. 6 2. 2020年目标. 6 3. 思路. 6 3.1用户留存提升(6%->12%). 6 3.2日活提升(30万->80万…

MySQL学习笔记_关于MySQL的字符类型VARCHAR长度知识总结

MySQL学习笔记_关于MySQL的字符类型VARCHAR长度知识总结 一.VARCHAR存储和行长度限制 1.VARCHAR(N)中,N指的是字符的长度,VARCHAR类型最大支持65535,指的是65535个字节,但并不支持65535长度的varchar,65535中应该包含了所有字段的长度、变长字段长度标示…

链表的分类

分类: 单链表 双链表:每一个节点有两个指针域 循环链表:能通过任何一个节点找到其他所有的结点 非循环链表 链表中第一个结点的存储位置叫做头指针,那么整个链表的存取就必须是从头指针开始进行了。之后的每一个结点,其实就是上一个的后继指…

机器学习基础笔记总结

最近在学习latex,将之前的机器学习基础知识相关的笔记用latex整理了以下,源地址如下: https://github.com/duankai/latex_book,感兴趣的可以自由下载,也可以随意使用latex的格式。 pdf 效果如下,文件可在h…

IOS基础:ActionSheet(上拉菜单)的实现

一看图就明白了,毋需多说。 [java] view plaincopyprint?UIActionSheet* mySheet [[UIActionSheet alloc] initWithTitle:"ActionChoose" delegate:self cance…

Word2vec学习笔记总结

git地址: https://github.com/duankai/latex_book/tree/master/word2vec

创建链表和遍历链表算法演示

#include <stdio.h> #include <malloc.h> #include <string.h> #include <stdlib.h>typedef struct Node {int data; //数据域struct Node * pNext; //指针域}Node, *pNode;//函数声明 pNode create_list(); void traverse_list(pNode pHead); int…

@Autowired、@Resource

Autowired通过 Autowired的使用来消除 set &#xff0c;get方法 - Spring 2.5 JPA hibernate 使用方法的点滴整理我们编写spring 框架的代码时候。一直遵循是这样一个规则&#xff1a;所有在spring中注入的bean 都建议定义成私有的域变量。并且要配套写上 get 和 set方法。虽然…

SpringCloud 入门教程(七): 熔断机制 -- 断路器

对断路器模式不太清楚的话&#xff0c;可以参看另一篇博文&#xff1a;断路器&#xff08;Curcuit Breaker&#xff09;模式&#xff0c;下面直接介绍Spring Cloud的断路器如何使用。 SpringCloud Netflix实现了断路器库的名字叫Hystrix. 在微服务架构下&#xff0c;通常会有多…

ABTest系统调研和需求

一、AB测试的必要性 1.1 算法评估 线下可以使用离线的AUC&#xff0c;NDCG等指标进行算法模型的评估&#xff0c;算法上线后怎样进行算法间的评估&#xff0c;上线的算法是好是坏&#xff0c;好多少&#xff1f;坏多少&#xff1f; 要有效评估算法&#xff0c;必须借助AB测试…

SpringCloud 入门教程(八): 断路器指标数据监控Hystrix Dashboard 和 Turbine

1. Hystrix Dashboard (断路器&#xff1a;hystrix 仪表盘) Hystrix一个很重要的功能是&#xff0c;可以通过HystrixCommand收集相关数据指标. Hystrix Dashboard可以很高效的现实每个断路器的健康状况。 1&#xff09;. 在Ribbon服务g和Feign服务的Maven工程的pom.xml中都加…

SpringCloud 入门教程(九): 路由网关zuul

在微服务架构中&#xff0c;需要几个关键的组件&#xff0c;服务注册与发现、服务消费、负载均衡、断路器、智能路由、配置管理等&#xff0c;由这几个组件可以组建一个简单的微服务架构。客户端的请求首先经过负载均衡&#xff08;zuul、Ngnix&#xff09;&#xff0c;再到达服…

33岁的互联网人,看看我自己做了什么?

一、2021年之前 2020年8月中&#xff0c;从一家上市互联网公司离职&#xff0c;离职的原因和其中发生的一些事情也是一言难尽。感谢我当时的直属领导lfp和上层领导zjs&#xff0c;他们教会了我不少的东西&#xff0c;到现在都还有和他们联系&#xff0c;也很感谢我的同事&…

SpringCloud 入门教程(十):和RabbitMQ的整合 -- 消息总线Spring Cloud Netflix Bus

在本教程第三讲Spring Cloud 入门教程(三)&#xff1a; 配置自动刷新中&#xff0c;通过POST方式向客户端发送/refresh请求&#xff0c; 可以让客户端获取到配置的最新变化。但试想一下&#xff0c; 在分布式系统中&#xff0c;如果存在很多个客户端都需要刷新改配置&#xff0…

SpringCloud Eureka参数配置项详解

Eureka涉及到的参数配置项数量众多&#xff0c;它的很多功能都是通过参数配置来实现的&#xff0c;了解这些参数的含义有助于我们更好的应用Eureka的各种功能&#xff0c;下面对Eureka的配置项做具体介绍&#xff0c;供大家参考。 Eureka客户端配置 1、RegistryFetchIntervalSe…