用户画像系统应用

                                      用户画像系统应用

1 用户信用等级分级

比如在银行根据分级决定给用户贷款的额度,以及贷款的时长,那么怎么对用户分级呢?首先收集大量用户的数据,包括基本属性信息以及用户在使用银行的借记卡,信用卡等等。如果是运营商,用户的入网时间,套餐是什么,每个·月的通话时长消耗流量等,以及整个行为的模式,另外归属地在哪。相关的消费记录...这些都是自身业务能够收集到的数据。

一般用聚类中的k-means聚类,这个用户到底属于哪一类,可能我们也不清楚,可以自动让他分簇,同时要保证评估的效率,就可以用RF(随机森林),就是有多个决策树,把每个决策树的结果求平均得到一个折中的值作为最后的结果。

2 大数据营销当中的应用

在各大网站进程可以看到各种各样的排行榜,比如颜值排行榜,吃货排行榜等等,其实这些排行版就是根据不同类型的用户不同商品消费的情况得到的。用户偏好度是不断变化,那么用户偏好度的标签就不断变化,那么我们的模型也是需要不断的更新,用户画像也是需要不断的更新的。用户偏好的标签通常是通过搜索,浏览,购买等站内行为计算的。也要考虑不同行为的·权重,比如购买的行为是需要掏钱的,代价非常高的,更能代表用户的偏好,可以给更大的权重,如果浏览也是只是一时好奇。

3 用户流失预警

用户流失的模型:比如计算6月份可能流失的用户,至少分析前3个月的行为数据,这个问题是属于非常明确的分类问题,流失为0,不流失为1。这种问题所使用的训练集是前3个月的数据,那么是使用怎么的数据呢?这些特征包括活跃度,登录次数,消费次数等等只要是和主题相关的一切能采集到的数据都能作为用户是否流式的特征·。经过对这些特征的建模,转换成特征向量,使用了分类算法,比如说逻辑回归或GBRT(渐进梯度回归树)。预测出可能会流失用户有针对的退出相关活动等

4 潜在用户分析

通过特征分解,借助一些用户画像系统的流程进行建模进行预测。当建立了全量的用户画像库后就可以轻松的分析用户到底是不是我们潜在的用户,然后分析出来了可以推荐给内容提供商。以在应用中产生注册,付费等的这样用户训练成样本,结合用户特征进行模型训练,从用户画像库中帅选出潜在的用户群体。这个用到的算法用非常简单的Logic Regression逻辑回归就可以了。

5 异常检测与分析(离群点分析)

比如在金融中判断用户是不是欺诈。基于规则,依赖经验准确度第,更好的做法就是基于用户画像,基于全部的用户画像,基于模型用户整个所以的行为包括基本的属性信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/473751.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SVN或其他网盘类软件同步图标不显示的异常

因为Windows Explorer只支持15个ShellIcon显示 所以有些软件为了正常显示其同步状态,就会通过修改自己的ShellIcon名称来抢占这15个名额 只需在注册表中修改下他们的名称,并将所需要展示的Icon的名称顺序提前 重启Explorer进程即可: HKEY_L…

LeetCode 1616. 分割两个字符串得到回文串

文章目录1. 题目2. 解题1. 题目 给你两个字符串 a 和 b ,它们长度相同。 请你选择一个下标,将两个字符串都在 相同的下标 分割开。 由 a 可以得到两个字符串: aprefix 和 asuffix ,满足 a aprefix asuffix ,同理&am…

Kafka基础

Kafka基础 1 消息队列 1.1 什么是消息队列 消息队列(MQ):消息队列,保存消息的队列。消息的传输过程中的容器;主要提供生产、消费接口供外部调用做数据的存储和获取。 1.2 为什么要有消息队列 当网站面对教大的流量…

系统总结学习 Python 的 14 张思维导图

本文主要涵盖了 Python 编程的核心知识(暂不包括标准库及第三方库)。 首先,按顺序依次展示了以下内容的一系列思维导图:基础知识,数据类型(数字,字符串,列表,元组&#x…

LeetCode 1617. 统计子树中城市之间最大距离(枚举所有可能+图的最大直径)

文章目录1. 题目2. 解题1. 题目 给你 n 个城市,编号为从 1 到 n 。同时给你一个大小为 n-1 的数组 edges ,其中 edges[i] [ui, vi] 表示城市 ui 和 vi 之间有一条双向边。 题目保证任意城市之间只有唯一的一条路径。换句话说,所有城市形成了…

HighCharts解析之xAxis——x轴的样式

xAxis:x轴选项 参数 描述 默认值 allowDecimals 轴上的刻度是否允许使用小数 true alternateGridColor 当使用备用的网格颜色时,表格会各行变色 null categories x轴的名称。比如 categories: [Apples, Bananas, Oranges] [] dateTimeLabe…

MYSQL电脑客户端免安装教程以及出现问题解决方案

准备工作:window 7 64位旗舰版 MySQL 5.6.35免安装。 1. 下载MySQL 1.1 进入MySQL官网下载(https://www.mysql.com/)MySQL的安装包。 1.2. 根据自己电脑的位数(32位/64位)来下载响应的MySQL 、 2. 部署MySQL 2.1 解压压缩包到自己的某个盘…

Kafka高性能相关

Kafka高性能相关 1 高性能原因 1.1 高效使用磁盘 (1)顺序写磁盘,顺序写磁盘性能高于随机写内存 (2)Append Only 数据不更新,无记录级的数据删除(只会整个segment删除) &#xf…

Python面试总结(四)ip正则与三次握手四次挥手

1.请简述值传递和引用传递的区别?值传递仅仅传递的是值 引用传递,传递的是内存地址,修改后会改变内存地址对应储存的值。2.请手写一个匹配ip的正则表达式?第一种方法: ((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\…

Android相关sdk使用

SimpleDateFormat使用详解 Android_AlertDialog 两分钟彻底让你明白Android Activity生命周期(图文)!Android布局控件之LinearLayout详解Relative Layout如何正确地使用android中的progressdialog android的Menu使用android Toast大全(五种情形)建立属于…

[Kaggle] Digit Recognizer 手写数字识别(卷积神经网络)

文章目录1. 使用 LeNet 预测1.1 导入包1.2 建立 LeNet 模型1.3 读入数据1.4 定义模型1.5 训练1.6 绘制训练曲线1.7 预测提交2. 使用 VGG16 迁移学习2.1 导入包2.2 定义模型2.3 数据处理2.4 配置模型、训练2.5 预测提交Digit Recognizer 练习地址 相关博文: [Hands …

SparkCore基础

目录 Spark简介 1 什么是Spark 2 Spark特点 3 Spark分布式环境安装 3.1 Spark HA的环境安装 3.2 动态增删一个worker节点到集群 4 Spark核心概念 5 Spark案例 5.2 Master URL 5.3 spark日志的管理 5.4 WordCount案例程序的执行过程 6 Spark作业运行架构图&#xff…

python面试总结(五)内存管理与MYSQL引擎选择

1.python是如何进行内存管理的?当内存中有不再使用的部分时,垃圾收集器就会把他们清理掉 Python引入了机制:引用计数与分代回收。 Python提供了对内存的垃圾收集机制, 但是它将不用的内存放到内存池而不是返回给操作系统。 2.谈…

Codeforces 374A - Inna and Pink Pony

原题地址:http://codeforces.com/contest/374/problem/A 好久没写题目总结了,最近状态十分不好,无论是写程序还是写作业还是精神面貌……NOIP挂了之后总觉得缺乏动力精神难以集中……CF做的也是一塌糊涂,各种pretest passed fail…

LeetCode 1320. 二指输入的的最小距离(动态规划)

文章目录1. 题目2. 解题1. 题目 二指输入法定制键盘在 XY 平面上的布局如上图所示,其中每个大写英文字母都位于某个坐标处, 例如字母 A 位于坐标 (0,0),字母 B 位于坐标 (0,1),字母 P 位于坐标 (2,3) 且字母 Z 位于坐标 (4,1)。 …

Python面试常用二十题总结

1.请至少用一种方法下面字符串的反转? 1).A[::-1] 2).交换前后字母的位置 t list(A) l len(t) for i, j inzip(range(l - 1, 0, -1), range(l // 2)): t[i], t[j] t[j], t[i] return"".join(t) 3). 递归的方式, 每次输出一个字符 defstring_re…

SparkStreaming基础

目录 SparkStreaming基础 1 流式计算 1.1 常见的离线和流式计算框架 2 SparkStreaming简介 2.1 核心概念DStream 2.2 工作原理 2.3 Storm,SparkStreaming和Flink的对比 2.4 如何选择流式处理框架 3 SparkStreaming实时案例 3.1 StreamingContext和Receiver…

【Kaggle微课程】Natural Language Processing - 1. Intro to NLP

文章目录1. 使用 spacy 库进行 NLP2. Tokenizing3. 文本处理4. 模式匹配练习:食谱满意度调查1 在评论中找到菜单项2 对所有的评论匹配3 最不受欢迎的菜4 菜谱出现的次数learn from https://www.kaggle.com/learn/natural-language-processing 1. 使用 spacy 库进行…

谈一谈HTTP中Get与Post的区别与主要应用场景

Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE。URL全称是资源描述符,我们可以这样认为:一个URL地址,它用于描述一个网络上的资源,而H…

Python基础(一)--初识Python

目录 Python基础(一)--初识Python 1 Python基本概念 1.1 什么是Python 1.2 Python的语言特征 1.3 Python的应用领域 2 Python开发环境 2.1 Windows操作系统 2.2 Linux / Mac操作系统 2.3 Python虚拟环境 2.4 Python开发工具 3 环境变量 4 变量…