聚类分析在用户行为中的实例_用户关注行为数据分析过程详解-描述统计+聚类...

以下是基于一小段用户关注产品的行为数据分析过程详细描述,各位老师如有不同意见或优化建议,还请不吝赐教。

一、数据大致是这样的(已经脱敏处理)

二、数据预处理

从年款提取出年限,从价格标识出价格区间,随便写一下SQL如下:

Select 城市,品牌,2016-substr(年款,1,4) as 年限

,case when

报价<=5 then ‘0~5’

when 报价>5 and 报价<10

then ‘5~10’

when 报价>10 and 报价<15

then ‘10~15’

when 报价>15 and 报价<20

then ‘15~20’

when 报价>20 and 报价<50

then ‘20~50’

Else ‘50以上’end as

报价区间

From 分析表

三、基础描述统计

基础分析一般对数据进行简单的整合操作,描述通过数据能够直观看到的结论,比如:

各地区的用户量占比—反映不同地区的需求量级

各地区的关注品牌top

10%—反映不同地区的品牌需求差异

不同品牌的价格区间—反映用户对于价格的关注情况

年限与价格的变化趋势—新人会觉得这个可以用一下相关分析之类的,其实没有太大必要。

因为,既定报价是受相对严格的市场规则调控的,而本次分析的目的是针对用户对于既定已在线产品的关注度,因此,价格并不是本次分析的主体。

这也响应上一篇文章,并不是越专业的分析越实用。

四、用户聚类

这个分两步,第一步是对数据进行再处理;第二步是分析(SPSS K-means聚类)。

处理结果是将用户日志数据,转变为对每个用户的行为统计数据,基本包括每个用户的关注次数、关注不同品牌数,同一品牌反复关注次数,关注不同价格区间的次数等,大致如下:

第二步是利用SPSS进行聚类分析,并将分析结果翻译为可读性较强的报告,用的是最基本的K-means聚类,以下是部分聚类结果:

结果解读起来并不费劲儿,大致用户划分为3类,每一类的描述数据如表最终聚类中心所示,每一类的用户数量即案例数如表案例数所示。

举例如第一类,可以解释为关注低价品牌的用户数量相对较少,对于品牌的选择也较少(从现实的市场角度讲,应是这部分价格区间的品牌类型本身就少的原因),但反复查看次数多,一定程度上不太利于成交。

以上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/542954.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

centos下升级jdk版本

2019独角兽企业重金招聘Python工程师标准>>> 由于安装的centos系统&#xff0c;自带了jdk1.6和1.7的版本&#xff0c;介于在平时开发&#xff0c;用了1.8.为了保持开发环境的一致&#xff0c;故此需要升级&#xff0c;放办maven打包等工具的使用。 查看系统的jdk版本…

学英语要用计算机吗,学计算机的人是否要学英语?

我记得在我大一的时候,那个时候还没有程序课呢.不过我是很喜欢计算机这个专业的,我也非常想学习编程语言,所以当时即使没有程序课,我也是借了一本VB的书回家来看.当时就在VB的贴吧乱看,大概贴吧里有一个人气很高的一位高手,写了好多文章,也帮人解决好多问题.在他的观点中,他认为…

语言之输出png图片_什么是PPML?如何输出PPML文档?

什么是PPML&#xff1f;PPML是由PODi联盟的几个会员公司共同开发出一种个性化印刷标识语言&#xff0c;这是一种全新的、基于XML(可扩展标识语言&#xff09;技术的印刷行业标准语言&#xff0c;得到越来越多的业内人士关注。PPML采用XML作为句法基础&#xff0c;使PPML其他很多…

TCP/IP协议网络模型

1.tcp/ip分层模型 tcp/ip把网络结构分为四层&#xff0c;从上到下依次为&#xff1a;应用层、传输层、互联网层、网络接口层。每层担任不同的职责&#xff0c;下层服务于上层&#xff0c;最终上层就是用户使用的层。分层结构如图1所示。 图1 tcp/ip分层模型 (1)应用层 向用户提…

c++中函数atan_atan()函数以及C ++中的示例

c中函数atanC atan()函数 (C atan() function) atan() function is a library function of cmath header, it is used to find the principal value of the arc tangent of the given number, it accepts a number (x) and returns the principal value of the arc tangent of…

我想成为计算机专业第一,我对计算机专业学生的忠告。

计算机专业的学生在面临毕业的时候有些同学应该会有这样的想法&#xff0c;我对计算机没有兴趣&#xff0c;毕业不打算从事计算机专业的对口工作&#xff1b;或者我当时选择学计算机专业是因为那时候对计算机有比较大的兴趣&#xff0c;而现在&#xff0c;越来越觉得没有意思了…

job每分钟执行 oracle_Oracle Job 每个时间点执行示例

1:每分钟执行Interval > TRUNC(sysdate,mi) 1/ (24*60)或Interval > sysdate1/14402:每天定时执行例如&#xff1a;每天的凌晨1点执行Interval > TRUNC(sysdate) 1 1/ (24)3:每周定时执行例如&#xff1a;每周一凌晨1点执行Interval >TRUNC(next_day(sysdate,星期…

c#打印程序原码_C#程序打印新行

c#打印程序原码C&#xff03;打印新行 (C# printing a new line) To print a new line within the message while printing it on the console, we can use following methods, 要在控制台上打印消息时在消息中打印新行&#xff0c;我们可以使用以下方法&#xff0c; Using \n…

TMCache

TMCache设计的目的是用于存储临时持久化对象的开源iOS/OS key/value缓存类库&#xff0c;减少重复创建像下载数据、缓慢的处理结果这样的昂贵性能花销。TMCache由两个本身相似的存储组成&#xff0c;一个是TMMemoryCache&#xff0c;存在于内存中&#xff0c;另外一个是TMDisk…

oracle 增量_【干货分享】DMETL中的增量抽取初识

DMETL实现了增量数据的同步。在源表上进行的增删改操作&#xff0c;可以通过增量数据抽取&#xff0c;同步到目的表中。在第一次将源表数据全量抽取到目的表中后&#xff0c;可以通过重复地执行增量数据抽取&#xff0c;将源表上的增删改操作产生的变化数据&#xff0c;无遗漏地…

python中ord函数_ord()函数以及Python中的示例

python中ord函数Python ord()函数 (Python ord() function) ord() function is a library function in Python, it is used to get number value from given character value, it accepts a character and returns an integer i.e. it is used to convert a character to an in…

364. Nested List Weight SumII

题目&#xff1a;Given a nested list of integers, return the sum of all integers in the list weighted by their depth. Each element is either an integer, or a list -- whose elements may also be integers or other lists. Different from the previous question wh…

计算机英语论文摘要,求英语高手翻译论文摘要,非常感谢!

彭洁回答&#xff1a;Thispaperdescribesacomputerlinecuttingtechnologyandcomputeranimationtechnology.Computertechnologyiscuttingwillbedesignatedasagraphicswindowborder,fromalargescreentoextracttherequiredspecificinformation,toshowapartialpictureorView.Comput…

python 示例_在Python中带有示例的while关键字

python 示例关键字的Python (Python for keyword) while is a keyword (case-sensitive) in python, it is used to create a while loop. while是python中的一个关键字(区分大小写)&#xff0c;用于创建while循环。 Syntax of while keyword while关键字的语法 while condit…

向量表示 运动抛物线_初学讲义之高中物理(四)常见运动类型

本章主要介绍几种较为常见的运动模型以及处理思路一、抛物运动抛物运动是一种较为简单的运动模型&#xff0c;在现实生活中非常常见&#xff0c;比如向空中抛球、向河里丢石子&#xff0c;等等。根据抛出方向的不同&#xff0c;抛物运动可以分为竖抛运动、平抛运动和斜抛运动。…

[Array]Majority Element

Given an array of size n, find the majority element. The majority element is the element that appears more than ⌊ n/2 ⌋ times. You may assume that the array is non-empty and the majority element always exist in the array. 方法&#xff1a;充分利用主元素出…

python true_True关键字,带Python示例

python truePython True关键字 (Python True keyword) True is a keyword (case-sensitive) in python, it is a Boolean value (a value of class type bool). True is the result of a comparison operation. True是python中的关键字(区分大小写)&#xff0c;它是一个布尔值(…

zeros什么意思_ma=zeros(n);是什么意思'

x[1 zeros(1,N-1)];这句matlab语句的意思是x[1zeros(1,N-1)];表示第一个位置是1,另N-1个0的行向量.y[a,b]如果a,b为行向量,那么y就是把a,b行向量拼接成另一个新的行向量u [zeros(1,10) 1 zeros(1,生成一个矩阵,其实是一个长度为31的行向量,里面的元素是10个0,一个1,后面还有20…

湖南工业大学在线计算机作业答案,湖南工业大学《计算机组成原理》试题集,共7份,有部分答案...

内容简介&#xff1a;湖南工业大学《计算机组成原理》试题集,共7份,有部分答案一、填空题(每空1分&#xff0c;共25分)1、码值80H:若表示真值0&#xff0c;则为------码&#xff1b;若表示-128&#xff0c;则为------码&#xff1b;若表示-127&#xff0c;则为------码&#xf…

python字母变成数字怎么办_在Python中将字母转换为数字

14 个答案:答案 0 :(得分&#xff1a;71)这样的事情&#xff1a;print [ord(char) - 96 for char in raw_input(Write Text: ).lower()]修改强>既然你让我解释我会...虽然已经在[&#xff1f;]的评论中得到了很好的解释。让我们在更多的一行开始。input raw_input(Write Te…