数据分析思维(一):业务指标(数据分析并非只是简单三板斧)

个人认为,数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。

推荐书本《数据分析思维——分析方法和业务知识》,本文内容就是提取这本书的主体思维,以提高自身的数据分析素养。

先来点鸡汤:学会把书读薄,就要学会总结,撰写学习博客的过程就是加深印象的过程,也是持续提高自身素质的有效方法。冲冲冲!


一、如何理解数据

第一步,当我们拿到一个数据集(通常是Excel数据),我们首先要弄清楚数据每一列的含义,不懂时要及时与数据提供方沟通。

第二步,进行数据分类。

数据分类

数据通常分为3类:

1、用户数据:

用户数据指用户的基本情况,包括姓名、性别、年龄、家庭地址、职业等。

2、行为数据:

行为数据是记录用户做了什么的数据。比如,用户在某网页的停留时间、浏览过哪些产品、购买了什么产品、转发量、收藏数等。

3、产品数据

描述产品的数据(像废话hhh)。比如,产品名称、产品价格、视频、评论、标题、阅读量、发表日期等。

注:从不同角度来看,数据可能属于多个不同类别。比如收藏量,用户收藏,则收藏量定义为行为数据,被用户收藏,则定义为产品数据。数据分类不是绝对,要根据业务来灵活定义。

二、常用指标

什么是指标?引用现代管理学之父的一句名言来定义指标:“如果你不能衡量,那么你就不能有效增长。”(用管理促进企业增长)

如何衡量指标?就是用某个统一标准去衡量业务。

2.1 用户数据指标

用户可以分三类:新增用户、活跃用户(不活跃用户)、留存用户(流失用户)。

我们需要选择合适的指标来衡量用户留存、活跃等情况。

用户数据相关指标有:

  • 新增用户——日新增用户数
  • 活跃用户——活跃率
  • 留存用户——留存率

下面围绕上述3个指标深入讲解:

1、日新增用户数:

日新增用户数——就是产品每日新增的用户的多少。

为什么要关注新增用户?

答:首先,一个产品如果没有用户增长,用户数量就会逐渐减少,产品经营惨淡。其次,新增用户可以反应某推广渠道下产品的推广效果,用于选择和优化产品推广策略。

2、活跃率

怎么定义活跃?不同产品定义不一样,可以用户登录了app,也可以是打开了某个功能,视情况而定。

要计算活跃率,就首先要计算活跃用户数。活跃用户数按时间主要分为以下三种:

  • 日活跃用户数:一天内活跃的用户数。比如,一天内登录过app的用户人数。
  • 周活跃用户数:一周内至少活跃一次的用户数。比如,一周内打开某app的人数。
  • 月活跃用户数:一个月内至少活跃一次的用户数。

统计活跃用户数时要去除重复数据。比如,某一天活跃一次,一个月就活跃30次,那么月活跃用户数是 30 ? 显然不对,同一个人月内活跃多次,也是一个人,月活跃人数是1。

活跃率——即活跃用户占总用户的比值。分为日活跃率、周活跃率、月活跃率等。出现低活跃率往往说明产品存在较大问题,需要想办法提升活跃率。

3、留存率

什么是留存?就是指推广渠道吸引来的新用户经过一段时间后有部分用户逐渐流失,留存下来的用户就是留存用户。比如,某一天新增了一批粉丝关注,一段时间后部分粉丝取关(流失)了,仍旧关注的就是留存用户。

留存率是用来评估产品(功能)对用户的黏性。留存率低,用户流失严重,用想办法提高。

留存率按照时间可以分为次日留存率、第3日留存率、第七日留存率、第30日留存率等。

留存率的40-20-10法则。即次日、第七日、第30日留存率分别为40%、20%和10%时,说明产品数据表现是较好的。

2.2 行为数据指标

行为数据指标包括:PV(访问次数)、UV(访问人数)、转发率、转化率、K因子。

1、PV和UV

PV(Page View):指一定时间内某个页面的浏览次数。比如,某网页一天被打开10次,则PV=10

UV(Unique Visitor):指一定时间内访问某个页面的人数。比如,某用户一天访问10次某网页,但是同一个人,所以 UV=1 ,而不是 UV=10

注:业务不同定义就不同,本质上还是PV和UV。通过 PV 或 UV 可以推断用户喜欢或不喜欢哪个功能或产品,根据用户行为来优化产品(功能)。

2、转发率

许多产品往往通过转发功能实现 “病毒式” 推广。转发率=转发某产品(功能)的用户数 / 看到该产品(功能)的用户数。比如,推送一篇文章给10万用户,转发人数1万,则 转发率 = 1/10 = 10%

3、转化率

转化率的计算方法与特定业务场景有关。

这里的到店人数、看到广告人数实质上就是UV。

4、K因子

K-因子用来衡量推荐效果,即一个发起推荐的用户可以带来多少新用户。

K因子 = 平均每个用户向多少人发起邀请 * 接收到邀请的人转化为新用户的转化率

举个例子:假设平均每个用户向20人发出邀请,而平均转化率为10%,则K因子=20*10%=2。当 K>1 时,新增用户会滚雪球式的增大。k<1时,那么新增用户增加到一定规模时就会停止自传播增长。

2.3 产品数据指标

产品数据指标主要包括:

  • 衡量业务总量的指标——如成交额、成交数量等。
  • 衡量人均情况的指标——如客单价。
  • 衡量付费情况的指标——如付费率、复购率等。
  • 与产品相关的指标

1、业务总量

 分析报告中常常会看到GMV(Gross Merchandise Volume),即成交总额,也是零售业所说的“流水”。特别注意的,成交总额包括销售额、取消订单金额、拒收订单金额和退货订单金额。

 成交数量就是下单的产品数量。

访问时长指用户使用app或网站的总时长。

2、人均情况

衡量人均情况的指标有:人均付费(Average Revenue Per User,ARPU)、付费用户人均付费(Average Revenue Per Paying User,ARPPU)、人均访问时长。其中,人均付费在电商领域也叫客单价。

3、付费情况

主要包括付费率、复购率。

4、产品

产品相关指标指从产品角度去衡量哪些产品好与不会。找出好产品重点推销,不好的产品分析原因。根据业务需求,产品常见指标包括但不限于热销产品数(Top N)、好评产品数、差评产品数等。

2.4 推广付费指标(特定场景用到)

我们在付费推广产品时,需要特定指标来衡量推广效果。主要有以下指标:

1、展示位广告

展示位广告出现在网站或app的顶部或开屏等最显眼的地方。比如,打开某个app时出现的几秒广告。展示位广告——含义是多少人看了该广告,通常按展示次数付费(CPM,Cost Per Mille)。

2、搜索广告

广告主为某一广告关键词出价,按照价格高低排名,出现在用户的搜索结果中。搜索广告——含义是多少人点击了该广告,通常按照点击次数付费(CPC,Cost Per Click)。

3、信息流广告

信息流广告是根据用户兴趣爱好来推荐的。通常按照CPC或者根据投放的实际效果(CPA,Cost Per Action)来付费。

投放的实际效果(CPA)包括:

  • CPD(Download):按照app下载数付费。
  • CPI(Install):按照下载并且安装app的数量(人数)付费。
  • CPS(Sale):按照完成购买的用户数或者销售额付费。

举个生活中的例子:比如,你打开某app时出现的几秒广告,展示的广告按照CPM付费;如果你对广告感兴趣,点击了广告,叫按照CPC付费;如果你点进去并且下了单购买产品(根据情况,可能是下载或按照app),叫按照CPA付费。广告主可以根据需求灵活选择付费标准。

一般来讲,如果推广一个新的产品(可能是app),要选择CPD付费。因为新产品几乎没什么知名度,按照下载数量来衡量更划算。等产品有了一定知名度,再选择CPC或者CPA付费更划算。

三、如何选择指标

这么多指标,如何选择?主要考虑两点:

1、好的数据指标应该是比例。通常情况下,单凭一个总数指标是看不出产品或业务有没有出现什么问题,因此,我们想办法将其转化为某种比例,用比例作为指标更有优势。

举个例子:比如,若告诉你我的活跃粉丝有10万,其实看不出来什么问题,也不知道是多还是少;假如我再告诉你我的总粉丝有1000万,我们可以计算出活跃率为1%,根据活跃率就可以看出来问题所在了(活跃用户比例过低)。

2、根据当前的业务重点,找到“北极星”指标(指引业务方向的核心指标)

“北极星”指标没有唯一的标准,不同公司关注的业务重点不一样,同一个公司在不同阶段的业务重点也不一样。

举个例子:在 Facebook 成立之前,最大社交网站是 myspace,myspace 被 Facebook 打败的原因之一在于,myspace 将“注册用户数”作为其核心指标,而 Facebook 成立之初就将“月活跃用户数”作为其核心指标。

四、指标体系和报表

一个优秀数据分析师要求会“构建指标体系”,也是一项基本技能。

4.1 什么是指标体系

在实际工作和生活中,讲清楚一件事情是不容易的。比如,我们可能听到“大概有1w多人申请贷款吧”、“很多人没有申请通过”、“我们的审核是不是太严格了”等对话。同事之间闲聊是没什么问题,但是向老板汇报或者自己回答业务上的问题时就不能这么说了,1w人是多是少,和什么对比,什么叫“很多人”,究竟是多少,为什么说审核严格。

因此我们需要详细数据和指标来描述问题。比如,今天新增的申请贷款用户为1.1万人,超目标达成1000人,其中申请通过的人数为1100人,申请通过率为10%。

在实际工作中,一个指标往往没有办法解决复杂的业务问题,就需要使用多个指标,从不同维度来评估业务,也就是使用指标体系。简单来讲,指标体系 = 指标 + 体系(业务联系)。一个指标不能叫指标体系,几个毫无关系的指标也不能叫指标体系。

4.2 指标体系有什么用

引入一个例子,判断一个人是否健康,我们可能会涉及体温、血压、体脂率等名词。综合这些来考量,就能确定一个人是否健康,若指标体系的某一指标出现异常,说明可能出现健康问题。判断业务是否健康时也一样。

指标体系的主要作用有以下3点:

  • 监控业务情况(监控业务)
  • 通过拆解指标寻找当前业务问题(排查问题)
  • 评估业务可以改进的地方,找出下一步工作的方向(提供方向)

4.3 如何构建指标体系

关键绩效指标(Key Performance Indicator,简称KPI)

可以按照图中的方法建立指标体系:

(1)明确部门 KPI,找到一级指标

一级指标是用来评价公司或部门情况最核心的指标。比如,某旅游公司在会员积分开销较大,业务部门关心成本,希望合理利用积分抵扣金额,所以定 KPI 为积分抵扣金额,也即一级指标。

一级指标并非只能为一个指标,可能需要多个指标综合评价业务(即多个KPI)。比如,某公司希望产品新增更多用户数,并且希望他们都很活跃,这时公司的 KPI 就有为新增用户数、活跃率两个。

(2)了解业务运营情况,找到二级指标。(细分一级指标)

得到一级指标后,我们需要拆解一级指标为二级指标。如何拆解?根据具体业务。比如,从会员角度拆解,积分抵扣金额 = 积分抵扣会员数 * 人均抵扣金额。二级指标就是积分抵扣会员数、人均抵扣金额。

(3)梳理业务流程,找到三级指标。

一级指标往往是业务的最后一个结果,比如积分抵扣金额。细分一级指标为二级指标后,二级指标可能也不足以监督、改进业务流程,就需要继续拆解为三级指标。

继续上面的例子,有业务流程(会员→购买业务产品→使用积分抵扣金额→支付金额),我们可能需要监测不同等级会员的情况,以便及时发现问题或优化针对性策略。这时候我们就将二级指标继续细分为三级指标,积分抵扣会员数 =(抵扣积分的Lv.1会员数 + 抵扣积分的Lv.2会员数......),而人均抵扣金额 = sum(各个Lv等级的人均抵扣金额)。

复杂来说,形成的指标体系金字塔可以为:

 (4)通过报表监控指标,不断更新指标

(可视化)报表就是通过表格、图表来展示指标,从而帮助部门掌握业务情况。日报——每天汇总更新的报表,周报——每周汇总更新的报表。必要时可以制作动态报表。

4.4 如何制作报表

1、需求分析

制作报表的目的是什么?希望从报表上知道什么问题?

2、建立指标体系

什么样的指标体系能满足业务需求?

3、设计展现形式

如何展示数据,以便业务部门更容易理解数据?比如给报表增加筛选器等。

4、编写需求文档

将上述指标体系和报表需求整理成一份需求文档,发给开发部门。

5、验证数据

报表开发出来并验证数据没有问题后,就可以告知业务部门了。

五、注意事项

注意避免以下几种情况:

1、没有一级指标,抓不住重点。

你获得了离职同事交接过来的报表,或者时领导给你的指标,而你只是负责更新报表。你要知道为什么要这样做报表,就必须知道一级指标,如果不是根据一级指标做事,会闹笑话的。我们要依葫芦画瓢。

2、指标之间没有逻辑关系。

你的报表指标虽多,但是指标之间没有逻辑联系。出现问题时候,就会找不到对应业务节点,没法解决问题。

3、拆解的指标没有意义。

要注意围绕业务目标拆解指标。有的报表指标很丰富,但是没有实际业务意义,报表就变成没用数字堆积成的“废表”。

4、自己独自一人完成指标体系和报表,没有和业务部门沟通。

零沟通是大忌!没有沟通制作出来的东西毛病多多,浪费时间精力,还不能有效解决业务问题。各部门之间是紧密协作的!

# 文章若对大噶有帮助的话,点个赞支持一下呗。我想知道自己写得有多烂 hhhhhhh

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/64104.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

系统思考—战略决策

别用管理上的勤奋&#xff0c;来掩盖经营上的懒惰。 日本一家物业公司&#xff0c;因经营不善&#xff0c;面临生死存亡的危机。老板为了扭转局面&#xff0c;采取了很多管理手段——提高员工积极性&#xff0c;推行业绩与绩效挂钩&#xff0c;实施各种考核制度。然而&#xf…

选择WordPress和Shopify:搭建对谷歌SEO友好的网站

在建设网站时&#xff0c;不仅要考虑它的美观和功能性&#xff0c;还要关注它是否对谷歌SEO友好。如果你希望网站能够获得更好的搜索排名&#xff0c;WordPress和Shopify是两个值得推荐的建站平台。 WordPress作为最流行的内容管理系统&#xff0c;其强大的灵活性和丰富的插件…

【研发经验】工作流和规则引擎的应用与场景

工作流引擎和规则引擎是两种常见的软件技术&#xff0c;可以被应用于各种场景中&#xff0c; 例如&#xff1a; 业务流程自动化&#xff1a;工作流引擎可以用于自动化和管理各种业务流程&#xff0c;例如审批流程&#xff0c;订单处理流程&#xff0c;客户服务流程等。它可以定…

html自带的input年月日(date) /时间(datetime-local)/星期(week)/月份(month)/时间(time)控件

年月日期控件 type"date" <input type"date" id"StartDate" valueDateTime.Now.ToString("yyyy-MM-dd") /> //设置值 $("#StartDate").val("2024-12-12"); //获取值 var StartDate$("#StartDate&quo…

【量化中的复权数据详解】

【复权计算方法】 股票会时不时的发生现金分红、送股等一系列股本变动&#xff0c;这会造成股价的非正常变化&#xff0c;导致我们不能直接通过股价来计算股票的涨跌幅。例如一个股票是10元&#xff0c;当他10送10的时候&#xff0c;它的价格会变成5元&#xff0c;但是我们并不…

【WRF安装】WRF编译错误总结1:HDF5库包安装

目录 1 HDF5库包安装有误&#xff1a;HDF5 not set in environment. Will configure WRF for use without.HDF5的重新编译 错误原因1&#xff1a;提示 overflow 错误1. 检查系统是否缺少依赖库或工具2. 检查和更新编译器版本3. 检查 ./configure 报错信息4. 检查系统环境变量5.…

生成式 AI 在个人层面的认知与应用

随着生成式人工智能技术的不断成熟和创新&#xff0c;其在各行各业的应用正在逐步拓展&#xff0c;展现出巨大的潜力和价值。我国政策对生成式 AI的支持和鼓励&#xff0c;不仅是对其潜力的认可&#xff0c;更是对其未来在推动社会进步和经济发展中作用的肯定。然而&#xff0c…

泛型编程--

auto自动推导数据类型 函数模板 定义和调用 函数模板具体化 函数模板通用版本之外的一个特殊版本 函数模板 具体化函数 &#xff0c;它们的声明和定义都可以分开写。 声明 定义 函数模板写变量 模板参数缺省 类成员函数作为函数模板 类构造函数是函数模板 函数模板重载 函数模…

Qt编写RK3588视频播放器/支持RKMPP硬解/支持各种视音频文件和视频流/海康大华视频监控

一、前言 用ffmpeg做硬解码开发&#xff0c;参考自带的示例hw_decode.c即可&#xff0c;里面提供了通用的dxva2/d3d11va/vaapi这种系统层面封装的硬解码&#xff0c;也就是无需区分用的何种显卡&#xff0c;操作系统自动调度&#xff0c;基本上满足了各种场景的需要&#xff0…

迎接全新的 Kotlin 支持 – K2 模式:基本信息

K2 模式有什么作用&#xff1f; K2 模式是 IntelliJ IDEA 中 Kotlin 支持的新实现&#xff0c;它可以提高 IDE 的稳定性&#xff0c;同时也会为支持未来 Kotlin 语言功能奠定基础。 K2 模式与 Kotlin K2 编译器有什么区别&#xff1f; K2 编译器负责编译 Kotlin 语言 2.0 或…

设计模式の建造者适配器桥接模式

文章目录 前言一、建造者模式二、适配器模式2.1、对象适配器2.2、接口适配器 三、桥接模式 前言 本篇是关于设计模式中建造者模式、适配器模式&#xff08;3种&#xff09;、以及桥接模式的笔记。 一、建造者模式 建造者模式是属于创建型设计模式&#xff0c;通过一步步构建一个…

智能引导小车充电系统设计(论文+源码)

1总体方案设计 在16*16点阵LED字符显示器的设计中&#xff0c;系统总体框架如图2.4所示&#xff0c;包括单片机主控模复位电路模块、晶振电路模块、按键电路模块、LED点阵驱动电路模块&#xff0c;蓝牙模块等构成。系统功能实现主要是利用系统在软件程序编写过程中&#xff0c…

PCIe学习笔记

PCIE高速串行数据总线 当拿到一块板子 比如你要用到PCIE 首先要看这块板子的原理图 一般原理图写的是 PCI express 表示PCIE 以下是Netfpga为例下的PCIE插口元件原理图 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/01dc604fbdc847e8998a978c83c7b2eb.png 一般主…

RabbitMQ实现消息发送接收——实战篇(路由模式)

本篇博文将带领大家一起学习rabbitMQ如何进行消息发送接收&#xff0c;我也是在写项目的时候边学边写&#xff0c;有不足的地方希望在评论区留下你的建议&#xff0c;我们一起讨论学习呀~ 需求背景 先说一下我的项目需求背景&#xff0c;社区之间可以进行物资借用&#xff0c…

The Past, Present and Future of Apache Flink

摘要&#xff1a;本文整理自阿里云开源大数据负责人王峰&#xff08;莫问&#xff09;在 Flink Forward Asia 2024上海站主论坛开场的分享&#xff0c;今年正值Flink开源项目诞生的第10周年&#xff0c;借此时机&#xff0c;王峰回顾了Flink在过去10年的发展历程以及 Flink社区…

城市大脑新型智慧城市数据中台建设方案

建设背景与现状 随着城市化进程的加速&#xff0c;城市数据呈现出爆炸式增长&#xff0c;但数据的整合、共享和利用却面临诸多挑战。信息孤岛、数据冗余、管理分散等问题日益突出&#xff0c;制约了智慧城市的发展。为了解决这些问题&#xff0c;构建城市大脑新型智慧城市数据…

力扣-图论-12【算法学习day.62】

前言 ###我做这类文章一个重要的目的还是给正在学习的大家提供方向和记录学习过程&#xff08;例如想要掌握基础用法&#xff0c;该刷哪些题&#xff1f;&#xff09;我的解析也不会做的非常详细&#xff0c;只会提供思路和一些关键点&#xff0c;力扣上的大佬们的题解质量是非…

每日一站技術架構解析之-cc手機桌布網

# 網站技術架構解析&#xff1a; ## 一、整體架構概述https://tw.ccwallpaper.com是一個提供手機壁紙、桌布免費下載的網站&#xff0c;其技術架構設計旨在實現高效的圖片資源管理與用戶訪問體驗優化。 ### &#xff08;一&#xff09;前端展示 1. **HTML/CSS/JavaScript基礎構…

代码随想录算法训练营第三十二天|动态规划理论基础|LC509.肥波那些数|LC70.爬楼梯|LC746.使用最小花费爬楼梯

动态规划理论基础 解释&#xff1a;动态规划&#xff0c;英文&#xff1a;Dynamic Programming&#xff0c;简称DP&#xff1b;如果某一问题有很多重叠子问题&#xff0c;使用动态规划是最有效的。 动态规划五部曲&#xff1a; 1、确定dp数组&#xff08;dp table&#xff09;…

RabbitMQ Work Queues (工作队列模式) 使用案例

Hi~&#xff01;这里是奋斗的明志&#xff0c;很荣幸您能阅读我的文章&#xff0c;诚请评论指点&#xff0c;欢迎欢迎 ~~ &#x1f331;&#x1f331;个人主页&#xff1a;奋斗的明志 &#x1f331;&#x1f331;所属专栏&#xff1a;RabbitMQ &#x1f4da;本系列文章为个人学…