如何计算指标波动贡献率?(附Pandas实现)

大家好,我是阿粥

“为什么这个月销售额提升了30%?”

“为什么转化率又降了,同比竟然降低了42%,什么原因导致的呢?”

这些都是数据分析师在工作中经常会遇到的问题,甚至有些基础岗的数据分析师要花80%以上的精力处理这类问题:指标降低或者提升了多少,以及波动的原因是什么。

这类问题可以概括为指标波动归因分析,很多时候用的是根据经验探索拆分的办法,非常占用数据分析师的时间,而且数据分析师获得的价值感也不高。

如果能够找到一些高效定位指标波动原因的方法,形成自动化判断机制,就能大大解放数据分析师的精力,使其能够把更多时间用在专题分析和推动业务上。

今天先讲解几种常见的计算指标波动贡献率的方法,量化波动来源。


一、什么是指标波动贡献率

当核心指标发生了波动,例如销售额从100万元上升到1000万元,分析师的活儿就来了,这个指标的波动可以从多个维度拆解。

  • 渠道维度:天猫渠道、京东渠道、线下渠道等。

  • 新老用户维度:新用户和老用户。

  • 用户属性维度:不同年龄、消费力、兴趣偏好、地区。

  • 其他底层数据能够支持的维度

能拆解的维度很多很多,一般来说,数据分析师根据自身经验,会选择一两个主要的维度优先进行拆解和验证。

例如从渠道维度进行拆解,可以进一步细分为A渠道、B渠道、C渠道三个元素。我们实际关注的是,A、B、C每一个渠道销售额的变化对于整体销售额波动到底有多大影响。

为了量化每一个元素对总体波动的影响程度,我们引入了“贡献率”的概念。贡献率主要回答“每一个元素的变化对总体波动的贡献是多少”这个问题。通常,各元素贡献率之和等于100%,正好可以完全解释总体波动。

需要强调的是,为了避免概念产生歧义,在本章的销售拆解中,渠道、用户、地区是指不同的维度渠道下面具体的渠道值A、B、C称为不同的元素。

对于不同类型的指标,有与之对应的不同的贡献率计算方法。


二、可加型指标

1、计算逻辑

可加型指标是指那些数值可以直接相加的指标,例如访客数、销量、销售额。这里以一个简单的案例来介绍可加型指标的计算方法,案例数据如表14-1所示。

表14-1 可加型指标基础数据

5facf719a0b11249cdbfc86a7835c0ce.png

总体销售额从活动前的11800元上升到活动后的14300元,环比提升21%。总体又可以拆分成A、B、C三个渠道,每个渠道活动前后的销售、环比值我们已经计算好了。

从环比波动的角度来看,B和C两个渠道波动较大。不过,由于B、C两个渠道体量和A差了很多,虽然它们本身波动很大,但对于总体波动的影响并不太大,其环比无法说清楚问题。所以,我们用贡献率来衡量每个渠道对于总体波动的影响。

要计算贡献率,我们先用活动后销售额减活动前销售额,计算出每个渠道销售前后的波动值,如表14-2所示。

表14-2 可加型指标计算波动值

295499570100406e3473fe04b1397c78.png

然后,用每个渠道的波动值除以总体波动值,得到每个渠道波动占总体波动的比重,也就是我们所说的波动贡献率。A渠道的波动贡献率=A渠道波动值/ 总体波动值=1000/2500 = 40%,B渠道的波动贡献率也是40%,C渠道的是20%。具体结果如表14-3所示。

表14-3 可加型指标波动贡献率结果

41162ed8a473e2e138daa98fe54e7e65.png

从波动贡献率可以发现,A和B渠道对于总体波动的贡献(也可以说影响程度)都很大,是最主要的影响因素。而C渠道虽然环比波动167%,但是受限于体量,其波动贡献率只有20%。

2、可加型指标波动贡献率的Pandas实现

我们构造上面的案例数据,before和after分别指代活动前、后销售额:

d1 = pd.DataFrame({'渠道':['A','B','C'],'before':[11000,500,300],'after':[12000,1500,800]})

直接计算环比、波动值、波动贡献率:

d1['环比'] = (d1['after'] - d1['before']) / d1['before']
d1['波动值'] = d1['after'] - d1['before']
d1['波动贡献率'] = d1['波动值'] / d1['波动值'].sum()     
#用每一行波动值除以总体波动值汇总得到贡献度
print(d1)

代码运行结果如下:

渠道 before   after    环比     波动值   波动贡献率
0   A   11000   12000   0.090909   1000     0.4
1   B   500     1500    2.000000   1000     0.4
2   C   300     800     1.666667   500      0.2

三、乘法型指标
1、计算逻辑

还记得我们在电商理论部分提到的指标拆解的黄金公式吗?销售额 = 访客数 X 转化率 X 客单价。

如果销售额出现了异常波动,业务人员大概率会循着这个公式来定位问题,判断访客、转化率、客单价每个指标的波动情况及影响。

在这个场景下,可加型指标波动贡献率的计算方式是无法解决问题的,因为各指标之间是乘法关系,而且量纲不同,无法直接相加减。想要计算出各指标对于总体指标波动的影响,使用对数转换法是条思路。

下面我们一起来看案例数据,如表14-4所示。

表14-4 乘法型指标案例数据

3f679e67a1975fffa650c4adae9df3fb.png

案例数据中,销售额增长了126%,访客数和转化率分别环比提升50%、60%,而客单价环比下降6%。

三个指标对于销售额贡献率的计算,可以使用对数转换对数LN转换

ad328b4df94d6586ba8ae0275af114f4.png 

活动前后访客转化率、客单价每个值进行对数转换,转换后的值就能够套用可加型指标贡献率的计算方法。其中LN是以常数e为底数的对数,例如在Excel中可以直接输入LN(数值)就可以完成转换,计算结果如表14-5所示。

表14-5 乘法型指标LN转换

1f93807b397cc11c2766589bad3558f2.png


将活动前访客数10000用LN(10000)进行转化,得到9.21;对活动后的访客数与其他指标也都做这样的转化。经过转化之后,相关值的波动是可以直接计算的,我们计算LN的差值(LN活动后-LN活动前),如表14-6所示。

表14-6 计算LN转化后的差值

d945b0db327dae1f5750193e380de0df.png

访客数、转化率、客单价的LN差值之和正好等于销售额的LN差值。到这一步,我们可以借用上面介绍的波动占比方法来计算贡献度,用每个元素的LN差值除以总体LN差值(销售额的LN差值),如表14-7所示。

表14-7 乘法型指标波动贡献率的计算

16ce0a49a60596aa5cd4e9da19b3e354.png

最终可以得到:转化率的波动贡献率为57.55%,排名第一;其次是访客数的波动贡献率,为49.65%;而客单价是环比降低的,对应的是负的贡献率。贡献率的总体之和是100%,逻辑自洽。

2、乘法型指标波动贡献率的Pandas实现

依然先构造数据,这次我们把销售额也直接构造出来:

d2 = pd.DataFrame({'指标':['访客数','转化率','客单价','销售额'],'before':[10000,0.05,350,175000],'after':[15000,0.08,330,396000]})

计算环比、LN后的值和波动贡献率:

import numpy as np #numpy的log可以直接计算一个数组d2['环比'] = (d2['after'] - d2['before']) / d2['before']
d2['LN_before'] = np.log(d2['before'])
d2['LN_after'] = np.log(d2['after'])
d2['LN波动值'] =  d2['LN_after'] - d2['LN_before']
d2['波动贡献率'] = d2['LN波动值'] / d2['LN波动值'][3].sum()   
#总体数据索引是3,因此这里用3来找到总体值print(d2)

运行结果如下。

a3df434f3c42e1b59b7f8b51152dc134.png

这样就得到了每个指标对于销售额的波动贡献率。

以上。

上面核心内容来自于我的新书《Python电商数据分析实战:从电商实际案例出发洞悉数据分析全流程》第十四章指标波动归因实战的部分内容。

书中这一章还会详细介绍了除法型指标的计算方法,以及如何用经典算法实现自动指标波动归因。

附上本书的章节目录,按照从后往前顺序,感兴趣的朋友可滑动查看:

2b6b4ae26a7bd67b119bc144f76dd171.png

a17ff1751afe90d7df8f859bb06399c6.png

269bad2822fd8140a4798283d88e10bb.png

15a8effa9c93563a733fd2ad58aa8a34.png

eedc78be4017d5baf2ec0ed83185e0c3.png

bef7765b3b192210ecc823623523bf6a.png

56c5df80ede06624e772516cef862a45.png

1f0a003895e7f2a02b066eef02e87081.png

9b0be35e8b1e82e0cb985a7d67d5fb07.png

<<< 左右滑动查看更多 >>>

最后,我跟出版社争取的京东限时5折福利,原价89元,现在只需要44.5元,只剩最后1天!!!不要错过了~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/607070.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

静态S5在项目管理中的应用与案例分享

静态S5作为一种强大的数据分析工具&#xff0c;不仅在数据处理和可视化方面表现出色&#xff0c;还在项目管理中发挥着重要作用。本篇将通过实际案例分享&#xff0c;探讨静态S5在项目管理中的应用与优势。 一、静态S5在项目管理中的应用 项目进度管理&#xff1a;静态S5通过…

软件测试|深入理解SQL CROSS JOIN:交叉连接

简介 在SQL查询中&#xff0c;CROSS JOIN是一种用于从两个或多个表中获取所有可能组合的连接方式。它不依赖于任何关联条件&#xff0c;而是返回两个表中的每一行与另一个表中的每一行的所有组合。CROSS JOIN可以用于生成笛卡尔积&#xff0c;它在某些情况下非常有用&#xff…

SpringBoot-自定义监听器

Spring Boot提供了强大的事件模型&#xff0c;其中包括多种内置监听器&#xff0c;同时也支持开发者自定义监听器。通过实现ApplicationListener接口&#xff0c;开发者可以创建自己的监听器&#xff0c;并在Spring Boot应用程序中进行配置。这样一来&#xff0c;在特定的应用程…

python 函数中字典的修改会影响函数外字典的值

def modify_dict(d):d[key] new valueprint(函数中字典d的位置,id(d))# 创建一个字典 original_dict {key: old value} print(函数外字典的位置,id(original_dict))# 调用函数来修改字典 modify_dict(original_dict)# 输出原始字典的值&#xff0c;可以看到它已经被修改了 pr…

一种DevOpts的实现方式:基于gitlab的CICD(二)

写在之前 前文已经搭建了基于gitlab的cicd环境&#xff0c;现在我们来更近一步&#xff0c;结合官网给出的案例来详细介绍如何一步一步实现CI的过程。 基于gitlab搭建一个前端静态页面 环境依赖&#xff1a; gitlabgitlab runner&#xff08;docker版本&#xff09; 环境达吉…

04、Kafka ------ 各个功能的作用解释(Cluster、集群、Broker、位移主题、复制因子、领导者副本、主题)

目录 启动命令&#xff1a;CMAK的用法★ 在CMAK中添加 Cluster★ 在CMAK中查看指定集群★ 在CMAK中查看 Broker★ 位移主题★ 复制因子★ 领导者副本和追随者副本★ 查看主题 启动命令&#xff1a; 1、启动 zookeeper 服务器端 小黑窗输入命令&#xff1a; zkServer 2、启动 …

【REST2SQL】06 GO 跨包接口重构代码

【REST2SQL】01RDB关系型数据库REST初设计 【REST2SQL】02 GO连接Oracle数据库 【REST2SQL】03 GO读取JSON文件 【REST2SQL】04 REST2SQL第一版Oracle版实现 【REST2SQL】05 GO 操作 达梦 数据库 对所有关系数据的操作都只有CRUD&#xff0c;采用Go 的接口interface{}重构代码…

Large Language Models Paper 分享

论文1&#xff1a; ChatGPTs One-year Anniversary: Are Open-Source Large Language Models Catching up? 简介 2022年11月&#xff0c;OpenAI发布了ChatGPT&#xff0c;这一事件在AI社区甚至全世界引起了轰动。首次&#xff0c;一个基于应用的AI聊天机器人能够提供有帮助、…

属性动画的使用

文章目录 1 概述2 创建属性动画页面3 属性动画参数调整延时播放时间delay的设置onFinish回调函数的使用 4 关闭属性动画页面5 参考 1 概述 属性动画&#xff0c;是最为基础的动画&#xff0c;其功能强大、使用场景多&#xff0c;应用范围较广。常用于如下场景中&#xff1a; …

第九节HarmonyOS 常用基础组件12-TextTimer

1、描述 通过文本显示计时信息并控制其计时器状态的组件。 2、接口 TextTimer(options?: {isCountDown?: boolean, count?: number, controller?: TextTimerController}) 3、参数 参数名称 参数类型 必填 描述 isCountDown boolean 否 是否倒计时。默认值&#…

Kafka与RabbitMQ的区别

消息队列介绍 消息队列&#xff08;Message Queue&#xff09;是一种在分布式系统中进行异步通信的机制。它允许一个或多个生产者在发送消息时暂时将消息存储在队列中&#xff0c;然后由一个或多个消费者按顺序读取并处理这些消息。 消息队列具有以下特点&#xff1a; 异步通…

64.网游逆向分析与插件开发-游戏增加自动化助手接口-优化自动助手与游戏焦点的切换

内容来源于&#xff1a;易道云信息技术研究院VIP课 上一个内容&#xff1a;自动化助手UI与游戏菜单的对接-CSDN博客 码云地址&#xff08;master分支&#xff09;&#xff1a;https://gitee.com/dye_your_fingers/sro_-ex.git 码云版本号&#xff1a;617ac3477ef18273fb9cc2…

Linux文件系统与日志服务管理

目录 一.Linux文件系统 1.inode表和block &#xff08;1&#xff09;inode &#xff08;2&#xff09;block 2.查看inode号命令 3.Linux系统文件三种主要时间属性 4.磁盘空间还剩余很多但无法继续创建文件 5.inode大小 二.日志 1.日志保存位置 2.日志文件的分类 &a…

Selenium 学习(0.17)——软件测试之流程图绘制方法

病假5天&#xff0c;出去野20天&#xff0c;成功错过了慕课网上的期末考试。 害&#xff0c;都怪玩乐太开心了…… 反正咱又不指着全靠这个行当来吃饭&#xff0c;错过也就错过了&#xff0c;立的Flag能抢救一下还是要抢救一下吧。【这个其实早都会画了&#xff0c;而且基本也正…

Mac robotframework+pycharm运行suite报错情况:ImportError: No module named request

报错实例&#xff1a; 当前Preferences–>Tool–>External Tools Suite配置&#xff0c;显示使用的python为2.7版本&#xff0c;robotframework安装在当前版本的python中&#xff1a; 但是我pycharm现在的环境配置的python为3.11&#xff0c;当前使用的RF与当前使用的py…

NoSQL概述与Redis入门-redis安装与测试

一、Nosql概述 1、为什么使用Nosql 1、单机Mysql时代 90年代,一个网站的访问量一般不会太大&#xff0c;单个数据库完全够用。随着用户增多&#xff0c;网站出现以下问题 数据量增加到一定程度&#xff0c;单机数据库就放不下了数据的索引&#xff08;B Tree&#xff09;,一个…

关于外连接、内连接和子查询的使用(2)

目录 一. 前言 二. 使用外连接、内连接和子查询进行解答 三. 思维导图 一. 前言 在前面我们对外连接、内连接和子查询的使用有了一些了解&#xff0c;今天我们将继续更深入的进行学习。&#xff08;这里缺少的八个题目在博主的前面博客有解答&#xff0c;大家可以移步前面一…

zabbix-proxy代理安装

zabbix-proxy代理安装 安装zabbix-proxyserver端配置zabbix-proxy配置被监控的agent安装中问题解决监控网络设备JMX和IPMI监控方式 zabbix-proxy的安装&#xff0c;至少需要准备三台机器&#xff0c;一台安装服务端&#xff0c;一台安装agent端&#xff0c;这里就不叙述了&…

OBD汽车

相当于客户端与服务器 诊断设备流程 》》》》诊断服务 OBD很多的定死了 Vme就很灵活 WWH 就是两个的结合 OBD15031 SID PID 可以自己定义一些 一个字节255个 两个有效字节 02 01 0D 5555&#xff08;随机值&#xff09;这是请求 两个有效字节 01 OD&#xff08;请求速…

51单片机之按键和数码管

51单片机之按键和数码管 ✍前言&#xff1a;♐独立按键&#x1f600;独立按键的原理&#x1f600;软件实现按键控制LED灯的亮灭 ♐数码管&#x1f60a;数码管显示数字或者字母的原理&#x1f409;共阳极数码管&#x1f409;共阴极极数码管&#x1f409;4位1体数码管 &#x1f6…