当多个因素影响一个结果时,我们需要综合考虑这些因素分别对结果德影响。因子评分就是用于比较其对结果德影响程度。
文章目录
- 前言
- 一、案例背景
- 二、解决方案
- (一)分析思路
- (二)剔除无关数据
- (三)求变化值
- (四)求收入评分
- 1. 数据标准化
- 2. 缩放
- 3. 倒数
- (五)求费用评分
- (六)计算综合评分
- 总结
前言
数据分析师的日常工作中,经常会遇到这样的问题,分析某个指标的下降/上升原因,且这个指标并不是受单一因素影响,这时就要求我们综合考虑分析。本文分享数据分析因子评分的学习案例,供各位小伙伴参考。
案例来源:【分析方法】指标下降如何分析?分享一种“因子评分法”,帮你快速定位原因,案例中数据标准化公式可能为原作者笔误,本人做部分修改。
一、案例背景
如下图所示,某新兴打车软件公司,2018年7月渠道引流新用户ROI环比大幅下降,需要排查异常渠道,为业务指明方向。
名词释义:
投资回报率(ROI)=(税前年利润/投资总额)*100%。是指企业从一项投资性商业活动的投资中得到的经济回报,是衡量一个企业盈利状况所使用的比率,也是衡量一个企业经营成果和效率的一项综合性指标。本案例ROI=收入/费用)
二、解决方案
(一)分析思路
由于ROI受收入和费用两个因子影响,单看各渠道ROI无法准确定位到重点异常渠道。可使用因子评分,综合结果得到结论。
(二)剔除无关数据
虽然整体ROI下降近25%,但快手渠道的ROI却上升,分析下降原因时,应先将其剔除。
(三)求变化值
将剩余4各渠道的收入和费用进行差值计算,由于ROI=收入/费用,当收入和费用同时增加时,两者对ROI贡献的影响程度相反。求出“收入变化-费用变化”值,用于判断各渠道对ROI下降的影响。
(四)求收入评分
1. 数据标准化
这里使用其中一种计算方式(极差标准化法),将最大值定为1,最小值定为0,把所有值到压缩到0和1之间,常用于统一数据量级。计算公式为:(x-x最小值)/(x最大值-x最小值),如该案例中,抖音的收入变化计算过程为:(-12540-(-21347))/(720-(-21347))=0.399102733
2. 缩放
在ROI的的计算中,收入作为分子,分子下降越多,ROI值则下降越多,需要将其进行缩放倒数
缩放到0.1~0.9之间,计算公式为:(0.9-0.1)*x+0.1,如该案例中,抖音的缩放计算过程为:(0.9-0.1)*0.399102733+0.1=0.419282186
3. 倒数
倒数,使其与评分正相关(“收入变化”越大,评分越高),计算公式为:1/x
(五)求费用评分
在ROI的计算中,费用作为分母,“费用变化”越大,评分越高。所以不必进行缩放倒数,直接标准化。
(六)计算综合评分
将收入评分与费用评分相加,可以看出,对ROI大幅下降的影响程度:抖音>今日头条>百度>爱奇艺。
总结
以上案例的因子评分,其实分别分析收入和费用两个因子的变化情况,最后综合考虑才得出结论。假设不综合考虑,如下图所示:
- 如果单纯看ROI环比,变化幅度是:抖音>百度>今日头条>爱奇艺;
- 如果单纯看收入变化,影响程度是:今日头条>抖音>百度>爱奇艺;
- 如果单纯看费用变化,影响程度是:抖音>百度>爱奇艺,今日头条费用减少,不会导致ROI下降
从单一角度考虑,都无法得出较准确的结论。所有可以参考上文,从以下几步分析:
- 剔除无关数据
- 求变化值
- 利用数据标准化,求各因子评分(评分旨在达到评分项变化越大,分数越高的效果)
- 综合评分得出结论