数据异常排查

  数据异常是每个数据分析师最常见的工作之一,大部分人缺乏方法论,排查起来没有方向感和层次感,这里看看,那里看看,非常耽误时间,可能最后也没有结果。所以,需要认真去制定一套标准化流程去做这件事。

  数据异常主要表现在两个方面,一是数据本身有问题,二是业务本身有问题

  数据异常排查的标准化流程:

  一、前期准备

  1、业务理解。我们知道,所有离开业务谈数据都是耍流氓。比如某个APP的DAU1000万,这个DAU是什么意思?是进程还在,还是打开APP,还是要有主动行为?这几个都是不一样的。

  2、指标口径。数据分析师是负责口径的第一人。比如某个APP的DAU1000万,这个DAU是安卓计算还是苹果计算,是imac计算还是手机号码计算

  3、当前数据产出过程。数据全链路需要搞清楚。比如某个APP的DAU1000万,这个数据是通过哪些报表,经过哪些清洗得到的?

  二、方法论

  1、判断是否异常:根据正确的业务理解,判断别人说的异常是否是真的异常。

  (1)一定要亲自去看所谓的数据异常是否是真实的异常,不要业务方说异常就去排查。要亲自去看数据准确性,业务方不一定专业。

  (2)将报表的时间轴拉长,看是近期异常(3个月)还是历史异常。单纯一周或者一个月的低谷或者高峰不一定是异常,可能是周期性事件。

  (3)看和该指标关联的其他指标或者其他核心指标是否也异常。如有异常,应该一同解决。

  (4)找到一个关键人物(产品/数据),提前沟通一下。提前沟通可以得知一些经验的东西

  2、最大概率法则归类:就那么几种原因,所以要沉淀,按照概率一项一项排查。

  (1)假期效应:开学季、暑假、四大节(春节、清明节、端午节、中秋节)、当地节日

  (2)热点事件:常规热点如世界杯、突发热点如某爆款IP

  (3)活动影响:双11,618,公司层面的活动

  (4)政策影响:互联网金融监管、快递行业实名等

  (5)底层系统故障:数据传输、存储、清洗有无问题

  (6)统计口径:业务逻辑更改、指标计算方式更改

  3、闭环:只有后期得到验证才能说明整个过程没有问题。

  (1)持续跟踪后期数据是否再次异常:确定前期排查的原因是否是正确的,给出建议之后问题有没有解决

  (2)记录、沉淀、文档化:异常排查是非常重视经验的,所以整个排查过程,需要沉淀成文档,方便以后的快速找出异常原因。

  (3)邮件化:只有确认了没有问题再邮件,描述影响范围和主要结论即可。

  三、案例

  某APP的主要用户再东南亚地区,某日DAU突然涨到5000万,与历史数据相比明显异常,问了一圈内部人员后,发现数据采集、传输、活动、业务口径、常规热点都没有变化。

  对照原因归类法则:只有突发热点某爆款IP没有排查,因此进一步深挖。最后发现是一位国宝级的女明星去世,带来大量访问,于是公司紧急调用运营资源,对该女明星的去世事件进行深度剖析,发酵,养成用户口碑,使整体的DAU在短期内提高了10%

  通过数据异常、找到新增长点(使用运营手段去运营,提高整个DAU提高了10%)

 

转载于:https://www.cnblogs.com/HYLering/p/11164517.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/550208.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

二叉排序树(BinarySortTree)

相关知识: 二叉树是每个节点最多有两个子树的树结构。通常子树被称作“左子树”(left subtree)和“右子树”(right subtree)。 二叉树中的左右子树不可随意交换。 根节点:一棵树最上面的节点称为根节点。 父…

fpga初始化错误_FPGA复位设计常见问题及处理方法

一开始接触到FPGA,肯定都知道”复位“,即简单又复杂。简单是因为初学时,只需要按照固定的套路——按键开关复位,见寄存器就先低电平复位一次,这样一般情况可以解决99%的问题,甚至简单的设计,就不…

惠普台式计算机系列,惠普发布设计笔记本、设计台式电脑等Z系列产品

惠普发布新一代惠普Z系列产品,包含设计笔记本、设计台式电脑、显示器和VR等产品。惠普Z系列设计笔记本HP ZBook 14u G6配有4K显示屏,支持100% Adobe RGB色域显示,拥有600尼特亮度,满足创意族群对色彩的精确要求。HP ZBook 15u G6图…

计算机应用需要英语水平,英语对计算机专业的重要性及如何提高英语水平

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼计算机研发人员要掌握的专业英语要求教高,必须掌握大量的专业术语和缩略语; 熟练掌握语法和惯用法的表达方式和功能; 能阅读英文文档和技术资料,阅读熟读在100词/分钟以上; 能借助字典翻译专业技术图书; 能使…

python asyncio 并发编程_asyncio并发编程

一. 事件循环1.注:实现搭配:事件循环回调(驱动生成器【协程】)epoll(IO多路复用),asyncio是Python用于解决异步编程的一整套解决方案;基于asynico:tornado,gevent,twisted(Scrapy,dj…

ORM多表操作之多对多查询

创建多对多的关系 authormodels.ManyToManyFleld(" ")  (推荐) 书籍对象它的所有关联作者 book_obj.authors.all() 掌握:通过filter values(双下划线)进行多对多的关联查询(形式一对多) django是将python语句翻译成sql语句执行 聚…

计算机的iscsi配置,我们将了解如何设置自己的支持iscsi配置的存储节点

iSCSI代表Internet小型计算机系统接口。它用于使用块级数据传输通过TCP / IP访问网络上的存储。NFS与iSCSI之间通常存在比较。关键区别在于NFS是文件级实现,而iSCSI是块级实现。这适用于TCP / IP层,并允许通过局域网(LAN)发送SCSI命令。在诸如iSCSI和光纤…

介词for和with 和of的用法_英语中的for,to,at,of,in,on,with的用法

英语中的for,to,at,of,in,on,with的用法英语中的for,to,at,of,in,on,with的用法人气:594 ℃时间:2019-11-07 00:56:02优质解答一、介词按其构成可分为:1.简单介词 at,in,on,to,since,until 等.如:Hes worked there since 1998.2.复…

转帖:解决System.Data.OracleClient requires Oracle client software version 8.1.7 or greater

原帖:http://blog.csdn.net/killer000777/archive/2008/12/03/3438519.aspx 原来当Oracle 9.2运行在NTFS的分区上时,对于某些非administrator组的用户,ORACLE_HOME 目录是不可见的,而在windows server 2003下Asp.net应用使用的帐户…

超级计算机发展及现状论文,浅谈超级计算机发展的过程及研究现状

摘要:当前,多核技术的不断发展和日渐成熟,使得处理器的性能得到巨大提升.但是对于存储设备来说,无论是速度还是容量都无法跟上这种步伐.随着处理器和其它子系统发展差距的日益加大,超级计算机的效率问题逐渐成为人们讨论和研究的热点,大部分的实际应用在超级计算机上…

P1047 校门外的树 Noip2005普及组第二题

洛谷红题(咳咳)>>>>点击跳转 题目描述 某校大门外长度为L的马路上有一排树,每两棵相邻的树之间的间隔都是11米。我们可以把马路看成一个数轴,马路的一端在数轴00的位置,另一端在LL的位置;数轴上…

裂变红包码的制作_红包墙裂变源码活码玩法 实现多次裂变传播

这是一个移动互联网迅速发展的时代,每个人都是一个自媒体,都有自己的朋友圈和社群。门店除了依靠自己雄厚的实力外,还应该充分用好每个店员的资源,让每个店员这个自媒体为门店所用,将能力发挥到极致。红包推出的超级红…

计算机基础知识复习资料,计算机基础知识复习资料

.Word 资料Ch1 计算机基础知识1.1 现代信息技术1.1.1、特征:●以数字技术和电子技术为基础;●以计算机及其软件为核心;●采用电子技术(包括激光技术)进行信息的收集、传递、加工、存储、显示与控制。1.1.2、数字技术一、二进位数字——比特(b…

linux上安装Docker

Docker的三大核心概念:镜像、容器、仓库 镜像:类似虚拟机的镜像、用俗话说就是安装文件 容器:类似一个轻量级的沙箱,容器是从镜像创建应用运行实例,可以将其启动、开始、停止、删除、而这些容器都是相互隔离、互不可见…

python节日贺卡图片_节日贺卡图片制作手工

手工贺卡,相信你也对贺卡感到很大的兴趣的吧,手工贺卡。手工贺卡范文,欢迎阅读。所需材料:黑纸胶水压钱粉红色的纸具体步骤:1黑色和红色纸剪成宽度为5mm的长条的,画出你喜欢的花树轮廓,使用笔温柔的拉伸黑色…

幼儿园计算机教师论文,幼儿园中班教师论文

幼儿园中班教师论文导语:幼儿教育是什么?幼儿应如何正确接受教育?幼儿接受与不接受教育区别又如 何?这些看似简单的问题,其实不然。在当今科技发达的今天,幼儿的教育起着承前启后的重要阶段,不仅…

ASP.NET 5 入门 (2) – 自定义配置

原文:ASP.NET 5 入门 (2) – 自定义配置ASP.NET 5 入门 (2) – 自定义配置 ASP.NET 5 理解和入门 建立和开发ASP.NET 5 项目 初步理解ASP.NET5的配置 正如我的第一篇文章ASP.NET 5 (vNext) 理解和概述 所说,ASP.NET 5的具有全新的配置机制,我们可以通过以下几点来进行理解: 支持…

中有冒号 文件路径_用Matlab脚本文件实现Excel文件的合并

日常吐槽前段时间跟同事聊天,同事洗脑了一个新的(扎心的)世界观,“人生分三个阶段,20岁时承认父母很平庸,30岁时承认自己很平庸,40岁时承认孩子很平庸”。这是这位同事在孩子学而思考试后的心得…

2019计算机国二操作题,2019年3月计算机二级C++操作练习题及答案(十二)

一、程序改错题使用VC6.0打开考生文件夹下的源程序文件1.cpp,该程序运行时有错,请改正其中的错误,使程序正常运行,输出的结果为Constructor,i0,Destructor注意:错误的语句在//******error******…

最简单的一个 STL格式的网格文件

简介 最简单格式的一个STL格式的文件 文件内容 solid filenamestlfacet normal 1 1 1outer loopvertex 0 0 1vertex 0 1 0vertex 1 0 0endloopendfacet endsolid filenamestl 简单描述 solid filenamestlfacet normal 1 1 1//面的法向量outer loopvertex 0 0 1 // 顶点1vertex …