这个时代最重要的技能之一(数据分析)

大家好,我是Z哥。

首先说明一下,今天不卖课程哈,就单纯聊聊我在做数据分析时的一些经验。

在如今这个数据爆炸的时代,我们每天不管是主动还是被动,都会面对大量的数据扑面而来。

如果有较好的数据分析能力,不管是对你的生活还是工作,都将带来巨大的帮助。因为你比别人拥有更好的“洞察力”,看到别人看不到的信息,这些信息可以帮助你更好地做出决策。

很多人做数据分析的时候经常会遇到一个问题,面前摆着一堆海量的数据,但是不知道怎么分析,从何下手,以此来得到一些有用的结论。

我最开始也深受这个问题的困扰,想了好久才明白这里的问题所在,所以今天我把我思考后的思路分享给你,希望能对你有所帮助。

一个合理的数据分析思路,不但可以帮助你高效地获得对你有价值的信息,还能提高结论的准确性。

我的思路其实是一个构建「点->线->面->体」的过程,主要分为以下六个步骤。

/01  带着目的/

如果你会觉得无从下手,大概率是因为目的不明确,或者说缺少目的。

没有目的,何以解决问题?寄希望于某个牛逼的方法能够“点石成金”?但是,谁来告诉你这个方法呢?靠上帝吗?

这个道理说透了其实很容易明白,但现实却是很多人陷在数据的海洋中无法自拔,认为先收集足够多的数据,然后再分析,就能从中得到一些有价值的结论。这个逻辑其实你细想一下是有问题的,因为不同的人看待同样的数据得出的结论往往是不同的。因此,如果你没有清晰的目的,再多的数据也没有意义。

所以,先确定目的就是先明确「点」,只有有了「点」,我们才能继续延伸去构建我们的「线面体」。

目的一般分为以下两种。

  1. 找原因。当前面临一些问题,从数据中找出相关因素。

  2. 找规律。从数据中提炼出一些规律,趋势,帮助未来做决策。

所以,不妨先明确一下,你是要找原因?还是找规律?

比如,我们分析网站访问量为什么下滑。很明显,这个目的是「找原因」。

/02  分解目的/

明确了目的,就有了一个大方向,剩下的就是分解目的。

分解目的的方法论有很多,MECE、5W2H 等等都可以。

按照 MECE 法,以「不重叠、不遗漏」的方式将数据分析的目的拆解成多个子问题。

5W2H 法很常见,就是what、why、when、where、who、how、how much。

还有一个我觉得很好用的方法论,从 GrowingIO 那学来的。就是一个「业务目标 * 业务流程 * 业务场景」的三级结构。先列出业务目标,然后展开每个目标的流程,再展开流程上的每一个环节对应的场景(场景中蕴涵着关键指标)。

这个方法其实一次性就把「线面体」的大框架构建完了。

在我们的案例中,影响访问量的因素有很多,对于这个目的的分解用 MECE 方法更合适。我们也可以用思维导图来实现。

/03  验证子问题/

通过 MECE 方法将目标分解完之后,其实就已经把「线和面」构建完了,接下去就是最后一步,构建「体」。

构建「体」的过程其实就是思考如何验证其中的每一个子问题。

怎么验证?先建指标。现代管理学之父彼得·德鲁克说过一句很经典的话:

如果你不能衡量它,那么你就不能有效增长它。

所谓衡量,就是需要建立统一的标准来定义和评价。你认为的不错,别人不一定这么认为,老板可能还认为很糟糕。所以,建立指标的目的其实就是统一口径,使得同一份数据能让更多人得到一致的理解。

建立和使用单一指标是数据分析的第一步,接下来你需要建立指标体系,因为孤立的指标发挥不出数据的价值。

一个还不错的指标体系,至少要满足以下三点:

  • 有三个以内的核心指标。核心指标不仅仅是数字,是所有人需要盯着看去努力的。就像销量和销售额,用户数和活跃用户数,大多数情况下后者都比前者重要。

  • 指标之间存在关联性。

  • 单一指标至少有两个以上维度。(比如,同比、环比等)

指标体系没有放之四海而皆准的模板,不同业务形态有不同的指标体系。移动 APP 和网站不一样,SaaS 和电子商务不一样,低频消费和高频消费不一样。比如婚庆业务不需要考虑复购率指标;互联网金融必须要风控指标;电商领域里的用户需要分为卖家和买家,而且他们的指标各不一样。

对我们上面的案例,摆上指标后大致是这个样子。

/04  清洗数据/

好了,「体」建设完之后,接下来就是把数据填入进去了。但是在复杂的数据分析场景下,我们可能在数据填入之前还要做一件事。

由于在实际的业务场景中,原始数据可能会来自于各个内部以及外部系统。指标口径对不上,总会出现不一致、重复、不完整、存在错误或异常的数据。

因此需要通过一些额外操作对这些数据做清洗,得到符合我们要求的原始数据。我们这里不讲太技术性的东西。从逻辑上主要做以下几件事。

  1. 数据清洗:去掉噪声和无关数据

  2. 数据聚合:将多个数据源中的数据结合起来存放在一个一致的数据存储中

  3. 数据转换:把原始数据转换成为适合做分析的数据格式。

/05  用数据验证/

好了,框架搭好了,原始数据也有了。剩下的就是通过数据来验证猜想了。

怎么验证呢?

这里我又要给出一个大杀器了,就是多用「演绎法」,而不是「归纳法」。

虽然这俩这都属于逻辑思维,但是归纳法有一个很大的问题:因为我们不可能观察到某个事物的所有影响因素,所以归纳法得出的结论是不一定是正确的。

比如,某个指标下降了 5 %,真的是个不好的情况吗?不一定,如果行业下降了 20 %,你才下降了 5 %,这就是一个还不错的结果。

而演绎法的本质是,找到发生变化的原因,如果某个原因在未来还会继续存在,那么可以支撑某个结论。

比如,行业为什么下降了 20 %?导致下降的原因未来是否还会存在?如果这些因素无法消除,那么未来继续下滑是在预期之内的。

/06  保持迭代/

当你形成了一套自己的数据分析体系之后,还不能一劳永逸,需要保持迭代。因为在业务的不同时期,我们关注的点会不同。

比如,在业务的初期,我们会更多关注流量、转化率这些,但到了成长期以及成熟期之后,还需要关注用户活跃度、复购率等等数据指标。

好了,这次就聊这么多。惯例总结一下。

这篇呢,Z 哥和你分享了我在数据分析上的一些经验。

我的思路其实是一个构建「点->线->面->体」的过程,主要分为以下六个步骤。

  1. 带着目的

  2. 分解目的

  3. 验证子问题

  4. 清洗数据

  5. 用数据验证

  6. 保持迭代

希望对你有所帮助

从本质上看,真正要做好数据分析这件事,本身对一个人商业理解、业务能力有很高的要求。因为只有有了这些能力,我们才能知道我需要哪些数据,才能识别出哪些数据是对我有用的,以及我可以如何运用这些数据。这些对数据分析有着事半功倍的效果。

引用一张 GrowingIO 的图,分别展现了数据分析相关工作的投入产出比。

可以看到,看上去越偏技术性的工作,其实产生的单位价值反而更低。所以,你知道该怎么做了吧?

推荐阅读:

  • 对DDD的常见误区

  • 如何摆脱「自我否定」状态

原创不易,如果你觉得这篇文章还不错,就「点赞」或者「在看」一下吧,鼓励我的创作 :)

也可以分享我的公众号名片给有需要的朋友们。

如果你有关于软件架构、分布式系统、产品、运营的困惑

可以试试点击「阅读原文

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/298964.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ADO.NET Entity Framework学习笔记(2)建模[转]

模型结构 [概念模型]中要有[实体键], [实体键]要与表中的 [主键] 对应,也就是说表必须要有主键. 表中的[唯一键]不会在[概念模型]中体现 在[概念模型]中默认是不允许修改[实体键]的值的 联合主健可以正常映射 如果为属性赋值超过字段长度保存时,会向数据库提交,数据库会返回错…

教你怎么一下哄好赌气的女朋友​

1 教你怎么一下哄好赌气的女朋友▼2 有钱人的隔离生活也格外丰富多彩▼3 狗:有一种被掏空的感觉▼4 湘西赶尸的原理找到了!▼5 泰罗奥特曼在打奥特曼你先去找迪迦奥特曼玩▼6 看起来就很值钱的哟而且还是微波炉专用哦!▼7 看完了有点恐…

最受欢迎中国技术博客? 我才狂写4周唉

今天察看了一下blog的访问来源,居然发现有很多点击来自同一个URL:http://blog.zdnet.com.cn/popblogger50.shtml。进去一看,发现是一个‘最受欢迎中国技术博客’评选活动。这让我很惊讶,因为这个Blog1)放得很冷僻&…

headless 怎么处理_公司清算注销债务怎么处理

公司解散2020-09-10 14:27:00更新公司在经营的过程中会产生很多应付款的,最为常见的是应付货款,应付款是指应该支付而未支付的款项,是属于债务的一种,那么公司注销清算前应付款如何处理?下面由华律网小编为读者进行的解答&#x…

WTMPlus 低代码平台来了

点击上方蓝字关注我们WTMPlusWTM框架开源4年以来,凭借其良好的设计,超高的开发效率,出色的性能和广泛的适用性得到了越来越多用户的喜爱,WTM的Nuget包累计下载已经超过了14万次,平均每天都有100人次使用WTM在开发项目。…

数据结构C#版笔记--堆栈(Stack)

堆栈(Stack)最明显的特征就是“先进后出”,本质上讲堆栈也是一种线性结构,符合线性结构的基本特点:即每个节点有且只有一个前驱节点和一个后续节点。 相对前面学习过的顺序表、链表不同的地方在于:Stack把所有操作限制在"只能…

为什么女生会有体香?

全世界只有3.14 % 的人关注了爆炸吧知识本文转载自微信公众号一只学霸(ID:bajie203)今天渣哥向我诉说了一个困扰了他很久的疑问看着渣哥这一副无知的样子学霸的内心暗爽就让你伟大而又聪慧的霸霸来为你揭开女生的真面目一说到这个学霸知道你们…

手游开发者交流会议暨OGEngine新版发布

2019独角兽企业重金招聘Python工程师标准>>> 手游开发者交流会议暨OGEngine新版发布 由OGEngine举办的第二次手游开发者交流会议以圆桌会议方式在深圳高新园举行。会议不仅吸引了手游开发者,也有海外支付商,国内外的手游发行商参加。 会议环绕…

python 绘制围棋棋盘_围棋之规则基础(一)

★本期导读:一、围棋的下法二、气★正文:一、围棋的下法1、 对局双方各执一色棋子。2、 空枰开局。3、 黑先白后,交替着一子于棋盘的交叉点上。4、 棋子下定后,不再向其它点移动。5、 轮流下子是双方的权利,但允许任何…

php pdo 查询语句,PDO:预处理语句(参数化查询)

(PDO(PHP data object/PHP数据对象))[PDO|预处理语句|参数化查询]The database library called PHP Data Objects or PDO for short can use drivers for many different database types, and supports a very important feature known as prepared statements, sometimes also…

WiFi密码都不会破译​还想考清华?​

1 18万的飞机票也能秒空???留学生:这是救命钱啊▼2 WiFi密码都不会破译还想考清华?▼3 好羡慕有这样的妈妈▼4 猫:你别进来,我这儿不接待小孩儿!孩子:我就进去看看▼…

ASP.NET网页文本编辑器的使用

ASP.NET网页文本编辑器的使用,效果图如下: 这里要用到DotNetTextBox.dll组件,具体内容可以在http://sites.google.com/site/zhangqs008/chang-yong-gong-ju 下载,使用方法如下: 1.将“DotNetTextBox.dll”文件添加到工…

在google play开放平台上closed texting如何删除_“爷青回”!如何抢先体验《英雄联盟》手游?这份攻略送给你...

如果你要问我最近什么手游最火?那我的回答肯定就是《英雄联盟》手游了!自从拳头公司在前几天爆出部分地区公测的消息之后,很多国内玩家就已经按耐不住自己激动的心了。由于国服没有公测,所以许多国内玩家便纷纷涌入日服和韩服。这…

php 电压 异常,tv断线警告是什么原因

电力系统中TV断线,就是电压互感器断线。TV断线一般可以分为TV 一次侧(高压)断线和二次侧(低压)断线,无论是哪一侧的断线,都将会使TV二次回路的电压异常,影响继电保护装置的正确动作。 (推荐学习:phpstorm)如果发生TV一…

《JavaScript 高级程序设计》 7.1 正则表达式支持

转载于:https://www.cnblogs.com/xiaochaohuashengmi/archive/2010/11/07/1871100.html

豆瓣9.7,这些舍不得看完的神剧,看一集少一集啊!

全世界只有3.14 % 的人关注了爆炸吧知识今天给大家介绍一位好朋友——菌菌。菌菌,作为资深美剧迷英语博主,收藏了很多经典美剧、动画资源,每天还会和大家分享新鲜有趣的英语知识。喜欢看美剧追动画和立志学好英语的小伙伴千万别错过&#xff…

因子分析最少要有几个因子_Re0:魔女司教和魔女是什么关系?他们的魔女因子是魔女给的吗...

​魔女司教和魔女的能力一点关系都没有,而且魔女教一开始是正常的,直到艾米莉亚父母死后才出现各种大罪司教发疯,怠惰是艾米莉雅的养父,艾米莉亚一族守护的封印被虚饰魔女入侵,怠惰为了守护强行融合了魔女基因&#xf…

徒手打造基于Spark的数据工厂(Data Factory):从设计到实现

在大数据处理和人工智能时代,数据工厂(Data Factory)无疑是一个非常重要的大数据处理平台。市面上也有成熟的相关产品,比如Azure Data Factory,不仅功能强大,而且依托微软的云计算平台Azure,为大…

深度学习框架PyTorch与TensorFlow,谁更胜一筹?

全世界只有3.14 % 的人关注了爆炸吧知识自从2012年深度学习再一次声名鹊起以来,许多机器学习框架都争先恐后地要成为研究人员和行业从业者的新宠。面对如些众多的选择,人们很难判断最流行的框架到底是什么。在某些情况下,深度学习或深度迁移学…

Windows Server 2008 R2 之二十一远程桌面服务RD之二

一、远程桌面授权 远程桌面授权(RD 授权)以前称为终端服务授权(TS 授权),它能够管理每个设备或用户与远程桌面会话主机(RD 会话主机)服务器连接所需的远程桌面服务客户端访问许可 (RDS CAL)。使…