浅谈-数据分析之道--数据思维的培养

第一篇数据思维

数据分析中最重要的是数据思维,对于业务场景中常见的问题,只要有分析问题的思路和方法,无论用什么工具都可以得到结果。

数据思维是数据分析师分析问题的思路和角度。

第一章,什么是数据思维

什么是数据治理?

数据治理是将零散的用户数据通过采集,传输、储存等一系列标准化流程变成格式规范,结构统一的数据,并构建严格规范的综合数据管控机制。对这些标准化的数据进行进一步加工分析,形成具有指导意义的业务监控报表、业务监控模型,以辅助业务方进行决策。

数据治理流程介绍

数据治理流程是从数据规划,数据采集,数据储存管理到数据应用的过程,是从无序到有序的过程,也是标准化流程的构建过程。

1.理: 梳理业务流程,规划数据资源。

对于企业来说,每天的实时数据量都会超过tb级别,需要采集用户的哪些数据?这么多的数据放在哪里?如何放?以什么样的方式放?这需要事先规划一套从无序变为有序的流程。数据从无序变为有序的过程,需要跨部门协作,需要前端工程师,后端工程师,数据工程师,数据分析师,产品经理等等参与。

2.采: 数据采集

前后端工程师将采集到的数据送到数据部门,数据部门通过ETl工具将数据从来源端经过抽取,转换,加载送至目的端。这个阶段主要是将散落和零乱的数据集中存储起来。

3.存:大数据高性能存储及管理。

这么多的业务数据存在哪里?这需要一个高性能的大数据存储系统,在这套系统里将数据分门别类地放到其对应的库中,为后续的管理及使用提供最大的便利。

4.用: 即时查询报表监控,智能分析,模型预测。

数据的最终目的是辅助业务方进行决策,前面的几个流程都是为最终的查询分析监控做铺垫的。这个阶段的是数据分析师的主场。数据分析师运用这些标准化的数据可以进行及时的查询,指标体系和报表体系的建立,业务问题的分析,甚至是模型的预测。

从数据治理流程谈数据部门岗位职责。

数据部门的数据来源于点击流日志和客户端、服务端上报的日志。

将数据上传到数据部门后,在工程层面需要数据工程师、数仓工程师完成数据的清洗、入库。

在应用层面,数据分析师则负责数据的即时查询和指标体系,报表体系的建设以及输出各项业务报告。

数据产品经理则负责数据产品原型设计以及推动数据产品的实现和落地。

数据挖掘与算法工程师会基于业务问题开发数据模型,以辅助业务方进行决策。

数据思维到底是什么?

1.其数据思维到底是什么?2.其二是数据思维是否可以培养?

应用数据思维的工作

如果从数据分析师的日常工作内容出发来定义数据思维,即数据分析师在数据埋点、体系和标准构建以及商业智能分析中思考问题的方式以及运用的分析方法。

1.数据埋点

数据分析师对业务进行分析,所需要的数据需要通过埋点来获取。数据分析师参与到数据规划,数据采集的过程中,可以更快的拿到数据,从而提高分析效率。

数据分析师需要在数据埋点时预见之后可能面临的数据分析需求,以及这些需求可能会用到的数据字段。只有考虑到这一层面,才能减少因数据埋点而造成分析延期的情况出现。

2.构建体系和标准

获取分析数据的终极目的是定位业务问题,辅助业务决策。业务评价标准是衡量业务发展水平的重要指标,而指标体系是监控业务问题,定位业务问题的好帮手。

3.商业智能分析

商业智能分析:包括各类活动效果分析,版本变化分析,用户分析,流失分析。

商业智能分析可以总结为探究原因,评价效果以及活动预估三大模块儿。

构建有效的监控体系和客观的评价标准

对于某一块新的业务,建立有效的监控体系和客观的评价标准是数据分析师的重要工作之一。对这套监控体系和评价标准需要哪些数据,哪些指标,指标如何定义,如何选取多个指标构成一套监控体系都涉及很多细节,这些细节设计得是否恰当关系到监控体系是否能反映业务的真实情况。

举个例子来说,某公司新推出一款APP,需要对这款APP构建数据监控体系。这时候数据分析师就可以根据海盗模型(AARRR)先对所需数据及相关监控指标进行埋点。有了数据之后,可以从获取,激活,留存,付费,自传播等不同的阶段对APP建立监控指标体系。

第二章 为什么数据思维如此重要?

1.数据分析师必备的硬技能。

所谓硬技能,就是数据分析师需要掌握的分析工具。数据分析师需要掌握的分析工具包括SQL,Excel,BI工具及Python。

2.数据分析师必备的软技能。

数据分析师必备的软技能,包括业务知识,数据思维,沟通能力。

第三章数据思维如何培养

第一:想要面对具体问题有分析思路和方法,就需要熟悉业务及常用的数据分析方法,最好能够建立自己的分析体系;

第二:面对具体问题多问几个为什么?树立目标意识,找出需求背后的潜在分析点

第三:作为数据分析师,需要建立标准,凡事不预设立场,通过客观的标准代替主观的判断;

第四:基于数据分析结果为业务方提出切实可行的解决方案。

三大分析思维:

对比思维、分群思维及相关思维是贯穿数据分析全流程的三大分析思维。

1.对比思维:对比分析可以衡量数据整体大小、数据波动及数据变化趋势,所以说对比分析是得出数据结论最简单的有效方法。

2.分群思维:是贯穿数据分析全链路的分析思维。根据用户的行为数据、消费数据等特征对用户分群是实现用户精细化运营的基础。用户分群可以基于用户历史数据,对数据进行分箱处理形成规则类型的标签。

用户同期群分析是用户分群的另一种方法,该方法是一种横纵结合的分析方法,在横向上分析同期群随着同期推移而发生的变化,在纵向上分析在生命周期相同阶段的群组之间的差异

不同生命周期的分析方法

分析用户流失的最终目的是实现用户的增长和让用户付费。对于用户付费转化来说,数据分析师通常会预估不同方案的转化率;通过漏斗分析和路径找出用户转化流程中可以优化的环节;同时,可以通过营销增益模型识别敏感人群,以提升转化方案的投入产出比。当然,也可以通过用户行为数据预估用户的生命周期价值。

需求的流程:1.目的是什么?2.需要研究什么?3.应用哪些相关的数据分析方法4.得出相应的结果与建议

预设立场与假设检验的区别:

  1. 预设立场是通过数据证明自己的猜测是正确的,一个数据不行,更换思路用另一个数据,直到找到能够证明猜想的数据为止;
  2. 假设检验是先提出一个假设,通过收集证据去验证假设是否是正确,如果有足够证据证明假设是正确的,则接受假设,否则拒绝假设。

如果数据分析师预设立场,就会通过不同的数据维度去证明一个猜想是否正确的,而不是客观地评价该事件。所以不预设立场,用假设检验的方法验证各类猜想,用客观的标准代替主观的评价数据思维的培养过程的原则之一。

基于数据分析结果为业务方提出切实可行的解决方案

数据分析不只是数据的罗列,而是数据和分析的结合。

1.数据层面包含数据获取、整合、可视化等操作;

2.数据分析层面则是结合业务目的和数据表现给出相应的数据结论。

根据分析结果给出合理的意见和建议是数据思维培养过程中重要的环节之一。

数据分析师提出合理建议需要经历的三个阶段

数据分析师在从入门到进阶:

数据分析师一般会经历从给数据到给结论再到给观点的转变

  1. 给数据:“给数据”是数据分析最初级的阶段,是通过数据陈述客观事实的过程。
  2. “给结论”:是对数据结果的加工和深入分析并给出结论性的表述
  3. “给观点”:是给结论的基础上对数据进行挖掘,基于对业务的了解给出一些切实可行的建议。
数据分析需要避免的几种提建议的方式
  1. 不明确分析目的,只做简单的数据堆砌

部分初级数据分析师给业务方给出数据之后,就没有了后续的意见和建议。

这种情况是:

1).没有明确需求,即没有搞清楚业务方需要的到底是什么?业务方面临的问题到底是什么,当然没有办法继续进行下一步的分析。

2).需求不明确这种困境一般是由于业务方和数据分析师共同造成的,可能是业务方在提出需求的时候也没有说清楚自己真正的数据。

3).明确分析目的,进而分析业务问题,是建立在数据分析师对业务有一定了解的基础上的。

4).企业的指标体系就是业务的抽象形态,而大部分问题是可以通过拆解数据指标初步定位。

2.说得都对,却没什么用

大多数是问题分析不够深入,拆解的不够细致造成的。

如果你只是给出一个结果,当然这个结果可能是正确的,但是也没有任何意义的,因为业务方法更想知道用户为什么流失?哪些环节或渠道流失的, 知道具体的细节后就可以精准地采取一系列的措施。

3.提出的建议无法落地

数据分析师在提出意见和建议时可以考虑用图表代替文字说明问题,用业务方听的懂的话代替专业术语陈述建议。如果你建议能够帮助业务方提升KPI,那么业务方多少会对你的建议感兴趣。

从不同的业务角度出发,从不同的分析角度着手,都能提出各种不同的建议。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/838647.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

适合建站的香港服务器有哪些,企业和个人建站的

香港服务器适合外贸建站、个人和企业建站,尤其是中小企业官网非常适合放在香港服务器上,因为香港服务器在国内外的访问速度都很快,也就意味着全球客户都能访问到你的网站。 对于很多新手小白来说不知道怎么才能买到靠谱稳定的香港服务器&…

mysql主从热备+keepalived 部署mysql高可用主备模式

目录 1、环境准备 2、分别在主服务器和备用服务器上安装keepalived 3、修改keepalived服务的配置文件 3.1 修改主服务器上的keepalive服务的配置文件 3.2 修改备用服务器上的keepalive服务配置文件 4、编写mysql监控脚本放到主服务器上 5、在主服务器和备用服务器上查看…

水泡传感器内部结构

水泡传感器内部结构: 水泡传感器放大电路 电路是基于1.6V做的TIA I2V, 也就是输出部分基于1.6V做电压的增加或减少。

Milvus 快速入门

引言 在本篇文章中,我们将介绍 Milvus 的基本概念,并通过一个简单的示例展示如何在 Milvus 中创建集合、插入向量和执行搜索。最后,我们将概览 Milvus 提供的 API。 一、基本概念 1.1 集合 (Collection) 在 Milvus 中,集合类似…

如何组织 Vue 项目

介绍 在启动 Vue 项目时,思考项目结构至关重要。主要考虑因素是预期项目的规模。在本篇博文中,我将探讨适用于不同规模 Vue 项目的各种结构。这个考虑与康威定律相吻合: “设计系统的组织受限于产生这些组织沟通结构的设计。” - 梅尔康威 基…

C语言之指针初阶

目录 前言 一、内存与地址的关系 二、指针变量 三、野指针 四、const 五、传值调用与传址调用 总结 前言 本文主要介绍C语言指针的一些基础知识,为后面深入理解指针打下基础,因此本文内容主要包括内存与地址的关系,指针的基本语法&…

WebRTC实时音视频通话之语音通话设计与实践

一、背景 在移动互联网流量时代,很多业务场景都有音视频通信的需求,比如IM场景,除了文字交流还需要音视频通话进行实时交互。为了帮助58、赶集、安居客等业务线更好的为用户提供服务,节约沟通成本,提升效率&#xff0…

【Linux】19. 习题②

2022-11-12_Linux环境变量 1. 分页存储(了解) 一个分页存储管理系统中,地址长度为 32 位,其中页号占 8 位,则页表长度是__。 A.2的8次方 B.2的16次方 C.2的24次方 D.2的32次方 【答案解析】A 页号即页表项的序号,总共占8个二进制…

STM32的FLASH学习笔记

不同型号的 STM32,其 FLASH 容量也有所不同,最小的只有 16K 字节,最大的则达到了1024K 字节。大容量产品的闪存模块组织如图所示: STM32 的闪存模块由:主存储器、信息块和闪存存储器接口寄存器等 3 部分组成。 ​ ①主…

Java环境搭建(二)Notepad++和IDEA的下载

Notepad(不推荐使用) 高级记事本 下载地址 Notepad (juxinwk1.cn) 下载安装后一直下一步就可以了 注:改一下路径还有建立快捷方式(自己选择) IDEA 集成环境 下载地址 IntelliJ IDEA – the Leading Java and Kotl…

React 第三十二章 虚拟DOM

面试题:什么是虚拟DOM?其优点有哪些? 标准且浅显的答案 虚拟dom本质上就是一个普通的 JS 对象,用于描述视图的界面结构 虚拟 DOM 最早是由 React 团队提出来的,因此 React 团队在对虚拟 DOM 的定义上面有绝对的话语权。…

若依-生成主子表

1. sql语句建表导入到数据库中: -- ---------------------------- -- Table structure for t_ques————主表 -- ----------------------------CREATE TABLE ques (ques_id INT NOT NULL AUTO_INCREMENT COMMENT Id,name VARCHAR(255) NOT NULL COMMENT 测评名称…

未授权访问:Rsync 未授权访问漏洞

目录 1、漏洞原理 2、环境搭建 3、未授权访问 4、利用rsync下载任意文件 5、利用rsync反弹shell 防御手段 今天继续学习各种未授权访问的知识和相关的实操实验,一共有好多篇,内容主要是参考先知社区的一位大佬的关于未授权访问的好文章&#xff0c…

ApiHug - 闭门造车, 出门合辙

🤗 ApiHug {Postman|Swagger|Api...} 快↑ 准√ 省↓ GitHub - apihug/apihug.com: All abou the Apihug apihug.com: 有爱,有温度,有质量,有信任ApiHug - API design Copilot - IntelliJ IDEs Plugin | Marketplace The Nex…

RocketMQ:新增consumer消费组group从最新消息开始消费skip last offset message

场景 想创建一个新的consumer去消费一个已经再使用的topic时,默认情况下会从topic中的第一条消息开始消费,大多数情况是需要从最新的消息开始。然后再使用CONSUME_FROM_LAST_OFFSET设置时并不会对新的consumer生效,它只是在停用consumer重新启…

MySQL单表查询案例演示

目录 一、创建数据库lianxi 二、选择数据库为lianxi 三、新建一个数据表grade,在grade表中插入数据 四、开始进行查询操作(验证表中数据) 1、查询1945班的成绩信息 2、查询1945班,语文成绩大于60小于90的成绩信息 3、查询学…

优雅谈论大模型8:神经网络与矩阵

向量与矩阵 上个章节的神经网络是为了解Transformer或者Mamba做好铺垫,在和后辈交流过程中发现有个障碍,那就是向量和矩阵。其实向量和矩阵的表达方式不是所有人都很习惯。在继续下面的章节之前小编认为有必要将向量、矩阵和神经网络做下补充解释。 向…

18.双线性插值缩放算法的matlab与FPGA实现

一篇文章为你讲透双线性插值 简介 1.什么是插值 图片放大是图像处理中的一个特别基础的操作。几乎在每一个图片相关的项目中,从传统图像处理到i深度学习,都有应用。   简单来说,插值指利用已知的点来“猜”未知的点,图像领域插…

华为OD机试【分奖金】(java)(100分)

1、题目描述 公司老板做了一笔大生意,想要给每位员工分配一些奖金,想通过游戏的方式来决定每个人分多少钱。按照员工的工号顺序,每个人随机抽取一个数字。按照工号的顺序往后排列,遇到第一个数字比自己数字大的,那么&…

【class9】人工智能初步(处理单张图片)

Class9的任务:处理单张图像 为了更高效地学习,我们将“处理单张图像”拆分成以下几步完成: 1. 读取图像文件 2. 调用通用物体识别 3. 提取图像分类信息 4. 对应分类文件夹还未创建时,创建文件夹 5. 移动图像到对应文件夹 0.获取…