数据分析的概念
数据分析是指通过恰当的统计方法和分析手段,对数据进行收集汇总,并进行加工处理。对处理过后的有效数据进行分析,发现存在的问题,制定可行的方案、从而帮助人们采取更科学的行动
数据分析4个层次
著名咨询公司Gartner于2013年总结、归纳、提炼出一套数据分析的框架,将数据分析过程分为4个层次
- 描述性分析( Descriptive Analysis
- 诊断性分析( Diagnostic Analysis )
- 预测性分析( Predictive Analysis)
- 处方性分析( Prescriptive Analysis)
实际应用
- 描述性分析,例如通过分析企业运营数据,判断运营现状
- 诊断性分析,可以通过企业运营状况分析当下存在的问题,找到问题的根源所在。也可以分析当下运营良好的原因,找到企业能稳步发展的相关因素;
- 预测性分析:在诊断的分析的基础上给出对策,并预测实施对策后的未来发展趋势
- 处方性分析:做出最终的决策,帮助企业发展
数据分析的基本流程
1、明确目标,收集数据
- 明确分析目的和思路:只有明确数据分析的目的,才能确保数据分析有效进行
- 数据收集:一般数据来源于数据库、互联网、市场调查、公开出版物
2、数据处理后进行分析
- 数据处理:数据清洗、数据转化、数据抽取、数据合并、数据计算等处理方法
- 数据分析:数据分析通常需要运用多种工具,如Excel的透视表,Excel函数公式等等。还需要借助专业的数据分析思维
3、可视化展示并生成报告
- 数据展示:数据是通过表格和图形的方式来呈现的,即用图表说话
- 报告撰写:数据分析报告是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程结果及建议完整地呈现出来,以供决策者参考
维度&指标
什么是维度?
定义:分析数据的角度
示例:
分析不同月份/年份的销售额变化,维度字段为月份/年份维度为时间;
分析不同省/市的销售占比,维度字段为省/市,维度为地区
什么是指标?
定义:对维度的量化:
示例
分析不同月份/年份的销售额变化,指标为销售额;
分析不同省/市的销售占比,指标为销售占比;
业务包
业务包包含了能够提供给分析人员使用的所有数据库表,以供分析人员使用
fineBI自助数据集的操作