数据分析已经成为数据时代各行各业突破各自行业发展瓶颈的最有效手段,无论是公司职员还是个体商户或大公司管理者,都需要有数据分析的能力。很多人认为数据分析能力就是对数据进行描述和做出漂亮的统计图形的能力,这是狭隘的理解。数据分析能力的基础在于数据分析的逻辑思维能力,而逻辑思维能力的培养必须建立在统计理论基础之上。
在移动互联网时代,信息的获取成本越来越低,这也导致拿来主义和实用主义盛行。数据分析科学是一门需要紧密联系生活实际的科学。数据分析方法非常多,这是因为不同的数据分析环境需要选择不同的数据分析方法来处理。因此,在数据和数据分析方法之间,天然地存在鸿沟,拿来主义和实用主义经常行不通,而磨平鸿沟的方法就是学习统计理论基础。
小编接触过很多希望学习数据分析或正在学习数据分析的朋友,发现他们身上都有一个通病,就是将学习各种分析软件作为学习重点,觉得学习数据分析就是学习分析软件操作。他们在进行具体的数据分析时,通常的做法是套用别人的数据分析逻辑和方法,如果分析结果与参考结果一致,那么没有问题,但是通常的情况是不一致的,这时他们就需要浪费大量的时间和精力查找原因。而不一致的原因通常是数据情况不符合导致的,解决的办法是根据实际的数据分析环境进行数据调整或选择其他合适的数据分析方法,而要做到这些,归根结底需要的还是扎实的统计理论基础。
学习数据分析应该以统计理论基础为主线,分析软件仅仅是各种分析方法的实现工具。因此,在开始学习时,应该辅以一到两种操作简便的分析软件,例如SPSS。这样就能够比较快速地建立统计理论框架,并掌握一款分析软件。当你的统计理论基础夯实以后,会发现学习各种分析软件都能够游刃有余,甚至像R和Python这种编程语言也能在比较短的时间内掌握。
话不多说,直接上干货。
资料目录
1.生活在数据时代
1.1 数据分析无处不在
1.1.1 常用的国家统计指标
1.1.2 制造业的数据分析应用
1.1.3 营销领域的数据分析应用
1.1.4 医疗行业的数据分析应用
1.2 人人都能成为数据分析师
1.2.1 数据分析过程
1.2.2 数据分析工具
1.2.3 数据分析师的成长之路
2.耳熟能详的数据你真的了解吗
2.1 数据的类型
2.1.1 数据的结构属性分类
2.1.2 数据的连续性特征分类
2.1.3 数据的测量尺度分类
2.2 数据描述的三个维度
2.3 数据的集中趋势描述
2.3.1 算术平均值
2.3.2 几何平均值
2.3.3 众数
2.3.4 中位数
2.4 数据的离散程度描述
2.4.1 极差
2.4.2 平均偏差
2.4.3 方差和标准差
2.4.4 变异系数
2.4.5 四分位极差
2.5 数据的分布形态描述
2.5.1 概率
2.5.2 概率分布
2.5.3 离散型概率分布:二项分布
2.5.4 离散型概率分布:多项分布
2.5.5 离散型概率分布:超几何分布
2.5.6 离散型概率分布:泊松分布
2.5.7 连续型概率分布:指数分布
2.5.8 连续型概率分布:均匀分布
2.5.9 连续型概率分布:正态分布
2.5.10 正态分布作为二项分布近似
2.5.11 正态分布作为泊松分布近似
3.数据分析的“内核”:推断分析
3.1 见微知著的抽样
3.1.1 抽样的意义
3.1.2 抽样方法
3.1.3 样本推断的理论基础
3.2 数据的处理
3.2.1 数据处理的不良案例
3.2.2 正确的数据存储形式
3.3 样本到总体的桥梁:抽样分布
3.3.1 抽样分布的定义
3.3.2 Z分布
3.3.3 T分布
3.3.4 切比雪夫定理
3.3.5 卡方(χ2 )分布
3.3.6 F分布
3.4 数据分析的第一板“斧”:参数估计
3.4.1 参数估计的类型
3.4.2 Z分布与总体均值的区间估计
3.4.3 T分布与总体均值的区间估计
3.4.4 切比雪夫定理与总体均值的区间估计
3.4.5 卡方(χ2 )分布与总体方差的区间估计
3.4.6 F分布与两个总体方差比的区间估计
3.4.7 两个总体均值差的区间估计
3.4.8 总体比率的区间估计
3.4.9 样本容量的确定
3.5 数据分析的第二板“斧”:假设检验
3.5.1 假设检验的理论基础
3.5.2 单样本的假设检验
3.5.3 两样本的假设检验
3.5.4 多样本的假设检验与方差分析
3.6 数据分析的第三板“斧”:非参数检验
3.6.1 非参数检验
3.6.2 卡方检验
3.6.3 Wilcoxon符号秩检验
4.数据分析的终极目的:“为我所用”
4.1 “相关”是继续分析的前提
4.1.1 相关关系
4.1.2 相关分析
4.2 “回归”是相关分析的归宿
4.2.1 回归分析综述
4.2.2 简单线性回归分析
4.2.3 多元线性回归分析
4.3 发现事物随时间变化的规律
4.3.1 时间序列分析综述
4.3.2 长期趋势分析
4.3.3 季节变动趋势分析
4.3.4 循环变动和不规则变动
4.3.5 时间序列分析应用
5.给数据披上靓丽“外衣”:数据可视化
5.1 数据的可视化
5.1.1 数据可视化工具
5.1.2 常用的统计图
5.2 条形图、直方图和饼图
5.2.1 条形图
5.2.2 直方图
5.2.3 饼图
5.3 线图与面积图
5.3.1 线图
5.3.2 面积图
5.4 散点图
5.5 高低图与箱线图
5.5.1 高低图
5.5.2 箱线图
5.6 时间序列图
5.7 帕累托图
5.8 P-P概率图和Q-Q概率图
5.8.1 P-P概率图
5.8.2 Q-Q概率图
资料预览
戳这里打包带走《每个人都学的会的数据分析》