《Python数据分析基础教程》学习笔记。
第1章 数据分析概述
1.1 数据的性质
1.1.1 数据的概念
所谓数据就是描述事物的符号,是对客观事物的性质、状态和相互关系等进行记载的物理符号或者是这些物理符号的组合。
在计算机系统中,各种文字、字母、数字符号的组合,图形、图像、视频、音频等统称为数据,数据经过加工后就成为了信息。
1.1.2 数据的类型
- 类别型:定类和定序。
- 数值型:离散和连续。
1.2 数据分析
1.2.1 数据分析的概念
处理海量数据,并从中提取出有价值的信息的过程就是数据分析。
数据分析是指用适当的统计分析方法对收集来的大量原始数据进行分析,为提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
数据分析的目的是提取不易推断的信息并加以分析,一旦理解了这些信息,就能够对产生数据的系统的运行机制进行研究,从而对系统可能的响应和演变做出预测。
模型实际上是指将所研究的系统转化成数学形式,一旦建立了数学或逻辑模型,就能对系统的响应做出不同精度的预测。
1.2.2 数据分析的过程
- 转换和处理原始数据。
- 用可视化方式呈现数据。
- 建模并做预测。
1.2.3 数据分析的作用
企业如果需要进行企业经营决策或者推出某种新型产品,就需要利用数据分析将一些凌乱的数据整合汇总,从中判断出具体方向。分析过去企业整体运营情况,分析现在所存在的隐患,以及预测未来企业的发展趋势。
1.2.4 数据分析的常用工具
目前主流的数据分析语言有Python、R语言、MATLAB。