自用笔记
1. 统计学习的定义与分类
1.1 统计学习的概念
统计学习(Statistical Machine Learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。
- 以计算机和网络为平台;
- 以数据为研究对象;
- 以预测和分析数据为目的;
- 以方法为中心;
- 是多领域交叉的学科。
统计学习方法的步骤:
- 得到一个有限的训练集;
- 确定学习模型的集合(又叫假设空间)————模型;
- 确定模型选择的准则————算法;
- 实现求解最优模型的算法————算法;
- 通过学习方法选择最优模型;
- 利用学习的最优模型对新数据进行预测或分析(将想要预测的数据代入到最优模型里面进行预测和分析)。
1.2 统计学习的分类
参数化模型适用于简单问题,非参数化模型适用于复杂问题。
在线学习,每次接收一个样本,然后学习,不断重复。
批量学习,一次接收一个批量,然后学习进行预测。