文章目录
- 基本概念
- 有监督学习
- 回归问题
- 分类问题
- 无监督学习
- 聚类问题
- 异常检测
基本概念
pass
有监督学习
回归问题
- 通过拟合函数,解决连续值的预测问题
- 梯度下降法优化;最小二乘法求解;
- 度量指标
- 均方误差;
- 均方根误差;
- 平均绝对误差;
- r2 score 决定系数, 1 − 误差平方和 总离差平方和 1 - \frac { 误差平方和 } {总离差平方和} 1−总离差平方和误差平方和
误差平方和: ∑ i m ( y t r u e − y p r e d ) 2 \sum_i^m ({y_{true}}-y_{pred})^2 i∑m(ytrue−ypred)2
总离差平方和: ∑ i m ( y t r u e − y m e a n ) 2 \sum_i^m(y_{true} - y_{mean})^2 i∑m(ytrue−ymean)2
- 如房价预测
- 线性回归篇
分类问题
- 使用预测函数,预测离散的类别;
- 极大似然估计 + 梯度下降求解;
- 度量
- 准确率、平均准确率;
- 查准率、召回率、f1-score;
- roc曲线、auc面积;
- 混淆矩阵;
- 逻辑回归
- KNN分类
- 支持向量机
- 决策树
- 随机森林
- GBDT梯度提升树
- 神经网络
无监督学习
聚类问题
- kmeas 聚类
- DBSCAN 密度聚类
- 其他聚类