机器学习 | Python实现KNN(K近邻)模型实践
目录
- 机器学习 | Python实现KNN(K近邻)模型实践
- 基本介绍
- 模型原理
- 源码设计
- 学习小结
- 参考资料
基本介绍
一句话就可以概括出KNN(K最近邻算法)的算法原理:综合k个“邻居”的标签值作为新样本的预测值。更具体来讲KNN分类过程,给定一个训练数据集,对新的样本Xu,在训练数据集中找到与该样本距离最邻近的K(下图k=5)个样本,以这K个样本的最多数所属类别(标签)作为新实例Xu的预测类别。
模型原理
- 距离度量
KNN算法用距离去度量两两样本间的临近程度,最终为新实例样本确认出最临近的K个实例样本(这也是算法的关键步骤),常用的距离度量方法有曼哈顿距离、欧几里得距离。曼哈顿、欧几里得距离的计算方法很简单&#