文章目录
- 一、K-Means算法
- 二、K-Means算法步骤
- 三、实现代码
- 四、实现效果
- 参考文献
一、K-Means算法
在诸多的聚类方法中,K-Means聚类方法是属于“基于原型的聚类”(也称为原型聚类)的方法,此类方法均是假设聚类结构能通过一组原型刻画,在现实聚类中极为常用。通常情况下,该类算法会先对原型进行初始化,然后再对原型进行迭代更新求解。采用不同的原型表示、不同的求解方式,也将会产生不同的算法。
K-Means算法作为一种经典的“原型聚类”算法,经典的原型选择的是“K个聚类中心”,但是这里我们选择的原型则是“K个聚类直线
”,之后迭代求解向着类别的中心部分逼近。
二、K-Means算法步骤
过程其实相对简单:
1、初始化原型,也就是指定K值和“
K个聚类直线
”。这其中聚类直线的指定为人为的输入(随机选择太容易出现偏差),不过尽量保证聚类直线之间的距离不要靠的太近。
2、聚类。遍历所有数据点,计算每个数据点到这“K个聚类直线
”的距离