与 k 均值算法类似,“学习向量量化” (Learning Vector Quantization,简 称 LVQ)也是试图找到一组原型向量来刻画聚类结构, 但与一般聚类算法不同 的是, LVQ 假设数据样本带有类别标记,学习过程利用样本的这些监督信息来 辅助聚类.
可看作通过聚类来形成 类别 "子类"结构,每个 子类对应一个聚类簇
给定样本集 D = {(Xl,Yl), (X2,的),… , (Xm, Ym)}, 每个样本的是由 η 个 属性描述的特征向量 (Xjl; Xj2;. …; 句n), 的 εy 是样本町的类别标记. LVQ 的 目标是学得一组 η 维原型向量 {Pl,酌,. . . ,pq}, 每个原型向量代表一个聚类簇, 簇标记 ti ε y.