本文包含什么?
- 项目运行的方式
- 项目代码,自己实现KNN算法以及朴素贝叶斯算法.
- 代码介绍
- 运行有问题? csdn上后台随时售后.
项目说明
本文主要是自己从0实现KNN算法以及朴素贝叶斯算法.然后使用英文垃圾邮件数据集进行垃圾邮件分类.常见的代码均调用sklearn库来实现,本文自行实现.
首先看模型指标对比:
算法 | 准确率 |
---|---|
KNN | 98.33% |
贝叶斯 | 98.00% |
算法介绍
KNN
原理很简单:选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数。最后,选择k个最相似数据中出现次数最多的分类,作为新数据的分类。
对应的核心算法:
def classifyKNN(inX, dataSet, lab