1. 在 Anaconda Navigator 中,打开 Jupyter Notebook ,在网页中,点击进入本地环境搭建中创
建的工作目录,点击右上角的 New- 》 Folder ,将新出现的 Untitled Folder 选中,并使用左上角
的 Rename 按钮重命名为 TestOfNB 。完成后进入 TestOfNB 文件夹。
2. 点击 New->Python 3 后,跳转至 Untitled.ipynb
3. 导入所需的库文件
Notebook 中,每个输入框为一个 Cell ,在编写完成 Cell 的代码后,点击红圈的 Run ,即可运行
本 Cell 中的代码。
当 [ ] 中出现数字后,即可视为这个 Cell 编译并运行成功。
4. 将广告类的标识置为 1 ,编写创建数据集、加载数据的函数 loadDataSet() ,编写完成后编译并
运行 Cell 。
5. 在 Cell 中写入 docs2VecList() 函数的代码,该函数用于对数据集进行预处理,编写完成后编译并
运行
6. 根据 Naive Bayes 的原理,在 Cell 中编写 Words2Vec 函数。
7. 编写训练函数,训练Naive Bayes 模型,完成后编译并运行
8. 编写使用 Naive Bayes 模型的接口,如果是垃圾邮件则返回 1 ,非垃圾邮件则返回 0
9. 打印 Naive Bayes 模型分类的结果
10. 将Naive Bayes 模型从加载数据集、数据处理、训练以及测试编写为 tNB() 函数
11. 编写主函数,调用 tNB()
12. 在 wordsList 所示的词汇中,任意挑选若干词汇并组成新的句子,按照 list 的格式送入 Naive
Bayes模型进行预测