朴素贝叶斯分类器
- 朴素贝叶斯分类器是一个以贝叶斯定理为基础的多分类的分类器。对于给定数据,首先基于特征的条件独立性假设,学习输入输出的联合概率分布, 然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率的最大的输出y
- 在sklean中,实现了三个朴素贝叶斯分类器:
分类器 | 描述 |
naive_bayes.GaussianNB | 高斯朴素贝叶斯 |
naive_bayes.MultinomialNB | 针对多项式模型的朴素贝叶斯分类器 |
naive_bayes.BernoulliNB | 针对多远伯努利模型的朴素贝叶斯分类器 |
- 参数:priors:给定类别的先验概率。如果为空,则按训练数据的实际情况进行统计,如果给定先验概率,则在训练过程不能更改。
import numpy as np X=np.array([[-1,-1],[-2,-1],[-3,-2],[1,1],[2,1],[3,2]]) Y=np.array([1,1,1,2,2,2,])from sklearn.naive_bayes import GaussianNB clf=GaussianNB(priors=None) clf.fit(X,Y) print(clf.predict([[-0.8,-1]]))
- 朴素贝叶斯是典型的生成学习方法,由训练数据学习联合概率分布,并求得后验概率分布
- 朴素贝叶斯一般在小规模数据上表现很好,适合进行多分类任务。