机器学习笔记（五）续——朴素贝叶斯算法的后验概率最大化含义

机器学习笔记（五）续——朴素贝叶斯算法的后验概率最大化含义

news/2025/4/10 3:41:05/文章来源:https://blog.csdn.net/chunyun0716/article/details/51058948

　　上一节中讲了朴素贝叶斯算法将实例分到后验概率最大的类。这等价于期望风险最小化。

假设使用0-1损失函数：

L (Y, f (X)) = {1, 0, Y \neq f (X) Y = f (X)

$L(Y, f(X)) = \Bigg\{ \begin{array} {ll}1, & Y \neq f(X) \\0, & Y = f(X)\end{array}$

上式中的 $f(x)$ 是分类决策函数，这时，期望风险函数是：

R e x p (f) = E [L (Y, f (X))]

$R_{exp}(f)=E[L(Y, f(X))]$

此期望是对联合分布 $P(X, Y)$ 取的。由此取条件期望

R e x p (f) = E X \sum k = 1 K [L (c k, f (X))] P (c k | X)

$R_{exp}(f) = E_X \sum_{k=1}^K[L(c_k, f(X))]P(c_k|X)$
为了使期望风险最小化，只需对

X=x $X=x$ 逐个极小化：

f (x) = a r g min y \in Y \sum k = 1 K L (c k, y) P (c k | X = x) = a r g min y \in Y \sum k = 1 K P (c k \neq Y | X = x) = a r g min y \in Y \sum k = 1 K (1 - P (c k = Y | X = x)) = a r g max y \in Y \sum k = 1 K P (c k = Y | X = x)

$f(x) =arg \min_{y \in Y} \sum_{k=1}^KL(c_k,y)P(c_k|X=x) \\ =arg \min_{y \in Y} \sum_{k=1}^KP(c_k \neq Y|X=x) \\ =arg \min_{y \in Y} \sum_{k=1}^K(1-P(c_k = Y|X=x) )\\ =arg \max_{y \in Y} \sum_{k=1}^KP(c_k = Y|X=x)$
通过以上推导，根据期望风险最小化得到了后验概率最大化：

f (x) = a r g max c k P (c k | X = x)

$f(x)=arg \max_{c_k}P(c_k|X=x)$
这就是朴素贝叶斯算法所使用的原理。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/576656.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

项目管理汇总

项目管理汇总

一、一个失败软件项目的思考 http://kb.cnblogs.com/page/113051/ 二、我们需要真正的软件项目经理 http://wangacidlemon.iteye.com/blog/1185903 评论写的不错，粘贴来先给大家分享一下一个好的项目负责人，是不会自己去做具体事情的，他应…

阅读更多...

ElasticSearch和solr的对比

ElasticSearch和solr的对比

关于ES：ElasticSearch是一个事实分布式搜索和分析引擎，使用其可以以前所未有的速度处理大数据，他用于全文搜索、结构化搜索、分析以及将这三者混合使用。维基百科使用ElasticSearch提供全文搜索并高亮关键字，以及输入实时搜索(sea…

阅读更多...

机器学习笔记（六）——朴素贝叶斯法的参数估计

机器学习笔记（六）——朴素贝叶斯法的参数估计

一、极大似然估计在上一笔记中，经过推导，得到了朴素贝叶斯分类器的表示形式： yargmaxckP(Yck)∏jP(X(j)x(j)|Yck)(1)也就是说，朴素贝叶斯方法的学习是对概率P(Yck)和P(X(j)x(j)|Yck)的估计。故可以用极大似然估计法估计上述先验…

阅读更多...

ElasticSearch和mysql对比

ElasticSearch和mysql对比

以员工文档的形式存储为例：一个文档代表一个员工数据。存储数据到 ElasticSearch 的行为叫做索引，但在索引一个文档之前，需要确定将文档存储在哪里。一个 ElasticSearch 集群可以包含多个索引，相应的每个索引可以包含多个类型。…

阅读更多...

最优化学习笔记（一）——牛顿法(一维搜索方法)

最优化学习笔记（一）——牛顿法(一维搜索方法)

一、一维搜索方法讨论目标函数为一元单值函数f:R→R时的最优化问题的迭代求解方法。二、局部极小点的条件 n元实值函数f的一阶导数Df为： Df≜[∂f∂x1,∂f∂x2,…,∂f∂xn]Df \triangleq \lbrack \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partia…

阅读更多...

针对12306.cn网站应用架够的一些看法

针对12306.cn网站应用架够的一些看法

临近年终，公司请来一位讲师来给我们作培训，题目记得是设计匠艺。说实话，我做不到像讲师那样，快讲完课时能将自己所讲的内容都有条理整理一遍。我就大致讲讲我所做笔记的一些内容吧。总的来说这位讲师的实践经验很丰富，…

阅读更多...

机器学习笔记（七）——决策树模型

机器学习笔记（七）——决策树模型

引言决策树（Decision Tree）是一种基本的分类和回归方法。它的扩展方法有GBDT和GBRT 等。决策树模型的学习过程主要有特征选择、决策树生成和剪枝。主要算法有ID3、C4.5和CART等。一、决策树模型决策树首先是一个树形结构，它包括两种类型…

阅读更多...

ElasticSearch获取多个文档Multi GET API介绍

ElasticSearch获取多个文档Multi GET API介绍

#■同时获取多个文档信息 #■例子:获职index:bank和shakespeare下面 #. I0为1.2.3.4.15.6.28的文档信息 GET /bank/bank_account/1 GET /bank/bank_account/2 GET /shakespcare/line/3 GET /bank/bank_account/4 GET /shakespeare/line/15 #日数组[] GET /_mget {"docs&qu…

阅读更多...

机器学习笔记（八）——决策树模型的特征选择

机器学习笔记（八）——决策树模型的特征选择

一、引言决策树构建过程中的特征选择是非常重要的一步。特征选择是决定用哪个特征来划分特征空间，特征选择是要选出对训练数据集具有分类能力的特征，这样可以提高决策树的学习效率。如果利用某一个特征进行分类与随机分类的结果没有很大的差别&#xf…

阅读更多...

Bulk批量操作API的介绍

Bulk批量操作API的介绍

#多重模式 #批量操作bulk POST /library/books/_bulk {"index": {"_id": 1}} {"title":"Elasticsearch: The Definitive Guide","price":5} {"index": {"_id": 2}} {"title":"The Elast…

阅读更多...

[转】：Android调试工具及方法

[转】：Android调试工具及方法

http://www.cnblogs.com/feisky/archive/2010/01/01/1637566.html--LogcatDump一份系统消息的日志。这些消息包括模拟器抛出错误时的堆栈跟踪。Android Log一个记录日志的类，用来将消息写入模拟器上的日志文件中。如果你在DDMS上运行logcat的话你可以就实时查看消息…

阅读更多...

机器学习笔记（九）——决策树的生成与剪枝

机器学习笔记（九）——决策树的生成与剪枝

一、决策树的生成算法基本的决策树生成算法主要有ID3和C4.5, 它们生成树的过程大致相似，ID3是采用的信息增益作为特征选择的度量，而C4.5采用信息增益比。构建过程如下： 从根节点开始，计算所有可能的特征的信息增益（信…

阅读更多...

Bulk处理文档大小的最佳值

Bulk处理文档大小的最佳值

阅读更多...

apache+webdav的安装配置

apache+webdav的安装配置

原始资料：http://www.howtoforge.com/setting-up-webdav-with-apache2-on-debian-etch apachewebdav的安装配置需求：1.开启一个web服务，使得客户端能够像操作本地磁盘一样操作服务端某个文件目录下的文件在服务器上安装配置apachewebdav模块…

阅读更多...

最优化学习笔记（二）——二分法

最优化学习笔记（二）——二分法

二分法是一种一维搜索方法。它讨论的是求解一元单值函数f:R→R在区间[a0,b0]的极小点问题。同时要求函数f在区间[a0,b0]上为单调函数，并且是连续可微的，这里将使用f的一阶导数f′。二分法的计算过程比较简单，它主要是利用一阶导数来连…

阅读更多...

elasticsearch内部版本控制

elasticsearch内部版本控制

现在我将这个price价格改为10，看下版本有什么变化？ 获取一下返回结果我们知道价格price已经修改为10，_version已经变成2 我们把参数version改成2试试我们从执行结果可知，我们已经修改成功，并且版本自增为3

阅读更多...

JAVA每个初学者都应该搞懂的问题还可以比较基础

JAVA每个初学者都应该搞懂的问题还可以比较基础

还可以比较基础转自http://blog.csdn.net/devillyd/article/details/2486520 对于这个系列里的问题，每个学Java的人都应该搞懂。当然，如果只是学Java玩玩就无所谓了。如果你认为自己已经超越初学者了，却不很懂这些问题，请将你自己…

阅读更多...

最优化学习笔记（三）——梯度下降法

最优化学习笔记（三）——梯度下降法

本来这周计划写下逻辑回归的学习笔记，但是其中用到了最优化对数似然函数，因此决定先复习下梯度方法和拟牛顿法。本节先从纯数学的角度总结下梯度下降法。一、柯西-施瓦茨不等式对于 Rn中的任意两个向量 x和y， 有： |<x,y&g…

阅读更多...

ElasticSearch外部版本控制

ElasticSearch外部版本控制

#外部版本控制机制| PUT /library/books/1?version5&version_typeexternal {"title": "Elosticsearch: The Definitive Guide" ,"name":{"first" : "Zachary","last" : "Tong"},"publish_dat…

阅读更多...

最优化学习笔记（四）——最速下降法

最优化学习笔记（四）——最速下降法

一、最速下降法的理念最速下降法是梯度方法的一种实现，它的理念是在每次的迭代过程中，选取一个合适的步长αk，使得目标函数的值能够最大程度的减小。αk可以认为是函数ϕk(α)f(x(k)−α∇f(x(k)))的极小值点： αkargminf(x(k)−…

阅读更多...

最新文章