数学基础 -- 条件概率、后验概率与联合概率

条件概率与后验概率

技术背景

条件概率和后验概率是概率论中的两个重要概念,在机器学习和贝叶斯推理中尤为关键。理解这两个概念对于处理不确定性和进行推理具有重要意义。本文将通过直观的例子和数学解释来详细介绍条件概率与后验概率。

条件概率

条件概率是指在已知某个事件发生的条件下,另一个事件发生的概率。用数学符号表示为 P ( A ∣ B ) P(A|B) P(AB),表示在事件 B B B 发生的前提下,事件 A A A 发生的概率。

直观例子

假设我们有一个袋子,里面有红球和蓝球。袋子里有3个红球和2个蓝球。我们随机从袋子里抽一个球,并且知道抽到的是红球。那么,在这个条件下,抽到第二个球是红球的概率是多少?

  1. 初始情况:袋子里有3个红球和2个蓝球,总共5个球。
  2. 条件:已知第一个抽到的球是红球。现在袋子里剩下2个红球和2个蓝球。
  3. 条件概率:在第一个球是红球的条件下,抽到第二个球是红球的概率是 2 4 = 0.5 \frac{2}{4} = 0.5 42=0.5

后验概率

后验概率是贝叶斯推理中的一个核心概念,它表示在观察到某些数据后,某个假设为真的概率。用数学符号表示为 P ( A ∣ B ) P(A|B) P(AB),但它的计算方法基于贝叶斯定理。

贝叶斯定理公式:
P ( A ∣ B ) = P ( B ∣ A ) ⋅ P ( A ) P ( B ) P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} P(AB)=P(B)P(BA)P(A)

其中:

  • P ( A ∣ B ) P(A|B) P(AB):事件 B B B 发生后事件 A A A 的后验概率。
  • P ( B ∣ A ) P(B|A) P(BA):在事件 A A A 发生的情况下,事件 B B B 发生的条件概率。
  • P ( A ) P(A) P(A):事件 A A A 的先验概率,即在没有任何其他信息之前,我们对事件 A A A 发生的信念。
  • P ( B ) P(B) P(B):事件 B B B 的边际概率,即所有情况下事件 B B B 发生的概率。

直观例子

假设我们有一个医疗测试,用于检测某种疾病。已知这种疾病在总人口中的发病率是1%(即先验概率 P ( 疾病 ) = 0.01 P(疾病) = 0.01 P(疾病)=0.01)。测试的准确率是已知的:如果一个人有病,测试结果是阳性的概率是99%(即 P ( 阳性 ∣ 有病 ) = 0.99 P(阳性|有病) = 0.99 P(阳性有病)=0.99);如果一个人没有病,测试结果是阳性的概率是5%(即 P ( 阳性 ∣ 无病 ) = 0.05 P(阳性|无病) = 0.05 P(阳性无病)=0.05)。现在,如果一个人的测试结果是阳性,我们想知道这个人实际上患病的概率是多少(即后验概率)。

  1. 已知信息

    • P(有病) = 0.01
    • P(无病) = 1 - P(有病) = 0.99
    • P(阳性|有病) = 0.99
    • P(阳性|无病) = 0.05
  2. 计算边际概率 ( P(阳性) )
    P ( 阳性 ) = P ( 阳性 ∣ 有病 ) ⋅ P ( 有病 ) + P ( 阳性 ∣ 无病 ) ⋅ P ( 无病 ) P(阳性) = P(阳性|有病) \cdot P(有病) + P(阳性|无病) \cdot P(无病) P(阳性)=P(阳性有病)P(有病)+P(阳性无病)P(无病)
    P ( 阳性 ) = 0.99 ⋅ 0.01 + 0.05 ⋅ 0.99 P(阳性) = 0.99 \cdot 0.01 + 0.05 \cdot 0.99 P(阳性)=0.990.01+0.050.99
    P ( 阳性 ) = 0.0099 + 0.0495 = 0.0594 P(阳性) = 0.0099 + 0.0495 = 0.0594 P(阳性)=0.0099+0.0495=0.0594

  3. 计算后验概率 ( P(有病|阳性) )
    P ( 有病 ∣ 阳性 ) = P ( 阳性 ∣ 有病 ) ⋅ P ( 有病 ) P ( 阳性 ) P(有病|阳性) = \frac{P(阳性|有病) \cdot P(有病)}{P(阳性)} P(有病阳性)=P(阳性)P(阳性有病)P(有病)
    P ( 有病 ∣ 阳性 ) = 0.99 ⋅ 0.01 0.0594 P(有病|阳性) = \frac{0.99 \cdot 0.01}{0.0594} P(有病阳性)=0.05940.990.01
    P ( 有病 ∣ 阳性 ) ≈ 0.167 P(有病|阳性) \approx 0.167 P(有病阳性)0.167

所以,尽管测试结果是阳性,实际上患病的概率只有大约16.7%。这说明即使测试看起来很准确,但由于疾病本身的低发病率,测试的阳性结果也可能是误报。

联合概率

联合概率是指两个或多个事件同时发生的概率。用数学符号表示为 P ( A ∩ B ) P(A \cap B) P(AB) 或者 P ( A , B ) P(A, B) P(A,B),表示事件 A A A 和事件 B B B 同时发生的概率。

数学定义

联合概率 P ( A ∩ B ) P(A \cap B) P(AB) 表示事件 A A A 和事件 B B B 同时发生的概率。对于离散事件,联合概率的计算公式为:

P ( A ∩ B ) = P ( A ) ⋅ P ( B ∣ A ) P(A \cap B) = P(A) \cdot P(B|A) P(AB)=P(A)P(BA)

这意味着,联合概率等于事件 A A A 发生的概率乘以在事件 A A A 发生的前提下事件 B B B 发生的条件概率。

直观例子

假设我们有一个班级,班级里有男生和女生,同时有的人是篮球队员,有的人不是。我们随机从班级里选一个人,已知该人是男生并且是篮球队员的概率是多少?

具体步骤
  1. 已知数据

    • 班级里有20个男生和10个女生,总共30人。
    • 男生中有5个篮球队员,女生中有3个篮球队员。
    • 总共有8个篮球队员。
  2. 计算概率

    • 选择到一个男生的概率 P ( 男生 ) = 20 30 = 2 3 P(男生) = \frac{20}{30} = \frac{2}{3} P(男生)=3020=32
    • 在选择到男生的前提下,选择到一个篮球队员的概率 P ( 篮球队员 ∣ 男生 ) = 5 20 = 1 4 P(篮球队员|男生) = \frac{5}{20} = \frac{1}{4} P(篮球队员男生)=205=41
  3. 联合概率:选择到一个既是男生又是篮球队员的概率是:
    P ( 男生 ∩ 篮球队员 ) = P ( 男生 ) ⋅ P ( 篮球队员 ∣ 男生 ) = 2 3 ⋅ 1 4 = 2 12 = 1 6 P(男生 \cap 篮球队员) = P(男生) \cdot P(篮球队员|男生) = \frac{2}{3} \cdot \frac{1}{4} = \frac{2}{12} = \frac{1}{6} P(男生篮球队员)=P(男生)P(篮球队员男生)=3241=122=61

应用场景

联合概率在许多领域有广泛的应用,包括但不限于:

  • 机器学习:在朴素贝叶斯分类器中,联合概率用于计算特征和类别同时发生的概率。
  • 统计学:在多变量分析中,联合概率用于分析两个或多个变量之间的关系。
  • 金融:在风险管理中,联合概率用于评估多个金融事件同时发生的风险。

总结

通过上述例子,我们展示了条件概率、后验概率和联合概率的基本概念和应用。在机器学习和数据分析中,理解这些概率概念可以帮助我们更好地处理不确定性和进行推理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/14328.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux rzsz安装(在线安装、离线安装),用于上传下载文件

在线安装: yum -y install lrzsz 离线安装: 1.下载安装包地址:http://freshmeat.sourceforge.net/projects/lrzsz/ 2.通过同一网络内可以上传文件的机器(B机:10.210.168.18)先将lrzsz-0.12.20.tar.gz上传至…

盘点Java中的排序操作方案

盘点Java中的排序操作方案 Comparable 接口-自然排序 类implements Comparable接口 类重写 public int compareTo(Object obj)方法 如果返回值为正数,则表示当前对象(调用该方法的对象)比 obj 对象“大”;反之“小”;如果为零的话&#x…

多家知名媒体到访“光子1号金融算力中心“ 交流AI与算力未来观

5月23日,企商在线 “光子1号金融算力中心媒体参观日”活动成功举办,十多家主流媒体、IT行业媒体及自媒体代表走进光子1号金融算力中心,深入了解企商业务发展、战略规划及“光子1号金融算力中心”等企商打造的新型数字基础设施,共同…

Python条件分支与循环

大家好,当涉及到编写高效和灵活的程序时,条件分支和循环是 Python 中至关重要的概念。它们允许我们根据不同的条件执行不同的代码块,或者重复执行一组语句。条件分支和循环是测试开发工程师在日常工作中经常使用的工具,无论是编写…

光耦合器的特性和应用概述

光耦合器又称光电耦合器,是现代电子学中必不可少的元件,确保隔离电路之间安全有效的信号传输。本文探讨了光耦合器的特性及其多样化应用,强调了它们在各种电子系统中的关键作用。 什么是光耦合器? 光耦合器是一种设计用于利用光传…

Java 18新特性详细介绍

Java作为一门广泛使用的编程语言,一直在不断地发展和更新。Java 18是Java的最新版本,它引入了许多新特性和改进,使得开发过程更加高效、安全和便捷。本文将详细介绍Java 18的新特性,帮助开发者更好地了解和应用这些新功能。 JEP …

vue详解(4)

1. v-model 原理 原理:v-model本质上是一个语法糖。例如应用在输入框上,就是 value属性 和 input事件 的合写。作用:提供数据的双向绑定。① 数据变,视图跟着变 :value;② 视图变,数据跟着变 input注意&am…

【MySQL数据库】CRUD 增 删 改 查 超详解,有这一篇就够了!

​ ​ 🔥个人主页: 中草药 🔥专栏:【MySQL】探秘:数据库世界的瑞士军刀 目录 ⚗️一.CRUD 🧪二.新增(Create) 🧫1.基本操作 🧬2.使用SELECT插入 &#x…

长难句5.24

There is pressure for change from within the profession, but opponents of change among the regulators insist that keeping outsiders out of a law firm isolates lawyers from the pressure to make money rather than serve clients ethically. 在(律师)行业内部也有…

云计算历史、业务驱动因素和术语 (Cloud Computing History, Business Drivers and Terminologies)

云计算的历史与定义 (History and Definition of Cloud Computing) 历史 (History) 云计算的概念化始于很久以前,早在1963年。麻省理工学院从美国国防高级研究计划局获得研究资金,用于开发一种“计算机可同时被两人或更多人使用”的技术。在早期的云计算…

区块链钱包如果丢失了私钥或助记词,资产还能恢复吗?

如果你丢失了区块链钱包的私钥或助记词(通常是用于恢复钱包的短语或种子),那么你的资产在大多数情况下是无法恢复的。私钥是访问和控制你在区块链上资产的唯一凭证,而助记词(如BIP39标准中的12、18、24个单词的短语&am…

centos常见命令总结

一、【写在前面】 注意到csdn在鼓励作者创作centos常见命令相关的文章,借此机会水一篇博文。 centos作为上个版本国内最常用的开源操作系统,占有量非常恐怖,排个前三应该没有任何疑问。但是我建议直接去学ubuntu,因为主流在用的…

【系统架构师】-案例篇(十五)SOA、微服务与数据库

1、可复用构件应具备哪些属性 可用性:构件必须易于理解和使用。 质量:构件及其变形必须能正确工作。 适应性:构件应该易于通过参数化等方式在不同语境中进行配置。 可移植性:构件应能在不同的硬件运行平台和软件环境中工作。 可变…

Spring Boot实现RabbitMQ监听消息的几种方式

Spring Boot实现RabbitMQ监听消息的几种方式 在现代的分布式系统中,消息队列扮演着至关重要的角色,用于解耦服务之间的通信,实现异步消息传递。而RabbitMQ作为其中一种常用的消息队列服务,在Spring Boot中得到了广泛的应用。本文…

pip(包管理器) for Python

pip是什么 pip是Python的包安装程序,即python包管理器。您可以使用 pip 从Python包索引和其他索引安装包。 1. pip 安装 python 包 pip install 包名 例如:pip install pymssql : 使用pip安装数据库驱动包 pymssql 2.pip 卸载 python 包 pi…

【Axure教程】拖动换位选择器

拖动换位选择器通常用于从一个列表中选择项目并将其移动到另一个列表中。用户可以通过拖动选项来实现选择和移动。这种交互方式在许多Web应用程序中很常见,特别是在需要对项目分组的情况下。 所以今天作者就教大家怎么在Axure用中继器制作一个拖动换位选择器的原型…

告别硬编码:Spring条件注解优雅应对多类场景

一、背景 在当今的软件开发中,服务接口通常需要对应多个实现类,以满足不同的需求和场景。举例来说,假设我们是一家2B公司,公司的产品具备对象存储服务的能力。然而,在不同的合作机构部署时,发现每家公司底…

RedisTemplateAPI:List

文章目录 ⛄介绍⛄List的常见命令有⛄RedisTemplate API❄️❄️添加缓存❄️❄️将List放入缓存❄️❄️设置过期时间(单独设置)❄️❄️获取List缓存全部内容(起始索引,结束索引)❄️❄️从左或从右弹出一个元素❄️❄️根据索引查询元素❄…

探索 Rust 语言的精髓:深入 Rust 标准库

探索 Rust 语言的精髓:深入 Rust 标准库 Rust,这门现代编程语言以其内存安全、并发性和性能优势而闻名。它不仅在系统编程领域展现出强大的能力,也越来越多地被应用于WebAssembly、嵌入式系统、分布式服务等众多领域。Rust 的成功&#xff0…

Day25:Leetcode:669. 修剪二叉搜索树 + 108.将有序数组转换为二叉搜索树 + 538.把二叉搜索树转换为累加树

LeetCode&#xff1a;669. 修剪二叉搜索树 问题描述 解决方案&#xff1a; 1.思路 2.代码实现 class Solution {public TreeNode trimBST(TreeNode root, int low, int high) {if (root null) {return null;}if (root.val < low) {return trimBST(root.right, low, hi…