ML 系列:第 18 部 - 高级概率论:条件概率、随机变量和概率分布

文章目录

  • 一、说明
  • 二、关于条件概率
    • 2.1 为什么我们说条件概率?
    • 2.2 为什么条件概率在统计学中很重要
  • 三、 随机变量的定义
    • 3.1 定义
    • 3.2 条件概率中的随机变量
  • 四、概率分布的定义
  • 五、结论

一、说明

条件概率是极其重要的概率概念,它是因果关系的数学表述,也是随机过程的主要核心内容。本文将就条件概率的相关概念进行叙述。

二、关于条件概率

碳条件概率是假设另一事件已经发生,则某事件发生的概率。当两个或多个事件不独立时,使用条件概率。这意味着 一个事件发生的可能性受到另一个事件是否发生的影响。

从数学上讲,条件概率用𝑃(𝐵∣𝐴) 表示,即“在事件 A 发生的情况下,事件 B 发生的概率”。它问道:“如果我们知道 A 已经发生,那么 B 发生的概率是多少?”
在这里插入图片描述
图 1.条件概率公式

2.1 为什么我们说条件概率?

我们使用“条件概率”一词,因为它表示在另一事件已经发生的条件下发生某事件的概率。换句话说,它量化了在我们有关于另一事件发生的额外信息的情况下发生某事件的可能性。
在这里插入图片描述

图 2.条件概率项

2.2 为什么条件概率在统计学中很重要

条件概率在统计学中至关重要,因为它可以帮助我们根据已知的信息调整预测。当我们已经知道事件 A 已经发生时,它告诉我们事件 B 发生的可能性。

三、 随机变量的定义

3.1 定义

随机变量是将实数与事件相关联的函数。这意味着为每个可能的结果分配一个值(一个实数)。用更数学的术语来说,它是从样本空间 Ω 到实数的函数。我们可以根据需要选择随机变量。

在这里插入图片描述

图 3.随机变量

3.2 条件概率中的随机变量

它为随机实验的样本空间中的每个结果分配一个数值,从而更容易处理和分析这些结果的概率属性。

在这里插入图片描述

图 4.硬币的随机变量
如果硬币正面朝上,则随机变量 X 的值为 1;如果硬币反面朝上,则随机变量 X 的值为 0。在一次抛硬币中,出现这两种情况的概率均为 50%。X(在本例中为 1 和 0)可以取的值称为样本空间,可以表示为 {0, 1}。

处理随机变量时,我们经常使用符号𝑃(𝐵=𝑏∣𝐴=𝑎)。

每个部分的含义如下:

𝐴 和 𝐵 是随机变量,a和b是这些随机变量可以取的特定值。𝑃(𝐵=𝑏∣𝐴=𝑎) 的含义:
该符号表示在随机变量 𝐴 取值a的情况下,随机变量 𝐵 取值b的概率。简单来说,它描述了了解 𝐴 的结果如何影响 𝐵 结果的可能性。

例子
假设某人掷出两个公平的六面骰子,并且我们希望计算第一个骰子的正面值为 2 的概率,前提是它们的总和不大于 5。

令D 1 为骰子 1 掷出的值。
令D 2 为骰子 2 掷出的值。
D 1 = 2的概率
在这里插入图片描述

图 5. D 1 = 2的概率
表 1 显示了两个骰子掷出的 36 种组合的样本空间,每种组合出现的概率为 1/36,红色和深灰色单元格中显示的数字为D 1 + D 2 (D = D1+D2 = 36)。注意:表 1 中的每个单元格代表 D1 和 D2(两个骰子的结果)的总和

在 36 个结果中,恰好有 6 个结果为D 1 = 2;因此P ( D 1 = 2) = 6/36 = 1/6

  1. D 1 + D 2 ≤5的概率

在这里插入图片描述

图 6. D 1 + D 2 ≤5的概率
我们有 36 种结果,但只有 10 种可能性小于 5,换句话说,结果是 10 / 36

  1. 假设D 1 + D 2 ≤ 5 ,则D 1 = 2的概率

这是一个有趣的例子,在这个例子中,条件概率发挥了作用。

在这里插入图片描述

图 7.假设D 1 + D 2 ≤ 5 ,则D 1 = 2的概率
表 3 显示,对于这 10 个结果中的 3 个(D 1+ D 2 ≤5),D 1 = 2。因此,条件概率 P( D 1 = 2 | D 1+ D 2 ≤5) = 3/10 = 0.3

让我们尝试了解其背后的数学原理:

B:D1=2
答:D1 + D2≤5
P( B | A ) = P(B∩A)/P(A) = (3/36)/(10/36) = 3/10是多少
所以我们可以说P( B | A ) = P(B ∩ A) / P(A);如果 P(A) ≠0

探索不同类型的随机变量:离散和连续
随机变量可分为两种主要类型:离散型和连续型。了解这两种类型之间的差异对于选择合适的统计方法和模型至关重要。
在这里插入图片描述

图 8.离散和连续随机变量

1.离散随机变量
离散随机变量具有可数的不同值。这些值通常是整数,随机变量通常来自可以计算结果的场景。示例包括一系列抛硬币中正面朝上的次数、一小时内通过收费站的汽车数量或教室里的学生人数。

在这里插入图片描述

图 9.离散随机变量
**主要特点:**

可数结果:离散随机变量具有有限或可数无限的可能值集。
2.连续随机变量
连续随机变量在给定间隔内具有无数个值。这些值通常是测量值,可以取一定范围内的任何值。示例包括班级学生的身高、完成任务所需的时间或城市的温度。

主要特点:

不可数结果:连续随机变量可以在区间内取任意值,使得其可能值集不可数。

四、概率分布的定义

随机变量 (X) 的概率分布显示事件概率在随机变量的不同值上的分布情况。当随机变量的所有值在图形上排列时,其概率值会形成一个形状。概率分布具有几个可以测量的属性(例如:期望值和方差)。应该记住,有利结果的概率始终大于零,所有事件的所有概率之和等于 1。

概率分布本质上是任何随机实验或事件的所有可能结果的集合。

概率分布在理解随机变量中的作用
概率分布表征随机变量可能取的值,并为这些值分配概率。这些分布是统计学中的基本概念,描述随机变量的值如何分布。根据随机变量是可数的还是不可数的,概率分布可以分别是离散的或连续的。

离散概率分布:处理离散随机变量(例如,硬币翻转的正面次数)并由概率质量函数(PMF)定义。
连续概率分布:处理连续随机变量(例如,人的身高)并由概率密度函数定义(PDF)。
在这里插入图片描述

图 10.概率分布

五、结论

我们的 ML 系列第 18 天深入探讨了条件概率、随机变量和概率分布,这些都是理解概率论的重要概念。在第 19 天 — PMF、PDF、均值、方差、标准差中,我们将通过探索概率质量函数 (PMF)、概率密度函数 (PDF)和深入研究著名的概率分布来进一步简化。请继续关注我们,我们将继续探索概率世界及其在机器学习及其他领域的应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/57662.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于springboot的社区团购系统设计与实现

一、项目背景 网络交易(Electronic Commerce):是指实现整个贸易过程中各阶段的贸易活动的电子化。网络交易是一种多技术的集合体。其业务可包括:信息交换、售后服务、销售、电子支付、运输、组建虚拟企业、公司和贸易伙伴可以共同…

挑战Java面试题复习第4天,坚持就是胜利

挑战第 4 天 Excption与Error包结构OOM 知识点SOF 知识点线程程序进程知识点有些字段不想序列化,怎么办?说说 IO 流Java IO与 NIO的区别 Excption与Error包结构 运行时异常(RuntimeException): 包括RuntimeException…

一文读懂系列:SSL加密流量检测技术详解

SSL加密流量检测功能的主要目的是为了对加密流量做解密处理,并对解密后的流量做内容安全检查(比如反病毒、入侵防御、URL远程查询、内容过滤、文件过滤和邮件过滤等)和审计(防止信息泄露)。接下来我们详细介绍SSL加密流…

dependencyManagement保持maven的多模块依赖版本一致

在maven的多模块中, 为保持jar包在每个子模块中版本一致, 一般会有两种选择: 在父pom的dependencies标签中声明一个jar,每个子模块都会默认继承该jar 如果只有部分子模块用到了一个jar, 则会选择将该jar坐标信息声明在父pom的dependencyManagement标签中…

axis 参数的方向

axis0:表示沿着行的方向进行操作,即对每一列进行操作。 axis1:表示沿着列的方向进行操作,即对每一行进行操作。 示例: import numpy as np# 创建一个二维数组 array np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9] ])axis0…

golang的循环引用解决方法

循环引用是指在数据结构中,两个或多个实体相互引用,形成一个闭环。例如,在 Golang 的结构体中,如果结构体 A 包含结构体 B 的实例,而结构体 B 又包含结构体 A 的实例,这种情况就称为循环引用。以下是关于循…

【C++】关联式容器

1.Set和Map 1.1 set的介绍 set是一个常用的关联式容器,它存储唯一的元素,这些元素默认情况下按照升序排序。其底层是一种自平衡的二叉搜索树(红黑树)。 set元素的键值就是实值,实值就是键值。set的元素允许插入删除但是不允许修改(具有const…

Spring Cloud Function快速入门Demo

1.什么是Spring Cloud Function? Spring Cloud Function是一个具有以下高级目标的项目: 通过功能促进业务逻辑的实现。将业务逻辑的开发生命周期与任何特定的运行时目标脱钩,以便可以将相同的代码作为Web终结点,流处理器或任务来…

第3章 继承与多态

Java面向对象程序设计-T3(继承与多态) 一、封装 1、概述 封装是指隐藏对象的属性和实现细节,仅对外提供公共访问方式。 public class Student {//1、私有化属性private String name;private int age;//2、提供公共方法供外部访问//传入数据public void setName(String nam…

荣誉证书PSD素材(59套免费)

本作品提供荣誉证书PSD素材下载,格式为PSD; 请使用软件Photoshop进行编辑,作品中文字及图均可以通过软件修改和编辑; 点击下载: 荣誉证书PSD素材

Java三大特性之多态

多态是Java的三大特性之一,它指的是同一个方法名字,在不同的对象中有不同的实现方式。具体来说,多态有两种表现形式:静态多态(编译时多态,也称为重载)和动态多态(运行时多态&#xf…

第T6周:Tensorflow实现好莱坞明星识别

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 目标 具体实现 (一)环境 语言环境:Python 3.10 编 译 器: PyCharm 框 架: (二)具体步骤 1.查询…

Spring6框架搭建(自用)

一、什么是Spring 众所不周知,Spring就是爪哇人的春天,但是在框架程序设计之前都绕不开javaWeb 1.javaWeb框架发展史 1、ServletJSPJavaBean(跳转页面、业务逻辑判断、数据库查询) 2、MVC三层架构(M Model pojo(User)V-view(USP)C-(controller-servl…

linux-UART

参考博客 https://blog.csdn.net/m0_38106923/article/details/126024970?sharetypeblog&shareId126024970&sharereferAPP&sharesourceweixin_40933496&sharefromlink 1.串口 UART的全称是Universal Asynchronous Receiver and Transmitter,即异步…

大数据治理:策略、技术与挑战

随着信息技术的飞速发展,大数据已经成为现代企业运营和决策的重要基础。然而,大数据的复杂性、多样性和规模性给数据管理带来了前所未有的挑战。因此,大数据治理应运而生,成为确保数据质量、合规性、安全性和可用性的关键手段。本…

vue插件清除 所有console.log()

一、作用 1、提升性能console.log() 语句会消耗一定的性能,尤其是在频繁调用的情况下。在生产环境中移除这些语句可以提高应用的运行效率。 2、减少信息泄露console.log() 可以输出敏感信息(如用户数据、API 响应等)。在生产环境中&#xf…

DAY15|二叉树Part03|LeetCode: 513.找树左下角的值、112. 路径总和、106. 从中序与后序遍历序列构造二叉树

LeetCode: 513.找树左下角的值 力扣代码链接 文字讲解:LeetCode: 513.找树左下角的值 视频讲解:怎么找二叉树的左下角? 递归中又带回溯了,怎么办? 基本思路 对题目进行一下分析,要找二叉树最底层最左边节点…

【记录】Excel 公式|(一)根据某列内容和关键词列,自动生成当前行的关键词分类名称

文章目录 引言公式解析应用场景数据准备公式应用结果分析 结论扩展应用注意事项总结后续学习结语 我的 Excel 版本:2021 引言 在当今数据驱动的世界中,高效的数据处理和分类对于企业和个人来说至关重要。Excel 作为最常用的数据处理工具之一&#xff0c…

【ROS2】hbm_img_msgs/msg/HbmMsg1080P 转 opencv cv::Mat

1、简述 在ROS2中处理图像时,经常会用的OpenCV,因此常常会涉及到ROS2话题和cv::Mat的转换 ROS2内置消息 sensor_msgs::msg::Image 可以使用 cv_bridge 转换成 OpenCV的 cv::Mat。 参见博客:【ROS2】cv_bridge:ROS图像消息和OpenCV的cv::Mat格式转换库 在使用地平线X3派时…

ClkLog企业版(CDP)预售开启,更有鸿蒙SDK前来助力

新版本发布 ClkLog在上线近1年后,获得了客户的一致肯定与好评,并收到了不少客户对功能需求的反馈。根据客户的反馈,我们在今年三季度对ClkLog的版本进行了重新的规划与调整,简化了原有的版本类型,方便客户进行选择。 与…