ML 系列:第 18 部 - 高级概率论:条件概率、随机变量和概率分布

文章目录

  • 一、说明
  • 二、关于条件概率
    • 2.1 为什么我们说条件概率?
    • 2.2 为什么条件概率在统计学中很重要
  • 三、 随机变量的定义
    • 3.1 定义
    • 3.2 条件概率中的随机变量
  • 四、概率分布的定义
  • 五、结论

一、说明

条件概率是极其重要的概率概念,它是因果关系的数学表述,也是随机过程的主要核心内容。本文将就条件概率的相关概念进行叙述。

二、关于条件概率

碳条件概率是假设另一事件已经发生,则某事件发生的概率。当两个或多个事件不独立时,使用条件概率。这意味着 一个事件发生的可能性受到另一个事件是否发生的影响。

从数学上讲,条件概率用𝑃(𝐵∣𝐴) 表示,即“在事件 A 发生的情况下,事件 B 发生的概率”。它问道:“如果我们知道 A 已经发生,那么 B 发生的概率是多少?”
在这里插入图片描述
图 1.条件概率公式

2.1 为什么我们说条件概率?

我们使用“条件概率”一词,因为它表示在另一事件已经发生的条件下发生某事件的概率。换句话说,它量化了在我们有关于另一事件发生的额外信息的情况下发生某事件的可能性。
在这里插入图片描述

图 2.条件概率项

2.2 为什么条件概率在统计学中很重要

条件概率在统计学中至关重要,因为它可以帮助我们根据已知的信息调整预测。当我们已经知道事件 A 已经发生时,它告诉我们事件 B 发生的可能性。

三、 随机变量的定义

3.1 定义

随机变量是将实数与事件相关联的函数。这意味着为每个可能的结果分配一个值(一个实数)。用更数学的术语来说,它是从样本空间 Ω 到实数的函数。我们可以根据需要选择随机变量。

在这里插入图片描述

图 3.随机变量

3.2 条件概率中的随机变量

它为随机实验的样本空间中的每个结果分配一个数值,从而更容易处理和分析这些结果的概率属性。

在这里插入图片描述

图 4.硬币的随机变量
如果硬币正面朝上,则随机变量 X 的值为 1;如果硬币反面朝上,则随机变量 X 的值为 0。在一次抛硬币中,出现这两种情况的概率均为 50%。X(在本例中为 1 和 0)可以取的值称为样本空间,可以表示为 {0, 1}。

处理随机变量时,我们经常使用符号𝑃(𝐵=𝑏∣𝐴=𝑎)。

每个部分的含义如下:

𝐴 和 𝐵 是随机变量,a和b是这些随机变量可以取的特定值。𝑃(𝐵=𝑏∣𝐴=𝑎) 的含义:
该符号表示在随机变量 𝐴 取值a的情况下,随机变量 𝐵 取值b的概率。简单来说,它描述了了解 𝐴 的结果如何影响 𝐵 结果的可能性。

例子
假设某人掷出两个公平的六面骰子,并且我们希望计算第一个骰子的正面值为 2 的概率,前提是它们的总和不大于 5。

令D 1 为骰子 1 掷出的值。
令D 2 为骰子 2 掷出的值。
D 1 = 2的概率
在这里插入图片描述

图 5. D 1 = 2的概率
表 1 显示了两个骰子掷出的 36 种组合的样本空间,每种组合出现的概率为 1/36,红色和深灰色单元格中显示的数字为D 1 + D 2 (D = D1+D2 = 36)。注意:表 1 中的每个单元格代表 D1 和 D2(两个骰子的结果)的总和

在 36 个结果中,恰好有 6 个结果为D 1 = 2;因此P ( D 1 = 2) = 6/36 = 1/6

  1. D 1 + D 2 ≤5的概率

在这里插入图片描述

图 6. D 1 + D 2 ≤5的概率
我们有 36 种结果,但只有 10 种可能性小于 5,换句话说,结果是 10 / 36

  1. 假设D 1 + D 2 ≤ 5 ,则D 1 = 2的概率

这是一个有趣的例子,在这个例子中,条件概率发挥了作用。

在这里插入图片描述

图 7.假设D 1 + D 2 ≤ 5 ,则D 1 = 2的概率
表 3 显示,对于这 10 个结果中的 3 个(D 1+ D 2 ≤5),D 1 = 2。因此,条件概率 P( D 1 = 2 | D 1+ D 2 ≤5) = 3/10 = 0.3

让我们尝试了解其背后的数学原理:

B:D1=2
答:D1 + D2≤5
P( B | A ) = P(B∩A)/P(A) = (3/36)/(10/36) = 3/10是多少
所以我们可以说P( B | A ) = P(B ∩ A) / P(A);如果 P(A) ≠0

探索不同类型的随机变量:离散和连续
随机变量可分为两种主要类型:离散型和连续型。了解这两种类型之间的差异对于选择合适的统计方法和模型至关重要。
在这里插入图片描述

图 8.离散和连续随机变量

1.离散随机变量
离散随机变量具有可数的不同值。这些值通常是整数,随机变量通常来自可以计算结果的场景。示例包括一系列抛硬币中正面朝上的次数、一小时内通过收费站的汽车数量或教室里的学生人数。

在这里插入图片描述

图 9.离散随机变量
**主要特点:**

可数结果:离散随机变量具有有限或可数无限的可能值集。
2.连续随机变量
连续随机变量在给定间隔内具有无数个值。这些值通常是测量值,可以取一定范围内的任何值。示例包括班级学生的身高、完成任务所需的时间或城市的温度。

主要特点:

不可数结果:连续随机变量可以在区间内取任意值,使得其可能值集不可数。

四、概率分布的定义

随机变量 (X) 的概率分布显示事件概率在随机变量的不同值上的分布情况。当随机变量的所有值在图形上排列时,其概率值会形成一个形状。概率分布具有几个可以测量的属性(例如:期望值和方差)。应该记住,有利结果的概率始终大于零,所有事件的所有概率之和等于 1。

概率分布本质上是任何随机实验或事件的所有可能结果的集合。

概率分布在理解随机变量中的作用
概率分布表征随机变量可能取的值,并为这些值分配概率。这些分布是统计学中的基本概念,描述随机变量的值如何分布。根据随机变量是可数的还是不可数的,概率分布可以分别是离散的或连续的。

离散概率分布:处理离散随机变量(例如,硬币翻转的正面次数)并由概率质量函数(PMF)定义。
连续概率分布:处理连续随机变量(例如,人的身高)并由概率密度函数定义(PDF)。
在这里插入图片描述

图 10.概率分布

五、结论

我们的 ML 系列第 18 天深入探讨了条件概率、随机变量和概率分布,这些都是理解概率论的重要概念。在第 19 天 — PMF、PDF、均值、方差、标准差中,我们将通过探索概率质量函数 (PMF)、概率密度函数 (PDF)和深入研究著名的概率分布来进一步简化。请继续关注我们,我们将继续探索概率世界及其在机器学习及其他领域的应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/57662.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于springboot的社区团购系统设计与实现

一、项目背景 网络交易(Electronic Commerce):是指实现整个贸易过程中各阶段的贸易活动的电子化。网络交易是一种多技术的集合体。其业务可包括:信息交换、售后服务、销售、电子支付、运输、组建虚拟企业、公司和贸易伙伴可以共同…

一文读懂系列:SSL加密流量检测技术详解

SSL加密流量检测功能的主要目的是为了对加密流量做解密处理,并对解密后的流量做内容安全检查(比如反病毒、入侵防御、URL远程查询、内容过滤、文件过滤和邮件过滤等)和审计(防止信息泄露)。接下来我们详细介绍SSL加密流…

【C++】关联式容器

1.Set和Map 1.1 set的介绍 set是一个常用的关联式容器,它存储唯一的元素,这些元素默认情况下按照升序排序。其底层是一种自平衡的二叉搜索树(红黑树)。 set元素的键值就是实值,实值就是键值。set的元素允许插入删除但是不允许修改(具有const…

荣誉证书PSD素材(59套免费)

本作品提供荣誉证书PSD素材下载,格式为PSD; 请使用软件Photoshop进行编辑,作品中文字及图均可以通过软件修改和编辑; 点击下载: 荣誉证书PSD素材

第T6周:Tensorflow实现好莱坞明星识别

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 目标 具体实现 (一)环境 语言环境:Python 3.10 编 译 器: PyCharm 框 架: (二)具体步骤 1.查询…

Spring6框架搭建(自用)

一、什么是Spring 众所不周知,Spring就是爪哇人的春天,但是在框架程序设计之前都绕不开javaWeb 1.javaWeb框架发展史 1、ServletJSPJavaBean(跳转页面、业务逻辑判断、数据库查询) 2、MVC三层架构(M Model pojo(User)V-view(USP)C-(controller-servl…

linux-UART

参考博客 https://blog.csdn.net/m0_38106923/article/details/126024970?sharetypeblog&shareId126024970&sharereferAPP&sharesourceweixin_40933496&sharefromlink 1.串口 UART的全称是Universal Asynchronous Receiver and Transmitter,即异步…

大数据治理:策略、技术与挑战

随着信息技术的飞速发展,大数据已经成为现代企业运营和决策的重要基础。然而,大数据的复杂性、多样性和规模性给数据管理带来了前所未有的挑战。因此,大数据治理应运而生,成为确保数据质量、合规性、安全性和可用性的关键手段。本…

vue插件清除 所有console.log()

一、作用 1、提升性能console.log() 语句会消耗一定的性能,尤其是在频繁调用的情况下。在生产环境中移除这些语句可以提高应用的运行效率。 2、减少信息泄露console.log() 可以输出敏感信息(如用户数据、API 响应等)。在生产环境中&#xf…

DAY15|二叉树Part03|LeetCode: 513.找树左下角的值、112. 路径总和、106. 从中序与后序遍历序列构造二叉树

LeetCode: 513.找树左下角的值 力扣代码链接 文字讲解:LeetCode: 513.找树左下角的值 视频讲解:怎么找二叉树的左下角? 递归中又带回溯了,怎么办? 基本思路 对题目进行一下分析,要找二叉树最底层最左边节点…

ClkLog企业版(CDP)预售开启,更有鸿蒙SDK前来助力

新版本发布 ClkLog在上线近1年后,获得了客户的一致肯定与好评,并收到了不少客户对功能需求的反馈。根据客户的反馈,我们在今年三季度对ClkLog的版本进行了重新的规划与调整,简化了原有的版本类型,方便客户进行选择。 与…

C++:set和map的使用

目录 序列式容器和关联式容器 set set类的介绍 构造和迭代器 增删查 insert find和erase erase迭代器失效 lower_bound与upper_bound multiset和set的区别 map map类的介绍 pair类型介绍 构造和迭代器 增删查 map数据修改:重载operator[] multimap…

Unix和Linux系统中的文件权限

详细解释Unix和Linux系统中的文件权限设置以及如何使用chmod命令来修改这些权限。 文件权限的详细解释 在Unix和Linux系统中,文件权限是控制谁可以访问和操作文件或目录的重要机制。权限分为三类:所有者(owner)、所属组&#xf…

android定时器循环实现轮播图

说明: android定时器加for循环实现轮播图 效果: step1: package com.example.iosdialogdemo;import android.os.Bundle; import android.os.Handler; import android.widget.ImageView; import android.widget.TextView;import androidx.appcompat.ap…

ChatGPT能预测时间序列?基于大模型的时间序列预测中的迭代事件推理_chatgpt能预测时间序列

引言 时间序列预测(Time Series Forecasting)是支撑经济、基础设施和社会各领域决策的关键技术。然而,传统的预测方法在面对由外部随机事件引起的突发性变化或异常时,往往表现出局限性。这些方法通常依赖于历史数据的模式识别&am…

计算机网络-传输层提供的服务

传输层在协议栈中的位置 我们可以给应用层的这些应用程序提供我们想要传输的数据,比如说我们想用微信传一张图片,或者想用QQ发一串字符。那这些数据是由我们用户直接提供的,那么我们的数据交给了应用层的某一个进程之后。这个进程可能会在我们…

将Notepad++添加到右键菜单【一招实现】

一键添加注册表 复制以下代码保存为 Notepad.reg,将红框内路径修改为自己电脑的“Notepad.exe路径”后,再双击运行即可。 Windows Registry Editor Version 5.00[HKEY_CLASSES_ROOT\*\shell\NotePad] "Notepad" "Icon""D:\\N…

存储引擎技术进化

B-tree 目前支撑着数据库产业的半壁江山。 50 年来不变而且人们还没有改变它的意向 鉴定一个算法的优劣,有一个学派叫 IO复杂度分析 ,简单推演真假便知。 下面就用此法分析下 B-tree(traditional b-tree) 的 IO 复杂度,对读、写 IO 一目了…

vscode | 开发神器vscode快捷键删除和恢复

目录 快捷键不好使了删除快捷键恢复删除的快捷键 在vscode使用的过程中,随着我们自身需求的不断变化,安装的插件将会持续增长,那么随之而来的就会带来一个问题:插件的快捷键重复。快捷键重复导致的问题就是快捷键不好使了&#xf…

00后整顿职场!一个人的底层逻辑,就是他的命运——早读(逆天打工人爬取热门微信文章解读)

00后整顿职场 引言Python 代码第一篇 洞见 一个人的底层逻辑,就是他的命运第二篇 百股跌停结尾 想看爽文情节的后续 引言 昨天晚上基本悟了 空空如也 之前听过一句话 非有之有为秒有 非空之空为真空 大致意思是 事物虽然没有独立不变的自性(非有&#…