【概率论基础】 一篇文章缕清概率论常见概念关系

碎碎念:再写CSDN之前有一小段时间写数模公众号的经历,但是公众号看的人实在太少了,而且排版和公式、代码编辑都没有CSDN这么方便,所以坚持一算时间就没有更新了。公众号大多写的是概念性的基础,稍加修改搬到咱们的主战场吧。

第一次更新:2027/5/10

目录

一. 引入

二. 概率论基础 

1. 随机试验

2. 样本点

3. 样本空间

4. 事件

5. 事件域/集类

6. 可测空间

7.  概率

8. 概率空间

三. 数理统计基础

1. 随机变量

2. 分布函数

3. 概率密度函数

4. n阶矩

5. 特征函数

四. 后记


一. 引入

啃数模论文或者教材学习过程中是不是总会看到:

特征函数,分布函数,随机变量,随机试验...

绕口令???

让原本艰难的学习道路雪上加霜

不慌不慌

小编为大家整理了常见概率论概念及其相关关系

先扫清学习路上的最大障碍—基础概念理解问题

首先我们举个通俗易懂的栗子,结合相关概率论定义便于理解一点:

白雪公主的后妈准备毒害白雪公主,于是她准备了一筐毒苹果,所有苹果形状大小一样,只有颜色不同,有红绿两种颜色的苹果。于是她想哄骗白雪公主随机抽一个苹果尝一下。

  切入正题,我们来聊一下概率论里的基础概念,以及这个栗子中所蕴含的概率论知识:

二. 概率论基础 

1. 随机试验

随机试验E : 一个试验,如果它的结果预先无法确定,但满足如下三个性质,即称之为随机试验:(1)相同条件下可重复进行;(2)所有试验可能结果已知;(3)每次试验结果具有不确定性

让我们更好地理解一下这个概念,随机试验本质上就是一个“活动”,结合栗子理解一下这个活动:白雪公主每次抽取苹果的动作就是一个随机试验,首先在篮子里可重复多次进行抽取活动,满足了随机试验的可重复性;其次,篮子里的苹果只有红绿两种颜色,白雪公主抽取的结果无非是红苹果或是绿苹果,满足了所有可能结果的已知条件;最后,白雪公主闭眼抽苹果,每次抽出什么颜色的苹果是不确定的,满足了试验结果的不确定性

是不是感觉懂了一点呀,那我们继续进一步理解:

2. 样本点

样本点ω:一个随机试验所产生的结果

样本点本质上就是一个“试验结果,也就是说在我们的栗子里,它就代表白雪公主进行了一次抽取活动后抽出来个啥颜色的苹果。比如白雪公主第一次抽出来一个红苹果,那第一次随机试验对应的样本点就是“红苹果”这个结果。

3. 样本空间

本空间Ω:所有试验的可能结果组成的集合

样本空间可以理解为白雪公主提的篮子,也就是由所有样本点组成的集合,这个集合里装满了所有的试验结果,即{红苹果,绿苹果,红苹果....}。但理解的时候要注意可不能用集合的互异性来衡量样本空间,样本空间相当于白雪公主手里也提了一个篮子,她每次抽一个苹果就放在自己的篮子里,她抽取了n次就会得到n个样本点,那放进自己的篮子里(即样本空间)中也会有n个元素

4. 事件

事件 A:由样本空间的某些样本点构成的子集合

事件可以理解为“将某一类随机试验结果”,在样本空间包含的n个样本点中,我们可以将一类样本点看作一类事件,把这些样本点放在一个集合中命名为一个事件A。比如,在样本空间中,“红苹果”这个元素出现了m次,就可以命名事件A为“抽到红苹果”,其中事件A={ω红苹果1,ω红苹果2,ω红苹果3...}。

5. 事件域/集类

集类 /事件域𝓐 :由样本空间中的若干子集构成的集合

到这儿是不是有些许抽象了?不急我们分解它的定义来看:

我们刚刚解释了事件可以理解为一类结果”,那集类作为一些子集的集合也可以理解为是“一类事件”;比如抽到红苹果是一个事件,抽到绿苹果也是一个事件,那我们可以定义抽到红苹果或者绿苹果这一类“抽到苹果事件”为一个集类。

为了便于进一步的计算我们定义一种特殊的集类—σ域(也称σ代数,一般用𝓕来表示这一集类),𝓕 满足:(1)Ω∈ 𝓕;(2)对逆运算封闭;(3)对可列并封闭。

6. 可测空间

可测空间(Ω,𝓕 ):定义二元体(Ω,𝓕 )为可测空间。

7.  概率

概率P:定义在在事件域𝓕 上,值域在[0,1]之间的,且满足条件(1)0≤P≤1;(2)P(Ω)=1;(3)满足可列可加性 的实值函数P(·)

   

概率本质上就是一个函数,既然是函数,我们在遇到这个概念的时候就一定要明确它的定义域是谁?值域是谁?函数关系怎么确定?(函数关系我们后面讲,这里先要理解:概率本质上就是一个函数,是一个事件映射到[0,1]区间的函数)。在栗子里的理解就是白雪公主抽到红苹果这个事件发生的可能性有多大?

8. 概率空间

概率空间(Ω,𝓕 ,P):定义三元体(Ω,𝓕 ,P)为概率空间。

三. 数理统计基础

我们在理解全局概念后接着来看一看建立在样本空间上的基础概念:

1. 随机变量

随机变量:X(ω)是定义在样本空间Ω上的单值实函数,若对于任意实数x∈R,有{x:X(ω)≤x}∈𝓕,则称X(ω)是𝓕上的随机变量。

 

随机变量本质上还是一个函数,我们需要明确这个函数的定义域为样本空间Ω(即所有样本点构成的集合),值域需要根据具体题目去确定。随机变量将随机随机事件数字化,使得每一个样本点都有一个实值对应,同时样本空间里的每个事件都有一个数确定。那为什么要引入这个随机变量呢?因为样本点(即我们看到的现象)是很难描述的,所以通过将样本点定量化,使得我们一看样本点的取值就知道实际对应情况且方便我们进一步进行统计分析。在我们的栗子里我们可以规定白雪公主每次可以取三个苹果,随机变量的取值对应取到的红苹果的数目。比如取到{红苹果,绿苹果,绿苹果}则有随机变量X=1;若取得{绿苹果,红苹果,红苹果}则随机变量X=2。

在概率论中根据随机变量取值范围(取值形式)将其分为两类:

  • 离散型随机变量顾名思义是指随机变量取值是离散的,即此时的样本空间为可数集或者有限集。接着上面的栗子,白雪公主取苹果,列举所有的情况我们发现随机变量的取值只可能为{0,1,2,3},故我们栗子里的随机变量就是一个离散型随机变量;
  • 连续性随机变量:如果变量可以在某个区间内取任一实数(即随机变量X的所有可能取值不可以逐个列举出来),即变量的取值可以是连续的。比如在做实验中白雪公主的后妈把苹果放在雪地里,拿出来以后在一段时间内测量苹果的温度,此时温度的取值是连续的,即温度为一连续型随机变量。

2. 分布函数

分布函数:函数F(x)=P{ω:X(ω)≤x},x∈R称为随机变量X的分布函数。

 

分布函数是定义在R上,值域为[0,1]的实值函数。它表示随机变量X取值小于等于变量x的概率,这里一定要区分清楚两个x,大X表示随机变量,小x表示普通变量,且分布函数是定义在x∈R上的函数。其次我们需要再思考,为什么要引入分布函数?在得到一系列样本点情况即随机变量值后,我们想研究这些随机变量值的特点,于是可以考虑从概率角度描述随机变量取值特点。已知X的分布函数,就可以知道X落在任一区间上的概率,在这个意义上说,分布函数完整地描述了随机变量的统计规律性。

3. 概率密度函数

概率密度函数(pdf):连续型随机变量X的分布函数F(x),若存在一非负函数f(x),对∀x∈R,满足:F(x)=\int_{-\bowtie }^{x}f(u)du,则称f(x)为随机变量X的概率密度函数。

概率密度函数是定义在R上,值域为[0,+∞]的实值函数概率密度函数的引入仍然是以概率角度来描述随机变量值,我们想知道随机变量某一取值的概率为多少(可以理解为想知道对应某一事件出现了多少次),可以通过将所有随机变量取值都列出,根据古典概型等概率论知识求得对应概率,即得到了离散型随机变量的分布律P{X=xk}(k=1,2,3...}对于连续型随机变量我们无法列出所有随机变量值,因此引入了连续性随机变量f(x)来描述随机变量取值概率。

4. n阶矩

n阶矩E(Xn):在数学和统计学中,矩是对变量分布和形态特点的一组度量。n阶矩被E(X_n)定义为一变量的n次方与其概率密度函数之积的积分。通常一阶矩E(X)又被称为数学期望,二阶矩E(X_2)被称为方差,三阶矩E(X_3)被称为偏度,四阶矩E(X_4)被称为峰度。  

5. 特征函数

特征函数φX(t):随机变量X的特征函数定义为\phi _X(t)=e^{itX} 。

四. 后记

特征函数可以看作分布函数的另一种描述方式。将特征函数做泰勒展开可得到特征函数中包含了分布函数的所有矩,即分布函数的所有特征都可以由特征函数反应出。[1]

白雪公主与后妈的栗子结束啦

欢迎大家和小编共同讨论学习

小编觉得在学习概念性问题时可以从三方面探索理解即:

What?Why?How?

概念是什么?怎么定义的?

为什么要提出这个概念?这个概念用来干什么?

最后这个概念用在哪儿?

本文的概念部分来源于百度百科

部分来源于《随机过程基础》

特征函数解释来源于 https://www.zhihu.com/tardis/bd/ans/376439033?source_id=1001

end

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/9574.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Git使用及相关问题

总结git中使用的问题 目录 1.git维护文件拷贝后unchanged 1.git维护文件拷贝后unchanged 文件权限不同,文件权限被修改,但内容未改变 命令行中使用git diff: diff --git a/compat/plan9/head b/compat/plan9/head old mode 100755 new mode 100644 主要…

Redis rehash 相关问题

前言 本文主要介绍 Redis Hash 表 rehash 相关的三个问题: 什么时候触发 rehashrehash 扩容扩多大rehash 如何执行 介绍的源码基于 Redis 5.0.8 版本,会删除一些不影响理解的部分。 什么时候触发 rehash Redis 用于判断是否触发 rehash 的函数是 _d…

‘pip‘ 不是内部或外部命令,也不是可运行的程序或批处理文件。

因为python13不支持 pip install cx_Oracle,卸载了python13,重新安装python10,导致cmd命令不识别 pip ,和python10,(;༎ຶД༎ຶ) 记录一种临时方案 如果你的命令行界面(cmd)不识别pip命令&am…

如何挑选“好用”的工业APP

我们日常生活中每天都在使用各种生活类的APP,然而,当我们谈到工业APP时,很多人可能并不那么熟悉。工业APP,虽然不像生活类APP那样直接面向广大消费者,但在工业领域却扮演着至关重要的角色。 先简单认识下啥是工业APP? 工业APP是…

集成学习算法:AdaBoost原理详解以及基于adaboost的图像二分类代码实现

本文尽量从一个机器学习小白或是只对机器学习算法有一个大体浅显的视角入手,尽量通俗易懂的介绍清楚AdaBoost算法! 一、AdaBoost简介 AdaBoost,是英文"Adaptive Boosting"(自适应增强)的缩写,由…

【退役之重学Java】关于缓存

一、为什么要用缓存 缓存嘛,对比计算机组成原理中的“高速缓存控制器”,就可以知道,缓存的存在是为了获取高性能,特别是在高并发场景下获取高性能。 二、缓存是如何获取高性能的 SQL的执行是非常消耗性能的有一些SQL经常是一样的…

【开发工具】使用Github pages、Hexo如何10分钟内快速生成个人博客网站

文章目录 一.准备工作1.安装git2.安装node安装 cnpm 3.使用 GitHub 创建仓库,并配置 GitHub Pages0.Github Pages是什么1. 在 GitHub 上创建一个新仓库2. 创建您的静态网站3. 启用 GitHub Pages4. 等待构建完成5. 访问您的网站 二. Hexo1.什么是Hexo2.安装Hexo1. 安…

分拣机器人也卷的飞起来了

导语 大家好,我是智能仓储物流技术研习社的社长,老K。专注分享智能仓储物流技术、智能制造等内容。 新书《智能物流系统构成与技术实践》 智能制造-话题精读 1、西门子、ABB、汇川:2024中国工业数字化自动化50强 2、完整拆解:智能…

解锁Swagger鉴权

在开发过程中,Swagger 是一个非常流行的 API 文档生成工具,它不仅可以帮助开发者设计、构建、记录 RESTful API,还能通过其交互式的 UI 改善前后端开发者的沟通效率。然而,在实际生产环境中,暴露未加保护的 API 文档可…

大数据基础工程技术团队4篇论文入选ICLR,ICDE,WWW

近日,由阿里云计算平台大数据基础工程技术团队主导的四篇时间序列相关论文分别被国际顶会ICLR2024、ICDE2024和WWW2024接收。 论文成果是阿里云与华东师范大学、浙江大学、南京大学等高校共同研发,涉及时间序列与智能运维结合的多个应用场景。包括基于P…

Android 蓝牙实战——蓝牙电话通话状态同步(二十四)

前面分析了蓝牙电话通话状态的广播,我们可以在蓝牙电话中实时监听蓝牙电话的状态,但如果是其他音乐类 APP 呢,在播放的时候也需要知道当前是否有通话正在进行,但是有完全没必要实时监听电话的状态,这就需要一个获取通话状态的方法。 一、通话状态处理 1、CallsManager …

MySQL学习笔记12——效率和优化

效率和优化 一、对查询语句进行调优1、查询分析语句2、优化查询方法 二、改进表设计以提高性能1、优化数据类型2、合理增加冗余字段以提高效率3、拆分表4、使用非空约束 三、如何充分利用系统资源1、优化系统资源配置2、如何利用系统资源来诊断问题 一、对查询语句进行调优 你…

vscode触发建议缓慢问题

说明 关于vscode上vite项目文件过多导致触发建议缓慢问题, 本人框架主要使用的技术是 vite vue3 ts tailwind eslint 项目初始阶段建议提示秒出,当项目文件过多时,建议延迟太高,即使是console代码片段也会过好几秒才出现 …

【R语言】边缘概率密度图

边缘概率密度图是一种在多变量数据分析中常用的图形工具,用于显示每个单独变量的概率密度估计。它通常用于散点图的边缘,以便更好地理解单个变量的分布情况,同时保留了散点图的相关性信息。 在边缘概率密度图中,每个变量的概率密度…

react native 设置屏幕锁定

原生配置 android 在android/app/src/main/AndroidManifest.xml在这个文件里的入口activity里添加 android:screenOrientation"portrait" <activityandroid:name".MainActivity"android:label"string/app_name" …

数字工厂管理系统如何助力企业数据采集与分析

随着科技的不断进步&#xff0c;数字化已成为企业发展的重要趋势。在制造业领域&#xff0c;数字工厂管理系统的应用日益广泛&#xff0c;它不仅提升了生产效率&#xff0c;更在数据采集与分析方面发挥着举足轻重的作用。本文旨在探讨数字工厂管理系统如何助力企业数据采集与分…

JavaScript异步编程——06-Promise入门详解【万字长文,感谢支持】

前言 Promise 是 JavaScript 中特有的语法。可以毫不夸张得说&#xff0c;Promise 是ES6中最重要的语法&#xff0c;没有之一。初学者可能对 Promise 的概念有些陌生&#xff0c;但是不用担心。大多数情况下&#xff0c;使用 Promise 的语法是比较固定的。我们可以先把这些固定…

【Linux】冯诺依曼体系

冯诺依曼体系 冯诺依曼体系结构是我们计算机组成的基本架构 中央处理器&#xff08;CPU&#xff09;&#xff1a; 中央处理器是冯诺伊曼体系的核心部分&#xff0c;负责执行计算机程序中的指令。它包括算术逻辑单元&#xff08;ALU&#xff09;和控制单元&#xff08;CU&#x…

uniapp 自定义App UrlSchemes

需求&#xff1a;外部浏览器H5页面&#xff0c;跳转到uniapp开发的原生app内部。 1、uniapp内部的配置&#xff1a; &#xff08;1&#xff09;打开manifest->App常用其他设置&#xff0c;如下&#xff0c;按照提示输入您要设置的urlSchemes&#xff1a; &#xff08;2&am…

Flink面试整理-Flink集群的部署方式有哪些?

Apache Flink 支持多种集群部署方式,以适应不同的运行环境和应用需求。主要的部署方式包括: 1. 独立部署(Standalone) 特点:Flink 自带的简单集群模式,不依赖于外部的集群管理系统。适用场景:适用于小规模集群、测试或者学习环境。配置:需要手动配置 JobManager 和 Tas…