【概率论基础】 一篇文章缕清概率论常见概念关系

碎碎念:再写CSDN之前有一小段时间写数模公众号的经历,但是公众号看的人实在太少了,而且排版和公式、代码编辑都没有CSDN这么方便,所以坚持一算时间就没有更新了。公众号大多写的是概念性的基础,稍加修改搬到咱们的主战场吧。

第一次更新:2027/5/10

目录

一. 引入

二. 概率论基础 

1. 随机试验

2. 样本点

3. 样本空间

4. 事件

5. 事件域/集类

6. 可测空间

7.  概率

8. 概率空间

三. 数理统计基础

1. 随机变量

2. 分布函数

3. 概率密度函数

4. n阶矩

5. 特征函数

四. 后记


一. 引入

啃数模论文或者教材学习过程中是不是总会看到:

特征函数,分布函数,随机变量,随机试验...

绕口令???

让原本艰难的学习道路雪上加霜

不慌不慌

小编为大家整理了常见概率论概念及其相关关系

先扫清学习路上的最大障碍—基础概念理解问题

首先我们举个通俗易懂的栗子,结合相关概率论定义便于理解一点:

白雪公主的后妈准备毒害白雪公主,于是她准备了一筐毒苹果,所有苹果形状大小一样,只有颜色不同,有红绿两种颜色的苹果。于是她想哄骗白雪公主随机抽一个苹果尝一下。

  切入正题,我们来聊一下概率论里的基础概念,以及这个栗子中所蕴含的概率论知识:

二. 概率论基础 

1. 随机试验

随机试验E : 一个试验,如果它的结果预先无法确定,但满足如下三个性质,即称之为随机试验:(1)相同条件下可重复进行;(2)所有试验可能结果已知;(3)每次试验结果具有不确定性

让我们更好地理解一下这个概念,随机试验本质上就是一个“活动”,结合栗子理解一下这个活动:白雪公主每次抽取苹果的动作就是一个随机试验,首先在篮子里可重复多次进行抽取活动,满足了随机试验的可重复性;其次,篮子里的苹果只有红绿两种颜色,白雪公主抽取的结果无非是红苹果或是绿苹果,满足了所有可能结果的已知条件;最后,白雪公主闭眼抽苹果,每次抽出什么颜色的苹果是不确定的,满足了试验结果的不确定性

是不是感觉懂了一点呀,那我们继续进一步理解:

2. 样本点

样本点ω:一个随机试验所产生的结果

样本点本质上就是一个“试验结果,也就是说在我们的栗子里,它就代表白雪公主进行了一次抽取活动后抽出来个啥颜色的苹果。比如白雪公主第一次抽出来一个红苹果,那第一次随机试验对应的样本点就是“红苹果”这个结果。

3. 样本空间

本空间Ω:所有试验的可能结果组成的集合

样本空间可以理解为白雪公主提的篮子,也就是由所有样本点组成的集合,这个集合里装满了所有的试验结果,即{红苹果,绿苹果,红苹果....}。但理解的时候要注意可不能用集合的互异性来衡量样本空间,样本空间相当于白雪公主手里也提了一个篮子,她每次抽一个苹果就放在自己的篮子里,她抽取了n次就会得到n个样本点,那放进自己的篮子里(即样本空间)中也会有n个元素

4. 事件

事件 A:由样本空间的某些样本点构成的子集合

事件可以理解为“将某一类随机试验结果”,在样本空间包含的n个样本点中,我们可以将一类样本点看作一类事件,把这些样本点放在一个集合中命名为一个事件A。比如,在样本空间中,“红苹果”这个元素出现了m次,就可以命名事件A为“抽到红苹果”,其中事件A={ω红苹果1,ω红苹果2,ω红苹果3...}。

5. 事件域/集类

集类 /事件域𝓐 :由样本空间中的若干子集构成的集合

到这儿是不是有些许抽象了?不急我们分解它的定义来看:

我们刚刚解释了事件可以理解为一类结果”,那集类作为一些子集的集合也可以理解为是“一类事件”;比如抽到红苹果是一个事件,抽到绿苹果也是一个事件,那我们可以定义抽到红苹果或者绿苹果这一类“抽到苹果事件”为一个集类。

为了便于进一步的计算我们定义一种特殊的集类—σ域(也称σ代数,一般用𝓕来表示这一集类),𝓕 满足:(1)Ω∈ 𝓕;(2)对逆运算封闭;(3)对可列并封闭。

6. 可测空间

可测空间(Ω,𝓕 ):定义二元体(Ω,𝓕 )为可测空间。

7.  概率

概率P:定义在在事件域𝓕 上,值域在[0,1]之间的,且满足条件(1)0≤P≤1;(2)P(Ω)=1;(3)满足可列可加性 的实值函数P(·)

   

概率本质上就是一个函数,既然是函数,我们在遇到这个概念的时候就一定要明确它的定义域是谁?值域是谁?函数关系怎么确定?(函数关系我们后面讲,这里先要理解:概率本质上就是一个函数,是一个事件映射到[0,1]区间的函数)。在栗子里的理解就是白雪公主抽到红苹果这个事件发生的可能性有多大?

8. 概率空间

概率空间(Ω,𝓕 ,P):定义三元体(Ω,𝓕 ,P)为概率空间。

三. 数理统计基础

我们在理解全局概念后接着来看一看建立在样本空间上的基础概念:

1. 随机变量

随机变量:X(ω)是定义在样本空间Ω上的单值实函数,若对于任意实数x∈R,有{x:X(ω)≤x}∈𝓕,则称X(ω)是𝓕上的随机变量。

 

随机变量本质上还是一个函数,我们需要明确这个函数的定义域为样本空间Ω(即所有样本点构成的集合),值域需要根据具体题目去确定。随机变量将随机随机事件数字化,使得每一个样本点都有一个实值对应,同时样本空间里的每个事件都有一个数确定。那为什么要引入这个随机变量呢?因为样本点(即我们看到的现象)是很难描述的,所以通过将样本点定量化,使得我们一看样本点的取值就知道实际对应情况且方便我们进一步进行统计分析。在我们的栗子里我们可以规定白雪公主每次可以取三个苹果,随机变量的取值对应取到的红苹果的数目。比如取到{红苹果,绿苹果,绿苹果}则有随机变量X=1;若取得{绿苹果,红苹果,红苹果}则随机变量X=2。

在概率论中根据随机变量取值范围(取值形式)将其分为两类:

  • 离散型随机变量顾名思义是指随机变量取值是离散的,即此时的样本空间为可数集或者有限集。接着上面的栗子,白雪公主取苹果,列举所有的情况我们发现随机变量的取值只可能为{0,1,2,3},故我们栗子里的随机变量就是一个离散型随机变量;
  • 连续性随机变量:如果变量可以在某个区间内取任一实数(即随机变量X的所有可能取值不可以逐个列举出来),即变量的取值可以是连续的。比如在做实验中白雪公主的后妈把苹果放在雪地里,拿出来以后在一段时间内测量苹果的温度,此时温度的取值是连续的,即温度为一连续型随机变量。

2. 分布函数

分布函数:函数F(x)=P{ω:X(ω)≤x},x∈R称为随机变量X的分布函数。

 

分布函数是定义在R上,值域为[0,1]的实值函数。它表示随机变量X取值小于等于变量x的概率,这里一定要区分清楚两个x,大X表示随机变量,小x表示普通变量,且分布函数是定义在x∈R上的函数。其次我们需要再思考,为什么要引入分布函数?在得到一系列样本点情况即随机变量值后,我们想研究这些随机变量值的特点,于是可以考虑从概率角度描述随机变量取值特点。已知X的分布函数,就可以知道X落在任一区间上的概率,在这个意义上说,分布函数完整地描述了随机变量的统计规律性。

3. 概率密度函数

概率密度函数(pdf):连续型随机变量X的分布函数F(x),若存在一非负函数f(x),对∀x∈R,满足:F(x)=\int_{-\bowtie }^{x}f(u)du,则称f(x)为随机变量X的概率密度函数。

概率密度函数是定义在R上,值域为[0,+∞]的实值函数概率密度函数的引入仍然是以概率角度来描述随机变量值,我们想知道随机变量某一取值的概率为多少(可以理解为想知道对应某一事件出现了多少次),可以通过将所有随机变量取值都列出,根据古典概型等概率论知识求得对应概率,即得到了离散型随机变量的分布律P{X=xk}(k=1,2,3...}对于连续型随机变量我们无法列出所有随机变量值,因此引入了连续性随机变量f(x)来描述随机变量取值概率。

4. n阶矩

n阶矩E(Xn):在数学和统计学中,矩是对变量分布和形态特点的一组度量。n阶矩被E(X_n)定义为一变量的n次方与其概率密度函数之积的积分。通常一阶矩E(X)又被称为数学期望,二阶矩E(X_2)被称为方差,三阶矩E(X_3)被称为偏度,四阶矩E(X_4)被称为峰度。  

5. 特征函数

特征函数φX(t):随机变量X的特征函数定义为\phi _X(t)=e^{itX} 。

四. 后记

特征函数可以看作分布函数的另一种描述方式。将特征函数做泰勒展开可得到特征函数中包含了分布函数的所有矩,即分布函数的所有特征都可以由特征函数反应出。[1]

白雪公主与后妈的栗子结束啦

欢迎大家和小编共同讨论学习

小编觉得在学习概念性问题时可以从三方面探索理解即:

What?Why?How?

概念是什么?怎么定义的?

为什么要提出这个概念?这个概念用来干什么?

最后这个概念用在哪儿?

本文的概念部分来源于百度百科

部分来源于《随机过程基础》

特征函数解释来源于 https://www.zhihu.com/tardis/bd/ans/376439033?source_id=1001

end

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/9574.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

‘pip‘ 不是内部或外部命令,也不是可运行的程序或批处理文件。

因为python13不支持 pip install cx_Oracle,卸载了python13,重新安装python10,导致cmd命令不识别 pip ,和python10,(;༎ຶД༎ຶ) 记录一种临时方案 如果你的命令行界面(cmd)不识别pip命令&am…

如何挑选“好用”的工业APP

我们日常生活中每天都在使用各种生活类的APP,然而,当我们谈到工业APP时,很多人可能并不那么熟悉。工业APP,虽然不像生活类APP那样直接面向广大消费者,但在工业领域却扮演着至关重要的角色。 先简单认识下啥是工业APP? 工业APP是…

集成学习算法:AdaBoost原理详解以及基于adaboost的图像二分类代码实现

本文尽量从一个机器学习小白或是只对机器学习算法有一个大体浅显的视角入手,尽量通俗易懂的介绍清楚AdaBoost算法! 一、AdaBoost简介 AdaBoost,是英文"Adaptive Boosting"(自适应增强)的缩写,由…

【开发工具】使用Github pages、Hexo如何10分钟内快速生成个人博客网站

文章目录 一.准备工作1.安装git2.安装node安装 cnpm 3.使用 GitHub 创建仓库,并配置 GitHub Pages0.Github Pages是什么1. 在 GitHub 上创建一个新仓库2. 创建您的静态网站3. 启用 GitHub Pages4. 等待构建完成5. 访问您的网站 二. Hexo1.什么是Hexo2.安装Hexo1. 安…

分拣机器人也卷的飞起来了

导语 大家好,我是智能仓储物流技术研习社的社长,老K。专注分享智能仓储物流技术、智能制造等内容。 新书《智能物流系统构成与技术实践》 智能制造-话题精读 1、西门子、ABB、汇川:2024中国工业数字化自动化50强 2、完整拆解:智能…

大数据基础工程技术团队4篇论文入选ICLR,ICDE,WWW

近日,由阿里云计算平台大数据基础工程技术团队主导的四篇时间序列相关论文分别被国际顶会ICLR2024、ICDE2024和WWW2024接收。 论文成果是阿里云与华东师范大学、浙江大学、南京大学等高校共同研发,涉及时间序列与智能运维结合的多个应用场景。包括基于P…

【R语言】边缘概率密度图

边缘概率密度图是一种在多变量数据分析中常用的图形工具,用于显示每个单独变量的概率密度估计。它通常用于散点图的边缘,以便更好地理解单个变量的分布情况,同时保留了散点图的相关性信息。 在边缘概率密度图中,每个变量的概率密度…

数字工厂管理系统如何助力企业数据采集与分析

随着科技的不断进步,数字化已成为企业发展的重要趋势。在制造业领域,数字工厂管理系统的应用日益广泛,它不仅提升了生产效率,更在数据采集与分析方面发挥着举足轻重的作用。本文旨在探讨数字工厂管理系统如何助力企业数据采集与分…

JavaScript异步编程——06-Promise入门详解【万字长文,感谢支持】

前言 Promise 是 JavaScript 中特有的语法。可以毫不夸张得说,Promise 是ES6中最重要的语法,没有之一。初学者可能对 Promise 的概念有些陌生,但是不用担心。大多数情况下,使用 Promise 的语法是比较固定的。我们可以先把这些固定…

【Linux】冯诺依曼体系

冯诺依曼体系 冯诺依曼体系结构是我们计算机组成的基本架构 中央处理器(CPU): 中央处理器是冯诺伊曼体系的核心部分,负责执行计算机程序中的指令。它包括算术逻辑单元(ALU)和控制单元(CU&#x…

uniapp 自定义App UrlSchemes

需求:外部浏览器H5页面,跳转到uniapp开发的原生app内部。 1、uniapp内部的配置: (1)打开manifest->App常用其他设置,如下,按照提示输入您要设置的urlSchemes: (2&am…

动联再掀创新风潮!P92 Max智能POS机惊艳发布

当下,智能支付与零售行业正经历着深刻变革,移动支付、无人支付等新型支付方式在我国广泛应用,显著优化了消费者的支付体验,同时也为零售行业带来新的发展契机。动联,凭借其在身份认证领域的深厚技术底蕴与创新精神&…

品鉴中的精神内涵:如何通过红酒品味生活的美好与哲学

红酒不仅仅是一种物质享受,更是一种精神体验。在品鉴云仓酒庄雷盛红酒的过程中,我们能够品味到生活的美好与哲学,感受到红酒所蕴含的精神内涵。 红酒的精神内涵源于其酿造过程中所融入的时间和匠心。一瓶上好的红酒需要经过长时间的陈年&…

【图像识别】Swin Transformer

一、引言 论文: Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 作者: Microsoft Research Asia 代码: Swin Transformer 特点: 提出滑动窗口自注意力 (Shifted Window based Self-Attention) 解决Vi…

RegExp魔法阵与Cookie记忆宫殿:JavaScript 中的秘密宝藏

个人主页:学习前端的小z 个人专栏:JavaScript 精粹 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结,欢迎大家在评论区交流讨论! 文章目录 🔆RegExp 🎲 1 什么是正则表达式 🎲2 创建…

「TypeScript」TypeScript入门练手题

前言 TypeScript 越来越火&#xff0c;现在很多前端团队都使用它&#xff0c;因此咱们前端码农要想胜任以后的前端工作&#xff0c;就要更加熟悉它。 入门练手题 interface A {x: number;y: number; }type T Partial<A>;const a: T { x: 0, y: 0 }; const b: T { …

数据可视化训练第二天(对比Python与numpy中的ndarray的效率并且可视化表示)

绪论 千里之行始于足下&#xff1b;继续坚持 1.对比Python和numpy的性能 使用魔法指令%timeit进行对比 需求&#xff1a; 实现两个数组的加法数组 A 是 0 到 N-1 数字的平方数组 B 是 0 到 N-1 数字的立方 import numpy as np def numpy_sum(text_num):"""…

互动科技如何强化法治教育基地体验?

近年来&#xff0c;多媒体互动技术正日益融入我们生活的各个角落&#xff0c;法治教育领域亦不例外。步入法治教育基地&#xff0c;我们不难发现&#xff0c;众多创新的多媒体互动装置如雨后春笋般涌现&#xff0c;这些装置凭借前沿的科技手段&#xff0c;不仅极大地丰富了法制…

【RabbitMQ】消息队列 - RabbitMQ的使用记录

目录 一、什么是消息队列 二、什么是RabbitMQ 三、安装RabbitMQ 3.1 安装Erlang环境 3.2 安装RabbitMQ 3.3 打开服务管理界面 3.4 常用命令 四、Python示例代码 4.1 发送数据 4.2 接收数据 一、什么是消息队列 消息队列(Message Queue)是一种用于在应用程序之间传递消…

【数据结构与算法】Huffman编码/译码(C/C++)

实践要求 1. 问题描述 利用哈夫曼编码进行信息通讯可以大大提高信道利用率&#xff0c;缩短信息传输时间&#xff0c;降低传输成本。但是&#xff0c;这要求在发送端通过一个编码系统对待传数据预先编码&#xff1b;在接收端将传来的数据进行译码(复原)。对于双工信道(即可以…