概率 随机变量以及分布

一、基础定义及分类

1、随机变量

        随机变量是一个从样本空间(所有可能结果的集合)到实数集的函数。(随机变量的值可以是离散的,也可以是连续的。 )

        事件可以定义为随机变量取特定值的集合。

2、离散型随机变量

        随机变量的取值是可数的,即有限个或可数无限个。取值之间有“间隔”,不是连续变化的。每个取值都有一个特定的概率,且所有取值的概率之和等于1。

        概率质量函数(PMF):对于所有的 x,有 P(X=x)≥0;所有可能取值的概率之和等于1。

 例如:假设由5个黑球,3个白球,每次取一个球不放回,直到取到黑球为止,X为取到白球的数量,求取到黑球的概率。

解:列出渠道黑球可能(0白1黑、1白1黑、2白1黑、3白1黑),将白球数量列为X,则

P(X=0)= 5/8;P(X=1)= 3/8 * 5/7 =15/56;P(X=2)= 3/8 *2/7* 5/6=5/56;P(X=3)= 3/8 *2/7* 1/6* 5/5 =1/56

画出概率分布表:

X0123
P5/815/565/561/56

验证:5/8 +  15/56 + 5/56+ 1/56 =1

3、连续型随机变量

        取值可以是某个区间内任意实数的随机变量。随机变量的取值是连续的,可以在一个或多个区间内取任意值。 取值是不可数的,即有无限多个可能的取值。每个取值区间都有一个特定的概率,且整个取值范围的概率密度函数积分等于1。在任意一点的概率都是0。在函数曲线上某个点的概率其实是取的该点附近值的大小。

        概率密度函数(PDF) ;对于一维实随机变量X,如果存在非负可积函数f(x),使得对于任意实数x,a\leq b 存在 P(a<X\leq b)=\int _a^bf(x) dx;对于所有的 x,有f(x)\geq 0 ;整个取值范围的积分等于1,即\int _{-\infty}^{+\infty} f(x) dx=1 。概率密度函数的积分其实就是求曲线在某个区间内的面积。

例如:假设密度函数 ,求k

解:根据函数列出 \int _{-\infty}^{+\infty}f(x)dx=\int _{0}^{2}f(x)dx = \int _{0}^{2} kx+1dx = (\dfrac{k}{2} * x^2+x)|_0^2 =2k+2=1 => k =-1/2

二、分布函数

1、定义

        描述随机变量取值分布情况的函数,无论是离散型随机变量还是连续型随机变量,都可以通过分布函数来描述其概率特性。分布函数通常指的是累积分布函数(Cumulative Distribution Function, CDF),用 F(x) 表示。

2、使用方法

        积分布函数(CDF) ;对于随机变量 X,其累积分布函数 F(x) 定义为随机变量 X 取值小于或等于 x 的概率: F(x)=P(X≤x) 。

        随着 x 的增加,F(x) 是非减的,即 F(x1)≤F(x2)对于所有的 x1≤x2 成立。 F(x)的值域在 0 到 1 之间,即 0≤F(x)≤1。任意点 x 都是右连续的。对于离散型随机变量,F(x) 在任意点 x 是右连续,对于连续型随机变量,F(x) 在任意点 x 是连续的。

        常用公式: F(x) = P(X≤x) ;  P(X≤a) = F(a) ; P(X>a) = 1-P(X≤a) = 1-F(a); P(a<X≤b) = P(X≤b)-P(X≤a)=F(b)-F(a)

例如离散型:假设概率分布表如下(求分布函数F(x) ):

X-123
P1/21/31/6

   根据x取值划分({-\infty},-1)、(-1,2),(2,3),(3,{\infty}

则:F(x)=P(X≤-1)=0 ;F(x)=P(-1≤X<2)=1/2;F(x)=P(2≤X<3)=5/6 ; F(x)=P(3≤X<{\infty})=1

例如连续型:假设函数如图,求分布函数F(x):

根据x取值划分({-\infty},0)、(0,2)、(2,{\infty}

F(X)= \int _{0}^{2}f(x)dx =\int _{0}^{2} -1/2 * x +1 dx =  -1/4 * x^{2} + x

3、常见分布

3.1离散型

3.1.1、0-1分布

        伯努利分布 :C_n^k p^k {(1-p)}^{n-k}

3.1.2 几何分布

        在独立重复的伯努利试验中,首次成功所需的试验次数:  P(X=k)={(1-p)}^{k-1} ⋅ p

3.1.3、二项分布

        n 次伯努利试验中成功的次数,那么 X 服从参数为 n 和 p 的二项分布,记作 X∼B(n,p) :P(X=k)=C_n^kp^k{(1-p)}^{n-k} 

3.1.4、泊松分布

        固定时间或空间内事件发生次数的离散型概率分布。 适用于事件发生的概率较小且事件之间相互独立的情况。 P(X=k)=λ^k  /  k!    * e^-λ

3.1.5、均匀分布

        续均匀分布中,所有可能的结果是连续的,并且在相同长度间隔的分布概率是相同的。

        均匀分布的概率密度函数(PDF):对于连续型随机变量 X,如果它服从区间 [a,b]上的均匀分布,其概率密度函数为:f(x)= 1 / (b-a) ,其实就是面积为1,宽为 b-a 的长方形区域,那它的高就是1 / (b-a)

3.2、连续型

3.2.1、指数分布

        概率密度函数  x 是随机变量,表示事件发生的时间间隔;λ 是率参数,表示单位时间内事件发生的平均次数。其对应的分布函数如图:

3.2.2、正态分布

        表达形式: X \sim N(μ,σ^2)

        概率密度函数 (x 是随机变量;μ 是均值;σ是标准差;σ^2是方差),其基本性质为 y=f(x)以x=u为对称轴;x=u时,f(x)取到最大值 ;y=f(x)以x轴为渐近线,x±σ为拐点 ;σ固定,μ 变化,图像左右移动;μ 固定,σ变小,最高点上移,σ变大,最高点下移。

        分布函数 

3.2.3、标准正态分布

         表达形式: X \sim N(0,1) ;标准正态分布的均值为0,标准差为1(y轴是对称轴,为偶函数)

        概率密度函数 ,也就是在正态分布基础上将 μ 与 σ 进行赋值后变形。

        分布函数  

3.2.4、正态分布标准化

第一步:设 y=x-μ 

第二步:标准化,设 z = y /σ = (x-μ )/σ

得到了以Z为变量的正态分布函数  Z∼N(0,1) 。

标准化正态分布和正态分布的关系  

概率密度函数   

分布函数 

三、随机变量函数的分布

        从原有随机变量出发,通过某种函数关系得到新的随机变量。

1、离散型

第一步:确定x的值 ,找出所有使得 g(x)=y 成立的 x 的值。

第二步:对于每个满足条件的 x,将 X 取该值后的函数结果进行整理,相同结果的概率相加。

        离散型随机变量函数的分布函数计算,最简单的方法是列出随机变量X的分布表,然后根据新的函数关系计算出新随机变量Y的值,其值对应的概率就是X原来值对应的概率值,然后形成分布表,如果Y值有重复,则将重复值对应的概率相加即可。

例如1:假设随机变量X的分布表:求Y=X^2

X123
P0.20.50.3

解:根据x的变化列出y的变化

Y149
P0.20.50.3

例如2:假设随机变量X的分布表:求 Y=X^4 - 1

解:先根据随机变量的函数关系计算Y值,再将X的概率值填入

Y150-1015
P0.20.10.50.10.1

进行重复项合并,按照从低到高排列:

Y150-1
P0.30.20.5

2、连续型

第一步:获取 Y的分布函数 ;F_Y(y) =P(Y≤y) = P(g(X)≤y)

第二步:对分布函数求导获得概率密度函数:f_Y(y)=d/dy * F_Y(y)

例如:已知随机变量X的概率密度函数为 f_X(x),求 Y=3X+2 的密度函数,假设f_X(x)服从在区间[0,4]的均匀分布 ,求f_Y(x)

解:

第一步:求Y的分布函数:F_Y(x) =P(Y≤x) = P(g(X)≤x) = P(3X+2 ≤ x )=P(X≤(x-2)/3) =F_X((x-2)/3)

第二步:对分布函数求导:f_Y(x)=F_Y'(x) = F_x' ((x-2)/3) = 1/3 * f_X((x-2)/3)

第三步:带入x的概率密度函数内容,得到 区间从[0,4] =>[0,12] ,1/4=>1/12,其他不变

例如: 求Y=2X+8的概率密度

第一步:F_Y(x) =F_Y(Y ≤ x) = F_X(2X+8≤x)=F_X((x-8)/(2))

第二步:f_Y'(x)=F_Y'(X)=F_X'((x-8)/(2))=1/2 * f_X'((x-8)/(2))

第三步:带入x的密度函数,获得y的密度函数:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/882105.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenCV高级图形用户界面(17)设置一个已经创建的滚动条的最小值函数setTrackbarMin()的使用

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 cv::setTrackbarMin 这个函数的作用就是设置指定窗口中轨迹条的最小位置。这使得开发者能够在程序运行时动态地调整轨迹条的范围&#xff0c;而不…

Leetcode—1242. 多线程网页爬虫【中等】Plus(多线程)

2024每日刷题&#xff08;187&#xff09; Leetcode—1242. 多线程网页爬虫 实现代码 /*** // This is the HtmlParsers API interface.* // You should not implement it, or speculate about its implementation* class HtmlParser {* public:* vector<string>…

Go程序的一生——Go如何跑起来的?

引入编译链接概述 编译过程 词法分析语法分析语义分析中间代码生成目标代码生成与优化链接过程Go 程序启动GoRoot 和 GoPathGo 命令详解 go buildgo installgo run总结参考资料 引入 我们从一个 Hello World 的例子开始&#xff1a; package mainimport "fmt"func…

PROFINET开发EtherNet/IP开发Vline板卡在称重设备行业的应用

本次分享的&#xff0c;是我们VlinePROFINET开发EtherNet/IP开发嵌入式板卡在称重行业的典型应用。 应用背景 在现代科技高度发达的时代&#xff0c;无论是科学研究、医疗诊断、制药生产还是工业制造&#xff0c;准确的测量和称重都是保证质量和效率的关键。 随着新项目实施…

【BGA布局布线-熬夜加班整理】

BGA CHIP PLACEMENT AND ROUTING RULE BGA 是 PCB 上常用的组件&#xff0c;通常 CPU、NORTH BRIDGE、SOUTH BRIDGE、 AGP CHIP、CARD BUS CHIP…等&#xff0c;大多是以 bga 的型式包装&#xff0c;简言之&#xff0c;80&#xfe6a;的 高频信号及特殊信号将会由这类型的 pac…

自动化测试与敏捷开发的重要性

敏捷开发与自动化测试是现代软件开发中两个至关重要的实践&#xff0c;它们相互补充&#xff0c;共同促进了软件质量和开发效率的提升。 敏捷开发的重要性 敏捷开发是一种以人为核心、迭代、循序渐进的软件开发方法。它强调以下几个核心价值观和原则&#xff1a; 个体和交互…

服务器技术研究分析:存储从HBM到CXL

服务器变革&#xff1a;存储从HBM到CXL 在《从云到端&#xff0c;AI产业的新范式&#xff08;2024&#xff09;》中揭示&#xff0c;传统服务器价格低至1万美金&#xff0c;而配备8张H100算力卡的DGX H100AI服务器价值高达40万美金&#xff08;约300万人民币&#xff09;。 从供…

jmeter使用文档

文章目录 一、安装使用1、下载2、bin/jmeter.properties介绍 二、windows使用1、微调&#xff08;1&#xff09;界面样式&#xff08;2&#xff09;修改语言 2、简单使用3、各组件详解&#xff08;1&#xff09;CSV 数据文件配置&#xff08;2&#xff09;BeanShell取样器 三、…

Golang | Leetcode Golang题解之第478题在圆内随机生成点

题目&#xff1a; 题解&#xff1a; type Solution struct {radius, xCenter, yCenter float64 }func Constructor(radius, xCenter, yCenter float64) Solution {return Solution{radius, xCenter, yCenter} }func (s *Solution) RandPoint() []float64 {r : math.Sqrt(rand.…

C++之设计原则

在C中&#xff0c;设计原则是一套指导软件开发过程中决策和设计模式的准则&#xff0c;旨在提高软件的可维护性、可扩展性、灵活性和可靠性。 以下是几种核心设计原则&#xff1a; 1.单一职责 功能单一&#xff0c;方便组合和复用。 图示&#xff1a; 应用场景&#xff1a;…

【godot游戏引擎学习笔记】初识界面

个人笔记&#xff0c;学习自B站视频BV1ut42177r8 目录 渲染器的选择 Forward 移动 兼容 编辑器页面 浏览场景&#xff08;左上角&#xff09; 文件浏览器&#xff08;左下角&#xff09; 属性检查器&#xff08;右侧&#xff09; 场景编辑器&#xff08;中间&#x…

electron本地OCR实现

使用tesseract.js - npm (npmjs.com) 官方demo&#xff1a;GitHub - Balearica/tesseract.js-electron: An example to use tesseract.js in electron 目录结构&#xff1a; // 引入 <script type"module" src"./ocr/tesseract.js"></script>…

如何设置 GitLab 密码过期时间?

GitLab 是一个全球知名的一体化 DevOps 平台&#xff0c;很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版&#xff0c;专门为中国程序员服务。可以一键式部署极狐GitLab。 学习极狐GitLab 的相关资料&#xff1a; 极狐GitLab 60天专业…

Go-知识反射

Go-知识反射 1. 接口1.1 类型1.2 interface 类型1.2.1 interface 变量1.2.2 实现接口1.2.3 复合类型1.2.4 空 interface 2. 反射定律2.1 reflect 包2.2 反射可以将 interface 类型变量转换为反射对象2.3 反射可以将反射对象还原成 interface 对象2.4 反射对象可修改&#xff0c…

Oracle权限安全管理

实验内容 本次实验先使用system用户连接 温馨提示&#xff1a;题目要求切换账户登录的时候自己记得切换&#xff0c;本文章只提供相应的SQL语句 在表空间BOOKTBS1&#xff08;实验4第1题已创建&#xff09;创建一张表BOOKS,其字段如下&#xff1a;&#xff1a; SQL> create…

一次性语音芯片:重塑语音识别技术,引领智能化生活新时代

随着一次性语音芯片的突破性进展&#xff0c;语音识别技术正融入我们生活的方方面面&#xff0c;引领着智能化生活迈向一个全新的时代。这些芯片不仅体积小巧、成本低廉&#xff0c;更在性能上实现了质的飞跃&#xff0c;能够更精确地捕捉并理解人类语音。本文将解读关于一次性…

嵌入式开发选硬件还是软件?

做了单片机软件开发很多年&#xff0c;和很多硬件工程师打过配合&#xff0c;其中大部分硬件工程师&#xff0c;越往后&#xff0c;学软件的意愿越强烈。 所以我建议是&#xff0c;先做软件&#xff0c;是比较好的发育路线。 软件开发的优势主要体现在几个方面。 第一是薪资待遇…

python爬虫实战案例——从移动端接口抓取微博评论,采用cookie登陆,数据存入excel表格,超详细(15)

文章目录 1、任务目标2、网页分析3、代码编写3.1 代码分析3.2 完整代码1、任务目标 1、目标网站:微博文章(https://m.weibo.cn/detail/4813628149072458),这是微博某一篇博文,用于本文测试 2、要求:爬取该博文下,所有一级评论和二级评论,以及每条评论的作者,最后保存至E…

Python魔法函数__iter__的用法

下面是找到的一个比较好的科学解释&#xff1a; Python中可迭代对象(Iterable)并不是指某种具体的数据类型&#xff0c;它是指存储了元素的一个容器对象&#xff0c;且容器中的元素可以通过__iter__( )方法或__getitem__( )方法访问。 1.__iter__方法的作用是让对象可以用for…

Vscode替换\n为换行符

文件内容是字符串&#xff0c;每行用\n分割&#xff0c;阅读困难&#xff0c;可以在vscode&#xff0c;用替换\n进行换行。