【数理统计】2-随机变量及其概率分布

文章目录

  • 一、随机变量的定义和分类
  • 二、离散概率分布
    • 2.1 二项分布 (Binomial Distribution)
    • 2.2 伯努利分布 (Bernoulli Distribution)
    • 2.3 几何分布 (Geometric Distribution)
    • 2.4 负二项分布 (Negative Binomial Distribution)
    • 2.5 超几何分布 (Hypergeometric Distribution)
    • 2.6 泊松分布 (Poisson Distribution)
    • 2.7 它们之间的关系
  • 三、连续概率分布
    • 3.1 指数分布 (Exponential Distribution)
    • 3.2 伽马分布 (Gamma Distribution)
    • 3.3 正态分布 (Normal Distribution)
    • 3.4 t分布 (t-Distribution)
    • 3.5 卡方分布 (Chi-Square Distribution)
    • 3.6 F分布 (F-Distribution)
    • 3.7 它们之间的关系


一、随机变量的定义和分类

定义:随机变量是指在随机试验中取不同数值的变量。

  1. 类别型随机变量(Nominal)

    • 例子:性别(男、女),职业(公务员、企业员工、学生、退休、失业),检验结果(阴性、阳性)
  2. 有序类别型随机变量(Ordered)

    • 例子:态度(非常赞同、赞同、中立、反对、非常反对),使用频率(每周一次、每两周一次、每半年一次、几乎不、从未)
  3. 数值型随机变量

    • 例子:年龄(13、14、15、16……),收入(可以填任何值)

二、离散概率分布

2.1 二项分布 (Binomial Distribution)

  • 定义:描述在 n n n 次独立试验中成功 k k k 次的概率,每次试验成功的概率为 p p p
  • 公式 X ∼ Bin ( n , p ) X \sim \text{Bin}(n, p) XBin(n,p)
  • 概率质量函数 (PMF) P ( X = k ) = ( n k ) p k ( 1 − p ) n − k P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} P(X=k)=(kn)pk(1p)nk
  • 累积分布函数 (CDF) F ( X = k ) = ∑ i = 0 k ( n i ) p i ( 1 − p ) n − i F(X = k) = \sum_{i=0}^{k} \binom{n}{i} p^i (1-p)^{n-i} F(X=k)=i=0k(in)pi(1p)ni

2.2 伯努利分布 (Bernoulli Distribution)

  • 定义:描述一次试验中成功(或失败)的概率,成功的概率为 p p p
  • 公式 X ∼ Bern ( p ) X \sim \text{Bern}(p) XBern(p)
  • 概率质量函数 (PMF) P ( X = x ) = { p if  x = 1 1 − p if  x = 0 P(X = x) = \begin{cases} p & \text{if } x = 1 \\ 1 - p & \text{if } x = 0 \end{cases} P(X=x)={p1pif x=1if x=0
  • 累积分布函数 (CDF) F ( X = x ) = { 0 if  x < 0 1 − p if  0 ≤ x < 1 1 if  x ≥ 1 F(X = x) = \begin{cases} 0 & \text{if } x < 0 \\ 1 - p & \text{if } 0 \leq x < 1 \\ 1 & \text{if } x \geq 1 \end{cases} F(X=x)= 01p1if x<0if 0x<1if x1

2.3 几何分布 (Geometric Distribution)

  • 定义:描述第一次成功前失败次数的概率,每次试验成功的概率为 p p p
  • 公式 X ∼ Geom ( p ) X \sim \text{Geom}(p) XGeom(p)
  • 概率质量函数 (PMF) P ( X = k ) = ( 1 − p ) k p P(X = k) = (1-p)^k p P(X=k)=(1p)kp
  • 累积分布函数 (CDF) F ( X = k ) = 1 − ( 1 − p ) k + 1 F(X = k) = 1 - (1-p)^{k+1} F(X=k)=1(1p)k+1

2.4 负二项分布 (Negative Binomial Distribution)

  • 定义:描述达到第 r 次成功之前失败的次数,每次试验成功的概率为 p p p
  • 公式 X ∼ NegBin ( r , p ) X \sim \text{NegBin}(r, p) XNegBin(r,p)
  • 概率质量函数 (PMF) P ( X = k ) = ( k + r − 1 k ) p r ( 1 − p ) k P(X = k) = \binom{k + r - 1}{k} p^r (1-p)^k P(X=k)=(kk+r1)pr(1p)k
  • 累积分布函数 (CDF) F ( X = k ) = ∑ i = 0 k ( i + r − 1 i ) p r ( 1 − p ) i F(X = k) = \sum_{i=0}^{k} \binom{i + r - 1}{i} p^r (1-p)^i F(X=k)=i=0k(ii+r1)pr(1p)i

2.5 超几何分布 (Hypergeometric Distribution)

  • 定义:描述在不放回抽样的情况下,从有限总体中抽取 n n n 次,成功 k k k 次的概率。
  • 公式 X ∼ Hypergeom ( N , K , n ) X \sim \text{Hypergeom}(N, K, n) XHypergeom(N,K,n)
  • 概率质量函数 (PMF) P ( X = k ) = ( K k ) ( N − K n − k ) ( N n ) P(X = k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}} P(X=k)=(nN)(kK)(nkNK)
  • 累积分布函数 (CDF) F ( X = k ) = ∑ i = 0 k ( K i ) ( N − K n − i ) ( N n ) F(X = k) = \sum_{i=0}^{k} \frac{\binom{K}{i} \binom{N-K}{n-i}}{\binom{N}{n}} F(X=k)=i=0k(nN)(iK)(niNK)

2.6 泊松分布 (Poisson Distribution)

  • 定义:描述在单位时间内发生 k k k 次事件的概率,事件发生的平均速率为 λ。
  • 公式 X ∼ Poisson ( λ ) X \sim \text{Poisson}(\lambda) XPoisson(λ)
  • 概率质量函数 (PMF) P ( X = k ) = λ k e − λ k ! P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!} P(X=k)=k!λkeλ
  • 累积分布函数 (CDF) F ( X = k ) = e − λ ∑ i = 0 k λ i i ! F(X = k) = e^{-\lambda} \sum_{i=0}^{k} \frac{\lambda^i}{i!} F(X=k)=eλi=0ki!λi

2.7 它们之间的关系

  • 伯努利分布是一个特殊的二项分布,当 n = 1 n = 1 n=1 时。
  • 几何分布是第一个成功之前所需试验次数的分布,可以看作是二项分布的延伸。
  • 负二项分布可以看作是几何分布的推广,用于描述进行r次成功前需要的失败次数。
  • 超几何分布类似于二项分布,但适用于有限总体和不放回抽样。
  • 泊松分布二项分布的极限情况,当 n n n 很大且 p p p 很小时,并且 λ = n p \lambda = np λ=np 保持恒定。

三、连续概率分布

3.1 指数分布 (Exponential Distribution)

  • 定义:指数分布是一种连续概率分布,通常用于描述独立事件发生的时间间隔。

  • 公式 X ∼ Exponential ( λ ) X \sim \text{Exponential}(\lambda) XExponential(λ),其中 λ > 0 \lambda>0 λ>0 是速率参数

  • 概率密度函数 (PDF) f ( x ; λ ) = λ e − λ x for  x ≥ 0 f(x; \lambda) = \lambda e^{-\lambda x} \quad \text{for } x \geq 0 f(x;λ)=λeλxfor x0

  • 累积分布函数 (CDF) F ( x ; λ ) = 1 − e − λ x for  x ≥ 0 F(x; \lambda) = 1 - e^{-\lambda x} \quad \text{for } x \geq 0 F(x;λ)=1eλxfor x0

3.2 伽马分布 (Gamma Distribution)

  • 定义:描述等待时间的累积,是指数分布和χ²分布的推广。

  • 公式 X ∼ Gamma ( k , θ ) X \sim \text{Gamma}(k, \theta) XGamma(k,θ),其中 k > 0 k>0 k>0 是形状参数, θ > 0 \theta>0 θ>0 是尺度参数

  • 概率密度函数 (PDF) f ( x ; k , θ ) = x k − 1 e − x / θ θ k Γ ( k ) for  x ≥ 0 f(x; k, \theta) = \frac{x^{k-1}e^{-x/\theta}}{\theta^k \Gamma(k)} \quad \text{for } x \geq 0 f(x;k,θ)=θkΓ(k)xk1ex/θfor x0,其中 Γ ( k ) \Gamma(k) Γ(k) 是伽马函数

  • 累积分布函数 (CDF) F ( x ; k , θ ) = γ ( k , x / θ ) Γ ( k ) F(x; k, \theta) = \frac{\gamma(k, x/\theta)}{\Gamma(k)} F(x;k,θ)=Γ(k)γ(k,x/θ),其中 γ ( k , x / θ ) \gamma(k, x/\theta) γ(k,x/θ) 是不完全伽马函数。

3.3 正态分布 (Normal Distribution)

  • 定义:描述大量独立随机变量之和的分布,广泛应用于自然科学和社会科学中。

  • 公式 X ∼ N ( μ , σ 2 ) X \sim \mathcal{N}(\mu, \sigma^2) XN(μ,σ2),其中, μ \mu μ 是均值, σ 2 \sigma^2 σ2 是方差

  • 概率密度函数 (PDF) f ( x ; μ , σ 2 ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x; \mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x;μ,σ2)=2πσ2 1e2σ2(xμ)2

  • 累积分布函数 (CDF) F ( x ; μ , σ 2 ) = 1 2 [ 1 + erf ⁡ ( x − μ 2 σ 2 ) ] F(x; \mu, \sigma^2) = \frac{1}{2}\left[1 + \operatorname{erf}\left(\frac{x-\mu}{\sqrt{2\sigma^2}}\right)\right] F(x;μ,σ2)=21[1+erf(2σ2 xμ)],其中,erf 是误差函数。

3.4 t分布 (t-Distribution)

  • 定义:用于小样本情况下的假设检验和置信区间估计。

  • 公式 X ∼ t ( ν ) X \sim t(\nu) Xt(ν),其中, ν \nu ν 是自由度

  • 概率密度函数 (PDF) f ( t ; ν ) = Γ ( ν + 1 2 ) ν π Γ ( ν 2 ) ( 1 + t 2 ν ) − ν + 1 2 f(t; \nu) = \frac{\Gamma\left(\frac{\nu+1}{2}\right)}{\sqrt{\nu\pi} \Gamma\left(\frac{\nu}{2}\right)} \left(1 + \frac{t^2}{\nu}\right)^{-\frac{\nu+1}{2}} f(t;ν)=νπ Γ(2ν)Γ(2ν+1)(1+νt2)2ν+1

  • 累积分布函数 (CDF) F ( t ; ν ) = 1 2 + t Γ ( ν + 1 2 ) π ν Γ ( ν 2 ) ∫ 0 t ( 1 + u 2 ν ) − ν + 1 2 d u F(t; \nu) = \frac{1}{2} + t\frac{\Gamma\left(\frac{\nu+1}{2}\right)}{\sqrt{\pi \nu} \Gamma\left(\frac{\nu}{2}\right)} \int_0^{t} \left(1 + \frac{u^2}{\nu}\right)^{-\frac{\nu+1}{2}} du F(t;ν)=21+tπν Γ(2ν)Γ(2ν+1)0t(1+νu2)2ν+1du

3.5 卡方分布 (Chi-Square Distribution)

  • 定义:通常用于假设检验和方差分析。

  • 公式 X ∼ χ 2 ( k ) X \sim \chi^2(k) Xχ2(k),其中 k k k 是自由度

  • 概率密度函数 (PDF) f ( x ; k ) = 1 2 k / 2 Γ ( k / 2 ) x k / 2 − 1 e − x / 2 for  x ≥ 0 f(x; k) = \frac{1}{2^{k/2} \Gamma(k/2)} x^{k/2-1} e^{-x/2} \quad \text{for } x \geq 0 f(x;k)=2k/2Γ(k/2)1xk/21ex/2for x0

  • 累积分布函数 (CDF) F ( x ; k ) = γ ( k 2 , x 2 ) Γ ( k 2 ) F(x; k) = \frac{\gamma\left(\frac{k}{2}, \frac{x}{2}\right)}{\Gamma\left(\frac{k}{2}\right)} F(x;k)=Γ(2k)γ(2k,2x)

3.6 F分布 (F-Distribution)

  • 定义:用于比较两个样本的方差。

  • 公式 X ∼ F ( d 1 , d 2 ) X \sim F(d_1, d_2) XF(d1,d2),其中 d 1 d_1 d1 d 2 d_2 d2 是自由度

  • 概率密度函数 (PDF) f ( x ; d 1 , d 2 ) = ( d 1 x ) d 1 d 2 d 2 ( d 1 x + d 2 ) d 1 + d 2 x B ( d 1 2 , d 2 2 ) for  x ≥ 0 f(x; d_1, d_2) = \frac{\sqrt{\frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1 + d_2}}}}{x B\left(\frac{d_1}{2}, \frac{d_2}{2}\right)} \quad \text{for } x \geq 0 f(x;d1,d2)=xB(2d1,2d2)(d1x+d2)d1+d2(d1x)d1d2d2 for x0,其中 B B B 是贝塔函数

  • 累积分布函数 (CDF) F ( x ; d 1 , d 2 ) = I d 1 x d 1 x + d 2 ( d 1 2 , d 2 2 ) F(x; d_1, d_2) = I_{\frac{d_1 x}{d_1 x + d_2}}\left(\frac{d_1}{2}, \frac{d_2}{2}\right) F(x;d1,d2)=Id1x+d2d1x(2d1,2d2),其中 I I I 是不完全贝塔函数

3.7 它们之间的关系

  • 卡方分布是正态分布的平方和。例如, k k k 个独立标准正态变量的平方和服从自由度为 k k k 的卡方分布。
  • t分布 是在标准正态分布和卡方分布的基础上构造的。具体来说,t分布可以通过将标准正态变量除以其独立卡方分布变量的平方根来得到。
  • F分布 是两个独立卡方分布变量比值的扩展。F分布用于比较两个方差,通过将两个卡方分布变量的比值来构造。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/870437.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在linux中查找 / 目录下的以.jar结尾的文件(find / -name *.jar)

文章目录 1、查找 / 目录下的以.jar结尾的文件 1、查找 / 目录下的以.jar结尾的文件 [rootiZuf6332h890vozldoxcprZ ~]# find / -name *.jar /etc/java/java-1.8.0-openjdk/java-1.8.0-openjdk-1.8.0.342.b07-1.el9_0.x86_64/lib/security/policy/limited/US_export_policy.ja…

【学习css2】grid布局-页面footer部分保持在网页底部

中间内容高度不够屏幕高度撑不开的页面时候&#xff0c;页面footer部分都能保持在网页页脚&#xff08;最底部&#xff09;的方法 1、首先上图看显示效果 2、奉上源码 2.1、html部分 <body><header>头部</header><main>主区域</main><foot…

在 Linux 上设置 RAID 阵列的全面指南

引言 在这篇博文中&#xff0c;我们将深入探讨如何在 Linux 上设置 RAID 阵列。本文将涵盖 RAID 的定义、架构、原理、应用场景、常见命令体系&#xff0c;并通过详细的实战模拟展示如何在 Linux 系统上实际操作。希望通过这篇文章&#xff0c;您能深入理解 RAID 技术&#xff…

Flutter实现局部刷新的几种方式

目录 前言 1.局部刷新的重要性 1.概念 2.重要性 2.局部刷新实现的几种方式 1.使用setState方法进行局部刷新 2.使用StatefulWidget和InheritedWidget局部刷新UI 3.ValueNotifier和ValueListenableBuilder 4.StreamBuilder 5.Provider 6.GetX 7.使用GlobalKey 前言 …

现在有什么副业可以让人快速上岸?可以试试这个行业上岸其实不难

人为什么要努力赚銭&#xff1f; 当你想结婚的时候&#xff0c; 你可以慢慢挑&#xff0c;不着急。 当父母年老遭遇大病的时候&#xff0c; 你有机会尽孝。 当孩子需要时&#xff0c;你不会囊中羞涩。 年轻时以为金钱最重要&#xff0c; 如今年纪大了&#xff0c;发现这…

CSS在页面中使用的三种方式:行内样式、内嵌式样式表、链接式样式表

CSS样式如何在页面中使用&#xff0c;包含三种方式&#xff1a;行内样式、内嵌式样式表、链接式样式表。 1、行内样式 行内样式是比较直接的一种样式&#xff0c;直接定义在 HTML 标签之内&#xff0c;并通过 style 属性来实现。这种方式比较容易学习&#xff0c;但是灵活性不…

【秋招突围】2024届秋招笔试-字节跳动笔试题-01-三语言题解(Java/Cpp/Python)

&#x1f36d; 大家好这里是清隆学长 &#xff0c;一枚热爱算法的程序员 &#x1f4bb; ACM银牌&#x1f948;| 多次AK大厂笔试 &#xff5c; 编程一对一辅导 ✨ 本系列打算持续跟新 秋招笔试题 &#x1f44f; 感谢大家的订阅➕ 和 喜欢&#x1f497; &#x1f4e7; 清隆这边最…

【Python 基础】控制流 - 2

程序执行 在第1篇的 hello.py 程序中,Python 开始执行程序顶部的指令,然后一条接一条往下执行。“程序执行”(或简称“执行”)这一术语是指当前被执行的指令。如果将源代码打印在纸上,在它执行时用手指指着每一行代码,你可以认为手指就是程序执行。 但是,并非所有的程…

Python基础知识——(004)

文章目录 P16——15. 布尔类型 P17——16. 类型转换函数 P18——17. eval函数 P19——18. 算数运算符 P20——19. 赋值运算符 P16——15. 布尔类型 布尔类型 用来表示 “真” 值或 “假” 值的数据类型在Python中使用标识符 True 或 False 表示布尔类型的值True表示整数1&…

【vue】下载 打印 pdf (问题总结)- 持续更新ing

这里是目录标题 一、pdf1.查看 下载一、pdf 1.查看 下载 样式 Code<template><div><el-table :data="pdfList" style="width: 100%" border ><el-table-columnprop="index"label="序号"width="80"ali…

JlmPack在医疗行业的使用

在医疗行业中&#xff0c;JlmPack也是一款强大而高效的文件管理工具。 医疗文档管理&#xff1a; JlmPack可以用来管理医疗机构的各类文档&#xff0c;如病历、诊断报告、治疗方案等。其强大的文件存储、查看和编辑功能&#xff0c;可以确保医疗文档的完整性和安全性。权限管理…

【UE5.1】NPC人工智能——01 准备NPC角色

效果 步骤 1. 之前我们已经创建了“BP_NPC”&#xff08;见&#xff1a;【UE5.1 角色练习】06-角色发射火球-part2&#xff09; 该蓝图继承于角色类 我们在该蓝图中添加了两个方法和两个变量。方法一个是用于修改角色HP值的&#xff0c;另一个是在收到伤害后执行的逻辑。两个…

面试题005-Java-JVM(上)

面试题005-Java-JVM(上) 目录 面试题005-Java-JVM(上)题目自测题目答案1. JVM由哪几部分组成&#xff1f;2. 运行时数据区中包含哪些区域&#xff1f;3. 栈和堆中分别存放什么数据&#xff1f;4. 为什么要将永久代 (PermGen) 替换为元空间 (MetaSpace) &#xff1f;5. 堆空间的…

千万慎投!自引率高达93%!这16本On hold正处于高危状态,无法检索,剔除岌岌可危中!近四年镇压期刊“出狱”情况一览

本周投稿推荐 SCI • 能源科学类&#xff0c;1.5-2.0&#xff08;25天来稿即录&#xff09; • CCF推荐&#xff0c;4.5-5.0&#xff08;2天见刊&#xff09; • 生物医学制药类&#xff08;2天逢投必中&#xff09; EI • 各领域沾边均可&#xff08;2天录用&#xff09…

20240712 每日AI必读资讯

&#x1f4f0;人工智能现状报告最新重要发现&#xff01;&#xff01; - 国外软件开发平台 Retool 日前调查约 750 位技术人员发现&#xff0c;AI 的采用率并没有飙升&#xff0c;但工作岗位的替代危机正在上演。 - AI 的采用率真的在飙升吗&#xff1f;真实现状&#xff1a;…

缓冲器的重要性,谈谈PostgreSQL

目录 一、PostgreSQL是什么二、缓冲区管理器介绍三、缓冲区管理器的应用场景四、如何定义缓冲区管理器 一、PostgreSQL是什么 PostgreSQL是一种高级的开源关系型数据库管理系统&#xff08;RDBMS&#xff09;&#xff0c;它以其稳定性、可靠性和高度可扩展性而闻名。它最初由加…

sqli-labs2

sqli-labs2 1.按照路径http://localhost/sqli-labs/sqli-labs-master/Less-2/进入 2.确认注入类型----数字型 Payload&#xff1a;?id1 and 11-- 3. 判断注入点&#xff1a;2&#xff0c;3 Payload&#xff1a;id-1 union select 1,2,3 -- 4.根据注入点查询数据库名----sec…

防火墙基础实验

首先交换机配置 [LSW7]undo info-center enable [LSW7]vlan batch 2 3 [LSW7]int g0/0/2 [LSW7-GigabitEthernet0/0/2]port link-type access [LSW7-GigabitEthernet0/0/2]port default vlan 2 [LSW7-GigabitEthernet0/0/2]int g0/0/3 [LSW7-GigabitEthernet0/0/3]port link-…

码云远程仓库, 回滚到指定版本号

1. 打开项目路径, 右击Git Bash Here 2. 查找历史版本 git reflog 3. 回退到指定版本 git reset --hard 版本号 4. 强制推送到远程 git push -f

#VERDI# 关于如何查看FSM状态机的方法

关于Verdi中查看状态机的问题,想必大家都duniang 一大把资料可以看,今天,主要在前人讲解的基础之上,这里添加一些自己的心得体会。为什么呢? 说来惭愧,自己工作几个年头了,但是对于Verdi中查查看状态机,还是心里有一些抵触。 今天,花点时间整理一下分享大家,如有不…