第二章 随机变量

随机变量
 目标:将实验结果数量化。实验结构有数字型和非数字型。数字型:降雨量、上车人数等。非数字型:晴天/阴天/下雨、化验结果阴性/阳性等。
 定义:随机试验样本空间S,如果X=X(e)为定义在S上的实数单值函数,则称X(e)为随机变量。简写为X。
 补充:随机变量X(e):S->R 的映射关系。随机变量实质是一个函数。
   如果ij,那么 {X=i}{X=j}=ϕ
   一般用大写字母X、Y、Z 或者希腊字母 ξ,η等表示随机变量。
事件表示:A={e:X(e)I}={XI},IR
随机变量的类型:离散型随机变量、连续型随机变量

离散型随机变量
 定义:如果随机变量X的取值为有限个,或者可数个,则称X为离散型随机变量。
 补充1:换句话说:如果一个函数自变量是有限个,或者可数个,那这个函数就是离散型随机变量。随机变量,是一种映射关系,是函数。
 补充2:有限是指知道有多少个,例如一枚硬币扔在地上,结果是正面或者反面,两种结果。可数是指能数的。例如正奇数集{1,3,5,7,…}虽然不知道有多少个,但是是可以一个一个的数的。有些情况是可数且有限个。例如人的年龄是可数且有限的,范围从0,1,2,….200。根据目前的资料,没有人年龄超过200的。那这个个数就是201。
 补充3:不可数是无穷集合的一种。一个无穷集合与自然数集合之间不是一一对应的关系,那么这个无穷集合是不可数的(?)。区间[0,1],开始数:
     0.34956852…
     0.58692….
     0.24986….
那么 0.490… 一定是你没有数到的。0.490…是这么来的:该数小数点后的第i位是第i个被数到的数的第i位加1,约定 9+1=0

 离散型随机变量的概率分布式律
 概率分布律是指随机变量取所有可能取值的情况下,每个取值对应的概率。
 


 
 
 
Xx1x2xk
Pp1p2pk

 分布律的性质: pk>=0; +k=1pk=1
 另外一种表示: P(X=xk)=pk,k=1,2,3...
 
 离散型随机变量的包含
 0-1分布、二项分布、泊松分布、几何分布都属于离散型随机变量。
 
0-1分布
 定义:若随机变量X可能的取值只有0和1,并且X的概率分布律满足 p0=1p,p1=p,其中 0<p<1,就称X服从参数为p的0-1分布记为 XB(p) X01(p)。0-1分布又称为 贝努力分布
 其分布律还可以写为 P(X=K)=pk(1p)(1k)
 应用
  1检查产品质量是否合格
  2新生婴儿的性别
  3检验种子是否发芽
  4考试是否通过
二项分布
 关系:如果试验E只有两个可能的结果:A或者 A¯¯¯,P(A)=p, 0<p<1,将E独立的重复进行n次,想了解n重贝努力试验中A发生的次数的统计规律,就是二项分布。
 定义:若X的概率分布律为 P(X=k)=Cknpk(1p)(nk),k=0,1,2...,n>=1, ,0<p<1,就称X服从参数n,p的二项分布,记为 XB(n,p)

泊松分布
 如果X的概率分布为P(X=k)=λkeλk!,k=0,1,2,3...,λ>0,就称X服从参数为λ的泊松分布,记为Xπ(λ)或者XP(λ)
 根据泰勒展开式eλ=k=0λkk!
 如果某事件以固定强度λ,随机且独立的出现,该事件在单位事件内出现的次数可以看成是泊松分布。
 当二项分布的n>10,p<0.1时,二项分布B(n,p)可以用泊松分布P(np)来近似。换句话说:当n远远大于p的时候,泊松分布是二项分布的近似计算公式。
 例如:某地区一个月内(单位时间)每200个成年人中会有1个人患上某种疾病(一定概率),设个人是否患病相互独立(随机且独立)。求如果该地某一社区内有1000个成年人,求某月内该社区至少有3人患病的概率。

几何分布
 若X的概率分布律为:P(X=K)=p(1p)k1,k=1,2,3… 称为X服从参数为p的几何分布,记为XGeom(p)。表示在多重贝努力试验中,试验进行到某一结果第一次出现为止,此时需要的试验次数的分布律。
     
概率分布函数
 定义:随机变量X对任意实数x,称函数F(x)=P(X<=x)为X的概率分布函数,简称分布函数。
 补充:任何随机变量都有对应的分布函数
 目的:给出随机变量落在某个范围的可能性。
 性质:1 0<=F(x)<=1;2 F(x)单调不减;3 F()=0F(+)=1;4 F(x)是右连续函数,F(x+0) = F(x)。
 计算:P(a<Xb)=P(Xb)P(Xa)=F(b)F(a)
    P(a<X<b)=P(a<Xb0)=F(b0)F(a)
 一般离散型随机变量的分布函数是分段函数。设随机变量X的分布律为P{X=x_k}=p_k,k=1,2,3… X的分布函数为F(x)=xk<=xpk.F(x)在x=x_k处有跳跃,其跳跃值为p_k=P{X=x_k}。
这里写图片描述

连续型随机变量
 定义:随机变量X的取值范围不可数,则称X为连续型随机变量。
 分类:均匀分布、指数分布、正态分布。

连续型随机变量的概率密度
 定义:对于随机变量X的分布函数F(x),若存在非负的函数f(x),使对于任意实数x有:F(x)=+f(t)dt。则称X为连续型随机变量,f(x)为X的概率密度函数,简称概率密度。有时候也写为fX(x)
 性质
  1 f(x)>=0
  2 +f(x)dx=1
  3 对于任意实数x1,x2x1<x2P(x1<x<x2)=x2x1f(t)dt
  4 X落在点x附近(x,x+Δx)的概率近似等于 f(x)Δx。f(x)可以大于1,f(x)的大小表示了X落在x附近的可能性大小,f(x)与F(x)之间是积分与微分的关系。
 

均匀分布
 若随机变量X的概率密度函数为f(x)=1ba,x(a,b)0,a<b,称X服从(a,b)上的均匀分布。记为 XU(a,b)
 这里写图片描述
  
 性质:均匀分布具有等可能性。X落入(a,b)区间中等长度的任意子区间上是等可能的。
 
指数分布
 若随机变量X的概率密度函数为f(x)=λexλ,x>00,x0 ,称X服从λ的指数分布。记为 XE(λ) 或者 XExp(λ)
 分布函数为F(x)={1eλx,x>00,x0
 性质:指数分布具有无记忆性。P(X>t0+t|X>t0)=eλt=P(X>t)
 应用
  指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔,中文维基百科出现一条新词条的时间间隔。在排队论中,一个顾客接受服务时间的长短也服从指数分布。

正态分布
 若随机变量X的概率密度函数为f(x)=12πσe(xμ)22σ2<μ<+σ>0,称X服从参数μ,σ的正态分布。记为:XN(μ,σ2)
 这里写图片描述
 性质
  1f(x)关于x=μ对称。
  2 当xμ的时候,f(x)严格单调递增。
  3 fmax=f(μ)=12πσ
  4 lim|xμ|>f(x)=0
 两个参数的含义
  1 固定σ,f(x)形状不变,移动位置,μ为位置参数。
  2 固定μ,f(x)位置不变,σ小,图形高瘦,σ大,图形宽胖。称为尺度参数。
 应用
 1 测量误差。3σ
 2 人的身高、体重
 正态分布的计算
 方法一:用excel、matlab计算
 方法二:数值积分
 方法三:转为标准正态分布,查表。
标准正态分布
 XN(0,1),X称为正态分布。
 Φ(z0)=1Φ(z0)
 转换公式
 这里写图片描述
 这里写图片描述

随机变量函数的分布
 随机变量函数的分布=函数的函数的分布。已知随机变量X的分布,Y=g(X),g(X)已知,求Y的分布。
 这里写图片描述
  这里写图片描述

 一般地,如果XN(μ,σ2),如果Y=ax+b,则YN(aμ+b,a2σ2)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/425048.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[Leetcode][第632题][JAVA][最小区间][堆][滑动窗口]

【问题描述】[困难] 【解答思路】 1. 堆 复杂度 class Solution {public int[] smallestRange(List<List<Integer>> nums) {//区间的左边和右边int rangeLeft 0, rangeRight Integer.MAX_VALUE;//最小范围int minRange rangeRight - rangeLeft;//区间的左边最…

第十期:过去50年间,十大热门语言及发明者大盘点

本文收集了十大热门编程语言背后的程序员和设计者的名字和大家分享。以下是十大热门编程语言及其创建者&#xff0c;排名不分先后。 软件领域有许多编程语言&#xff0c;每年还涌现出越来越的新语言。新发布的语言有Scala、Kotlin、Go和Closure&#xff0c;但历史证明&#xff…

2018-2019-2 20165212《网络攻防技术》Exp5 MSF基础应用

2018-2019-2 20165212《网络攻防技术》Exp5 MSF基础应用 攻击成果 主动攻击的实践 ms17010eternalblue payload windows/x64/meterpreter/reverse_tcp&#xff08;成功&#xff09;payload generic/shellreversetcp&#xff08;成功&#xff09;ms17010psexec&#xff08;成功且…

【数据结构与算法】复杂度分析

一、什么是复杂度分析&#xff1f; 1.数据结构和算法解决是“如何让计算机更快时间、更省空间的解决问题”。 2.因此需从执行时间和占用空间两个维度来评估数据结构和算法的性能。 3.分别用时间复杂度和空间复杂度两个概念来描述性能问题&#xff0c;二者统称为复杂度。 4.复杂…

第十一期:30秒内便能学会的30个实用Python代码片段

许多人在数据科学、机器学习、web开发、脚本编写和自动化等领域中都会使用Python&#xff0c;它是一种十分流行的语言。 Python流行的部分原因在于简单易学。 本文将简要介绍30个简短的、且能在30秒内掌握的代码片段。 1. 唯一性 以下方法可以检查给定列表是否有重复的地方&…

[Leetcode][第114题][JAVA][二叉树展开为链表][递归][迭代]

【问题描述】[中等] 【解答思路】 1. 前序遍历 将二叉树展开为单链表之后&#xff0c;单链表中的节点顺序即为二叉树的前序遍历访问各节点的顺序。因此&#xff0c;可以对二叉树进行前序遍历&#xff0c;获得各节点被访问到的顺序。 由于将二叉树展开为链表之后会破坏二叉树的…

第三十八期:美国数据隐私保护法案来临,明年1月生效,现仅2%企业合规

2018 年美国加州通过消费者隐私法案&#xff08;CCPA&#xff09;&#xff0c;缓冲一年多后&#xff0c;将于 2020 年 1 月生效。届时&#xff0c;类似于欧盟的法案&#xff0c;CCPA 将对所有和美国加州居民有业务的数据商业行为进行监管。 依然在应付欧盟数据保护法案(GDPR)的…

二元随机变量

本章记录  1二元随机变量的定义  2二元离散型随机变量的定义、联合概率分布律、边际分布律、条件分布律  3二元离散型随机变量联合概率分布律函数、边际分布函数、条件分布函数  4二元连续型随机变量的定义、联合概率密度函数、边际密度函数、条件密度函数 二元随机变…

第三十九期:原生图数据库的15条规则

不妨看一下原生图形数据库的15条规则。就像复杂的系统网格或空中交通管制图&#xff0c;图形数据库用节点和连接组成的网络(名为标记属性图)来表示。节点显示为圆形或正方形&#xff0c;代表人员、产品、公司或订单等实体。 就像复杂的系统网格或空中交通管制图&#xff0c;图形…

[周赛第200场][Leetcode][第5477题][第5478题][JAVA][双指针][贪心]

【问题描述】[中等]5477. 排布二进制网格的最少交换次数 【解答思路】 贪心 限制条件 第一行要求末尾的0要尽量多 计算每行最后有几个0遍历交互 符合条件 第i行的末尾0的数量为n-i-1 统计交换次数第i行的末尾0的数量小于n-i-1&#xff0c;不符合条件 时间复杂度&#xff1a…

ubuntu异常关机,断电重启后进入紧急模式,挂载磁盘SSD失败了怎么办?(Failed mount on XXX)

解决方案&#xff1a; 进入/etc/fstab中保留你所有的除了必要的系统分区挂载点&#xff0c;这里保存了所有开机引导的时候自动挂载到linux文件系统里的设备还有分区信息&#xff0c;当系统启动的时候&#xff0c;系统会在这里读取信息并挂载到相应目录下。所有的磁盘硬盘SSD挂…

6项目启动

项目启动概述

[Leetcode][第415题][JAVA][字符串相加][双指针]

【问题描述】[简单] 【解答思路】 1. 双指针 从两个字符串最后开始处理 对齐字符串添加当前位 int c abcnt; cnt为进位超过长度的补“0” 要注意最后有可能需要处理溢出位 时间复杂度&#xff1a;O(max(M,N)) 空间复杂度&#xff1a;O(1) public String addStrings(String nu…

401 binary watch

文章题目来源于leetcode&#xff0c;解法学习了讨论去的解法。  问题&#xff1a;有一种二进制LED表。上面的4个LED灯表示小时&#xff0c;下面6个LED灯表示分钟。给定一个int值&#xff0c;写出可能表示的时间。例如输入1&#xff0c; Input: n 1 Return: [“1:00”, “2…

7立项申请

项目诞生的驱动因素 系统服务请求书 识别需求提出项目建议书 项目建议书内容 项目的可行性研究 如何进行项目的可行性研究 市场可行性研究 市场可行性分析注意事项 捕捉用户需求是一件困难的事 三个苹果改变世界 经济可行性 收益与成本 投入产出分析 投资分析期 纯收入 技术可行…

【数据结构与算法】数组与链表

数组的定义和特性 数组&#xff08;Array&#xff09;是一种线性表数据结构。它用一组连续的内存空间&#xff0c;来存储一组具有相同类型的数据。 线性表&#xff08;Linear List&#xff09;&#xff1a;数组、链表、队列、栈 非线性表&#xff1a;树 图 连续的内存空间和相…

8构建项目组

组建项目组 组建项目组的任务 项目组架构 项目赞助人职责 项目经理的标签 项目经理的责任 项目成员的职责 案例分析 西天取经的只能架构 西天取经项目组 一个良好团队的七个要素

MySQL数据库面试题

目录数据库基础知识为什么要使用数据库什么是SQL&#xff1f;什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式&#xff1f;分别有什么区别&#xff1f;数据类型mysql有哪些数据类型引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引…

log双线性模型log-bilinear model简单概括

LBLM(log-bilinear model)是自然语言处理中的比较简单的模型。LBLM根据上下文的词向量来预测下一个词向量wnw_nwn​&#xff0c;通过对上下文词向量的一个线性组合来表示&#xff1a; rwr_wrw​是一个实数值词向量对于词www对于下一个词的分布计算根据wnw_nwn​预测表示和所有…

9制定项目章程

项目干系人概述 项目主要干系人 项目章程 项目章程的功能 项目章程