第一章 概率论的基本概念
一、事件及其关系与运算
1、样本空间、样本点、随机事件、必然事件、不可 能事件、基本事件和复合事件的概念;
2、事件的包含与相等:若事件A包含事件B,则B的发生必然导致A的发生。进而有P(AB)=P(B),P(AUB)=P(A)
3、和事件:A、B至少有一个发生的事件,即AUB
4、积事件:A、B同时发生的事件,即AB
5、互斥事件:A、B不能同时发生的事件,即满足AB=φ,也称互不相容事件。
6、对立事件:满足条件AB=Φ而且A∪B=S,A的对立事件 用A ̅表示,A ̅=S-A;对立事件一定是互不相容事件。
7、差事件:A发生B不发生的事件称为A与B的差事件,表示为A-B或
8、常用运算式:
二、事件的概率及其计算
1、概率的公理化定义,规定了概率要满足的三 个条件:
(1)P(A)≥0,即非负性;
(2)P(S)=1,即规范性;
(3)两两互不相容事件的和的概率等于事件 的概率之和,即概率的可加性。
2、概率的性质
(1)对于任一事件A,有P(A ̅)=1-P(A);
(2)P(Φ)=0;
(3)若B包含A,则有P(B-A)=P(B)-P(A),而 且P(B)≥P(A);
(4)对任一事件A,有P(A)≤1;
(5)对任意两个事件A、B有 P(A∪B)=P(A)+P(B)-P(AB), 该式称为概率的加法公式。
(6)【概率减法公式】P(A-B)=P(A)-P(AB)
当B⊂A时,P(A-B)=P(A)-P(B) 当A=Ω时,P(B)=1- P(B)。
3、古典概率计算:P(A)=K/N=事件A包含的样本点数/样本空间S包含的样本点数
4、条件概率的定义: 当P(B)>0时,有P(A/B)=P(AB)/P(B)
5、乘法定理: 计算事件之积的概率公式 设P(A)>0,则有P(AB)=P(A)P(B/A)
6、全概率公式:设S为试验E的样本空间,B1,B2,···Bn为S的一个划分,A为E的事件,且 P(Bi)>0(i=1,2,3···n),则有
7、贝叶斯公式:实质为一条件概率
设S为试验E的样本空间,B1,B2,···Bn为S的一个划分,A为E的事件,且P(Bi)>0(i=1,2,3···n),P(A)>0,则有
满足全概率公式和贝叶斯公式的前提是“完备事件群”。
满足 :BiBj=∅(i≠j)B1+B2+⋯=Ω
这样的一组事件称为一个“完备事件群”。简而言之,就是事件之间两两互斥,所有事件的并集是整个样本空间(必然事件)。
三、事件的独立性
1、独立性的定义:设A、B为两事件,如果有P(AB)=P(A)P(B)成立,则称事件A和事件B相互独立。
2、推论
(1)若A与B独立,则有A ̅与B,A与B ̅,A ̅与B ̅也相互独立;
(2)若A、B互斥,且P(A)>0,P(B)>0,则A与B不独立;
(3)若A、B独立,且P(A)>0,P(B)>0,则A与B不互斥;
(4)样本空间中,S与Φ既独立又互斥;
(5)Φ与任何事件都独立且互斥。
第二章 随机变量及其分布
一、随机变量的定义
设E的样本空间为S={e},X=X{e}是定 义在样本空间上的实值单值函数,称X=X{e}为随机变量, 记为R.V。R.V一般用大写的字母X、Y、Z等表示,而小 写的x、y、z用来表示R.V所取的值。
二、离散型随机变量
1、离散型R.V的定义:R.V的全部可能取值是有限个 或可列无限多个。
2、离散型R.V的分布律:P{X=xk}=pk,k=1,2,3···
3、分布律的性质:pk≥0,
三、三种重要的离散型随机变量的分布律
1、(0—1)分布,记为X~(0,1)
,其中k=0,1,0<p<1。
2、二项分布,记为X~B(n,p)
(1)伯努利试验:试验E只有两种可能的结果,A和A ̅。 令A发生的概率为p。
(2)n重伯努利试验:将试验E独立地重复进行n次。
(3)定义R.V X为N重伯努利试验中A发生的次数,则有
3、泊松分布,记为X~π(λ)
(1)泊松分布的定义:,k=0,1,2···
(2)泊松定理:当二项分布中n很大,p很小时,可以用泊松分布来近似二项分布,泊松分布中的 参数λ=np。
四、R.V的分布函数
1、分布函数的定义:F(x)=P{X≤x},其中X是随机变量,x是实数参变量.
由定义可P{a<X≤b}=F(b)-F(a)
2、分布函数的性质:F(x)是一个不减函数,0≤F(x)≤1,F(x)右连续。
五、连续性随机变量
1、,其中f(x)为随机变量X的概率密度 函数。
2、概率密度的性质:f(x)≥0,,,
若f(x)在x处连续,则有f(x)=F′(x).
3、连续型随机变量X取任一指定值的概率为0,即 P{X=a}=0,其中a为任意实数。
4、对于连续性随机变量X,有P{a≤X≤b}=P{a<X≤b}=P{a<X<b}=P{a≤X<b}.
六、三种重要的连续性随机变量
1、均匀分布,记为X~U(a,b),概率密度为
2、指数分布,记为X~E(θ),概率密度为
3、正态分布,也称为高斯分布,记为X~N(u,σ2)
(1)正态分布的概率密度,-∞<x<∞, 其中u可取任意实数,σ取大于0的实数。
(2)正态曲线关于x=u对称。
(3)当x=u时,f(x)取到最大值,即f(u)=1/σ√2π。
(4)u决定了正态曲线的中心位置,称为位置参数;σ 决定了正态曲线的中峰陡峭程度,称为尺度参数。
(5)标准正态分布:
u=0,σ=1的正态分布称为标准正态分布, 即X~N(0,1).
(6)标准正态分布的密度函数为 标准正态分布的分布函数为
φ(x)可通过标准正态分布函数表查表得到。
(7)正态分布转化为标准正态分布的方法(必会): 因此有F(x)=P(X≤x)=φ(x−u/σ); P(x1<X≤x2)=φ(x_1−u/σ)-φ(x_2−u/σ)
(8)上α分位点:设X~N(0,1),若z_α满足条件 P{X>zα}=α,0<α<1,则称z_α为标准正态分布的上α 分位点。
七、随机变量的函数的分布
1、离散型随机变量函数的分布 若X的分布律为,
则Y=g(X)的分布律为 ,
若g(xk)中有一些取值相同,则把它们的概率相加。
2、连续型随机变量的函数的分布
问题的提法:已知X的概率密度为f(x),求Y=g(X)概率密度。
做法1(针对g(X)为严格单调时):设Y的分布函数为FY(y),则有FY(y)=P{Y≤y}=P{g(X)≤y}=P{X≤h(y)}=FX(h(y)), 其中h(y)为y=g(x)的反函数。然后FY(y)对y求导,即得 Y的概率密度f(y)。
定理:若函数g(x)处处可导且g(x)的倒数恒大与0或恒小于0,则有以下结论: f(y)=fX[h(y)]|h/(y)|,其中h(y)为y=g(x)的反函数。
做法2(分布函数法)【必会】连续型随机变量函数的分布的求法,通常是采用分布函数的定义的方法。我们将分布函数变形,将它化成关于 的分布函数,然后对 y 求导,就得到了 Y 的概率密度。
第三章 多维随机变量及其分布
一、二维随机变量的定义
设E是一个随机试验,它的样本空间是S={e},设X=X{e}和Y=Y{e}是定义在S上的随机变量,由它们构成的一个向量(X,Y)称为二维随机变量。
二、二维R.V的分布函数
1、定义:F(x,y)=P{X≤x,Y≤y},也称为联合分布函数。
P{a<X≤b,c<Y≤d}=F(b,d)-F(b,c)-F(a,d)+F(a,c)
2、性质
(1)F(x,y)是变量x和y的不减函数。
(2)0≤F(x,y)≤1,F(-∞,y)=0,F(x,-∞)=0,F(-∞,-∞)=0,F(∞,∞)=1
(3)F(x,y)关于x和y右连续
三、离散型二维随机变量
1、定义:二维R.V的所有可能取值是有限对或可 列无限多对。
2、分布律:P{X=xi,Y=yj}=pij,i,j=1,2,3······也称联合分布律
四、连续型二维随机变量
1、定义:存在非负函数f(x,y),有, 其中f(x,y)称为二维随机变量(X,Y)的概率密度。
2、二维概率密度函数f(x,y)的性质
(1)f(x,y)≥0
(2)【必知】
(3)若f(x,y)在(x,y)处连续,则有
(4)设G是xoy平面上的一个区域,点(X,Y)落 在区域G内的概率为 ,积分区域为G。
五、边缘分布
1、边缘分布函数:已知联合分布函数F(x,y)
X的边缘分布函数为:FX(x)=P{X≤x}=P{ X≤x,Y≤∞}=F(x,∞)
Y的边缘分布函数为:FY(y)=P{Y≤y}=P{ X≤∞,Y≤y}=F(∞,y)
2、离散型二维R.V的边缘分布律:已知联合分布律pij X的边缘分布律为:
Y的边缘分布律为:
3、连续型二维R.V的边缘概率密度:已知联合概率密度f(x,y) 【必会】
X的边缘概率密度为:
Y的边缘概率密度为:
六、条件分布
1、离散型R.V的条件分布分布律
(1) 若P{Y=yi}>0,则在Y=yi 条件下X的条件分布律为
P{ X=xi| Y=yi}= P{X=xi,Y=yj}/ P{Y=yi}=pij/p.j,i=1,2···
(2)若P{X=xi}>0,则在X=xi 条件下Y的条件分布律为
P{ Y=yi | X=xi }= P{X=xi,Y=yj}/ P{ X=xi }=pij/ pi.,j=1,2···
2、连续型R.V的条件概率密度
(1)若fY(y)>0,在Y=y条件下X的条件概率密度为
(2)若fX(x)>0,在X=x条件下Y的条件概率密度为
(3)综合来说,条件分布=联合分布/边缘分布
3、二维R.V的均匀分布的定义
设G是平面上的有界区域,其面积为A,若其联合概率密度为 ,
则称(X,Y)在G上服从均匀分布。
七、相互独立的随机变量
1、定义:设F(x,y)及FX(x)、FY(y)分别是二维R.V(X,Y)的联合分布函数和边缘分布函数,若对于所有的x,y,有
F(x,y)= FX(x)·FY(y),则称R.V X和Y是相互独立的。
2、对于连续型随机变量,有f(x,y)= fX(x)·fY(y)
3、对于离散型随机变量,有P{X=xi,Y=yj}= P{X=xi}·P{Y=yi}
4、二维正态随机变量:
两个边缘分布为
当ρ=0时,X和Y相互独立;若X和Y相互独立,则ρ=0.
八、两个随机变量函数的分布
1、Z=X+Y的分布 已知(X,Y)的联合概率密度为f(x,y),则Z的概率密度为 ;
若X和Y相互独立,则Z的概率密度为
;
2、关于随机变量之和的分布的几个结论
(1)设X和Y相互独立,且X~N(u1, σ12),Y~N(u2,σ22),则Z=X+Y仍服从正态分布, 且.
(2)若Xi~N(ui, σi2),i=1,2···且它们相互独立,则它们的和服从正态分布,
且有
(3)设X和Y相互独立,且X~π(λ1),Y~π(λ2),则Z=X+Y~π(λ1+λ2).
(4)设X和Y相互独立,且X~b(n,p),Y~b(n,p),则 Z=X+Y~b(2n,p)
3、M=max(X,Y)和N=min(X,Y)的分布函数
(1) 设X、Y相互独立,其分布函数分别为FX(x)、FY(y),则【必知】
上述结论可以推广到n个相互独立的随机变量的情况。
(2)若 相互独立且均服从参数为θ的指数分布,定义,则Z服从参数为θ/n 的指数分布。
第四章 随机变量的数字特征
一、随机变量的数学期望的定义
1、离散型随机变量X,其分布律为P{X=xk}=pk,k=1,2,3···若级数绝对收敛,则称该级数的和为R.V X的数学期望,记为。
2、连续型随机变量X,其概率密度为f(x),若积分绝对收敛,则称该积分值为随机变量X的数学期望,记为。【必知】
二、随机变量的函数的数学期望
设Y为随机变量X的函数,Y=g(X),其中g是连续函数
1、已知离散型随机变量X,其分布律为P{X=xk}=pk, k=1,2,3···则Y的数学期望为
2、已知连续型随机变量X,其概率密度为f(x),则Y的数学期望为
结论:不必知道Y的概率分布,可以通过X的概率分布求Y的 数学期望。
以上结论可以推广到求取二维随机变量的函数的数学期望, 已知条件为二维随机变量的联合概率分布。
三、数学期望的重要性质
1、设C是常数,则有E(C)=C。
2、设X是随机变量,C是常数,则有E(CX)=CE(X).
3、设X、Y是两个随机变量,则有E(X+Y)=E(X)+E(Y).
4、设X、Y是相互独立的随机变量,则有E(XY)=E(X)E(Y).
第3、4条性质可以推广到n个随机变量。
四、随机变量的方差
1、方差的定义:设X是R.V,若E{[X-E(X)]2}存在,则称其 为X的方差,记为D(X),即D(X)=E{[X-E(X)]2}。
2、方差的意义:方差表示随机变量X的取值与其数学期望E(X)的偏离程度。
3、方差的计算:由方差的定义可知,方差实质为一数学期 望,是随机变量的函数[X-E(X)]2的数学期望。
(1)离散情况:
(2)连续情况:
(3)计算方差的重要公式:D(X)=E(X2)-[E(X)]2【必会】
五、标准化随机变量的定义
设R.V X的E(X)=u,D(X)=σ2≠0,记X*=(X-u)/σ,则称X*为X的标准化的随机变量。且E(X*)=0,D(X*)=1。
六、方差的性质
1、设C为常数,则D(C)=0。
2、设X是R.V,C是常数,则有【必知】
3、设X、Y是两个随机变量,则有D(X+Y)=D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}
4、若X、Y相互独立,则有D(X+Y)=D(X)+D(Y),此结论可以推广到n 个相互独立的随机变量的情况。
5、D(X)=0的充要条件是X以概率1取常数C,且C=E(X)。
七、六种重要的随机变量的数学期望和方差
1、X~(0-1),X=1的概率为p,则有E(X)=p,D(X)=p(1-p)
2、X~B(n,p),则有E(X)=np,D(X)=np(1-p)
3、X~π(λ),则有E(X)=λ,D(X)=λ
4、X~U(a,b),则有E(X)=(a+b)/2,
5、X~E(θ),则有E(X)=θ,
6、X~N(u,σ2),则有E(X)=u,
八、切比雪夫不等式 【必会】
定理:设随机变量X具有数学期望E(X)= u,D(X)=σ2,则对于任意正数ε,不等式 成立,该不等式称为切比雪夫不等式。
切比雪夫不等式的另一种形式:
九、协方差及相关系数
1、X、Y的协方差的定义:Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}
2、X、Y的相关系数的定义:ρXY= Cov(X,Y)/√D(X)D(Y)
3、跟协方差及相关系数有关的计算公式:
(1)D(X+Y)=D(X)+D(Y)+2Cov(X,Y);D(X-Y)=D(X)+D(Y)-2Cov(X,Y)
(2)Cov(X,Y)= ρXY√D(X)D(Y)
(3)Cov(X,Y)=E(XY)-E(X)E(Y)【必会】
(4)Cov(X,X)=E(X2)-E(X)E(X)=D(X)
4、协方差的性质
(1)Cov(X,Y)= Cov(Y,X)
(2)若a,b为常数,则Cov(aX,bY)=ab Cov(X,Y)
(3)Cov(X1+X2,Y)= Cov(X1,Y) + Cov(X2,Y)
5、相关系数的性质
(1)|ρXY|≤1
(2)|ρXY|=1的充要条件是:存在常数a,b,使 P{Y=a+bX}=1
6、不相关的定义及性质
(1)不相关的定义:如果ρXY=0,则称X和Y不相关
(2)以下4条说法和不相关等价
①ρXY=0; ②Cov(X,Y)=0;
③E(XY)=E(X)E(Y);④D(X+Y)=D(X)+D(Y)。
(3)若X和Y相互独立,则X和Y不相关;反之不成立。
7、 二维正态分布X和Y不相关的充要条件为:ρ=0;
结合二维正态分布X和Y相互独立的条件可知,
二维正态分布X和Y不相关和独立是等价的,充 要条件均为ρ=0。
十、矩的概念
1、X的k阶原点矩:E(Xk),K=1,2,3······
2、X的k阶中心距:E{[X-E(X)]k},k=2,3······
3、X和Y的k+l阶混合矩:E[XkYl],k,l=1,2,3······
4、X和Y的k+l阶混合中心矩:E{[X-E(X)]k[Y-E(Y)]l},k,l=1,2,3······
由矩的概念知,E(X)为X的一阶原点矩;D(X)为X的二阶中心矩;
Cov(X,Y)为X、Y的二阶混合中心矩。
十一、n维正态随机变量的性质
1、n维正态随机变量(X1,X2···Xn)的每一个分量Xi(i=1,2···n)都是正态随机变量;
反之,若X1,X2···Xn是相互独立的正态随机变量, 则(X1,X2···Xn)是n维正态随机变量。
2、n维随机变量(X1,X2···Xn)服从n维正态分布的条件是X1,X2···Xn的任意线性组合服从一维正态分布。
第五章 大数定律及中心极限定理
一、定理一:切比雪夫定理的特殊情况
设随机变量X1,X2···Xn···相互独立,且具有相同的数学期望和方差:,
做前n个随机变量的算术平均值,则对于任意的ε>0,有
实际意义:用n很大时的Yn来估计u的值。
二、定理二:伯努利定理
设nA是n次独立重复试验中事件A发生的次数,p是 事件A在每次试验中发生的概率,则对于任意的ε>0,有
实际意义:以严格的数学形式证明了频率的稳定性,从而可以用n很大时的频率来代替概率。
三、定理三:辛钦大数定理
设随机变量X1,X2···Xn···相互独立,服从同一分布且具有数学期望E(Xk)=u,则对于任意的ε>0,有
四、依概率收敛的定义
设X1,X2···Xn···是一个随机变量序列,a是一个常数,若 对于任意的ε>0,有
则称序列X1,X2···Xn···依概率收敛于a。记为
五、中心极限定理
1、定义:把和的分布收敛于正态分布这一类定理都叫 作中心极限定理。
2、独立同分布的中心极限定理: 设随机变量X1,X2···Xn···相互独立,服从同一分布 且具有数学期望,
定义随机 变量,则有,从而有
3、李雅普诺夫定理:
设随机变量X1,X2···Xn···相互独立,具有数学期望 和方差:,定义随机变量 ,则有,从而有
4、棣莫佛-拉普拉斯定理:
设随机变量Xn~B(n,p),定义随机变量,则有,从而有
设随机变量X1, X2,…, Xn相互独立,且服从相同的分布,他们的数学期望和方差均为µ和σ²(>0)。记:【理解清楚】
则有
其中φ(z)是标准正态分布的分布函数。
第六章 样本及抽样分布
一、随机样本
1、总体:研究对象的某项数量指标的值得全体。一般用随机变量或随机变量的分布函数来表示总体。
2、个体:总体中的每个元素称为个体。
3、抽样:为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息 ,这一抽取过程称为抽样。
4、样本和样本值:抽样得到的个体称为样本,样本所取到的观察值称为样本值。
5、简单随机样本X1,X2···Xn的特点:独立同分布
(1)X1,X2···Xn是相互独立的随机变量;
(2)X1,X2···Xn中的每一个个体与所考察的总体有相同的分布。
二、统计量
1、统计量的定义: 不含任何未知参数的样本的函数称为统计量。
2、常用统计量: 设X1,X2···Xn是来自总体的样本,则有以下常用统计量
(1)样本均值:
(2)样本方差:
(3)样本标准差:
(4)样本k阶原点矩:
(5)样本k阶中心矩:
三、抽样分布
1、抽样分布的定义:统计量的分布称为抽样分布。
2、常用抽样分布
(1) 分布的定义及性质 (2)t分布的定义 (3)F分布的定义
3、正态总体的样本均值和样本方差的分布
(1)样本均值和样本方差的数字特征
设总体X的均值为u,方差为σ2,X1,X2···Xn是总体X的 一个样本,则总有 (2)正态总体样本均值的分布
设X1,X2···Xn是总体N(u,σ2)的一个样本,则有
(3)正态总体样本方差的分布 (卡方分布) 【必会】
设X1,X2···Xn是总体N(u,σ2)的一个样本,则有 a: (主要结论)
b:样本均值与样本方差相互独立
(4)与样本均值和样本方差有关的一个分布 (t分布)
设X1,X2···Xn是总体N(u,σ2)的一个样本,则有
(5)F分布
F分布是由两个卡方分布与其自由度比值的比值确定的分布,记作
第七章 参数估计
一、点估计
1、点估计问题
设总体X的分布函数为F(x;θ),θ为待估计的参数。X1,X2···Xn是总体X的一个样本,x1,x2,···xn是相应的一个样本值。点估计问题就是构造一个适当的统计量 ,用它的观察值来估计参数θ。统计量称为估计量,观察值称为估计值。
2、矩估计法
理论依据:样本矩Ak依概率收敛于相应的总体矩uk
具体做法:令Ak=uk,有几个未知参数就列几个等式,求解方程或方程组即可得到未知参数的矩估计量,代入样本值,即可得到相应的矩估计值。
求解:求出期望,令其=x的绝对值,求得未知参数的^
3、最大似然估计法
对于离散总体,已知其分布律;对于连续总体,已知其概率密度。
由总体的分布律或概率密度写出样本似然函数L(θ)
求样本似然函数的最大值,最大值所对应的θ即为参数θ的最大似然估计值
最大似然估计的性质:设θ的函数u=u(θ)具有单值反函数 θ=θ(u),若 是θ的最大似然估计,则是u(θ)的 最大似然估计。
求解:对L(θ)取对数,两边分别对θ求导,令其为0,求得
二、估计量的评选标准
1、无偏性:如果,则称是θ的无偏估计量。
结论:Ak是uk的无偏估计;样本均值是总体均值的无偏估计;样本方差是总体方差的无偏估计。
无偏估计量:若a为b的无偏估计量,则E(a)=b;
2、有效性:设和是θ的无偏估计,若有 ,则称比有效。
3、相合性:设 (X1,X2…Xn)是θ的估计量,当n趋于 无穷大时,若(X1,X2…Xn)依概率收敛于θ,则称 (X1,X2…Xn)为θ的相合估计量。
三、区间估计
1、区间估计的定义:
设总体X的分布函数为F(x;θ),其中含有一个未知参数θ,对于 给定的α(0<α<1),若由样本X1,X2…Xn确定的 两个统计量 和 ,满足 ,则称区间为θ的置信度为1-α的 置信区间。
其中为置信下限,为置信上限,1-α为置信度。
2、求未知参数θ的置信区间的步骤
(1)明确问题。确定求什么参数的置信区间,置信水平1-α是多少。
(2)寻找参数θ的一个良好的点估计T(X1,X2…Xn),可从无偏估计入手。
(3)寻找一个待估参数θ和估计量T的函数Z(T,θ),而且其分布已知。Z(T,θ)称为枢轴量。 (4)对于给定的置信水平1-α,根据Z(T,θ)的分布,确定常数a,b,使得。
(5)做等价变形,求出 。
3、正态总体均值的区间估计
总体X~N(u,σ2), X1,X2…Xn为样本,设置信度为1-α,求均值u的置信区间。
(1)已知的情况。置信区间为
(2)未知的情况。置信区间为 4、正态总体方差的区间估计
总体X~N(u,σ2), X1,X2…Xn为样本,设置信度为1-α,求方差 的置信区间。
u未知情况下,置信区间为
5、单侧置信区间
给定值α ( 0< α<1 ),若由样本X1,X2…Xn确定的统计量
(1)满足 ,则称 为θ的置信度为1-α的单侧置信区间, 称为单侧置信下限;
(2)满足 ,则称 为θ的置信度为1-α的单侧置信区间, 称为单侧置信上限;
(3)在形式上,将双侧置信区间里面的上下限中的α/2改成 α,即可得到对应的单侧置信上下限。