从今天开始要学习数理统计。
概率论:是专门研究随机现象的一门学科,定量描述随机现象及其规律。
数理统计:数理统计的研究对象是数据,包括对数据的采集、整理、分析、建模。主要任务是获取样本、描述样本,从样本得到总体的分布情况和分布参数。
基本概念
总体:研究对象的全体。
个体:总体中的成员。
总体的容量:总体中包含的个体数。
有限总体:容量有限的总体。
无限总体:容量不可数的总体。有限总体量非常大的时候,也看作是无限总体。
总体的某个指标X,对于不同个体,有不同的值。X可以看做是随机变量。假设X的分布函数为F(X),也称总体X具有分布函数F(X)。
数据收集
数据收集方法有两种。1 调查记录,例如是否做过家教。2 试验记录。例如药物反应。
抽样
数理统计的目标是从样本推总体。使用的方法是抽样。
样本:从总体中抽取到的部分个体叫样本。
简单随机样本:满足以下两个条件的随机样本(X1,X2...Xn)称为容量为n的简单随机样本:1 每个Xi与X同分布;2 X1,X2...Xn是相互独立的随机变量。详细解释第一个条件。一批灯泡的寿命服从π(λ)。这个总体中任何一个样本的寿命都是服从π(λ),所以任意抽取一个就可以。如果这里面混入了别人家的产品,这个产品服从π(λ1),那这个抽样就要出问题了。或者这里混入了IBM笔记本。笔记本寿命可能就不符合泊松分布了。
一个容量为n的样本X1,X2...Xn是指n个独立的与总体分布相同的随机变量。
样本观察值:对样本进行一次观察,得到实际的值。
抽样分不放回抽样、放回抽样。
统计量:样本的不包含任何未知参数的函数。
样本均值:X¯¯¯=1n∑ni=1Xi
样本方差:S2=1n−1∑ni=1(Xi−X¯¯¯)2
标准差:S=S2−−−√
k阶矩:Ak=1n∑ni=1Xki
k阶中心矩:Bk=1n∑ni=1(Xi−X¯¯¯)k
B2=n−1nS2
样本分位数
样本p分位数:1至少有np个观察值小于等于xp;2 至少有n(1-p)个观察值大于等于xp。(0<<script type="math/tex" id="MathJax-Element-16"><</script>p<1)。样本中位数M、第一四分位数Q1、第三四分位数Q3。
例如:一组容量为18的样本值如下:
122 126 122 140 145 149 150 157
162 166 175 177 183 188 199 212
x0.2=x(n∗0.2)=x([18∗0.2]+1)=x([3.6]+1)=x4=140
x0.25=x(n∗0.25)=x([18∗0.25]+1)=x([4.5]+1)=x5=145
x0.5=?:18*0.5=9;x0.5=12∗(157+162)=159.5
箱线图:最小值Min,第一四分位数Q1、样本中位数M、第三四分位数Q3、样本最大值Max,五个数据画成的图。
重要的抽样分布
统计量的分布称为抽样分布。
几个重要的抽样分布:正态分布、卡方分布、t分布、F分布。
卡方分布
定义:设随机变量X1,...Xn相互独立,且都服从N(0,1),则称卡方分布=∑ni=1X2i服从自由度为n的卡方分布。
概率密度函数:
性质:
1 E(卡方分布)=n,D(卡方分布)=2n。
2 可加性。Y1 卡方分布(n1),Y2 卡方分布(n2),且Y1,Y2相互独立,则Y1+Y2 卡方分布(n1+n2)。
上α分位数
t分布
定义:设随机变量X~N(0,1),Y~卡方分布(n),X与Y相互独立,则称变量T=XY/n−−−−√ 服从 t(n)。
概率密度函数:
上α分位数
F分布
定义:设随机变量X~卡方分布(n1),Y~卡方分布(n2),X与Y相互独立,则称变量F=X/n1Y/n2 服从F(n1,n2)。
概率密度函数:
性质:
1 如果F服从F(n1,n2),则1F~F(n2,n1).
上α分位数
单个正态总体的抽样分布
设总体X的均值为μ,方差为σ2,X1,X2,...Xn是来自X的一个样本,样本均值X¯¯¯=1n∑ni=1Xi,样本方差S2=1n−1∑ni=1(Xi−X¯¯¯)2,则有E(X¯¯¯)=μ,D(X¯¯¯)=σ2n,E(S2)=σ2。
定理一:总体X~
(1)X¯¯¯服从N(μ,σ2n)
(2)(n−1)S2σ2~卡方分布(n-1),S2与X¯¯¯相互独立。
定理二:总体X~N(μ,σ2),X1,X2,...Xn是样本,样本均值X¯¯¯=1n∑ni=1Xi,样本方差S2=1n−1∑ni=1(Xi−X¯¯¯)2,则X¯¯¯−μS/n√~t(n-1)
两个正态总体的抽样分布
定理三:设样本(X1,X2...Xn)和(Y1,Y2...Yn)分别来自总体N(μ1,σ21)和N(μ2,σ22),并且它们相互独立,样本均值分别为X¯¯¯、Y¯¯¯;样本方差分为别S21、S22,则可以得到以下抽样分布:
1 F=S21/σ21S22/σ22=S21/S22σ21/σ22~F(n1−1,n2−1)。
2 (X¯¯¯−Y¯¯¯)σ21n1+σ22n2−−−−−−−−√服从N(0,1)
3 当σ21=σ22=σ2时,(X¯¯¯−Y¯¯¯)Sw1n1+1n2−−−−−−−−√服从t(n1+n2−2),其中S2w=(n1−1)S21+(n2−1)S22n1+n2−2,Sw=S2w−−−√。
总结
1 设样本X1,X2...Xn是来自总体X的样本,不管X服从什么分布,只要期望和方差存在,具有E(X)=μ,D(X)=σ2,则有E(X¯¯¯)=μ,D(X¯¯¯)=σ2n。
2 总体X~
(1)X¯¯¯服从N(μ,σ2n)
(2)(n−1)S2σ2~卡方分布(n-1)
(3)S2与X¯¯¯相互独立。
(4)X¯¯¯−μS/n√~t(n-1)
3 对于两个正态总体,有三条重要的结果。