关于样本量n的取值
如果希望在控制第I类错误的情况下,同时限制第II类错误的,这个时候就需要考虑样本量。样本量越大,错误概率越低。使用OC曲线。
分布拟合检验
如果不知道总体服从什么类型的分布,就需要根据样本来检验分布的假设。
单个分布的卡方拟合检验法
卡方拟合检验法可以检验总体是否具有某一个指定的分布或者属于某一分布族。具体参见第8章第6节。要求样本量n大于等于50。
定义
记:F(x)为总体X的未知分布函数
假设:F0(x)是形式已知,但含有若干个未知参数的分布函数。
检验假设:H0:F(x)=F0(x),∀x∈R
说明:如果总体X是离散的,则假设H0为:
H0:总体X的分布律为P{X=ti}=pi,i=1,2,3....
若总体X是连续的,则假设H0为:
H0:总体X的概率密度函数为f(x)
原理和步骤
1在H0下,总体X取值的全体分为k个两两不相交的子集A1,A2...Ak。
2以ni(i=1,2...k)记录样本观察值x1,x2,...xk中落在Ai的个数(实际频数)。
3当H0为真,且F0(x)完全已知时,计算事件Ai发生的概率pi=PF0(Ai),i=1,2...k。
3.1如果F0(x)含有r个未知参数的时候,先利用极大似然估计r个未知参数,然后求得pi的估计值p^i。
4检验统计量∑ki=1hi(ni−npi)2。这个统计量表示事件实际Ai发生的次数与理论上事件Ai发生的次数之间的平方差。当试验次数够多,H0为真,这个数应该不会太大。hi是个常数。检验的拒绝域形式是∑ki=1hi(ni−npi)2≥c。
4.1如果hi=npi,统计量变为∑ki=1npi(ni−npi)2;
4.2hi的值。皮尔逊证明以下定理
若n充分大(n≥50),则当h0为真时,
统计量∑ki=1npi(ni−npi)2近似服从χ2(k−1),
统计量∑ki=1npi(ni−np^i)2近似服从χ2(k−r−1)
k是分类个数,r是未知参数个数。
4.3简化统计量得到最终的拒绝域
χ2=∑ki=1npi(ni−npi)2=∑ki=1n2inpi−n
χ2=∑ki=1npi(ni−npi)2=∑ki=1n2inp^i−n
χ2=∑ki=1n2inpi−n≥χ2α(k−1)
χ2=∑ki=1n2inp^i−n≥χ2α(k−r−1)
注意:n要足够大,n≥50;npi>5。
正态性检验方法
偏度、峰度检验法。偏度、峰度是指X的标准化变量的三阶矩、四阶矩。
v1=E[(X−E(X)(√D(X)))3]
v2=E[(X−E(X)(√D(X)))4]
样本量大于100为宜
秩和检验
在前面都介绍的是显著性检验。这里会介绍秩和检验。
ok。It’s great to finish this course.