文章目录
- 区间估计的概念
- 一个正态总体的情形
- 两个正态总体的情形
- 参考文献
区间估计的概念
对未知参数来说,我们除了关心它的点估计外,有时还需要估计出它的一个范围,以及这个范围包含参数真值的可信程度。这种范围通常用区间的形式给出,称之为置信区间。这种形式的估计就称为区间估计。
设总体 X X X 的分布函数为 F ( x ; θ ) F(x;\theta) F(x;θ), θ \theta θ 为未知参数, X 1 , . . . , X n X_1,...,X_n X1,...,Xn 是来自总体 X X X 的样本。对于给定值 α ( 0 < α < 1 ) \alpha(0<\alpha<1) α(0<α<1),若存在统计量 θ ‾ ( X 1 , . . . , X n ) \underline{\theta}(X_1,...,X_n) θ(X1,...,Xn) 和 θ ˉ ( X 1 , . . . , X n ) \bar{\theta}(X_1,...,X_n) θˉ(X1,...,Xn),使得 P { θ ‾ ( X 1 , . . . , X n ) < θ < θ ˉ ( X 1 , . . . , X n ) } ≥ 1 − α P\{\underline{\theta}(X_1,...,X_n)<\theta<\bar{\theta}(X_1,...,X_n)\} \ge 1-\alpha P{θ(X1,...,Xn)<θ<θˉ(X1,...,Xn)}≥1−α 则称区间 ( θ ‾ , θ ˉ ) (\underline{\theta},\bar{\theta}) (θ,θˉ) 为参数 θ \theta θ 的置信度为 1 − α 1-\alpha 1−α 的置信区间, θ ‾ 、 θ ˉ \underline{\theta}、\bar{\theta} θ、θˉ 分别称为置信上、下限。
通常可按下列思路来寻求未知参数 θ \theta θ 的置信区间:
- 由未知参数 θ \theta θ 的点估计量入手,构造一个仅包含样本 X 1 , . . . , X n X_1,...,X_n X1,...,Xn 和被估参数 θ \theta θ 的随机函数 G = G ( X 1 , . . . , X n ; θ ) G=G(X_1,...,X_n;\theta) G=G(X1,...,Xn;θ),其中 G G G 的概率分布应当容易确定且不含任何未知参数( G G G 也称为枢轴量);
- 对给定的置信度 1 − α 1-\alpha 1−α,由等式 P { c < G ( X 1 , . . . , X n ; θ ) < d } = 1 − α P\{c<G(X_1,...,X_n;\theta)<d\}=1-\alpha P{c<G(X1,...,Xn;θ)<d}=1−α 适当的确定常数 c , d c,d c,d;
- 把不等式 c < G ( X 1 , . . . , X n ; θ ) < d c<G(X_1,...,X_n;\theta)<d c<G(X1,...,Xn;θ)<d 化为等价的不等式 θ ‾ ( X 1 , . . . , X n ) < θ < θ ˉ ( X 1 , . . . , X n ) \underline{\theta}(X_1,...,X_n)<\theta<\bar{\theta}(X_1,...,X_n) θ(X1,...,Xn)<θ<θˉ(X1,...,Xn) 这样即可找到参数 θ \theta θ 的置信度为 1 − α 1-\alpha 1−α 的置信区间 ( θ ‾ , θ ˉ ) (\underline{\theta},\bar{\theta}) (θ,θˉ)。
上述寻求参数 θ \theta θ 的置信区间的方法称为枢轴量法。
一个正态总体的情形
设总体 X ∼ N ( μ , σ 2 ) X \sim N(\mu,\sigma^2) X∼N(μ,σ2), X 1 , . . . , X n X_1,...,X_n X1,...,Xn 为总体 X X X 的样本, X ˉ 、 S ∗ 2 \bar{X}、S^{*2} Xˉ、S∗2 分别为样本均值和修正样本方差。下面讨论 μ , σ 2 \mu,\sigma^2 μ,σ2 的区间估计。
μ \mu μ 的区间估计
(1) 当方差 σ 2 \sigma^2 σ2 已知时,因为 X ˉ \bar{X} Xˉ 是 μ \mu μ 的无偏估计,因此构造枢轴量 U = n ( X ˉ − μ ) σ ∼ N ( 0 , 1 ) U=\frac{\sqrt{n}(\bar{X}-\mu)}{\sigma}\sim N(0,1) U=σn(Xˉ−μ)∼N(0,1) μ \mu μ 的置信度为 1 − α 1-\alpha 1−α 的置信区间为 ( X ˉ − σ n u α / 2 , X ˉ + σ n u α / 2 ) \left(\bar{X}-\frac{\sigma}{\sqrt{n}}u_{\alpha/2},\bar{X}+\frac{\sigma}{\sqrt{n}}u_{\alpha/2}\right) (Xˉ−nσuα/2,Xˉ+nσuα/2)
(2) 当方差 σ 2 \sigma^2 σ2 未知时,注意到 S ∗ 2 S^{*2} S∗2 是 σ 2 \sigma^2 σ2 的无偏估计,以 S ∗ S^* S∗ 替换 (1) 中枢轴量的 σ \sigma σ,可得枢轴量 T = n ( X ˉ − μ ) S ∗ ∼ t ( n − 1 ) T=\frac{\sqrt{n}(\bar{X}-\mu)}{S^*}\sim t(n-1) T=S∗n(Xˉ−μ)∼t(n−1) μ \mu μ 的置信度为 1 − α 1-\alpha 1−α 的置信区间为 ( X ˉ − S ∗ n t α / 2 ( n − 1 ) , X ˉ + S ∗ n t α / 2 ( n − 1 ) ) \left(\bar{X}-\frac{S^*}{\sqrt{n}}t_{\alpha/2}(n-1),\bar{X}+\frac{S^*}{\sqrt{n}}t_{\alpha/2}(n-1)\right) (Xˉ−nS∗tα/2(n−1),Xˉ+nS∗tα/2(n−1))
σ 2 \sigma^2 σ2 的区间估计
这里只讨论 μ \mu μ 未知时的 σ 2 \sigma^2 σ2 的区间估计。
因为 S ∗ 2 S^{*2} S∗2 是 σ 2 \sigma^2 σ2 的无偏估,因此构造枢轴量 χ 2 = 1 σ 2 ∑ i = 1 n ( X i − X ˉ ) 2 = ( n − 1 ) S ∗ 2 σ 2 ∼ χ 2 ( n − 1 ) \chi^2=\frac{1}{\sigma^2}\sum_{i=1}^n (X_i-\bar{X})^2=\frac{(n-1)S^{*2}}{\sigma^2} \sim \chi^2(n-1) χ2=σ21i=1∑n(Xi−Xˉ)2=σ2(n−1)S∗2∼χ2(n−1) σ 2 \sigma^2 σ2 的置信度为 1 − α 1-\alpha 1−α 的置信区间为 ( ( n − 1 ) S ∗ 2 χ α / 2 2 ( n − 1 ) , ( n − 1 ) S ∗ 2 χ 1 − α / 2 2 ( n − 1 ) ) \left(\frac{(n-1)S^{*2}}{\chi^2_{\alpha/2}(n-1)},\frac{(n-1)S^{*2}}{\chi^2_{1-\alpha/2}(n-1)}\right) (χα/22(n−1)(n−1)S∗2,χ1−α/22(n−1)(n−1)S∗2)
两个正态总体的情形
设总体 X ∼ N ( μ 1 , σ 1 2 ) X \sim N(\mu_1,\sigma^2_1) X∼N(μ1,σ12),总体 Y ∼ N ( μ 2 , σ 2 2 ) Y \sim N(\mu_2,\sigma^2_2) Y∼N(μ2,σ22), ( X 1 , . . . , X n 1 ) T (X_1,...,X_{n_1})^T (X1,...,Xn1)T, ( Y 1 , . . . , Y n 2 ) T (Y_1,...,Y_{n_2})^T (Y1,...,Yn2)T 分别为来自总体 X 、 Y X、Y X、Y 的样本,且假定两样本相互独立。记 X ˉ , Y ˉ \bar{X},\bar{Y} Xˉ,Yˉ 为两样本各自的样本均值, S 1 n 1 ∗ 2 , S 2 n 2 ∗ 2 S^{*2}_{1n_1},S^{*2}_{2n_2} S1n1∗2,S2n2∗2 为两样本各自的修正方差。对给定的置信度 1 − α 1-\alpha 1−α,要讨论 μ 1 − μ 2 , σ 1 2 / σ 2 2 \mu_1-\mu_2,\ \sigma_1^2/\sigma_2^2 μ1−μ2, σ12/σ22 的区间估计。
μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2 的区间估计
(1) σ 1 2 \sigma_1^2 σ12 和 σ 2 2 \sigma_2^2 σ22 均已知。
构造枢轴量 U = X ˉ − Y ˉ − ( μ 1 − μ 2 ) σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) U=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1) U=n1σ12+n2σ22Xˉ−Yˉ−(μ1−μ2)∼N(0,1) 故 μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2 的置信度为 1 − α 1-\alpha 1−α 的置信区间为 ( ( X ˉ − Y ˉ ) ∓ u α / 2 σ 1 2 n 1 + σ 2 2 n 2 ) \left((\bar{X}-\bar{Y}) \mp u_{\alpha/2} \sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\right) (Xˉ−Yˉ)∓uα/2n1σ12+n2σ22
(2) σ 1 2 = σ 2 2 = σ 2 \sigma_1^2=\sigma_2^2=\sigma^2 σ12=σ22=σ2,但 σ 2 \sigma^2 σ2 未知。
构造枢轴量 T = X ˉ − Y ˉ − ( μ 1 − μ 2 ) S w 1 n 1 + 1 n 2 ∼ t ( n 1 + n 2 − 2 ) T=\frac{\bar{X}-\bar{Y}-(\mu_1-\mu_2)}{S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2) T=Swn11+n21Xˉ−Yˉ−(μ1−μ2)∼t(n1+n2−2) 其中 S w = ( n 1 − 1 ) S 1 n 1 ∗ 2 + ( n 2 − 1 ) S 2 n 2 ∗ 2 n 1 + n 2 − 2 S_w=\sqrt{\frac{(n_1-1)S^{*2}_{1n_1}+(n_2-1)S^{*2}_{2n_2}}{n_1+n_2-2}} Sw=n1+n2−2(n1−1)S1n1∗2+(n2−1)S2n2∗2 故 μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2 的置信度为 1 − α 1-\alpha 1−α 的置信区间为 ( ( X ˉ − Y ˉ ) ∓ t α / 2 ( n 1 + n 2 − 2 ) S w 1 n 1 + 1 n 2 ) \left((\bar{X}-\bar{Y}) \mp t_{\alpha/2}(n_1+n_2-2)S_w \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right) ((Xˉ−Yˉ)∓tα/2(n1+n2−2)Swn11+n21)
(3) σ 1 2 \sigma_1^2 σ12 和 σ 2 2 \sigma_2^2 σ22 均未知,但 n 1 = n 2 = n n_1=n_2=n n1=n2=n
令 Z i = X i − Y i ∼ N ( μ 1 − μ 2 , σ 1 2 + σ 2 2 ) , i = 1 , 2 , . . . , n Z_i=X_i-Y_i \sim N(\mu_1-\mu_2,\sigma_1^2+\sigma_2^2),i=1,2,...,n Zi=Xi−Yi∼N(μ1−μ2,σ12+σ22),i=1,2,...,n,故 μ 1 − μ 2 \mu_1-\mu_2 μ1−μ2 的置信度为 1 − α 1-\alpha 1−α 的置信区间为 ( Z ˉ ∓ S Z ∗ n t α / 2 ( n − 1 ) ) \left(\bar{Z} \mp \frac{S_Z^*}{\sqrt{n}} t_{\alpha/2}(n-1)\right) (Zˉ∓nSZ∗tα/2(n−1)) 其中 Z ˉ = X ˉ − Y ˉ , S Z ∗ = 1 n − 1 ∑ i = 1 n ( Z i − Z ˉ ) 2 \bar{Z}=\bar{X}-\bar{Y},S_Z^*=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (Z_i-\bar{Z})^2} Zˉ=Xˉ−Yˉ,SZ∗=n−11i=1∑n(Zi−Zˉ)2
σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 的区间估计
这里只讨论 μ 1 , μ 2 \mu_1,\mu_2 μ1,μ2 为未知时, σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 的区间估计。
构造枢轴量
F = σ 2 2 S 1 n 1 ∗ 2 σ 1 2 S 2 n 2 ∗ 2 ∼ F ( n 1 − 1 , n 2 − 1 ) F=\frac{\sigma_2^2 S_{1n_1}^{*2}}{\sigma_1^2 S_{2n_2}^{*2}} \sim F(n_1-1,n_2-1) F=σ12S2n2∗2σ22S1n1∗2∼F(n1−1,n2−1) 故 σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 的置信度为 1 − α 1-\alpha 1−α 的置信区间为
( S 1 n 1 ∗ 2 / S 2 n 2 ∗ 2 F α / 2 ( n 1 − 1 , n 2 − 1 ) , S 1 n 1 ∗ 2 / S 2 n 2 ∗ 2 F 1 − α / 2 ( n 1 − 1 , n 2 − 1 ) ) \left(\frac{S_{1n_1}^{*2}/S_{2n_2}^{*2}}{F_{\alpha/2}(n_1-1,n_2-1)}, \frac{S_{1n_1}^{*2}/S_{2n_2}^{*2}}{F_{1-\alpha/2}(n_1-1,n_2-1)}\right) (Fα/2(n1−1,n2−1)S1n1∗2/S2n2∗2,F1−α/2(n1−1,n2−1)S1n1∗2/S2n2∗2) 利用 F F F 分布上侧分位数性质,可将 σ 1 2 / σ 2 2 \sigma_1^2/\sigma_2^2 σ12/σ22 的置信度为 1 − α 1-\alpha 1−α 的置信区间改写为
( F 1 − α / 2 ( n 2 − 1 , n 1 − 1 ) S 1 n 1 ∗ 2 S 2 n 2 ∗ 2 , F α / 2 ( n 2 − 1 , n 1 − 1 ) S 1 n 1 ∗ 2 S 2 n 2 ∗ 2 ) \left(F_{1-\alpha/2}(n_2-1,n_1-1)\frac{S_{1n_1}^{*2}}{S_{2n_2}^{*2}}, F_{\alpha/2}(n_2-1,n_1-1)\frac{S_{1n_1}^{*2}}{S_{2n_2}^{*2}}\right) (F1−α/2(n2−1,n1−1)S2n2∗2S1n1∗2,Fα/2(n2−1,n1−1)S2n2∗2S1n1∗2)
参考文献
[1] 《应用数理统计》,施雨,西安交通大学出版社。