在假设检验中,我们常常看到跟P值形影不离的一对区间值, 就是大名鼎鼎的置信区间了。 这置信区间和P值是怎么得来的,我想大多数盆友都不会有什么直观的概念,只会注意P值是否小于0.05或者0.01(根据显著性水平确定)。
为了给大伙说清楚置信区间和P值的梗,小编以比较常见的两独立样本t检验为例进行分析。样本数据如下:
使用SPSS进行t检验后结果如下:
在检验结果中, 可以容易找到置信区间和P值, 下面我们一步一步来实现得到这两组值, 并且配合R语言代码来实践一遍, 诸位可以跟着一起做哦。
第一步:确定两样本的统计量
参考Group Statistics表,可以看到
样本量都是 5
样本均值分别是 33.00 和 44.60
样本标准差分别是 3.87298 和 3.84708
其中, 样本量、样本均值、样本方差都是比较基础的统计量,相信看官都明白怎么来的,不是很清楚的请翻看统计学入门书籍即可。
对于样本均值标准差(Std.Error Mean), 就不那么常见了,这里解释一下:
虽然统计学学过总体均值方差, 但是真实情况下很少能拿到总体数据, 大多数情况都是用抽样的方法对总体进行估计。对于例子中双样本t检验,并不是看两样本是否相互独立(样本均值是否差异显著),而是要估计两样本均值的总体分布是否有差异。比如,我们想知道学校男生女生身高是否有差异, 将所有男生女生进行测量分别求平均比较成本很高。因此各随机抽取男女生100名,测量身高, 然后通过这100对样本的假设检验来说明学校男女学生身高是否存在差异。
第二步:确定两样本均值抽样分布的统计量
现在已知样本的均值和标准差, 那怎么估计样本均值的抽样分布的统计量呢?
现在我们构造出了两样本均值抽样分布的统计量, 那么就可以用来进行假设检验了。
第三步:两样本均值抽样分布的假设检验
假设检验的零假设就是X1总体和X2总体的均值没有差异
则 X1-X2服从
t统计量为:-11.6/2.44131 = -4.752 服从自由度为8的t分布。
我们可以查找t分布表或者使用统计软件计算, 当统计量为 -4.752 时, 累积概率分布为 0.001,远小于显著性水平0.05,则拒绝零假设,接受备择假设:两样本均值抽样总体有显著差异。
根据显著性水平, 我们可以得到该水平下的上限为2.306004个标准差。 因此置信区间计算如下:
下限: -11.6 - 2.306004 * 2.44131 = -17.22967
上限: -11.6 + 2.306004 * 2.44131 = -5.97033
就这样, 我们将置信区间, 还有P值都计算出来了。有兴趣的朋友可以实践下单样本t检验,熟悉一下。
知识补充:
正态分布
正态分布(normal distribution)是数理统计中的一种重要的理论分布,是许多统计方法的理论基础。正态分布有两个参数,μ和σ,决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normal distribution),亦称u分布。
根据中心极限定理,通过上述的抽样模拟试验表明,在正态分布总体中以固定n,抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,σ2/n)。所以,对样本均数的分布进行u变换,也可变换为标准正态分布N (0,1)
t分布
由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。
假设X服从标准正态分布N(0,1),Y服从χ2(n)分布,那么Z=X/sqrt(Y/n)的分布称为自由度为n的t分布,记为 Z~t(n)。