一、假设检验-基本概念
对总体提出一假设,然后借助样本对该假设进行检验。
原假设 H0: 在统计学中,把需要通过样本去推断正确与否的命题,称为原假设,又称零假设.它常常是根据已有资料或经过周密考虑后确定的.
备择假设H1: 与原假设对立的假设.
显著性水平(significant level ) α: 确定一个事件为小概率事件的标准,称为检验水平.亦称为显著性水平。通常取α =0.05,0.01,0.1.
假设及检验的形式
H0——原假设(null hypothesis)
H1——备择假设(alternative hypothesis)
双尾检验:
H0:μ=μ0
H1:μ≠μ0
单尾检验 :
H0:μ≥μ0 , H1:μ<μ0 (左侧检验)
或 H0:μ≤μ0 H1:μ>μ0 (右侧检验)
假设检验就是根据样本观察结果对原假设H0进行检验,如果接受H0,就否定H1;如果拒绝H0,就接受H1。
假设检验问题的基本步骤
(1)提出假设:原假设H0及备择假设H1
(2)选择适当的检验统计量,并指出H0成立时该检验统计量所服从的抽样分布
(3)根据给定的显著性水平,查表确定相应的临界值,并确定拒绝域
(4)根据样本观察值计算检验统计量的值H0 。当检验统计量的值落入拒绝域时拒绝H0而接受H1;否则不能拒绝H0,可接受H0 。
SPSS非参数检验
非参数检验适用于以下三种情况:
①顺序类型的数据资料,这类数据的分布形态一般是未知的;
②虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;
③总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下(虽然T检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。
SPSS单样本非参数检验
总体分布的chi-square检验
(1)目的:
根据样本数据推断总体的分布与某个已知分布是否有显著差异---吻合性检验。
适用于无序分类资料的统计推断
(2)基本假设: H0:总体分布与理论分布无显著差异
(3)基本方法
根据已知总体的构成比计算出样本中各类别的期望频数,计算实际观察频数与期望频数的差距,即:计算卡方值
卡方值较小,则实际频数和期望频数相差较小.如果P大于a,不能拒绝H0,认为总体分布与已知分布无显著差异.反之
(4)基本操作步骤
chi-square检验的用途:
(1)检验某个连续变量的分布是否与某种理论分布一致;
(2)检验某个分类变量各类的出现概率是否等于指定概率;
(3)检验某两个分类变量是否相互独立;
(4)检验控制某种或几种分类因素之后,另两个分类变量是否相互独立;
(5)检验某两种方法的结果是否一致。
举个栗子
用卡方检验考察2007年4月的性别分布是否均衡。(操作如上图)
例2.某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1
数据--个案加权
K-S检验
(1)目的:
利用样本数据推断总体是否服从某个理论分布(正态分布、均匀分布、指数分布和泊松分布)。 适用于探索连续随机变量的分布情况
(2)基本假设: H0:总体服从指定的分布.
(3)基本方法
根据用户指定检验的总体分布,构造出一理论的频数分布,并计算相应的累计频率.
与样本在相同点的累计频率进行比较.如果相差较小,则认为样本所代表的总体符合指定的总体分布.
(4)实验步骤
分析—非参数检验—样本k-s检验
变量值的随机性检验(游程检验)
(1)目的:
利用样本数据对总体可能出现的变量值是否随机进行检验.
(2)基本假设:
H0:总体可能出现的变量值是随机的.
(3)基本方法:
观察样本序列出现了多少游程(run).
游程是样本序列中连续出现的变量值的次数.
一般出现太多或太少的游程表示变量值序列有一定的非随机性.
(4)基本操作步骤:
SPSS两独立样本非参数检验
(一)目的
由独立样本数据推断两总体的分布是否存在显著差异(或两样本是否来自同一总体)。
(二)基本假设
H0:两总体分布无显著差异(两样本来自同一总体)
(三)数据要求 样本数据和分组标志
(四)基本方法
1.曼-惠特尼U检验(Mann-Whitney U):平均秩检验
将两样本数据混合并按升序排序
求出其秩
对两样本的秩分别求平均
如果两样本的平均秩大致相同,则认为两总体分布无显著差异
2.k-s Z检验
将两样本混合并按升序排序
分别计算两个样本在相同点上的累计频数和累计频率
两个累计频率相减.
如果差距较小,则认为两总体分布无显著差异
应保证有较大的样本数
3.游程检验(Wald-Wolfowitz runs)
将两样本混合并按升序排序
计算分组标志序列的游程数
如果游程数较大,则说明是由于两类样本数据充分混合的结果,即:认为两总体分布无显著差异.
如果两样本中有相同的样本值,则会使游程数发生变化.系统会作出提示.
Mann-Whitney U: 主要用于判别两个独立样本所属的总体是否有相同的分布;
若不能明确两总体分布的形状是否相同,则不宜单独使用此方法作分析了事,应同时作K-S检验或W-W检验,并对全部结果作综合分析。小样本时应读取精确概率作结论。
Kolmogorov-Smirnov Z: 推测两个样本是否来自具有相同分布的总体;
如果结论是两总体分布不相同,此方法尚不足以说明是位置不同、变异程度不同还是偏度不同,这是报告结果时应注意的。小样本时应读取结果中两个经验分布函数的最大差值查界值表作结论,不可直接利用结果中的P值作结论。
Moses extreme reactions:检验两个独立样本之观察值的散布范围是否有差异存在,以检验两个样本是否来自具有同一分布的总体;
检验注重于对分布范围(变异程度)作检验,实际是检验H0:两样本所对应的总体具有相同的分布范围,要求样本足够大。
Wald-Wolfowitz runs: 考察两个独立样本是否来自具有相同分布的总体。
与K-S检验相似,也是对全貌作检验,但其功效不如后者;此方法实为Runs过程用于分析两个独立样本的情形。
总结
本章主要针对SPSS非参数检验
主要解决问题:
1)SPSS单样本非参数检验
2)SPSS两独立样本非参数检验