实验目的:
了解符号检验,掌握Wilcoxon符号秩检验,Wilcoxon秩和检验;
掌握Pearson拟合优度c2检验,Shapiro-Wilk 正态性检验,了解Kolmogorov-Smirnov单样本和双样本检验);
实验内容:
(习题6.2)在某养鱼塘中,根据过去经验,鱼的长度的中位数为14.6cm,现对鱼塘中鱼的长度进行一次估测,随机地从鱼塘中取出10条鱼长度如下(单位:cm):
13.32 13.06 14.02 11.86 13.58 13.77 13.51 14.42 14.44 15.43
(存放在fish.data文件中)(1)用符号检验分析;(2)用Wilcoxon符号秩检验。将它们作为一个样本进行检验,试分析,该鱼塘中鱼的长度是在中位数之上,还是在中位数之下。
提示:单个总体的中位数检验。
解:
(1)用符号检验分析
提出假设:
H0:M = 14.6
H1:M ≠ 14.6
源代码及运行结果:(复制到此处,不要截图)
> X<-scan("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\fish.data")> binom.test(sum(X>14.6),length(X))
Exact binomial test
data: sum(X > 14.6) and length(X)
number of successes = 1, number of trials = 10,
p-value = 0.02148
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.002528579 0.445016117
sample estimates:
probability of success
0.1
结论:
P值(=0.02148)<0.05,拒绝原假设,并且置信区间【0.002528579,0.445016117】<0.05,即鱼的长度在中位数之上。
(2)用Wilcoxon符号秩检验分析
提出假设:
H0:M = 14.6
H1:M ≠ 14.6
源代码及运行结果:(复制到此处,不要截图)
> X<-scan("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\fish.data")> wilcox.test(X,mu=14.6,exact = F,conf.int = T)
Wilcoxon signed rank test with continuity
correction
data: X
V = 4.5, p-value = 0.02174
alternative hypothesis: true location is not equal to 14.6
95 percent confidence interval:
13.06002 14.43996
sample estimates:
(pseudo)median
13.74995
结论:P值(=0.0217)<0.05,拒绝原假设,并且中位数的置信区间可知,这批鱼的长度在中位数之上。
(习题6.4)用两种不同的测定方法测定同一种中草药的有效成分,共重复20次,得到实验结果如下表所示(数据存放在 method.data 文件中). (1) 试用符号检验法检验两测定有无显著差异;(2)试用 Wilcoxon 符号秩检验法检验两测定有无显著差异;(3) 试用 Wilcoxon 秩和检验法检验两测定有无显著差异。
方法A | 方法B | 方法A | 方法B | 方法A | 方法B | |||
1 | 48.0 | 37.0 | 8 | 36.0 | 36.0 | 15 | 52.0 | 44.5 |
2 | 33.0 | 41.0 | 9 | 11.3 | 5.7 | 16 | 38.0 | 28.0 |
3 | 37.5 | 23.4 | 10 | 22.0 | 11.5 | 17 | 17.3 | 22.6 |
4 | 48.0 | 17.0 | 11 | 36.0 | 21.0 | 18 | 20.0 | 20.0 |
5 | 42.5 | 31.5 | 12 | 27.3 | 6.1 | 19 | 21.0 | 11.0 |
6 | 40.0 | 40.0 | 13 | 14. 2 | 26.5 | 20 | 46.1 | 22.3 |
7 | 42.0 | 31.0 | 14 | 32.1 | 21.3 |
两种不同的测试方法得到的结果
提示:两个总体的中位数检验。
解:
(1)用符号检验分析(提示:以两个样本之差>0的个数作为成功的个数)
提出假设:
H0:M = 0
H1:M ≠ 0
源代码及运行结果:(复制到此处,不要截图)
> X<-read.table("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\method.data",header = T)> Y<-(X$A-X$B)> binom.test(sum(Y>0),length(Y))
Exact binomial test
data: sum(Y > 0) and length(Y)
number of successes = 14, number of trials = 20,
p-value = 0.1153
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
0.4572108 0.8810684
sample estimates:
probability of success
0.7
结论:P值(=0.1153)>0.05,接受原假设,即测试中草药成分方法A与方法B无显著性差异。
(2)用Wilcoxon符号秩检验分析
提出假设:
H0:M = 0
H1:M ≠ 0
源代码及运行结果:(复制到此处,不要截图)
> X<-read.table("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\method.data",header = T)> M<-(X$A - X$B)> wilcox.test(M,,exact = F)
Wilcoxon signed rank test with continuity
correction
data: M
V = 136, p-value = 0.005191
alternative hypothesis: true location is not equal to 0
结论:P值(=0.00519)<0.05,拒绝原假设,即测试中草药成分方法A与方法B存在显著性差异。
(3)用Wilcoxon秩和检验分析
提出假设:
H0:A - B = 0
H1:A - B ≠ 0
源代码及运行结果:(复制到此处,不要截图)
> X<-read.table("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\method.data",header = T)> wilcox.test(X$A,X$B,paired = T,exact = F)
Wilcoxon signed rank test with continuity
correction
data: X$A and X$B
V = 136, p-value = 0.005191
alternative hypothesis: true location shift is not equal to 0
结论:P值(=0.00519)<0.05,拒绝原假设,即测试中草药成分方法A与方法B存在显著性差异。
(习题6.5)为比较一种新疗法对某种疾病的治疗效果,将40名患者随机地分为两组,每组20人,一组采用新疗法,另一组用原标准疗法。经过一段时间的治疗后,对每个患者的疗效作仔细的评估,并划分为差、较差、一般、较好和好5个等级。两组处于不同等级的患者人数下表所示。试分析,由此结果能否认为新方法的疗效显著地优于原疗法。(a =0.05)
等级 | 差 | 较差 | 一般 | 较好 | 好 |
新疗法组 | 0 | 1 | 9 | 7 | 3 |
原疗法组 | 2 | 2 | 11 | 4 | 1 |
不同方法治疗后的结果
解:提出假设:
H0:M1 - M2 = 0
H1:M1 - M2 ≠ 0
源代码及运行结果:(复制到此处,不要截图)
> New<-rep(1:5,c(0,1,9,7,3))> Old<-rep(1:5,c(2,2,11,4,1))> wilcox.test(New,Old,exact = F)
Wilcoxon rank sum test with continuity correction
data: New and Old
W = 266, p-value = 0.05509
alternative hypothesis: true location shift is not equal to 0
结论:P值(=0.05509)>0.05,接受原假设,即认为新方法的疗效与原疗法没有显著性差异。
(习题6.6)Mendel用豌豆的两对相对性状进行杂交实验,黄色圆滑种子与绿色皱缩种子的豌豆杂交后,第二代根据自由组合规律,理论分离比为
黄圆:黄皱:绿圆:绿皱 = ( 9/16):(3/16):(3/16):(1/16)
实际实验值为:黄圆315粒、黄皱101粒、绿圆108粒、绿皱32粒,共556粒。问此结果是否符合自由组合规律的理论分离比?
解:提出假设:
H0:p1 = 9/16,p2 = 3/16,p3 = 3/16,p4 = 1/16
H1:p1 ≠ 9/16,p2 ≠ 3/16,p3 ≠ 3/16,p4 ≠ 1/16
源代码及运行结果:(复制到此处,不要截图)
> chisq.test(c(315,101,108,32),p = c(9,3,3,1)/16)
Chi-squared test for given probabilities
data: c(315, 101, 108, 32)
X-squared = 0.47002, df = 3, p-value = 0.9254
结论:P值(=0.9254)>0.05,接受原假设,即豌豆杂交结果符合自由组合定律的分离定律。
(习题6.7)观察每分钟进入某商店的人数X,任取200分钟,所得数据如下:
顾客人数 | 0 | 1 | 2 | 3 | 4 | 5 |
频数 | 92 | 68 | 28 | 11 | 1 | 0 |
试分析,能否认为每分钟顾客数X服从Poisson分布(a =0.1)。
解:提出假设:
H0:X服从Poisson分布
源代码及运行结果:(复制到此处,不要截图)
> X<-0:5> Y<-c(92,68,28,11,1,0)> lambda<-weighted.mean(X,Y)> x<-0:4> y<-c(92,68,28,12)> F<-ppois(x,lambda);m<-length(y)> p<-F[1];p[m]<-1-F[m-1]> for (i in 2:(m-1)) p[i] <- F[i] - F[i-1]> (chi<-chisq.test(y,p = p))
Chi-squared test for given probabilities
data: y
X-squared = 0.91132, df = 3, p-value = 0.8227
结论:P值(=0.8227)>0.05,接受原假设,即分钟顾客数X服从Poisson分布
(习题6.10)对习题6.2的数据做正态性检验。问该数据是否能做T检验?如果能,请做T 检验。结合习题6.2,分析各种的检验方法,试说明哪种检验法的效果最好。
解:提出假设:
H0:鱼的长度服从正态分布
源代码及运行结果:(复制到此处,不要截图)
> X<-scan("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap06\\fish.data")Read 10 items> shapiro.test(X)
Shapiro-Wilk normality test
data: X
W = 0.96883, p-value = 0.8798
结论:P值(=0.8798)>0.05,接受原假设,即鱼的长度服从正态分布。由于题目样本量较小使用Wilcoxon符号秩和检验可能更为适合。
35位健康男性在未进食前的血糖浓度如下所示,
87 77 92 68 80 78 84 77 81 80 80 77 92 86 76
81 90 84 86 80 68 77 87 76 77 78 92 75 80 78
80 81 75 77 72
试用KS方法检验这组数据是否服从均值 μ =80,标准差 σ =6的正态分布?
解:提出假设:
H0: 数据服从均值 μ =80,标准差 σ =6的正态分布
源代码及运行结果:(复制到此处,不要截图)
> bs<-c(87,77,92,68,80,78,84,77,81,80,80,77,92,86,76,81,90,84,86,80,68,77,87,76,77,78,92,75,80,78,80,81,75,77,72)> ks.test(bs,"pnorm",mean = 80,sd = 6,exact = T)
Exact one-sample Kolmogorov-Smirnov test
data: bs
D = 0.1481, p-value = 0.3883
alternative hypothesis: two-sided
结论:P值(=0.3883)>0.05,接受原假设,即数据服从均值 μ =80,标准差 σ =6的正态分布。
思考:
符号检验、Wilcoxon符号秩检验和Wilcoxon秩和检验针对的哪一类型的数据?A.连续型变量;B.无序分类变量;C.有序分类变量
B.无序分类变量
顺序统计量与秩统计量是一样的吗?在R语言中分别利用什么函数可以求得?秩统计计量是按顺序排列还是按降序排列?
顺序统计量 quantile()
秩统计量 rank()、order()
按顺序排列
非参数检验中在检验一个样本是否来自某个总体,或者检验两个总体是否有显著性差异时,为什么不能用均值这个统计量,而是用中位数这个统计量?
因为中位数这个统计量与分布没有关系。
非参数检验中使用中位数作为统计量,是因为中位数对异常值不敏感,能够更好地反映数据的中心位置,同时也避免了假设总体分布形式的限制。
为什么符号秩检验的功效比符号检验好?
因为符号秩检验将符号检验中没有利用的数据顺序信息也考虑了进来,从而提高了检验的效力。
符号检验和Wilcoxon符号秩检验都可以用于单个样本的检验,来判断一个样本是否来自某个总体;也可以用于两配对(成对)样本的检验,来判断两个相关总体是否存在显著性差异。Wilcoxon秩和检验主要是用于哪一类问题的检验?
主要用于两独立样本的检验。
参数检验中的均值检验,两配对样本t检验可以转化为单样本t检验,即检验两个样本的差值序列的均值是否为0。非参数检验中的中位数检验,两个配对样本的检验,也可以转化为单样本的检验,即检验两个样本的差值序列的______是否为____。
中位数 0
c2检验针对的哪一类型的数据?A.连续型变量;B.无序分类变量(计数资料);C.有序分类变量
B.无序分类变量(计数资料)
分布拟合检验的方法主要有哪三种?在R语言中这三种方法用的函数分别是?
分布拟合检验的方法主要有Kolmogorov-Smirnov检验、Chi-squared检验和Anderson-Darling检验。在R语言中,分别可以使用函数ks.test()、chisq.test()和ad.test()进行拟合检验。
Kolmogorov-Smirnov检验与Pearson 拟合优度c2检验相比,有什么优缺点?
优点:K-S检验比Pearson 拟合优度c2检验使用更加简单,且若两种方法都能使用时,则K-S检验的功效略优于Pearson 拟合优度c2检验。
缺点:K-S检验只能用于连续型累积分布函数,Pearson 拟合优度c2检验可用于离散型和连续型分布。