- 实验目的:
- 掌握正态分布和二项分布中,功效与样本容量之间的关系;
- 学会利用R软件完成一个正态总体方差和两个正态总体方差比的区间估计和检验。
实验内容:
(习题5.28)一种药物可治疗眼内高压,目的是阻止青光眼的发展。现试验了 10 名病人,治疗一个月后,他们的眼压平均降低了 5mmHg ,且标准差为 10mmHg。其功效为多少?如果功效在80% 以上,应当至少选择多少名试验者?
提示:此题是单个正态总体的功效和样本容量的计算问题。参考例5.34。在使用power.t.test()函数时,参数delta=5,sd=10。
解:
(1)功效是多少?
功效大约为0.184
源代码及运行结果:(复制到此处,不要截图)
> power.t.test(10,delta = 5,sd = 10)
Two-sample t test power calculation
n = 10
delta = 5
sd = 10
sig.level = 0.05
power = 0.1838375
alternative = two.sided
NOTE: n is number in *each* group
结论:此时功效为0.184,功效偏低
(2)功效在80% 以上,应当至少选择多少名试验者?
功效在80%以上,至少要选择64名实验者
源代码及运行结果:(复制到此处,不要截图)
> power.t.test(power = 0.80,delta = 5,sd = 10)
Two-sample t test power calculation
n = 63.76576
delta = 5
sd = 10
sig.level = 0.05
power = 0.8
alternative = two.sided
NOTE: n is number in *each* group
结论:n=63.77.至少取64名实验者
(习题5.29)为了检测某种药物服用后可能导致血压升高,找了8名药物服用者,他们的平均收缩压为 132.86 mmHg ,样本标准差为 15.34 mmHg。对照组共 21 人,他们的平均收缩压为127.44 mmHg ,样本标准差为 18.23 mmHg。 如果假设数据服从正态分布,试分析该药物服用后是否能导致血压升高?检验的功效是多少?如果功效要达到 80 每组至少取多少个样本?
t test power calculation n1 = 31.2884 n2 = 21 d = 0.8058214 sig.level = 0.05 power = 0.8 alternative = two.sided |
提示:此题是两个正态总体的功效和样本容量的计算问题。参考例5.35。但此题与例5.35略有不同:此题的两个样本标准差不相同,因此在使用power.t.test()函数时,参数sd需要按P127公式(5.46)中的分母来计算。另外,也可以使用pwr包来计算功效。
解:
(1)功效是多少?
功效大约为0.464
源代码及运行结果:(复制到此处,不要截图)
> library(pwr)> n1<-8> n2<-21> mean_diff<- 132.86-127.44> sd1<-15.34> sd2<-18.23> pwr.t2n.test(n1 = n1,n2 = n2,d = mean_diff/sqrt((sd1^2/n1)+(sd2^2/n2)))
t test power calculation
n1 = 8
n2 = 21
d = 0.8058214
sig.level = 0.05
power = 0.4643853
alternative = two.sided
结论:此时功效为0.464,功效偏低
(2)功效在80% 以上,应当至少选择多少名试验者?
功效在80%以上,至少要选择32名实验者
源代码及运行结果:(复制到此处,不要截图)
结论:n=31.3,至少要选择32名实验者
(习题5.30)对于习题 5.26 ,如果要求功效达到 80% 以上,试验时至少选择多少个样本?
提示:此题是两个总体比例的功效和样本容量的计算问题。参考例5.36。
解:
源代码及运行结果:(复制到此处,不要截图)
power.prop.test(power = 0.8,p1 = 34/70, p2 = 31/80)
Two-sample comparison of proportions power calculation
n = 399.1236
p1 = 0.4857143
p2 = 0.3875
sig.level = 0.05
power = 0.8
alternative = two.sided
NOTE: n is number in *each* group
结论:n=399.12,至少要选择400个样本,才能让功效达到80%
(习题5.31)某汽车公司要求员工恪守时间,以在公众面前树立良好的值得信赖的形象。公司要求各个汽车的汽车到站时间的变化不能太大,具体要求是:到站时间的标准差不能超过2分钟。公司在某市的汽车中转站随机地抽取了 10 次汽车的到站时间如下(单位:分钟):
15 .2 17.5 19.6 16.6 21 . 3 17.1 15.0 15.5 20.0 16.2
试分析该公司的汽车司机是否遵守时间规定?
> source("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap05\\var1.test.R")> X<-c(15.2,17.5,19.6,16.6,21.3,17.1,15.0,15.5,20.0,16.2)> var1.test(X,var = 2^2,alternative = "less")
$X.squared [1] 10.8 $sample.var [1] 4.8 $df [1] 9 $conf.inter [1] 0.00000 12.99204 $p.value [1] 0.7103325 |
提示:此题是单个正态总体的方差检验。参考例5.37。
解:提出假设:
H0:σ2≥22
H1:σ2<22
源代码及运行结果:(复制到此处,不要截图)
结论:P值>0.05,接受原假设,即到站时间的标准差超过2分钟
(习题5.32)对习题5.16中甲乙两种稻种的数据作方差比的区间估计,并用其估计值来判定两数据是否等方差。若两数据方差不相等,试重新计算两稻种产量的期望差m1-m2的置信区间(a =0.05)。
提示:在R软件中,var.test()函数能够提供两个样本方差比的区间估计。此结果可认为方差不等。因此重新计算期望差时应该采取方差不等的参数。
解:
源代码及运行结果:(复制到此处,不要截图)
> a<-c(140,137,136,140,145,148,140,135,144,141)> b<-c(135,118,115,140,128,131,130,115,131,125)> Table<-data.frame(a,b)> var.test(a,b)
F test to compare two variances
data: a and b
F = 0.23533, num df = 9, denom df = 9, p-value =
0.04229
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.05845276 0.94743902
sample estimates:
ratio of variances
0.2353305
> t.test(a,b,var.equal = F)
Welch Two Sample t-test
data: a and b
t = 4.6287, df = 13.014, p-value = 0.0004712
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
7.359713 20.240287
sample estimates:
mean of x mean of y
结论:var.test()计算结果中,P值<0.05,且置信区间不包含1,这说明两者方差并不相等,且重新求出其95%置信区间为7.40,,20.24
(习题5.33)检验习题5.24中试验组和对照组的数据的方差是否相同。
提示:此题是两个正态总体的方差检验。参考例5.38。
解:提出假设:
H0:σ12=σ22
H1:σ12≠σ22
源代码及运行结果:(复制到此处,不要截图)
> 甲<-c(140,137,136,140,145,148,140,135,144,141)> 乙<-c(135,118,115,140,128,131,130,115,131,125)> Table<-data.frame(甲,乙)> with(Table,var.test(甲,乙))
F test to compare two variances
data: 甲 and 乙
F = 0.23533, num df = 9, denom df = 9, p-value =
0.04229
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.05845276 0.94743902
sample estimates:
ratio of variances
0.2353305
结论:P值<0.05,拒绝原假设,即试验组和对照组的数据的方差存在差异
思考:
检验功效 p 就是正确地否定了错误的原假设的概率,即 p = 1-β,其中 β 称为犯第 二 类错误的概率。在R软件,利用 power.t.test() 函数可以完成正态分布均值(差)的检验功效或样本容量的计算;利用 pwr.prop.test() 函数可以完成两组数据比率差的检验功效或样本容量的计算。
影响均值检验功效的因素有:
样本量n:其他条件不变情况下,样本量越大,发生第二类错误的概率 β (包括第一类错误的概率)越小,因此功效越__高___;
差异Δ(两总体时是μ1-μ2,单总体时是μ1-μ0):以单个总体为例,其他条件不变情况下,差异越大,说明样本与总体之间的差异越大,越容易被检验出来,因此统计功效越__高__。
样本标准差σ:σ越小,功效越大。
显著性水平α:由于α与 β 是此消彼涨的关系,因此α越大,β 越小,因此功效越__高___;
事实上,上述前3个因素①②③与功效共4个量,知道其中3个,就可以求出另一个。这也是power.t.test()函数中最重要的几个参数。
单个正态总体的方差的区间估计和检验(设样本容量为n)
当这个总体的均值μ已知时,用到的是哪个分布?
正态分布
当这个总体的均值μ未知时,用到的是哪个分布?
t分布
两个正态总体的方差比的区间估计和检验(设两个样本容量分别为n1、n2)
当这两个总体的均值μ1、μ2已知时,用到的是哪个分布?
F分布
当这两个总体的均值μ1、μ2未知时,用到的是哪个分布?
F分布
在R的基本函数中,没有计算单个总体方差的区间估计与假设检验的函数;两个正态总体的情况下,可通过方差比的估计和检验来两个总体的方差是否相同,可以利用R软件中的 var.test() 函数来完成。