统计学-R语言-7.2

文章目录

  • 前言
  • 总体均值的检验
    • 总体均值的检验(一个总体均值的检验)
    • 两个总体均值之差的检验
  • 总体比例的检验
    • 一个总体比例的检验
  • 练习


前言

本篇将继续上篇文章进行介绍。


总体均值的检验

总体均值的检验(一个总体均值的检验)

小样本的检验
假定条件
小样本(n<30)
总体服从正太分布
检验统计量的选择与总体方差是否已知有关
在这里插入图片描述已知样本,均值经标准化后服从标准正态分布:
在这里插入图片描述
在这里插入图片描述

单样本t检验的效应量通常使用 Cohen的d统计量来度量,计算公式为:
在这里插入图片描述

该效应量表示样本均值与假设的总体均值的差异是多少个标准差。根据 Cohen(1988)提出的标准,单样本t检验的小、中、大效应量对应的d值分别为0.20,0.50,0.80。即当d<0.20时,效应量非常小,几乎为0;当0.20≤d<0.50时,为小的效应量;当0.50≤d<0.80时,为中的效应量;当d≥0.80时,为大的效应量。0.20表示样本均值与假设的总体均值相差0.2个标准差,0.50表示相差0.5个标准差,0.80表示相差0.8个标准差。(Cohen提供的标准只是近似结果)

例题:
数据: example6_4.RData)一种建筑用砖的厚度要求为5cm,高于或低于该标准均被认为是不合格的。现对一家生产企业提供的20块样本进行检测,结果如表6-2所示:
在这里插入图片描述
假定砖的厚度服从正态分布,在0.05的显著性水平下,检验该企业生产的砖的厚度是否符合要求。
t.test(x,y=NULL,mu=0,)函数可以实现t检验。当不指定y时为单样本检验,mu为检验的均值,默认为0。
结论:在该项检验中, 在这里插入图片描述=4.8,t=-5.6273,df=19,=1.998e-05,由于P<0.05,拒绝H0,有证据显示该企业生产的砖的厚度不符合要求。
检验结果表明,该企业生产的砖的厚度与5cm有显著差异,但要想知道差异的程度,则需要计算效应量。有在这里插入图片描述

结果表示:样本砖的平均厚度与标准厚度相差1.258306个标准差。根据Cohen准则,该检验结果属于大的效应量。计算效应量的R代码和结果如下所示
计算效应量

load("C:/example/ch6/example6_4.RData")
library(lsr)
cohensD(example6_4$厚度,mu=5)

在这里插入图片描述

两个总体均值之差的检验

根据获得样本的方式不同,两个总体均值的检验分为独立样本和配对样本两种情形,而且也有大样本与小样本之分。检验的统计量是以两个样本均值之差( 在这里插入图片描述

)的抽样分布为基础构造出来的。对于大样本和小样本两种情形,由于两个样本均值之差经标准化后的分布不同,检验统计量也有差异。

独立大样本的检验
在这里插入图片描述
在这里插入图片描述

例题:
(数据: example6_5. RData)为分析男女学生上网时间是否有差异,从男女学生中各随机抽取36人,得到每天的上网时间数据如下表所示。在显著性水平0.05下,检验男女学生上网的平均时间是否有显著差异
在这里插入图片描述
设μ1=男生上网的平均时间;μ2=女生上网的平均时间。由于关心上网的平均时间是否有显著差异,所以提出的假设为:
H0:μ1-μ2=0; H1:μ1-μ2≠0
检验的R代码和结果如下所示:

load("C:/example/ch6/example6_5.RData")
library(BSDA)
z.test(example6_5$男生上网时间,example6_5$女生上网时间,sigma.x=sd(example6_5$男生上网时间),sigma.y=sd(example6_5$女生上网时间),alternative="two.sided")

在这里插入图片描述
结论:在该项检验中, 在这里插入图片描述=3.058333, 在这里插入图片描述=2.830556,z=1.1188,P=0.2632由于P>0.05,不拒绝H0,没有证据显示男女学生上网的平均时间有显著差异。

独立小样本的检验
在这里插入图片描述

在这里插入图片描述
这时,两个样本均值之差经标准化后服从自由度为(n1+n2-2)的t分布,因而采用的检验统计量为:
在这里插入图片描述
在这里插入图片描述

例题:
(数据: example6_6. RData)为比较两家企业生产的灯泡平均使用寿命是否有显著差异,质检人员对两家供货商提供的各20个样品进行检测,得到的使用寿命数据如下表所示。检验两家企业灯泡的平均使用寿命是否有显著差异( 在这里插入图片描述=0.05):

(1) 假设两个总体方差相等
(2) 将设两个总体方差不相等
t.test(x,y=null, alternative=c(“two. sided”,“less”,“greater”),mu=0,paired=FALSE
var. equal=FALSE,conf.level=0.95,)函数中,var. equal=true和var. equal=FALSE分别对应两总体方差相等和不相等的假设,默认var. equal=FALSE.默认 paired=FALSE,为独立样本检验, paired=TRUE为配对样本检验。
在这里插入图片描述
解:设μ1为甲企业灯泡的平均使用寿命,μ2为乙企业灯泡的平均使用寿命。依题意提出如下假设:
H0:μ1-μ2=0; H1:μ1-μ2≠0
检验的R代码和结果如下所示
(1) 假设两个总体方差相等
假设方差相等

load("C:/example/ch6/example6_6.RData")
t.test(example6_6$甲企业,example6_6$乙企业,var.equal=TRUE)

在这里插入图片描述

(2) 将设两个总体方差不相等

t.test(example6_6$甲企业,example6_6$乙企业,var.equal=FALSE)

在这里插入图片描述
结论在该项检验中, 在这里插入图片描述=8487.5, 在这里插入图片描述=8166.0,假设总体方差相等时t=3.4943,df=38,P=0.00122:假设总体方差不等时,t=3.4943,=33.683,P=0.001353。两种假设条件下检验的P值均小于0.05,所以拒绝H0,表明两家企业生产的灯泡平均使用寿命有显著差异。
检验结果显示两家企业生产的灯泡平均使用寿命差异显著,但要想知道差异的程度则需要计算效应量。独立样本t检验的效应量的估计通常由 Cohen的d统计量给出,计算公式为
在这里插入图片描述

该效应量表示总体1的均值( )与总体2的均值( )相差多少个标准差。根据 Cohen(1988)提出的标准,独立样本检验的小、中、大效应量对应的d值分别为0.20, 0.50, 0.80。
计算效应量的R代码和结果如下所示:
计算效应量

library(lsr)
cohensD(example6_6$甲企业,example6_6$乙企业)

在这里插入图片描述
结果显示,d=1.104985,表示甲企业和乙企业的灯泡平均使用寿命相差1.104985个标准差。根据 Cohen准则,该检验结果属于大的效应量。

配对样本的检验
在这里插入图片描述
例题:
(数据: example6_7. Rdata)某饮料公司研制出一款新产品,为比较消费者对新旧产品口感的满意程度,随机抽选一组消费者共10人,让每个消费者先品尝一款饮料,再品尝另一款饮料,两款饮料的品尝顺序是随机的,而后每个消费者要对两款饮料分别进行评分(0~10分),评分结果如下表所示。取显著性水平 =0.05,检验消费者对两款饮料的评分是否有显著差异。
在这里插入图片描述
解:设 u1 =消费者对旧款饮料的平均评分, u2=消费者对新款饮料的平均评分,依题意建立的原假设与备择假设为:

检验的R代码和结果如下所示:

load("C:/example/ch6/example6_7.RData")
t.test(example6_7$旧款饮料,example6_7$新款饮料,paired=TRUE)

在这里插入图片描述
结论:在该项检验中, 在这里插入图片描述=-1.3,t=-2.7508,df=9,P=0.02245,由于P<0.05,拒绝H0,消费者对新旧饮料的评分有显著差异。
拒绝原假设后,可计算效应量来进一步分析配对样本差值的均值与假设的总体差值的均值之间的差异程度。配对样本t检验的效应量的估计由 Cohen的d统计量给出。计算公式为:
在这里插入图片描述
根据 Cohen提出的标准,配对样本检验的小、中、大效应量对应的d值分别为 0.20,0.50,0.80
计算效应量的R代码和结果如下所示

library(lsr)
cohensD(example6_7$旧款饮料,example6_7$新款饮料,method="paired")

在这里插入图片描述

总体比例的检验

总体比例的检验程序与总体均值的检验类似,本小节只介绍大样本情形下一个总体比例的检验方法和两个总体比例之差的检验方法。

一个总体比例的检验

在这里插入图片描述
例题:
一家电视台的影视频道制作人认为,某电视连续剧如果在黄金时段播出,收视率将会达到25%以上。经过一周的试播放后,该制作人随机抽取了由2000人组成的一个样本,发现有450个观众观看了该电视连续剧。取显著性水平a=0.05,检验收视率是否达到制作人的预期。
解:制作人想支持的观点是收视率达到25%以上,因此提出的假设为
H0: π ≤25%; H1: π>25%
检验的R代码和结果如下所示:

n<-2000
p<-450/2000
pi0<-0.25
z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
p_value<-1-pnorm(z)
data.frame(z,p_value)

在这里插入图片描述
在该项检验中,z=-2.581989,P=0.9950884,由于P>0.05,不拒绝H0,没有证据表明收视率达到了制作人的预期。
在这里插入图片描述
例题:
一所大学准备采取一项新的上网收费措施,为了解男女学生对这一措施的看法是否有差异,分别抽取200名男生和200名女生进行调查。其中的一个问题是:“你是否赞成采取新的上网收费的措施?”其中男生表示赞成的比例为27%,女生表示赞成的比例为35%。调查者认为,男生中表示赞成的比例显著低于女生。取显著性水平 =0.05,样本提供的证据是否支持调查者的看法?
解:设π1=男生中表示赞成的比例,π2=女生中表示赞成的比例。依题意提出如下假设解:
H0: π1-π2 ≥0; H1: π1-π2<0
检验的R代码和结果如下所示:

n1<-200;n2<-200
p1<-0.27;p2<-0.35
p<-(p1*n1+p2*n2)/(n1+n2)
z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
p_value<-pnorm(z)
data.frame(z,p_value)

结论:在该项检验中,z=-1.729755,P=0.04183703由于P<0.05,拒绝H0。样本提供的证据支持调査者的看法,即男生中表示赞成的比例显著低于女生。
在这里插入图片描述

例题:
有两种方法生产同一种产品,方法1的生产成本较高而次品率较低,方法2的生产成本较低而次品率则较高。管理人员在选择生产方法时决定对两种方法的次品率进行比较。如果方法1比方法2的次品率低8%以上,则采用方法1,否则就采用方法2。管理人员从采用方法1生产的产品中随机抽取300个,发现有33个次品;从采用方法2生产的产品中也随机抽取300个,发现有84个次品。用显著性水平a=0.01进行检验,管理人员应决定采用哪种方法进行生产?
解:设π1=方法1的次品率,π2=方法2的次品率。因为是要检验“方法1的次品率是否比方法2低8%”(不是检验二者的差值是否等于0),所以选择下式作为检验统计量
H0: π1-π2 ≥8%; H1: π1-π2< 8%
检验的R代码和结果如下所示:

n1<-300;n2<-300
p1<-33/300;p2<-84/300
d0<-0.08
z<-((p1-p2)-0.08)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
p_value<-pnorm(z)
data.frame(z,p_value)

结论:在该项检验中,z=-7.91229,P=1.26348e-15由于P<0.01,拒绝H0。表示方法1的次品率显著地低于方法2达8%以上,所以应采用方法1进行生产。
在这里插入图片描述


练习

1、(数据:exercise6_1.RData)一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家准备采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从新机床生产的零件中随机抽取50个进行检验。50个零件尺寸的绝对误差数据(单位:mm)如下:
(1)检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低(在这里插入图片描述=0.01)
解:假定零件尺寸的绝对误差服从正态分布
这里关心的是零件尺寸的绝对误差的均值是否显著低于过去的误差均值,也就是μ是否小于1.35mm,因此提出如下假设:

load("C:/exercise/ch6/exercise6_1.RData")
library(BSDA)
z.test(exercise6_1$零件误差,mu=1.35,sigma.x=sd(exercise6_1$零件误差),alternative="less",conf.level=0.99)

结论:在该检验中,z=-2.6061,P=0.004579,由于P<0.01,拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比显著降低
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/636829.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何利用 APM 追踪完整的类函数调用

通常&#xff0c;应用接入 APM 后&#xff0c;可以追踪到应用相关组件、服务间的调用链路情况&#xff0c;如 Tomcat、Redis、MySQL 等&#xff0c;这是因为 APM 对于标准性组件做了插桩处理&#xff0c;从而更好的观测到在实际使用过程中组件调用对应用的影响。 而在实际生产…

揭秘AI换脸技术:从原理到应用

随着人工智能技术的不断发展&#xff0c;AI换脸技术逐渐成为人们关注的焦点。这项神奇的技术能够将一张图像或视频中的人脸替换成另一张人脸&#xff0c;让人不禁惊叹科技的神奇。那么&#xff0c;AI换脸技术究竟是如何实现的呢&#xff1f;本文将带您深入了解AI换脸技术的原理…

《WebKit 技术内幕》之五(3): HTML解释器和DOM 模型

3 DOM的事件机制 基于 WebKit 的浏览器事件处理过程&#xff1a;首先检测事件发生处的元素有无监听者&#xff0c;如果网页的相关节点注册了事件的监听者则浏览器会将事件派发给 WebKit 内核来处理。另外浏览器可能也需要处理这样的事件&#xff08;浏览器对于有些事件必须响应…

logstack 日志技术栈-04-opensource 开源工具 OpenObserve+Grafana Loki

日志技术栈 日志管理包含日志数据存储、处理、分析和可视化&#xff0c;通过利用日志管理工具&#xff0c;可以监控性能趋势、解决问题、检测异常并优化整体系统性能。 近年来&#xff0c;开源日志管理解决方案在大家寻求灵活且经济有效的方式来管理现代系统典型的大量日志数…

JVM问题分析处理手册

一.前言 各位开发和运维同学&#xff0c;在项目实施落地的过程中&#xff0c;尤其是使用EDAS、DRDS、MQ这些java中间件时&#xff0c;肯定会遇到不少JAVA程序运行和JVM的问题。我结合过去遇到的各种各样的问题和实际处理经验&#xff0c;总结了JAVA问题的处理方式&#xff0c;…

soso移动营业大厅(纯后端+MySQL数据库+JDBC)

一、项目需求 中国移动,中国联通,中国电信是国内3大通信运营商,每个运营商都提供了不同的品牌套餐来应对不同的用户群,比如北京移动主要有全球通,神州行,动感地带等3大品牌套餐,每种套餐的内容和费用不同,嗖嗖移动是一个假定的通信运营商,提供了话痨套餐,网虫套餐,超人套餐,各…

等离子环制作

免责声明 在您参考该博客制作等离子环前&#xff0c;请仔细阅读以下重要安全警告和免责说明。使用本文档即表示您已充分了解并同意以下条款&#xff1a; 等离子环的危险性&#xff1a;等离子环在运行时玻璃瓶身会产生高温&#xff0c;存在低温烧伤风险。任何时候都不建议用手…

C for Graphic:Sliced Circle Image

不做UI不知道&#xff0c;没想到时至今日&#xff0c;ugui居然没有sliced filled image模式&#xff0c;用circle做filled&#xff0c;不能用sliced九宫格图&#xff0c;导致每次使用这个效果必须一张新图&#xff0c;何其浪费资源。 原始功能如下&#xff1a; 我…

【C++】unordered_map,unordered_set模拟实现

unordered_map&#xff0c;unordered_set模拟实现 插入普通迭代器const迭代器unordered_map的[ ]接口实现查找修改哈希桶完整代码unordered_map完整代码unordered_set完整代码 喜欢的点赞&#xff0c;收藏&#xff0c;关注一下把&#xff01; 上一篇文章我们把unordered_map和u…

爬虫之Cookie获取:利用浏览器模拟一个cookie出来、面对反爬虫、加密的cookie的应对方法

爬虫之Cookie获取&#xff1a;利用浏览器模拟一个cookie出来、面对反爬虫、加密的cookie的应对方法 在爬虫或模拟请求时&#xff0c;特别是获取验证码的时候&#xff0c;反爬虫的网站的cookie或定期失效&#xff0c;复制出来使用是不行的为了应对这种方式&#xff0c;我们可能…

第十一站:多态练习ODU

实现动态切换 ODU.h #pragma once #include <iostream> using namespace std; #define ODU_TYPE_311_FLAG "311" #define ODU_TYPE_335_FLAG "335" enum class ODU_TYPE {ODU_TYPE_311,ODU_TYPE_335,ODU_TYPE_UNKNOW };class ODU{ public:ODU();//发…

Windows下载安装vcpkg并使用它来安装第三方库(visualstudio)

1.使用Git下载vcpkg仓库&#xff08;下载比较慢&#xff0c;个人比较喜欢打开下面网址然后用迅雷下载&#xff0c;速度飞快&#xff09; git clone "https://github.com/Microsoft/vcpkg.git"2.下载好之后解压打开文件夹&#xff0c;双击bootstrap-vcpkg.bat文件&…

中小企业如何快速融资-----股权融资的四种方式(上)

’在企业融资的多种手段中&#xff0c;股权质押融资、股权交易增值融资、股权增资扩股融资和股权的私募融资&#xff0c;逐渐成为中小企业利用股权实现融资的有效方式。随着市场体系和监管制度的完善&#xff0c;产权市场为投融资者搭建的交易平台日益成熟&#xff0c;越来越多…

ChatGPT 到 Word:使用 Writage 进行复制粘贴魔法

ChatGPT 到 Word&#xff1a;使用 Writage 进行复制粘贴魔法 写在前面Writage的使用 写在前面 随着ChatGPT的日益普及&#xff0c;越来越多的人每天依赖它来完成各种任务。无论是寻找信息、语言翻译、解决数学问题&#xff0c;还是精炼复杂的概念和文本&#xff0c;ChatGPT 都…

React里面table组件的时间轴的位置计算

如上图的时间轴位置计算 计算时间轴位置倒是容易&#xff0c;主要是React里面的antd的table组件怎么监听滚动是个问题 /*** &#xff08;月台/时间&#xff09;为150&#xff0c;时间为100&#xff0c;每个格子为120&#xff0c;120px/30分钟4px/分钟* 00:00分为250px* 00:…

muduo 网络库源码解析和使用

1. base 模块 1.1 API 1.1.1 eventfd int eventfd(unsigned int initval, int flags);&#xff08;1&#xff09;类似信号量&#xff1b;其内部保存了一个 uint64_t 计数器 count&#xff0c;使用 initval 初始化&#xff1b; &#xff08;2&#xff09;read 没有设置 EFD…

Suricata-7.0 源码分析之流表建立FlowWorker

一、什么是Flow&#xff1f; 二、Flow是怎么建立的&#xff1f; 三、Flow建立的具体过程是什么&#xff1f; 一、什么是Flow&#xff1f;   在Suricata 7.0中&#xff0c;流Flow是指所有相同五元组&#xff08;协议&#xff0c;源IP&#xff0c;目的IP&#xff0c;源端口&am…

makefile里面的变量使用,系统变量

文章目录 makefile里面的变量使用 makefile里面的变量使用 calc:add.o sub.o multi.ogcc add.o sub.o multi.o calc.cpp -o calcadd.o:add.cppgcc -c add.cpp -o add.osub.o:sub.cppgcc -c sub.cpp -o sub.omulti.o:multi.cppgcc -c multi.cpp -o multi.oclean:rm -rf *.o cal…

Linux第32步_编译ST公司的TF-A源码

正点原子STM32MP157开发板使用的CPU型号是STM32MP157DAA1&#xff0c;而开发板硬件参考了ST公司的STM32MP157 EVK开发板&#xff0c;因此我们在移植的时候需要关注“stm32mp157d-ev1”。 一、了解SDK 包 ST公司会从ARM官方下载TF-A软件包&#xff0c;然后将STM32MP1 芯片添加…

算法总结——单调栈

纵有疾风起&#xff0c;人生不言弃。本文篇幅较长&#xff0c;如有错误请不吝赐教&#xff0c;感谢支持。 文章目录 一、单调栈的定义二、单调栈的应用&#xff1a;寻找左边第一个比它小的数单调栈的思想&#xff08;重点&#xff09;&#xff1a;寻找左边第一个比它小的数的下…