统计学-R语言-6.2

文章目录

  • 前言
  • 总体均值的区间估计
    • 两个总体均值之差的估计
    • 两个总体均值之差的估计(独立大样本的估计)
    • 两个总体均值之差的估计(独立小样本的估计)
    • 两个总体均值之差的估计(配对样本的估计)
  • 总体比例的区间估计
    • 总体比例的区间估计(一个总体比例的估计)
    • 总体比例的区间估计(两个总体比例之差的估计)
    • 在这里插入图片描述
  • 练习


前言

本篇将继续介绍上篇所剩下的内容。


总体均值的区间估计

两个总体均值之差的估计

设两个总体的均值分别为1和2,从两个总体中分别抽取样本量为n1和n2的两个随机样本,其样本均值分别为 在这里插入图片描述在这里插入图片描述。估计两个总体均值之差(u1-u2)的点估计量显然是两个样本的均值之差( 在这里插入图片描述)。
两个总体均值的置信区间是由两个样本均值之差加减估计误差得到的。
两个总体均值之差(1-2)在置信水平下的置信区间可一般性地表达为:
在这里插入图片描述

两个总体均值之差的估计(独立大样本的估计)

假定条件
两个总体都服从正态分布,12、 22已知
若不是正态分布, 可以用正态分布来近似(n130和n230)
两个样本是独立的随机样本
使用正态分布统计量 z
在这里插入图片描述
在这里插入图片描述

例题:
为研究男女工资的差异,从某行业中随机抽取男女员工各40人,得到的月工资数据如下表所示。建立男女平均工资之差的95%的置信区间。(example5_3)
在这里插入图片描述
在这里插入图片描述

load("C:/example/ch5/example5_3.RData")
library(BSDA)
z.test(example5_3$男性工资,example5_3$女性工资,sigma.x=sd(example5_3$男性工资),sigma.y=sd(example5_3$女性工资))$conf.int

在这里插入图片描述

两个总体均值之差的估计(独立小样本的估计)

假定条件
两个总体都服从正态分布
两个总体方差已知(12,22)
两个独立的小样本(n1<30和n2<30)
两个样本均值之差经标准化后服从标准正态分布,此时可按下式建立两个总体均值之差的置信区间。
在这里插入图片描述

1222未知的时候,有以下几种情形:
(1) 两个总体方差未知但相等:12=22=2

需要用两个样本的方差 在这里插入图片描述在这里插入图片描述
来估计。这时,需要将两个样本的数据合并在一起,得到2的合并估计量 在这里插入图片描述,其计算公式如下:
在这里插入图片描述
这时,两个样本均值之差经标准化后服从自由度为(n1+n2-2)的t分布。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

例题:
(数据: example5_4. RData)为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排12个工人,每个工人组装一件产品所需的时间如下表所示。假定两种方法组装产品的时间服从正态分布,求以95%的置信水平建立两种方法组装产品所需平均时间差值的置信区间。
在这里插入图片描述
平均时差95%的置信区间(使用t.test函数)
假设方差相等

load("C:/example/ch5/example5_4.RData")
t.test(x=example5_4$方法一,y=example5_4$方法二,var.equal=TRUE)$conf.int

在这里插入图片描述

假设方差不相等

t.test(x=example5_4$方法一,y=example5_4$方法二,var.equal=FALSE)$conf.int

在这里插入图片描述

两个总体均值之差的估计(配对样本的估计)

在上面的例题中,使用的是两个独立样本。但使用独立样本估计两个总体均值之差时有潜在弊端:比如,在对每种方法随机指派12个工人时,偶尔可能会将技术比较差的12个工人指派给方法一,而技术较好的12个工人指派给方法二。这种不公平的指派可能会掩盖两种方法组装产品所需时间的真正差异。
为解决这一问题,可以使用配对样本(paired sample),即一个样本中的数据与另一个样本中的数据相对应,这样的数据通常是对同一个体所做的前后两次测量。比如,先指定12个工人用第一种方法组装产品,然后再让这12个工人用第二种方法组装产品,再比如:比如减肥前后的重量比较,治疗前后的症状比较,同样情况下对两种材料某种性能的比较等等,这样得到的两种方法组装产品的时间数据就是配对数据。

在这里插入图片描述

例题:

(数据:example5_5. RData)由10名学生组成一个随机样本,让他们分别采用A和B两套试卷进行测试,结果如下表所示。假定两套试卷分数之差服从正态分布,试建立两种试卷平均分数之差 d=1-2 95%的置信区间。

在这里插入图片描述
试卷平均分数差值95%的置信区间

load("C:/example/ch5/example5_5.RData")
t.test(example5_5$试卷A,example5_5$试卷B,paired=TRUE)    

在这里插入图片描述

只输出置信区间信息

t.test(example5_5$试卷A,example5_5$试卷B,paired=TRUE)$conf.int

在这里插入图片描述

例题:
一个有20人参加的技术革新试验前后的产量列在下表中,这里,pre和post分别是试验前后的产量(单位:个),而D=post-pre为相应的差 值(单位:个)。
在这里插入图片描述
首先看看试验前后的产量的线图,结果如下所示:

pre=c(64,125,86,103,111,112,48,71,60,66,100,64,109,75,80)
post=c(92,110,109,125,107,137,69,81,54,85,99,77,100,93,98)
production=cbind(pre,post)#cbind是根据列进行合并,合并的前提是所有数据行数相等,构建分块矩阵
matplot(production,type="o",col=1,pch=c(1,16),ylab="production")#matplot()函数将两个矩阵作为参数。一个矩阵的列参照另一个矩阵的相应列来绘制图形。在绘制同一个图时,两个矩阵的行数应该一样。如果行数不一样,行数较少的那个矩阵用缺失值(NA)来填充。第一个矩阵的值会用在横轴上。如果其中x,y一人失踪,另一种是作为y和x向量1:n使用。遗漏值(NAS)是允许的。pch点的样式,1个字符或整数的字符串或向量绘图字符,请参阅points。第一个字符是绘制的第一个图,第二次为第二个字符,默认为数字(1,0到9),然后是小写和大写字母。col,颜色矢量。颜色循环使用。
legend(8,130,c("技术革新前的产量","技术革新后的产量"),pch=c(1,16),lty=1:2)#legend(x, y, legend)在点(x,y)处添加图例,说明内容由legend给定

可以看出,技术革新前后的产量在 大部分情况下的走势相似,这表明一 个人在技术革新前后的产量并不是独立的。相比于技术革新前,大部分的工人都在技术革新后有更高的产量,因此,这个问题不能用前面对待两个独立样本的方法来求估计。
可以把同一个个体观察前后的产量相减,对得到的差使用正态总体均值的区间估计来解决

可以看出,技术革新前后的产量在 大部分情况下的走势相似,这表明一 个人在技术革新前后的产量并不是独立的。相比于技术革新前,大部分的工人都在技术革新后有更高的产量,因此,这个问题不能用前面对待两个独立样本的方法来求估计。
可以把同一个个体观察前后的产量相减,对得到的差使用正态总体均值的区间估计来解决。
在这里插入图片描述
在这里插入图片描述

mean(post-pre)  

[1] 10.8

t.test(post-pre)$conf  #或者使用等价的语t.test(x,y,parired=T)$conf,可以得到同样的结果 

[1] 3.038022 18.561978

attr(,"conf.level")  

[1] 0.95

总体比例的区间估计

总体比例的区间估计研究一个总体时,推断总体比例π使用的统计量为样本比例p。研究两个总体时,所关注的参数是两个总体的比例之差( 在这里插入图片描述),用于推断的统计量则是两个样本的比例之差( 在这里插入图片描述)。

总体比例的区间估计(一个总体比例的估计)

推断总体比例时,同样需要考虑样本量的大小。当样本量非常大时,可采用传统的估计方法。对于小样本或中等大小的样本,需要对样本量和试验成功的次数做出修正以改进估计的区间。
大样本情形:
在这里插入图片描述

例题:
某城市想要进行一项交通措施改革,为征求市民对该项改革措施的意见,在成年人中随机调查了500个市民,其中325人赞成改革措施。用95%的置信水平估计该城市成年人口中赞成该项改革的人数比例的置信区间。

n<-500;x<-325;p<-x/n
q<-qnorm(0.975)
LCI<-p-q*sqrt(p*(1-p)/n)
UCI<-p+q*sqrt(p*(1-p)/n)
data.frame(LCI,UCI)

在这里插入图片描述
任意大小样本情形:
大样本的估计方法至今仍被广泛使用,但按该方法计算出来的置信水平为(1- ) 的置信区间能够覆盖总体真实比例的概率通常小于(1- ),即使大样本也是如此(除非样本量非常大),更不可能应用于小样本。因此对于任意大小的样本,可以通过修正试验次数(样本量)n和样本比例的值让置信区间有所改进。

任意大小样本情形:
在这里插入图片描述
例题:
某城市想要进行一项交通措施改革,为征求市民对该项改革措施的意见,在成年人中随机调查了500个市民,其中325人赞成改革措施。用95%的置信水平估计该城市成年人口中赞成该项改革的人数比例的置信区间。
女性与男性收视率差值的95%置信区间(大样本)

n1<-500+4
p1<-(325+2)/n1
q<-qnorm(0.975)
LCI<-p1-q*sqrt(p1*(1-p1)/n1)
UCI<-p1+q*sqrt(p1*(1-p1)/n1)
data.frame(LCI,UCI)

在这里插入图片描述

总体比例的区间估计(两个总体比例之差的估计)

对两个总体比例之差的估计同样需要考虑两个样本量的大小。当两个样本量都非常大时,可采用传统的估计方法。对于两个小样本或中等大小的样本,需要对样本量和试验成功的次数做出修正以改进估计的区间。
在这里插入图片描述
假定条件
在这里插入图片描述
在这里插入图片描述
例题:
在某个电视节目的收视率调查中,女性观众随机调查了500人,有225人收看了该节目;男性观众随机调查了400人,有128人收看了该节目。用95%的置信水平估计女性与男性收视率差值的置信区间。
女性与男性收视率差值的95%置信区间(大样本)

p1<-225/500;p2<-128/400
q<-qnorm(0.975)
LCI<-p1-p2-q*sqrt(p1*(1-p1)/500+p2*(1-p2)/400)
UCI<-p1-p2+q*sqrt(p1*(1-p1)/500+p2*(1-p2)/400)
data.frame(LCI,UCI)

在这里插入图片描述
在这里插入图片描述
例题:
某城市想要进行一项交通措施改革,为征求市民对该项改革措施的意见,在成年人中随机调查了500个市民,其中325人赞成改革措施。用95%的置信水平估计该城市成年人口中赞成该项改革的人数比例的置信区间。
女性与男性收视率差值的95%置信区间(任意大小样本)

n1<-500+2;n2<-400+2
p1<-(225+1)/n1;p2<-(128+1)/n2
q<-qnorm(0.975)
LCI<-p1-p2-q*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
UCI<-p1-p2+q*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
data.frame(LCI,UCI)

在这里插入图片描述

练习

1、某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间,得到的数据(单位:小时)如下(exercise5_3.RData)利用函数:
在这里插入图片描述
求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。

load("C:/example/ch5/exercise5_3.RData")
library(BSDA)
z.test(exercise5_3$上网时间,sigma.x=sd(exercise5_3$上网时间),conf.level=0.90)
z.test(exercise5_3$上网时间,sigma.x=sd(exercise5_3$上网时间),conf.level=0.95)
z.test(exercise5_3$上网时间,sigma.x=sd(exercise5_3$上网时间),conf.level=0.99)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2、某小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。
采取重复抽样方法随机抽取50户,其中有32户赞成,18户反对。估计总体中赞成采用新设施的户数比例的置信区间,置信水平为95%(利用公式计算)

n1<-50+4
p1<-(32+2)/n1
q<-qnorm(0.975)
LCI<-p1-q*sqrt(p1*(1-p1)/n1)
UCI<-p1+q*sqrt(p1*(1-p1)/n1)
data.frame(LCI,UCI)

在这里插入图片描述

3、顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与许多因素有关,比如,银行的业务员办理业务的速度、顾客等待排队的方式等等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是所有顾客都进入一个等待队伍,第二种排队方式是顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下(exercise5_5.RData利用函数):
在这里插入图片描述
在这里插入图片描述
(1)构建第一种排队方式等待时间均值的95%的置信区间

load("C:/example/ch5/exercise5_5.RData")
t.test(exercise5_5$方式1,paired=FALSE,conf.level=0.95)$conf.int

在这里插入图片描述

(2)构建两种方式排队时间均值差值的95%的置信区间:

t.test(exercise5_5$方式1,y=exercise5_5$方式2,var.equal=TRUE)$conf.int
t.test(exercise5_5$方式1,y=exercise5_5$方式2,var.equal=FALSE)$conf.int

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/634196.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python数字图像处理基础(九)——特征匹配

目录 蛮力匹配&#xff08;ORB匹配&#xff09;RANSAC算法全景图像拼接 蛮力匹配&#xff08;ORB匹配&#xff09; Brute-Force匹配非常简单&#xff0c;首先在第一幅图像中选取一个关键点然后依次与第二幅图像的每个关键点进行&#xff08;描述符&#xff09;距离测试&#x…

前端-基础 表格标签 总结

目录 表格的相关标签 &#xff1a; 表格的相关属性 合并单元格 &#xff1a; 表格的相关标签 &#xff1a; 表格标签 - <table> 行标签 - <tr> 单元格标签 - <td> 表头单元格标签 - <th> 表格结构标签 表头区域标签 - < thead >…

MySQL 查询数据

今天介绍一下 MySQL 数据库使用 SELECT 语句来查询数据。 语法 首先&#xff0c;介绍一下语法。以下为在 MySQL 数据库中查询数据通用的 SELECT 语法&#xff1a; SELECT column1, column2, ... FROM table_name [WHERE condition] [ORDER BY column_name [ASC | DESC]] [LI…

【算法】递归

递归 递归初始递归&#xff1a;数列求和递归的应用&#xff1a;任意进制转换递归深度限制递归可视化&#xff1a;分形树递归可视化&#xff1a;谢尔宾斯基Sierpinski三角形递归的应用&#xff1a;汉诺塔递归的应用&#xff1a;探索迷宫 分治策略和递归优化问题兑换最少个数硬币…

k8s和knative的区别与联系

目录 什么是k8s 什么事knative 区别与联系 联系 区别 什么是k8s k8s是容器编排引擎和管理器。 其主要功能特性有&#xff1a;服务发现&#xff08;提供ip&#xff09;和负载均衡&#xff0c;存储编排&#xff0c;自动推出和回滚&#xff0c;自我修复&#xff0c;自动装箱…

交换两个int变量的值,不能使用第三个变量。即a=3,b=5,交换之后a=5,b=3。

//法一&#xff08;正常方法&#xff09; int main() {int a 3;int b 5;int tmp 0;//临时变量printf("before:a%d b%d\n", a, b);tmp a;a b;b tmp;printf("after:a%d b%d\n", a, b);return 0; } //法二&#xff08;加减法&#xff09; 有缺陷 aab超出…

Vue 3 hooks的基本使用及疑问

前言 vue3也用过一段时间了&#xff0c;hooks听说过&#xff0c;但是一直没有用过。公司的前端项目里也没有相应的应用&#xff0c;因此打算系统的学习一下。 hooks与普通函数的区别 以实现一个加法功能为例。 普通函数未抽离 <template><div class"box&quo…

大游戏并发使用什么阿里云服务器配置?

阿里云服务器配置如何选择&#xff1f;用于高性能计算或大游戏并发&#xff0c;可选择企业级第七代云服务器计算型g7、ECS计算型c7、内存型r7独享型云服务器&#xff0c;CPU采用第三代Intel Xeon可扩展处理器&#xff08;Ice Lake&#xff09;&#xff0c;基频2.7 GHz&#xff…

Java开发的审批流系统,前端使用vue,支持常态化工作审批流程

一、项目形式 springbootvueactiviti集成了activiti在线编辑器&#xff0c;快速开发平台&#xff0c;可插拔工作流服务。 二、项目介绍 本项目拥有用户管理&#xff0c;部门管理&#xff0c;代码生成&#xff0c;系统监管&#xff0c;报表&#xff0c;大屏展示&#xff0c;业…

代码随想录算法训练营第二十四天 | 回溯算法终于开始了!77. 组合

回溯算法终于开始了&#xff01; 题目链接&#xff1a;leetcode 77. 组合 文章讲解&#xff1a;代码随想录 77. 组合讲解 视频讲解&#xff1a;带你学透回溯算法-组合问题&#xff08;对应力扣题目&#xff1a;77.组合&#xff09; 思路和解法 题目&#xff1a; 给定两个整…

贝塞尔曲线(Bezier Curve)原理、公式推导及matlab代码实现

目录 参考链接 定义 直观理解 公式推导 一次贝塞尔曲线&#xff08;线性公式&#xff09; 二次贝塞尔曲线&#xff08;二次方公式&#xff09; 三次贝塞尔曲线&#xff08;三次方公式&#xff09; n次贝塞尔曲线&#xff08;一般参数公式&#xff09; 代码实现 参考链接…

C语言入门第二节-概述C语言

C语言入门第二节-概述C语言 一.C语言的程序结构 1.当前最新的C语言标准为c11&#xff0c;在他之前的C语言标准为c99&#xff1b; 2.结构主要包括&#xff1a;1.预处理指令&#xff0c;2.函数&#xff0c;3,变量&#xff0c;4.语向和表达式&#xff0c;5.注释 #include<std…

基于局部信息提取的人脸标志检测算法matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1 人脸检测 4.2 局部区域选择 4.3 特征提取 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 .........................................…

java面试题(23):Spring Bean如何保证并发安全

1 问题分析 我们知道默认情况下&#xff0c;Spring中的Bean是单例的&#xff0c;所以在多线程并发访问的时候&#xff0c;有可能会出现线程安全问题。 2 解决方案 有几个方面的解决思路&#xff1a; 我们可以设置Bean的作用域设置为原型&#xff08;prototype&#xff09;&a…

一篇文章带你彻底了解flex布局

哈喽&#xff0c;大家好呀&#xff0c;我是前端理想哥&#xff0c;今天我们来聊聊 flex 布局。 好&#xff0c;主角登场。 CSS 弹性盒子模型( Flexible Box 或者 Flexbox ) 先来看看它的定义&#xff1a;弹性布局是指通过调整其内元素的宽高&#xff0c;从而在任何显示设备上…

Qt实现在5种情况下快速求最值

1. 求最大值 const T &qMax(const T &a, const T &b) 举例&#xff1a; float value1 20; float value2 30; float result qMax(value1, value2); qDebug() << "Result:" << result; 结果&#xff1a;Result: 30 2. 求最小值 const …

【02】mapbox js api加载arcgis切片服务

需求&#xff1a; 第三方的mapbox js api加载arcgis切片服务&#xff0c;同时叠加在mapbox自带底图上 效果图&#xff1a; 形如这种地址去加载&#xff1a; http://zjq2022.gis.com:8080/demo/loadmapbox.html arcgis切片服务参考链接思路&#xff1a;【01】mapbox js api加…

基于gd32f103移植freemodbus master 主栈

1.移植freemodbus master需要先移植RT-Thread操作系统 GD32F103C8T6移植 RTT Nano 教程-CSDN博客 2.移植freemodbus master协议栈 在移植了RTT以后,我们需要移植就只有串口相关的函数 移植freemodbus master协议栈具体步骤 下载移植freemodbus master协议栈 源码添加协议栈…

多字段枚举类型定义

如何定义枚举类型&#xff0c;包含两个字段。 public enum TypeNnum {TYPE_1("TYPE_1", 1),TYPE_2("TYPE_2", 2),;private String name;private Integer value;TypeNnum( String name, Integer value) {this.value value;this.name name;}public String…

2024 1.13~1.19 周报

一、本周计划 确定论文题目&#xff0c;重新思考能加的点子&#xff0c;重点在网络架构部分。主要了解了注意力模块如SE、CBAM、CA&#xff0c;在模型中插入注意力模块。读论文。 二、完成情况 2.1 论文题目 基于注意力的Unet盐体全波形反演 想法来源&#xff1a;使用的是二维…