R实验 参数估计

  • 实验目的:
  1. 掌握矩法估计与极大似然估计的求法;
  2. 了解估计量的优良性准则:无偏性、有效性、相合性(一致性);
  3. 学会利用R软件完成一个正态总体均值和两个正态总体均值差的区间估计;
  4. 学会利用R软件完成两个成对数据均值差的区间估计;
  5. 学会利用R软件完成一个总体比例和两个总体比例差的区间估计;
  6. 掌握大样本数据关于单个总体均值和总体比例的样本容量的确定方法。

实验内容:

(习题5.1)下表列出 50 个抽取自二项分布总体 B(n, p) 的数据(数据存放在 binom . data件中),试用矩估计方法估计参数np

来自二项分布总体的数据

15

16

14

15

16

11

15

15

12

14

14

14

12

14

12

15

14

14

12

14

15

17

18

10

13

12

15

17

16

18

17

12

10

15

13

12

14

16

16

16

15

11

13

15

16

17

14

11

16

17

解:若将n作为未知参数,则需要同时考虑一阶矩和二阶矩。

总体的一阶矩和二阶矩分别为:

a1 =E(X)= npa2 =E(X 2)= var(X)+(E(x))2 = np(1-p)+(np)2,

根据矩估计的基本思想,a1 = A1,a2 = A2,(其中

即有

解上述方程组,可得

以下请根据上式完成R程序,计算出参数np的矩估计量的值

(参考n = 20.0284,p = 0.713986)

源代码:

# 读取数据data <- scan("C:/Users/黄培滇/Desktop/R语言生物统计学/chap05/binom.data")# 计算参数估计m1 <- mean(data)m2 <- mean(data^2)p=1+m1-m2/m1n=m1/ppn

  

运行结果或截图:

(习题5.2)设总体X的分布密度函数为

从总体X抽取的样本为:

0.1  0.2  0.9  0.8  0.7  0.7  0.6  0.5

求参数a 的极大似然估计量

解:

X1,X2,…,Xn 为其样本,只需要考虑xÎ(0, 1)部分。依题意,

此分布的似然函数为         L(a ; x) =

相应的对数似然函数为       ln L(a ; x) = n ln(a +1)+ a ln

令           

 ln=0

解此似然方程得到

,或写为

容易验证

,从而a 使得L达到极大,即参数a 的极大似然估计量

以下请根据上式完成R程序,计算出参数a 的极大似然估计量的值。

源代码:

data<-c(0.1,0.2,0.9,0.8,0.7,0.7,0.6,0.5)n<-length(data)alpha_hat<-n/(-sum(log(data)))-1alpha_hat

运行结果或截图:

补充:求参数a 的矩估计量。由于只有一个参数,因此只需要考虑a1 = A1,即E(X)=

而由E(X)的定义有:E(X)=

因此,解得

以下请根据上式完成R程序,计算出参数a 的矩估计量的值,并与其极大似然估计量的值进行比较。

源代码:

data<-c(0.1,0.2,0.9,0.8,0.7,0.7,0.6,0.5)data_bar<-mean(data)alpha_hat_moment<-(data_bar-1)*(data_bar+2)alpha_hat_moment

运行结果或截图:

(习题5.4)为研究新生儿出生时的体重,随机地选取了某妇产医院的100个新生儿,其样本均值为3338g,样本标准差为629g。试计算新生儿平均体重的置信水平为95%的置信区间。

提示:参考例5.6

解:源代码及运行结果:(复制到此处,不要截图)

birth_bar<-3338birth_S<-629n<-100alpha<-0.05z<-qnorm(1-alpha/2)c(birth_bar - birth_S/sqrt(n)*z,birth_bar + birth_S/sqrt(n)*z)

结论:

(习题5.5)某妇产医院有意估计产妇在该医院住院的平均天数,在过去的年份中随机抽取了 36位孕妇,每位孕妇住院天数取整后如下表所示(数据存放在 hospital.data 文件中)。使用这些数据构建 95% 的置信区间,估计在该医院生小孩的所有孕妇的平均住院天数。

提示:参考例5.10。由于此题是小样本数据,也可以直接使用t.test()函数。

解:源代码及运行结果:(复制到此处,不要截图)

> H_data<-scan("C:\\Users\\黄培滇\\Desktop\\R语言生物统计学\\chap05\\hospital.data")Read 36 items> H_bar<-mean(H_data);S<-sd(H_data)> n<-length(H_data)> alpha<-0.05> t<-qt(1-alpha/2,df = n-1)> c(H_bar - S/sqrt(n)*t,H_bar + S/sqrt(n)*t)

[1] 2.910812 3.700299

结论:

即95%的产妇在医院的平均住院时间在2~3天

(习题5.8)已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10 只,测得其寿命(单位:小时)为

1067  919  1196  785  1126  936  918  1156  920  948

求灯泡寿命平均值的置信度为0.95的单侧置信下限。

提示:此题是一个正态总体的区间估计问题,且由于总体方差未知,因此可以直接使用R语言中t.test()函数进行分析。参考例5.11,单侧置信下限,t.test()函数中的参数alternative="greater"。

解:源代码及运行结果:(复制到此处,不要截图)

> L<-c(1067,919,1196,785,1126,936,918,1156,920,948)> t.test(L,alternative="greater")

One Sample t-test

data:  L

t = 23.969, df = 9, p-value = 9.148e-10

alternative hypothesis: true mean is greater than 0

95 percent confidence interval:

 920.8443      Inf

sample estimates:

mean of x

    997.1

结论:

即这批灯泡中95%的平均寿命在997.1小时以上

(习题5.11)某调查公司对 902 名高尔夫女选手进行了一项调查,以了解女选手怎样看待自己在比赛中的安排。调查结果显示 397 名女选手对下午茶的时间感到满意。(1) 试计算所有女选手对下午茶的时间感到满意的置信区间,这里取置信水平为 0.95; (2) 如果使用binom. test ()函数精确计算两者相差多少?

提示:参考例5.12。

解:源代码及运行结果:(复制到此处,不要截图)

> my<-397;w<-902> p<-my/w;q<-1-p> alpha<-0.05;z<-qnorm(1-alpha/2)> c(p-z*sqrt(p*q/w),p+z*sqrt(p*q/w))

0.4077379 0.4725281

> binom.test(my,w)

Exact binomial test

data:  my and w

number of successes = 397, number of trials =

902, p-value = 0.0003617

alternative hypothesis: true probability of success is not equal to 0.5

95 percent confidence interval:

 0.4074246 0.4732337

sample estimates:

probability of success

              0.440133

结论:

即在女子高尔夫比赛时间安排中,女选手对下午茶的时间满意总体比例在0.407~0.473的概率是95%

两者相差0.440133

(续习题5.12)如果希望新生儿的平均体重与总体均值的边际误差不超过 100 ,应从该妇产医院随机地选取多少名新生儿?

提示:例5.13。

解:源代码及运行结果:(复制到此处,不要截图)

> birth_S<-629> E<-100> alpha<-0.05> z<-qnorm(1-alpha/2);> (n<-z^2*birth_S^2/E^2)

[1] 151.9839

结论:

说明还需要从妇产医院再随机抽取52名新生儿

(习题5.13)某汽车营销公司计划估计某地区拥有小汽车家庭所占的比重,要求边际误差不超过5%,置信水平取 90%, 问应抽取多少样本?公司调查人员认为,拥有小汽车家庭的实际比重不会超过 20%,如果这一结论成立,应抽取多少样本?

提示:例5.14。

解:源代码及运行结果:(复制到此处,不要截图)

> p<-0.2;E<-0.05;alpha<-0.1> z<-qnorm(1-alpha/2)> (n<-z^2*p*(1-p)/E^2)

[1] 173.1548

结论:

即需要随机抽取174个家庭

(习题5.16)甲、乙两种稻种分别播种在10块试验田中,每块试验田甲、乙稻种各种一半。假设两稻种产量X, Y均服从正态分布,且方差相等。收获后10块试验田的产量如下所示(单位:千克)。

甲种

140

137

136

140

145

148

140

135

144

141

乙种

135

118

115

140

128

131

130

115

131

125

求出两稻种产量的期望差m1-m2的置信区间(a =0.05)。

提示:此题是两个正态总体的区间估计问题,且由于两总体方差未知,因此可以直接使用R语言中t.test()函数进行分析。t.test()可做两正态样本均值差的估计。注意此例中两样本方差相等。

解:源代码及运行结果:(复制到此处,不要截图)

> a<-c(140,137,136,140,145,148,140,135,144,141)> b<-c(135,118,115,140,128,131,130,115,131,125)> a_bar<-mean(a);Sa<-sd(a);na<-length(a)> b_bar<-mean(b);Sb<-sd(b);nb<-length(b)> alpha<-0.05;z<-qnorm(1-alpha/2)> S<-sqrt(Sa^2/na + Sb^2/nb)> c(a_bar - b_bar - z*S,a_bar - b_bar + z*S)

[1]  7.956516 19.643484

结论:

两个稻种产量的期望差在95%的置信水平下位于[7.96, 19.64]这个区间内。

(习题5.17)甲、乙两组生产同种导线,现从甲组生产的导线中随机抽取4根,从乙组生产的导线中随机抽取5根,它们的电阻值(单位:W)分别为

甲组

0.143

0.142

0.143

0.137

已组

0.140

0.142

0.136

0.138

0.140

假设两组电阻值分别服从正态分布N(m1, s 2)和N(m1, s 2),s 2未知。试求m1-m2的置信区间系数为0.95的区间估计。

提示:此题是两个正态总体的估计问题,且由于两总体方差未知,因此可以直接使用R语言中t.test()函数进行分析。t.test()可做两正态样本均值差的估计。注意此例中两样本方差相等。

解:源代码及运行结果:(复制到此处,不要截图)

> x <- c(0.143, 0.142, 0.143, 0.137)> y <- c(0.140, 0.142, 0.135, 0.138, 0.140)> x_bar <- mean(x)> Sx <- sd(x)> nx <- length(x)> y_bar <- mean(y)> Sy <- sd(y)> ny <- length(y)> Sw2 <- ((nx - 1) * Sx^2 + (ny - 1) * Sy^2) / (nx + ny - 2)> S <- sqrt(Sw2 * (1/nx + 1/ny))> alpha <- 0.05> t <- qt(1 - alpha/2, nx + ny - 2)> conf_interval <- c(x_bar - y_bar - t*S, x_bar - y_bar + t*S)> conf_interval

[1] -0.002104423  0.006604423

结论:

两组之差的置信区间系数为0.95的区间估计为-0.002,0.007

思考:

常用的点估计的方法有哪些?

矩估计法;极大似然估计法;

估计量的优良性准则有哪些?

估计量的优良性准则:无偏性、有效性、相合性(一致性)

在对单个总体样本均值进行区间估计时,可以使用Z统计量和T统计量,这两个统计量分别在什么情况下使用?

总体标准差已知且样本容量较大,则可以使用Z统计量进行区间估计;

如果总体标准差未知或者样本容量较小,则应使用T统计量进行区间估计

对于单个总体比例的区间估计问题,涉及到其实是二项分布。但是当满足
    n大于等于30                条件时,也可以近似使用正态分布来计算。

对于单个总体比例的区间估计,涉及的是二项分布。因此在R语言中,可以使用binom.test()函数进行区间估计,它是精确检验函数,通常用于小样本数据;当处理大样本数据时,在R语言并没有使用正态分布函数,而是使用了  prop.test()      分布函数?同样,在使用这个分布函数时,仍然需要满足 样本容量足够大,且满足二项分布近似正态性                   条件。

在对两个总体样本均值差进行区间估计时,可以使用Z统计量和T统计量,这两个统计量分别在什么情况下使用?

两个总体标准差已知,用Z统计量

两个总体标准差未知,用T统计量

在对两个总体样本均值差进行区间估计时,如果使用了T统计量,还要进一步考虑两个总体的     方差      是否相同 ,来分别使用不同的T统计量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/843456.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NiuCloud-Admin-SAAS:引领前端技术革新与SaaS应用快速开发的未来

一、引言 在数字化快速发展的今天&#xff0c;企业对于快速搭建、高效运营的SaaS&#xff08;Software-as-a-Service&#xff09;系统的需求日益增长。为满足这一需求&#xff0c;NiuCloud-Admin-SAAS作为一款快速开发SaaS通用管理系统后台框架&#xff0c;凭借其先进的技术栈…

基于Java实现震中附近风景区预警可视化分析实践

目录 前言 一、空间数据说明 1、表结构信息展示 2、空间范围查询 二、Java后台开发实现 1、模型层设计与实现 2、控制层设计与实现 三、Leaflet地图开发 1、地震震中位置展示 2、百公里风景区列表展示 3、风景区列表展示 4、附近风景区展示 四、总结 前言 地震这类…

链表mark

什么是链表&#xff0c;链表是一种通过指针串联在一起的线性结构&#xff0c;每一个节点由两部分组成&#xff0c;一个是数据域一个是指针域&#xff08;存放指向下一个节点的指针&#xff09;&#xff0c;最后一个节点的指针域指向null&#xff08;空指针的意思&#xff09;。…

[数智人文实战] 02.舆情分析之词云可视化、文本聚类和LDA主题模型文本挖掘

【数智人文与文本挖掘】知识星球建立且正式运营,欢迎新老博友和朋友加入,一起分享更多数智人文知识和交流进步。该星球计划每周至少分享7个资源或文章,包括数智人文、文本挖掘、人工智能、大数据分析和图书情报的技术文章、代码及资源。同时,欢迎进入星球的朋友咨询我图情和…

操作系统课程实验1-进程调度模拟实验

操作系统课程实验1-进程调度模拟实验 一、实验介绍 1.1 实验目的 本实验模拟在单处理机环境下的处理机调度&#xff0c;帮助理解进程调度的概念&#xff0c;深入了解进程控制块的功能&#xff0c;以及进程的创建、撤销和进程各个状态间的转换过程。 1.2 实验内容 进程调度算…

NDIS小端口驱动开发(一)

在四种NDIS相关的驱动中&#xff0c;微型端口驱动(也经常翻译为为小端口驱动)位于驱动栈的底部&#xff0c;一般将它理解为NIC设备的驱动程序&#xff1a; 有几种类型的微型端口驱动程序类型&#xff1a; 无连接微型端口驱动程序用于控制无连接网络媒体 &#xff0c;如以太网的…

redis基本数据结构与应用

文章目录 概要String结构Hash结构List结构Set结构Zset结构bitmap位图类型geo地理位置类型其他常用命令 概要 redis常用的5种不同数据结构类型之间的映射如下&#xff1a; 结构类型结构存储的值结构的读写能力STRING可以是字符串、整数或者浮点数key-value形式&#xff1b;对整…

JMH304-剑侠情缘2网络版+2017纹饰端+翅膀+单机+外网整理+各种副本

资源介绍&#xff1a; 藏剑-太虚-梁山-杀手堂种树地宫师门纹饰装备长流云阳套等等———– 做登录器联系站长 资源截图&#xff1a; 下载地址

.NET周刊【5月第4期 2024-05-26】

国内文章 开源低代码框架 ReZero API 正式版本发布 &#xff0c;界面操作直接生成API https://www.cnblogs.com/sunkaixuan/p/18201175 ReZero是一款.NET6的中间件&#xff0c;采用MIT许可证开源&#xff0c;目的是降低.NET Core开发的门槛。它提供界面操作生成API的功能&am…

《Ai学习笔记》自然语言处理 (Natural Language Processing):常见机器阅读理解模型(上)02

Glove 词向量&#xff1a; 在机器理解中的词的表示&#xff1a; 词袋&#xff08;bow,bag of words&#xff09; one-hot 词向量 word2vec glove 目的&#xff1a;将一个词转换成一个向量 Word2vec 是一种用于生成词向量的工具包&#xff0c;由Google在2013年开源推出…

大规模语言模型的书籍分享

在当今人工智能领域&#xff0c;大规模语言模型成为了研究和应用的热点之一。它们以其大规模的参数和强大的性能表现&#xff0c;推动着机器学习和深度学习技术的发展。对于GPT 系列大规模语言模型的发展历程&#xff0c;有两点令人印象深刻。 第一点是可拓展的训练架构与学习范…

《TCP/IP网络编程》(第十二章)I/O复用(1)

本章将讨论实现并发服务器的第二种办法&#xff0c;基于I/O复用的服务器端构建。 I/O复用它允许单个进程或线程同时处理多个输入/输出&#xff08;I/O&#xff09;操作&#xff0c;而无需为每个I/O操作创建一个独立的线程或进程。这种技术可以显著提高应用程序的效率和性能&…

前端学习--React部分

文章目录 前端学习--React部分前言1.React简介1.1React的特点1.2引入文件1.3JSX&#x1f349;JSX简介与使用&#x1f349;JSX语法规则 1.4模块与组件&#x1f349;模块&#x1f349;组件 1.5安装开发者工具 2.React面向组件编程2.1创建组件&#x1f349;函数式组件&#x1f349…

Elasticsearch 认证模拟题 - 1

1、题目 定义一个数据流&#xff0c;满足 data-stream_*_*&#xff0c;数据首先分布在 data_hot&#xff0c;5分钟后移动到 data_warm&#xff0c;3分钟后到 data_cold&#xff0c;再过 8 分钟删除。 1.1 考点 生命周期索引模板数据流 1.2 答案 # 修改生命周期策略修改时间…

【算法】位运算算法——只出现一次的数字Ⅱ

题解&#xff1a;只出现一次的数字Ⅱ(位运算算法) 目录 1.题目2.题解&#xff1a;3.代码示例4.总结 1.题目 题目链接&#xff1a;LINK 要求&#xff1a;时间复杂度&#xff1a;O(N)&#xff0c;空间复杂度&#xff1a;O(1) 2.题解&#xff1a; 3.代码示例 class Solution {…

Java设计模式 _行为型模式_中介者模式

一、中介者模式 1、中介者模式 中介者模式&#xff08;Mediator Pattern&#xff09;是一种行为型模式。主要通过一个中介类&#xff0c;该类通常处理不同类之间的通信&#xff0c;并支持松耦合&#xff0c;使代码易于维护。 2、实现思路 &#xff08;1&#xff09;、定义实体…

【Linux】-Kafka集群安装部署[18]

简介 Apache Kafka是一款分布式的、去中心化的、高吞吐低延迟、订阅模式的消息队列系统。 同RabbitMQ一样&#xff0c;Kafka也是消息队列。不过RabbitMQ多用于后端系统&#xff0c;因其更加专注于消息的延迟和容错。 Kafka多用于大数据体系&#xff0c;因其更加专注于数据的…

K210 数字识别 笔记

一、烧写固件 连接k210开发板&#xff0c;点开烧录固件工具&#xff0c;选中固件&#xff0c;并下载 二、模型训练 网站&#xff1a;MaixHub 1、上传文件 2、开始标记数据 添加9个标签&#xff0c;命名为1~9&#xff0c;按键盘w开始标记&#xff0c;键盘D可以下一张图片&…

解密Prompt系列15. LLM Agent之数据库应用设计:DIN C3 SQL-Palm BIRD

上一章我们主要讲搜索引擎和LLM的应用设计&#xff0c;这一章我们来唠唠大模型和DB数据库之间的交互方案。有很多数据平台已经接入&#xff0c;可以先去玩玩再来看下面的实现方案&#xff0c;推荐 [sql translate]&#xff1a;简单&#xff0c;文本到SQL&#xff0c;SQL到文本…

后端企业级开发之yaml数据序列化格式文件详解2024

yaml格式 数据格式 yaml 是一种数据序列化的格式 容易阅读 容易与脚本语言交互 以数据为核心 重数据轻格式 我们要知道他怎么书写 大小写敏感 属性层级关系使用多行描述 每行结尾使用冒号结束 使用缩进表示层级关系 同层级左侧对其 只运行使用空格 属性前面添加空格 #表…