置信区间(confidence interval)

要理解置信区间,就要从统计学最基本最核心的思想去思考,那就是用样本估计总体。

置信水平(Confidence level)是指总体参数值落在样本统计值某一区内的概率;
而置信区间(confidence interval)是指在某一置信水平下,样本统计值与总体参数值间误差范围。
置信区间越大,置信水平越高。

一、置信区间的概念

1.1 置信区间

置信区间,就是一种区间估计

先来看看什么是点估计,什么是区间估计。

1.1.1 点估计与区间估计

以前很流行一种刮刮卡:
在这里插入图片描述
游戏规则是(假设只有一个大奖):

  • 大奖事先就固定好了,一定印在某一张刮刮卡上
  • 买了刮刮卡之后,刮开就知道自己是否中奖

那么我们起码有两种策略来刮奖:

  • 点估计:买一张,这就相当于你猜测这一张会中奖
  • 区间估计:买一盒,这就相当于你猜测这一盒里面会有某一张中奖

很显然区间估计的命中率会更高(当然费用会更高,因为风险降低了)。

%%%
当我们做某个试验时,没有办法完全消除误差,这种情况下,我们会给结果一个可接受的误差范围,统计学上叫置信区间,置信区间是随机变量,它根据所抽取的样本决定,每抽取一个样本就会有一个置信区间。

置信区间是指由样本统计量所构造的总体参数的估计区间。

置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)。

置信区间展现的是这个参数的真实值落在测量值(推测值)的周围的可信程度。

接下来,我们看看置信区间是如何进行区间估计的。

1.1.2 置信区间

我们通过对人类身高的估计来讲解什么是置信区间。

1.1.2.1 上帝视角

对于人类真实的平均身高,我们是没有办法知道的,因为几乎不可能把每个人都统计到。

但这个数据肯定是真实存在的,我们可以说,上帝知道。

在这里我们引入了上帝视角,即上帝看到的人类身高的真实分布。

在这里插入图片描述

1.1.2.2 点估计

作为愚蠢的人类,我们只能在人群中抽样统计:
在这里插入图片描述
在这里插入图片描述
区间估计可以改进此问题。

1.1.2.3 置信区间

置信区间,提供了一种区间估计的方法。

在这里插入图片描述
但是,和点估计比较:

  • 点估计和区间估计,都不知道哪个点或者哪个区间更好
  • 但是,按照95%95\%95%置信区间构造出来的区间,如果我构造出100个这样的区间,其中大约有95个会包含μ\muμ

这就好像用渔网捞鱼,我知道一百次网下去,大约会有95次网到我想要的鱼,但是我并不知道是不是现在这一网:
在这里插入图片描述
剩下的问题就是95%95\%95%置信区间是如何构造的。

1.1.2.4 95%95\%95%置信区间

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.1.2.5 总结

总结一下:

  • 置信区间要求估计量是个常数
  • 95%95\%95%也被称为置信水平,是统计中的一个习惯,可以根据应用进行调整

1.2 置信水平

置信区间包含总体平均值的概率

又称 置信度

eg:95%的置信水平表示:抽取的100个样本,有100个置信区间,其中有95个置信区间可能包含总体的真实平均值。
在这里插入图片描述

1.2.1 是不是置信水平越高越好

这个问题就要看你需要统计的是什么?经济效益是什么?通常情况下,95%被作为常用的置信度,原理就在于3西格玛控制(在一些严格的领域甚至会用到6西格玛),此时已经有很高的置信度了,那在往上去,随着置信度的上升,置信区间的跨度也就越大,对参数估计的精度必定降低。点估计就一个值,精度高,但置信度则低,精度与置信度相互的取舍则要全由分析者自行选择了。

1.3 计算置信区间的步骤

第一步:求一个样本的均值

第二步:计算出抽样误差。

人们经过实践,通常认为调查:
100个样本的抽样误差为±10%
500个样本的抽样误差为±5%
1,200个样本时的抽样误差为±3%

第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。

1.4 举例说明

美国Gallup(盖洛普)公司就消费者对美国产品质量的看法,对美国、德国和日本三国共计3,500名消费者(每个国家约1,200名)分别进行了调查,调查结果:有55%的美国人认为美国产品质量好,而只有26%的德国人和17%的日本人持同样看法。抽样误差为±3%,置信水平为95%。则这三个国家消费者的置信区间分别为:

国别样本均值抽样误差置信区间

美国55%±3%52%-58%
德国26%±3%23%-29%
日本17%±3%14%-20%

二、关于置信区间的宽窄

窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。

假设全班考试的平均分数为65分,则

置信区间间隔宽窄度表达的意思
0-100分100,宽,等于什么也没告诉你
30-80分50,较窄,你能估出大概的平均分了(55分)
60-70分10,窄,你几乎能判定全班的平均分了(65分)

三、样本量对置信区间的影响

影响:在置信水平固定的情况下,样本量越多,置信区间越窄。
下面是经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同):

样本量置信区间间隔宽窄度
10050%—70%20,宽
80056.2%-63.2%7,较窄
1,60057.5%—63%5.5,较窄
3,20058.5%—62%3.5,更窄

由上表得出:

  • 1、在置信水平相同的情况下,样本量越多,置信区间越窄。
  • 2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一倍(实践证明,样本量要增加4倍,置信区间才能变窄一倍),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。

通过置信区间的计算公式来验证置信区间与样本量的关系

  • 置信区间=样本的推断值±(可靠程度系数×)

从上述公式中可以看出:
在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。

四、置信水平对置信区间的影响

影响:在样本量相同的情况下,置信水平越高,置信区间越宽。

举例说明:美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。则两组数字的情况比较如下:

抽样误差置信水平置信区间间隔宽窄度
±3%95%60%±3%=57%-63%6宽
±2.3%90%60%±2.3%=57.7%-62.3%4.6窄

由上表得出:
在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。

五、样本量对置信水平的影响

影响:在置信区间不变的情况下,样本量越多,置信水平越高。
举例说明:

置信区间样本量置信水平
52%-58%1,20095%

(前面美国盖洛普公司的例子)

https://www.zhihu.com/question/26419030/answer/103956460
https://zhuanlan.zhihu.com/p/38755140
https://zhuanlan.zhihu.com/p/110612323

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/345631.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

卫星运动轨道

地球的自转轴与地球公转平面并不垂直,因此,黄道面和地球赤道面并不重合,而是有大约23.4的夹角,通常被称为黄赤交角,也称为转轴倾角、倾角(obliquity)或轴交角(axial inclination&…

随机过程:指数分布、泊松过程、更新过程(renewal process)+大数定律

笔记主要基于中文版《应用随机过程 Introduction to Probability Models 》(Sheldon M. Ross),只有非常少的一部分是我自己的注解。写这个笔记的目的是自己复习用,阅读需要一定的微积分和概率论基础。本人为初学者,且全部为自学,如…

接受拒绝采样(Acceptance-Rejection Sampling)

我们所说的抽样,其实是指从一个概率分布中生成观察值(observations)的方法。而这个分布通常是由其概率密度函数(PDF)来表示的。而且, 即使在已知PDF的情况下,让计算机自动生成观测值也不是一件容…

gradle文件不识别_识别Gradle约定

gradle文件不识别通过约定进行配置具有许多优点,尤其是在简洁方面,因为开发人员不需要显式配置通过约定隐式配置的内容。 但是,在利用约定进行配置时,需要注意这些约定。 这些约定可能已记录在案,但是当我可以编程方式…

Telesat、OneWeb及SpaceX三个全球宽带低轨卫星星座系统的技术对比

编者按:本文来自微信公众号“卫星与网络”(ID:satnetdy),作者Inigo del Portilloa,*, Bruce G. Cameronb, Edward F. Crawleyc,编译 刘帅军、胡月梅(中科院软件所),36氪经…

腾讯人均每月薪酬成本超8万元,员工总数首次超10万

11月10日,腾讯在23岁“生日”即将到来之际发布2021年第三季度业绩报告。财报显示,第三季度腾讯总收入为人民币1424亿元(220亿美元 ),同比增长13%;净利润(Non-IFRS)317.5亿元,同比减少…

低轨卫星通信系统发展综述

最近几年低轨移动通信领域风起云涌,Iridium、OneWeb、Boeing、SpaceX 这些商业航天的 独角兽 都先后实施或宣布自己在这一领域雄心勃勃的计划。 通信、导航和遥感是卫星应用领域的三驾马车,简称 通导遥。鉴于任务特性,通信卫星和导航卫星通常…

创建您的第一个servlet

在本教程中,我们将学习如何使用Servlet创建非常基本的Web应用程序。 Servlet是一类,扩展了服务器拦截和响应传入请求的功能。 Servlet是一个Web组件,可在服务器上进行编写,构建和部署,以创建动态Web页面。 首先&…

StarLink星座最新动态及星间组网动态路由探讨

StarLink星座最新动态及星间组网动态路由探讨 2020-06-24 11:50 StarLink星座最新动态及星间组网动态路由探讨 作者 | 刘帅军、徐帆江、刘立祥、范媛媛、王大鹏 (中国科学院软件研究所,天基综合信息系统重点实验室) 一 概述 自2020年6月开…

累计分布函数CDF、互补累计分布函数CCDF、期望Expection

1 CDF 累积分布函数(Cumulative Distribution Function,CDF),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写CDF标记,,与概率密度函数probability density function&#xff08…

markov chain, MRP MDP

在强化学习中,马尔科夫决策过程(Markov decision process, MDP)是对完全可观测的环境进行描述的,也就是说观测到的状态内容完整地决定了决策的需要的特征。几乎所有的强化学习问题都可以转化为MDP。本讲是理解强化学习问题的理论基…

(网络)流和会话

流:指具有相同五元组(源IP,源端口,目的IP,目的端口,协议)的所有包 会话:指由双向流组成的所有包(源和目的互换)

Filtration, σ-algebras

1. Filtration filtration在钱敏平老师和龚光鲁老师的《随机过程论》中直接称其为非降的KaTeX parse error: Undefined control sequence: \sigmma at position 1: \̲s̲i̲g̲m̲m̲a̲代数族。如图。 一般叫σ\sigmaσ-代数流或σ\sigmaσ-域流 在鞅论中的花体FtF_tFt​&…

gradle 命令行_Gradle命令行便利

gradle 命令行在我的《用Gradle构建Java的gradle tasks 》一文中,我简要提到了使用Gradle的“ gradle tasks ”命令来查看特定Gradle构建的可用任务。 在这篇文章中,我将对这一简短提及进行更多的扩展,并查看一些相关的Gradle命令行便利。 Gr…

怎样更好地理解并记忆泰勒展开式

本段的核心思想是仿造。当我们想要仿造一个东西的时候,无形之中都会按照上文提到的思路,即先保证大体上相似,再保证局部相似,再保证细节相似,再保证更细微的地方相似……不断地细化下去,无穷次细化以后&…

新的DMN编辑器预览

Workbench 7.13.0.Final于10月16日星期二发布,此版本带来了许多有趣的功能和重要的修复程序。 亮点之一是作为技术预览功能的新DMN编辑器,该功能仍在开发中,但您可以开始使用。 在本文中,您将学习如何启用DMN编辑器预览&#xff…

指数矩阵(exponential matrix)

类似于指数ex……e^x……ex……的本质是一种近似,eAt……e^{At}……eAt……是同样原理。 http://www.mashangxue123.com/%E7%BA%BF%E6%80%A7%E4%BB%A3%E6%95%B0/1756604500.html

Boole‘s,Doob‘s inequality,中心极限定理Central Limit Theorem,Kolmogorov extension theorem, Lebesgue‘s domin

1. Boole’s inequality In probability theory, Boole’s inequality, also known as the union bound, says that for any finite or countable set of events, the probability that at least one of the events happens is no greater than the sum of the probabilities …

秩为 1 的矩阵的一些性质

前言 从上面的分析和例题看到,对于秩为1的n阶矩阵,零是其n重或n-1重特征值,如果是n-1重,则非零特征值是矩阵的主对角线元素之和;另外还看到,秩为1的矩阵可以分解为一个非零列向量与另一个非零列向量的转置的乘积&#…