f分布表完整图_【教育统计答疑】如何理解正态分布、均值分布、^2分布、t分布和F分布...

许多教育统计的初学者都表示这几个分布感到学起来非常吃力,结合最近上课的体会以及答疑的情况,觉得很有必要在这里简单地对这部分内容进行澄清和梳理,以助理解。

首先,“为什么要学习这几个分布”可能是许多人纠结的问题,明明已经在电脑中装了SPSS软件了,那么复杂而繁琐的公式不应该直接内置在软件之中就可以了吗?为什么还要花费功夫去学习它们呢?我只能说,在你对这部分内容不甚了解的情况下,你很难意识到其重要性。这些分布都各有所长,也就因为自然界和社会系统中这些分布存在的广泛性,使得教育统计领域许多习以为常的假设背后都有充分的根据,例如为什么心理能力测量数据的相关性可以选用皮尔逊(Pearson)系数、为什么样本的数量要在30个以上、为什么只有达到“显著性水平”,才能说不同的变量之间存在统计意义上的差异等……诸如这样的例子背后,都与数据的这些分布特征有关,正是由于知道如果从某个总体中抽取一定的数据作为样本,这些数据将会存在着一定的分布规律,我们才能大胆地根据样本数据对总体的情况进行大胆而有把握的判断和推理……因此,简而言之,当你能理解这些分布的时候,至少让你在根据数据结果做出推断的时候,对自己所得出的结论坚信不疑。

好了,解答完学习必要性的疑惑后,终于要进入正题了。

1.正态分布(Normal Distribution)

第一个我们要讨论的概念就是正态分布,正态分布是所有概率分布中最重要的形式,如果没有它,也就没有接下来的那几个分布。正态分布的特征表明被测事物处于稳定的状态下,测量数据的波动是由于偶然因素引起的,所以在实践中有广泛的应用。在稳定的系统环境(如自然、人类社会等),许多事物和现象都会服从正态分布,例如人的身高、体重和智商;各种商品的尺寸和质量;自然环境的温度、湿度和降雨量;考试的成绩等。正态分布的重要性还体现在用样本数据来推断总体时,当样本的数量足够大的时,可以利用样本的某些特征数据服从正态分布,进行推断,获得准确的结果。

正态分布一般记作  x~N(μ, σ^2),它的分布函数表达式为 ee0c49eb37dd73f8cdfa814269c3d1e1.png

其中,π是圆周率;e是自然对数的底;x为随机变量的取值;μ为正态分布的均值(期望),σ^2是正态分布的方差。

正态分布的函数图像是一条“中间高,两端低,左右对称的曲线”(如下图所示)。

dfc0cf4b0d300d82a94cc614f995e5d8.png

特别的,当μ=0,σ^2=1时,我们称X服从标准正态分布:X~N(0,1).

由于其分布函数比较复杂,函数图像将随着不同的和方差发生着变化,人们将一般的正态分布进行标准化,即对于一般的正态分布x~N(μ, σ^2),只要令Z=(x-μ)/σ,则转化为标准正态分布 Z~N(0,1).为了便于计算,人们制作出相应的数值表,方便对不同的数据代入值进行查询,这就是标准正态分布表(如下表)。

294b7e2c486215a31d07eca8a2a72dee.png

正态分布表是我们学习教育统计到目前为止接触到的第一个表,它比较特殊,每一个Z值都会对应一个Y值和P值,其中P值是我们比较关心的,也就是概率大小,如图所示,当Z_0=1.00的时候,直线Z=0,直线Z=1,正态曲线以及Z轴所围成的面积(也就是阴影部分)的概率大小为0.34134,写成数学表达式则为P{Z≤1.00}=0.34134。由于正态曲线是对称的,因此正态分布表所能查到的数据只有非负数,至于Z负半轴部分则很容易根据正半轴的情况进行推算。

利用正态分布以及标准正态分布表还有许多其他的实际应用,如将原始分转化为标准分数;根据录取率计算录取的上线分数等。关于正态分布的内容就先介绍这么多,如有兴趣的可以参考相关书籍深入了解。(张敏强.《教育与心理统计学》[M].北京:人民教育出版社,2010,11:88-100)

正态分布部分性质的证明:

1bbcf88021fa0c44b1b09b156d73a77e.png

dba46268435e03bd6a3a5565370db8b4.png

72e6b1e7674d41042a614ff1f7df1493.png

如有兴趣了解更多,还可访问https://www.investopedia.com/terms/n/normaldistribution.asp

2. 均值分布(Meandistribution)(μ分布,  μ-distribution)

现在开始讨论第二个分布,第一个分布是正态分布,正态分布是自然环境或者人类社会中普遍存在的数据分布特征,那么均值分布又是怎么来的呢?顾名思义,只要你从总体中随机抽取若干组(如m)相同容量(如n)的数据,然后将每一组都求平均值,那么这m个平均值的分布情况就形成了均值分布(它的标准化形式称为μ分布),而这样的均值分布在一般情况下和正态分布的特征基本一致,因此均值分布也是正态分布,只是它的形状一般会比总体更往对称轴靠拢了而已。

那么,如果用数学语言来描述它的定义,即为设X服从正态分布,其均值为μ,方差为σ^2,则X~N(μ ,σ^2  ),设x_1,x_2,…,x_n是总体X抽取的随机样本,则X̅=1/n ∑_(i=1)^n▒x_i 样本的平均数。由于从总体中可以抽出多组的容量为n的样本,则存在多个X̅,此时X ̅也服从正态分布,平均数为μ,方差为σ^2/n, 记作X̅~(μ,σ^2/n)

为方便查表,作变换,

757e7696b1e0137a80d830ce34e1dc77.png

则Z~N(0,1)标准正态分布,又称为Z分布,或u~N(0,1) , u分布。

对于均值分布,我们需要熟悉的是这个分布的均值μ和方差σ^2/n,标准差σ⁄√n,以及将一般均值分布转化为标准正态分布的方法:Z=u=(X̅-μ)/(σ⁄√n),然后能根据正态分布表查值即可。

由于均值分布通常会用来进行假设检验,我们会接触到另外一个概念,显著性水平α,那么α和标准正态曲线(Z表)有什么联系呢?请看下图(双侧检验为例),由于对称和双侧检验,所以每边的尾端阴影部分概率大小均为它的一半 α/2,它与标准正态分布表中的对应关系为α/2=0.5-P,也即P=0.5-α/2,我们可以很容易地根据正态分布表的近似P值查到相应的Z值和Y值。

7ed5ec5d614cecce3d2b22ea941340e3.png

      U分布的简单应用:

32dea182352a5d9c0065210a00568823.png

如有兴趣了解更多,还可访问https://sciencing.com/calculate-distribution-mean-6715845.html

3.  卡方(χ^2)分布(Chi-Square distribution)

卡方分布又是怎么来的呢?χ^2的符号就是“卡方分布”的缩写记号而已,相当于一般函数的记号f(x)一样,不能把它当作x^2!之所以卡方分布的符号记成平方的形式,是由于卡方分布的由来与平方有关,试看它的定义:

设X~N(0,1), x_1, x_2,…,x_n是总体X抽取的随机样本,则〖x_1〗^2+〖x_2〗^2+⋯+〖x_n〗^2是服从以n为自由度的χ^2分布,记作χ^2  ~〖χ^2〗_((n)),自由度df=n.(自由度(degreeof freedom,df)就是所有类别中可以自由改变的类别数,在卡方分布中这n个样本数据都是可以自由更换的,只要它们是来自N(0,1)总体就可以了。)

由此可知,卡方分布就是n项标准正态分布中抽出来的样本数据的平方和的分布特征,它的密度函数为:

59bf1083f9e4d9fc1013fbdb73f47a00.png

函数图像如下图所示

3a8053cfe24219eddb644049966ff7b4.png

其中横坐标表示卡方函数的取值x,,纵坐标表示x所对应的p(x)概率大小,概率密度图像与横坐标围成的面积之和为1。卡方分布是一个正偏态分布(一般看函数图像均值偏向小的一边为正,偏向大的一边为负)。随着每次抽取的随机变量X的个数不同,其分布的形状会发生变化,n越小,分布偏斜;n越大,则会越接近于正态分布;当自由度n趋向无穷时,卡方分布即为正态分布。到此可见,无论是均值分布还是卡方分布,其图像都与正态分布存在着千丝万缕的联系。

由于卡方分布密度函数计算比较复杂,因而人们编制了χ^2分布表,表中列出了χ^2变量在不同自由度下的临界值63c11b6baf46c1d7f68c4d8dab2155e4.png(单侧) [如果是双侧检验,为了便于记忆,则记一边为aa38b96c9f2ed7170b8ce7e0ab7f1106.png,另一边为d297c9b9d689662ebc1ea89e4981cce5.png,因为它的函数图像并不对称,因此不能将两边阴影部分的面积都当成是α/2]。

fd87fdc6e1d964b5e59c197ff50645a4.png

卡方分布多用于卡方检验,这部分内容将在后面学习非参数假设检验的时候进行深入介绍,目前需要掌握的就是能看懂卡方分布表,以及了解卡方统计量如何构造:如果样本数据来自(标准)正态分布,则计算这些数据平方和的方法就可以视为一个卡方统计量。

例如,当对总体方差进行估计区间估计时。

6df7ded601b27f8da6e9a99d0fedb3c2.png

如有兴趣了解更多,还可访问

https://www.statisticshowto.datasciencecentral.com/probability-and-statistics/chi-square/

4. t分布(t-distribution)

从卡方分布开始,我们就是通过构造统计量,从而得到相应的分布规律;同样的,t分布的产生也是如此。结合参数估计的实际应用,对于t分布的由来,我更想将其与参数估计联系在一起。

由前面的u分布可知,当总体方差σ^2未知时,要对总体的均值u进行估计,就需要利用u分布的基本性质,利用标准正态分布的转化方法构造出统计量 Z=(X ̅-μ)/(σ⁄√n),从而可以得到对总体均值进行区间估计的方法。

而如果总体方差σ^2未知,同样要对总体的均值μ进行估计,那么又应该如何解决这个问题呢?我们看到,(X ̅-μ)/(σ⁄√n)表达式中的σ此时也变成了未知,则没办法直接继续使用上一种情况的方法构造出统计量,但是我们又知道,样本的方差的调整值 S_(n-1)^2可以看成总体方差的一个无偏估计,那么就可以用这个无偏估计值来取代上一种情况统计量中的σ,即(X ̅-μ)/(S⁄√n),这样一来,我们就引出了t分布统计量的基本形式:

236d8acb29f23e72c6efef840decdeaf.png

be7df2c0ffc5915e8fc177c8800ec0aa.png

db4caf99d7a916bf69fa72ad8fdb2194.png

T分布在后面的假设检验中将扮演关键的作用,如相关样本的 t检验、独立样本 t检验中都是对 t分布的实际应用。

如有兴趣了解更多,还可访问

https://www.statisticshowto.datasciencecentral.com/probability-and-statistics/t-test/

5. F分布( F-distribution)

 对于F分布,目前只要知道它的基本定义以及会查 F分布表就可以了。

333d794be963a53ff543792ac7b9a233.png

如有兴趣了解更多,还可访问

https://www.thoughtco.com/f-distribution-3126583

由于编辑时间仓促,疏漏之处在所难免,如发现问题,欢迎批评指正!

参考文献:

张敏强. 教育与心理统计学[M].北京:人民教育出版社,2010,11: 105-133.

刘新平 等. 教育统计与测评导论[M].北京:科学出版社,2013,11: 43-60.

[美]亚瑟∙阿伦 等著,方双虎 等译. 心理统计学(第5版)[M].北京:中国人民大学出版社,2017,10:98-124.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/532230.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新颖的c语言题目,新颖版c语言经典习题100例(全面面)

新颖版c语言经典习题100例(全面面) (66页)本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦!19.90 积分实用文档C语言习题100例(最新整理版)习题目录:(按住Ctrl点击可以快速跳转到…

c语言jt808协议库,平台如何应答——关于JT/T808协议

前两篇也说明了一些应答的相关内容,对于刚接触的开发者来说恐怕还是不太容易理解,这里专门列举一个篇幅来讲解如何针对终端设备上报的信息进行应答。严格来讲,如果不应答,终端设备会判别为服务平台断开连接,就会重复发…

熊猫的python小课账号_学习python中的pandas有没有好的教程推荐?

之前好多人私信我python数据分析怎么快速入门,我在这里直接介绍一下自己的心得经验吧。 要学习pandas,我并不建议看大量的教程,等看完教程,天都黑了,一觉醒来热情都凉了。 我的建议是,首先放平心态&#xf…

ubuntu nfs linux,Ubuntu的NFS功能配置

环境:Ubuntu 10.04步骤:1.sudo apt-get install portmap2.sudo apt-get install nfs-kernel-server注意:第2步我安装失败,换源后仍然如此,最后我在新立得里面搜索到nfs-kernel-server,安装成功3.在更目录下新建共享目录:mkdir /forlinux4.gedit /etc/exprots,在后面添加/forlin…

一个android工程生成两个aar,android studio生成aar包并在其他工程引用aar包(示例代码)...

1.aar包是android studio下打包android工程中src、res、lib后生成的aar文件,aar包导入其他android studio 工程后,其他工程可以方便引用源码和资源文件2.生成aar包步骤:①.用android studio打开一个工程,然后新建一个Module&#…

android 尺寸变化动画,Android ScaleAnimation类:尺寸变化动画类

ScaleAnimation类是Android系统中的尺寸变化动画类,用于控制View对象的尺寸变化,该类继承于Animation类。 ScaleAnimation类中的很多方法都与Animation类一致,该类中最常用的方法便是ScaleAnimation构造方法。【基本语法】public ScaleAnimat…

javascript 本地对象和内置对象_详解 JavaScript 面向对象

1. 概述JavaScript面向对象比较难理解的点是类的继承。不管是es5写法还是es6写法,JavaScript继承的本质是原型链。具体可看我的上一篇文章:田浩:详解原型、原型链、构造函、实例、new​zhuanlan.zhihu.com因为es6有专门的语法,写法…

工作汇报ppt案例_【赠书】开工大吉!今年一定要干过写PPT的!

不知不觉,春节就过去了,新年开工,朋友圈里晒满了开工红包,领了开工礼就意味着真正新的一年开始了。虽然假期的慵懒安逸留下了倦怠的后遗症,但状态依旧切换到工作模式,毕竟每年都希望能比过去更进一步&#…

postscript打印机什么意思_涨知识|你不知道的关于打印机的打印过程和打印机驱动的那些事...

以前一直以为打印很简单,不就是编辑好文件按个“打印”就行了?但其实打印过程可以复杂到你分分钟“怀疑人生”。你以为的打印过程可能是这样的 ↓。我们看到的打印过程然而,真正的打印过程是这样的 ↓。实际上的打印过程打印机打印一页文件或…

python dicom图像分割_python读取DICOM头文件的实例

这篇文章主要介绍了关于python 读取DICOM头文件的实例,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 用dicompyler软件打开dicom图像,头文件如图所示:当然也可以直接读取: ds dicom.read_…

索尼android电视图片轮播,电视投屏居然还能这样玩?

原标题:电视投屏居然还能这样玩?现如今,投屏几乎成为大家日常生活必不可少的一种观影方式,通过电视投屏可以带来更清晰的画面效果,成为追剧党以及各类球赛爱好者的不二之选。那么今天小智就以索尼电视为例,…

android 高并发弹幕,高并发实时直播弹幕研发实践

高并发实时直播弹幕研发实践直播间特点聊天室限制人数的原因应对万级以上的实时互动跨服务器是为了解决单一服务器接入数量限制、发布消息吞吐限制等问题;多进程并发则是为了充分利用多核CPU以及减小一个循环规模从而达到降低延迟的目的。云巴实时系统的设计云巴是基…

linux python3_在Linux上安装Python 3

在Linux上安装Python 3这份文档描述了如何在Ubuntu Linux机器上安装Python 3.6。 想要获取已安装的Python 3版本号,可以通过终端运行命令: $ python3 --version 如果您使用的是Ubuntu 16.10或更新,可以通过以下命令简单地安装Python 3.6: $ s…

android手机电话铃声设置,安卓手机铃声怎么设置

网上有很多安卓手机铃声的设置教程,说什么SD卡里建立这个那个的文件夹,那问题是怎么才能进到SD卡里去建立文件夹啊?手机里哪个选项里进去呢?这里小编告诉你,可以通过电脑连接数据线管理SD卡。下面介绍两种简单的设置安…

安装squid_「首席推荐」设置Squid转发代理或者正向代理

如果您正在阅读这篇文章,您可能会因为缺少与Squid相关的信息而感到沮丧,Squid是一种非常流行的转发代理。这些令人沮丧的事情包括:在小的软件修订之后出现的重大的可用性变化,对幕后发生的事情的误解,以及真正糟糕的文档。这是一个…

android区域截图app,【干货】最新App应用市场截图尺寸大全

今天给大家分享最新的干货,刚好碰上这段时间设计市场截图,所以给各位设计新人,分享本人整合的尺寸大全,希望对你们的设计之路有所帮助。一、IOS App Store尺寸尺寸(机型) 大小(px)3.5寸(iphone4/4s)…

2018python做图形界面哪个库简单_2018年常见的python编程开发库都有哪些类型

python编程开发可以说是目前比较热门的一项编程开发语言了,而今天我们就一起来了解一下,关于python编程都有哪些常见的python库可以使用。1、TensorFlow “TensorFlow是一个使用数据流图进行数值计算的开源软件库。图形节点表示数学运算,而图…

c++ socket线程池_java 网络编程,Socket编程

Java的网络编程主要涉及到的内容是Socket编程,那么什么是Socket呢?简单地说,Socket,套接字,就是两台主机之间逻辑连接的端点。TPC/IP协议是传输层协议,主要解决数据如何在网络中传输,而HTTP是应…

android签名忘记密码,修改Android签名证书keystore的密码、别名alias以及别名密码

之前在测试Eclipse ADT的Custom debug Eclipse ADT的Custom debug keystore所需证书规格,提到过自定义调试证书的密码和1. 首先当然是先复制一份正式证书出来作为要修改为的临时调试证书。2. 修改keystore密码的命令(keytool为JDK带的命令行工具):keytoo…

识别物体是否存在_【科学实践Vol.1】带你玩转“人脸识别”

随着时代的发展,人脸识别在我们的生活中变得随处可见:商场里的人脸识别储物柜,校园里的人脸识别刷卡机,手机里的面部解锁……这些应用极大的便利了我们的日常生活。今天,就让我们一起走进人脸识别的原理世界。首先我们…