f分布表完整图_【教育统计答疑】如何理解正态分布、均值分布、^2分布、t分布和F分布...

许多教育统计的初学者都表示这几个分布感到学起来非常吃力,结合最近上课的体会以及答疑的情况,觉得很有必要在这里简单地对这部分内容进行澄清和梳理,以助理解。

首先,“为什么要学习这几个分布”可能是许多人纠结的问题,明明已经在电脑中装了SPSS软件了,那么复杂而繁琐的公式不应该直接内置在软件之中就可以了吗?为什么还要花费功夫去学习它们呢?我只能说,在你对这部分内容不甚了解的情况下,你很难意识到其重要性。这些分布都各有所长,也就因为自然界和社会系统中这些分布存在的广泛性,使得教育统计领域许多习以为常的假设背后都有充分的根据,例如为什么心理能力测量数据的相关性可以选用皮尔逊(Pearson)系数、为什么样本的数量要在30个以上、为什么只有达到“显著性水平”,才能说不同的变量之间存在统计意义上的差异等……诸如这样的例子背后,都与数据的这些分布特征有关,正是由于知道如果从某个总体中抽取一定的数据作为样本,这些数据将会存在着一定的分布规律,我们才能大胆地根据样本数据对总体的情况进行大胆而有把握的判断和推理……因此,简而言之,当你能理解这些分布的时候,至少让你在根据数据结果做出推断的时候,对自己所得出的结论坚信不疑。

好了,解答完学习必要性的疑惑后,终于要进入正题了。

1.正态分布(Normal Distribution)

第一个我们要讨论的概念就是正态分布,正态分布是所有概率分布中最重要的形式,如果没有它,也就没有接下来的那几个分布。正态分布的特征表明被测事物处于稳定的状态下,测量数据的波动是由于偶然因素引起的,所以在实践中有广泛的应用。在稳定的系统环境(如自然、人类社会等),许多事物和现象都会服从正态分布,例如人的身高、体重和智商;各种商品的尺寸和质量;自然环境的温度、湿度和降雨量;考试的成绩等。正态分布的重要性还体现在用样本数据来推断总体时,当样本的数量足够大的时,可以利用样本的某些特征数据服从正态分布,进行推断,获得准确的结果。

正态分布一般记作  x~N(μ, σ^2),它的分布函数表达式为 ee0c49eb37dd73f8cdfa814269c3d1e1.png

其中,π是圆周率;e是自然对数的底;x为随机变量的取值;μ为正态分布的均值(期望),σ^2是正态分布的方差。

正态分布的函数图像是一条“中间高,两端低,左右对称的曲线”(如下图所示)。

dfc0cf4b0d300d82a94cc614f995e5d8.png

特别的,当μ=0,σ^2=1时,我们称X服从标准正态分布:X~N(0,1).

由于其分布函数比较复杂,函数图像将随着不同的和方差发生着变化,人们将一般的正态分布进行标准化,即对于一般的正态分布x~N(μ, σ^2),只要令Z=(x-μ)/σ,则转化为标准正态分布 Z~N(0,1).为了便于计算,人们制作出相应的数值表,方便对不同的数据代入值进行查询,这就是标准正态分布表(如下表)。

294b7e2c486215a31d07eca8a2a72dee.png

正态分布表是我们学习教育统计到目前为止接触到的第一个表,它比较特殊,每一个Z值都会对应一个Y值和P值,其中P值是我们比较关心的,也就是概率大小,如图所示,当Z_0=1.00的时候,直线Z=0,直线Z=1,正态曲线以及Z轴所围成的面积(也就是阴影部分)的概率大小为0.34134,写成数学表达式则为P{Z≤1.00}=0.34134。由于正态曲线是对称的,因此正态分布表所能查到的数据只有非负数,至于Z负半轴部分则很容易根据正半轴的情况进行推算。

利用正态分布以及标准正态分布表还有许多其他的实际应用,如将原始分转化为标准分数;根据录取率计算录取的上线分数等。关于正态分布的内容就先介绍这么多,如有兴趣的可以参考相关书籍深入了解。(张敏强.《教育与心理统计学》[M].北京:人民教育出版社,2010,11:88-100)

正态分布部分性质的证明:

1bbcf88021fa0c44b1b09b156d73a77e.png

dba46268435e03bd6a3a5565370db8b4.png

72e6b1e7674d41042a614ff1f7df1493.png

如有兴趣了解更多,还可访问https://www.investopedia.com/terms/n/normaldistribution.asp

2. 均值分布(Meandistribution)(μ分布,  μ-distribution)

现在开始讨论第二个分布,第一个分布是正态分布,正态分布是自然环境或者人类社会中普遍存在的数据分布特征,那么均值分布又是怎么来的呢?顾名思义,只要你从总体中随机抽取若干组(如m)相同容量(如n)的数据,然后将每一组都求平均值,那么这m个平均值的分布情况就形成了均值分布(它的标准化形式称为μ分布),而这样的均值分布在一般情况下和正态分布的特征基本一致,因此均值分布也是正态分布,只是它的形状一般会比总体更往对称轴靠拢了而已。

那么,如果用数学语言来描述它的定义,即为设X服从正态分布,其均值为μ,方差为σ^2,则X~N(μ ,σ^2  ),设x_1,x_2,…,x_n是总体X抽取的随机样本,则X̅=1/n ∑_(i=1)^n▒x_i 样本的平均数。由于从总体中可以抽出多组的容量为n的样本,则存在多个X̅,此时X ̅也服从正态分布,平均数为μ,方差为σ^2/n, 记作X̅~(μ,σ^2/n)

为方便查表,作变换,

757e7696b1e0137a80d830ce34e1dc77.png

则Z~N(0,1)标准正态分布,又称为Z分布,或u~N(0,1) , u分布。

对于均值分布,我们需要熟悉的是这个分布的均值μ和方差σ^2/n,标准差σ⁄√n,以及将一般均值分布转化为标准正态分布的方法:Z=u=(X̅-μ)/(σ⁄√n),然后能根据正态分布表查值即可。

由于均值分布通常会用来进行假设检验,我们会接触到另外一个概念,显著性水平α,那么α和标准正态曲线(Z表)有什么联系呢?请看下图(双侧检验为例),由于对称和双侧检验,所以每边的尾端阴影部分概率大小均为它的一半 α/2,它与标准正态分布表中的对应关系为α/2=0.5-P,也即P=0.5-α/2,我们可以很容易地根据正态分布表的近似P值查到相应的Z值和Y值。

7ed5ec5d614cecce3d2b22ea941340e3.png

      U分布的简单应用:

32dea182352a5d9c0065210a00568823.png

如有兴趣了解更多,还可访问https://sciencing.com/calculate-distribution-mean-6715845.html

3.  卡方(χ^2)分布(Chi-Square distribution)

卡方分布又是怎么来的呢?χ^2的符号就是“卡方分布”的缩写记号而已,相当于一般函数的记号f(x)一样,不能把它当作x^2!之所以卡方分布的符号记成平方的形式,是由于卡方分布的由来与平方有关,试看它的定义:

设X~N(0,1), x_1, x_2,…,x_n是总体X抽取的随机样本,则〖x_1〗^2+〖x_2〗^2+⋯+〖x_n〗^2是服从以n为自由度的χ^2分布,记作χ^2  ~〖χ^2〗_((n)),自由度df=n.(自由度(degreeof freedom,df)就是所有类别中可以自由改变的类别数,在卡方分布中这n个样本数据都是可以自由更换的,只要它们是来自N(0,1)总体就可以了。)

由此可知,卡方分布就是n项标准正态分布中抽出来的样本数据的平方和的分布特征,它的密度函数为:

59bf1083f9e4d9fc1013fbdb73f47a00.png

函数图像如下图所示

3a8053cfe24219eddb644049966ff7b4.png

其中横坐标表示卡方函数的取值x,,纵坐标表示x所对应的p(x)概率大小,概率密度图像与横坐标围成的面积之和为1。卡方分布是一个正偏态分布(一般看函数图像均值偏向小的一边为正,偏向大的一边为负)。随着每次抽取的随机变量X的个数不同,其分布的形状会发生变化,n越小,分布偏斜;n越大,则会越接近于正态分布;当自由度n趋向无穷时,卡方分布即为正态分布。到此可见,无论是均值分布还是卡方分布,其图像都与正态分布存在着千丝万缕的联系。

由于卡方分布密度函数计算比较复杂,因而人们编制了χ^2分布表,表中列出了χ^2变量在不同自由度下的临界值63c11b6baf46c1d7f68c4d8dab2155e4.png(单侧) [如果是双侧检验,为了便于记忆,则记一边为aa38b96c9f2ed7170b8ce7e0ab7f1106.png,另一边为d297c9b9d689662ebc1ea89e4981cce5.png,因为它的函数图像并不对称,因此不能将两边阴影部分的面积都当成是α/2]。

fd87fdc6e1d964b5e59c197ff50645a4.png

卡方分布多用于卡方检验,这部分内容将在后面学习非参数假设检验的时候进行深入介绍,目前需要掌握的就是能看懂卡方分布表,以及了解卡方统计量如何构造:如果样本数据来自(标准)正态分布,则计算这些数据平方和的方法就可以视为一个卡方统计量。

例如,当对总体方差进行估计区间估计时。

6df7ded601b27f8da6e9a99d0fedb3c2.png

如有兴趣了解更多,还可访问

https://www.statisticshowto.datasciencecentral.com/probability-and-statistics/chi-square/

4. t分布(t-distribution)

从卡方分布开始,我们就是通过构造统计量,从而得到相应的分布规律;同样的,t分布的产生也是如此。结合参数估计的实际应用,对于t分布的由来,我更想将其与参数估计联系在一起。

由前面的u分布可知,当总体方差σ^2未知时,要对总体的均值u进行估计,就需要利用u分布的基本性质,利用标准正态分布的转化方法构造出统计量 Z=(X ̅-μ)/(σ⁄√n),从而可以得到对总体均值进行区间估计的方法。

而如果总体方差σ^2未知,同样要对总体的均值μ进行估计,那么又应该如何解决这个问题呢?我们看到,(X ̅-μ)/(σ⁄√n)表达式中的σ此时也变成了未知,则没办法直接继续使用上一种情况的方法构造出统计量,但是我们又知道,样本的方差的调整值 S_(n-1)^2可以看成总体方差的一个无偏估计,那么就可以用这个无偏估计值来取代上一种情况统计量中的σ,即(X ̅-μ)/(S⁄√n),这样一来,我们就引出了t分布统计量的基本形式:

236d8acb29f23e72c6efef840decdeaf.png

be7df2c0ffc5915e8fc177c8800ec0aa.png

db4caf99d7a916bf69fa72ad8fdb2194.png

T分布在后面的假设检验中将扮演关键的作用,如相关样本的 t检验、独立样本 t检验中都是对 t分布的实际应用。

如有兴趣了解更多,还可访问

https://www.statisticshowto.datasciencecentral.com/probability-and-statistics/t-test/

5. F分布( F-distribution)

 对于F分布,目前只要知道它的基本定义以及会查 F分布表就可以了。

333d794be963a53ff543792ac7b9a233.png

如有兴趣了解更多,还可访问

https://www.thoughtco.com/f-distribution-3126583

由于编辑时间仓促,疏漏之处在所难免,如发现问题,欢迎批评指正!

参考文献:

张敏强. 教育与心理统计学[M].北京:人民教育出版社,2010,11: 105-133.

刘新平 等. 教育统计与测评导论[M].北京:科学出版社,2013,11: 43-60.

[美]亚瑟∙阿伦 等著,方双虎 等译. 心理统计学(第5版)[M].北京:中国人民大学出版社,2017,10:98-124.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/532230.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c语言第一章考试题及答案,C语言考试题库及答案整理版.doc

C语言考试题库及答案整理版.docC语言理论上机考试选择题部分(共200题)1、下面程序的输出是___D______#includevoid main(){ int k11;printf("k%d,k%o,k%x\n",k,k,k);}A) k11,k12,k11 B) k11,k13,k13C) k11,k013,k0xb D) k11,k13,kb2、在下列选项中,不正确的赋值语句是…

python每天定时9点执行_python每天定时运行某程序代码

思路:利用time函数返回的时间字符串与指定时间字符串做比较,相等的时候执行对应的操作。不知道大家的思路是什么,感觉这样比较耗CPU。。。。 此处设置为15:30:10 输出相应内容,需要执行什么,就修改什么。 import time …

新颖的c语言题目,新颖版c语言经典习题100例(全面面)

新颖版c语言经典习题100例(全面面) (66页)本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦!19.90 积分实用文档C语言习题100例(最新整理版)习题目录:(按住Ctrl点击可以快速跳转到…

c语言jt808协议库,平台如何应答——关于JT/T808协议

前两篇也说明了一些应答的相关内容,对于刚接触的开发者来说恐怕还是不太容易理解,这里专门列举一个篇幅来讲解如何针对终端设备上报的信息进行应答。严格来讲,如果不应答,终端设备会判别为服务平台断开连接,就会重复发…

熊猫的python小课账号_学习python中的pandas有没有好的教程推荐?

之前好多人私信我python数据分析怎么快速入门,我在这里直接介绍一下自己的心得经验吧。 要学习pandas,我并不建议看大量的教程,等看完教程,天都黑了,一觉醒来热情都凉了。 我的建议是,首先放平心态&#xf…

rssi定位算法 c语言,【论文※】An RSSI Gradient-based AP Localization Algorithm 基于RSSI梯度的AP定位算法...

摘要:Recent rapid rise of indoor location based services for smartphones has further increased the importance of precise localization of Wi-Fi Access Point(AP).However,most existing AP localization algorithms either exhibit high errors or need s…

arm体系结构与编程_教程:如何学习嵌入式系统(基于ARM平台)

一、嵌入式系统的概念 着重理解“嵌入”的概念 主要从三个方面上来理解。 1、从硬件上,将基于CPU的处围器件,整合到CPU芯片内部,比如早期基于X86体系结构下的计算机,CPU只是有运算器和累加器的功能,一切芯片要造外部…

ubuntu nfs linux,Ubuntu的NFS功能配置

环境:Ubuntu 10.04步骤:1.sudo apt-get install portmap2.sudo apt-get install nfs-kernel-server注意:第2步我安装失败,换源后仍然如此,最后我在新立得里面搜索到nfs-kernel-server,安装成功3.在更目录下新建共享目录:mkdir /forlinux4.gedit /etc/exprots,在后面添加/forlin…

python import 路径_python import 上级目录的导入

python import 上级目录的导入,路径,上级,文件,目录,递归 python import 上级目录的导入 易采站长站,站长之家为您整理了python import 上级目录的导入的相关内容。 有时候我们可能需要import另一个路径下的python文件,例如下面这个目录结构,…

一个android工程生成两个aar,android studio生成aar包并在其他工程引用aar包(示例代码)...

1.aar包是android studio下打包android工程中src、res、lib后生成的aar文件,aar包导入其他android studio 工程后,其他工程可以方便引用源码和资源文件2.生成aar包步骤:①.用android studio打开一个工程,然后新建一个Module&#…

python设计一个动物类_我用Python实现了12500张猫狗图像的精准分类

我用 Python 实现了 12500 张猫狗图像的精准分类 在这篇文章中,我们将展示如何建立一个深度神经网 络,能做到以 90% 的精度来对图像进行分类,而在深度神 经网络,特别是卷积神经网络兴起之前,这还是一个非常困 难的问题…

android 尺寸变化动画,Android ScaleAnimation类:尺寸变化动画类

ScaleAnimation类是Android系统中的尺寸变化动画类,用于控制View对象的尺寸变化,该类继承于Animation类。 ScaleAnimation类中的很多方法都与Animation类一致,该类中最常用的方法便是ScaleAnimation构造方法。【基本语法】public ScaleAnimat…

javascript 本地对象和内置对象_详解 JavaScript 面向对象

1. 概述JavaScript面向对象比较难理解的点是类的继承。不管是es5写法还是es6写法,JavaScript继承的本质是原型链。具体可看我的上一篇文章:田浩:详解原型、原型链、构造函、实例、new​zhuanlan.zhihu.com因为es6有专门的语法,写法…

android wifi设备连接通信,通过wifi与设备进行通信(Android)

通过wifi与设备进行通信(Android)[复制链接]本帖最后由 灞波儿奔 于 2019-2-17 21:40 编辑通过wifi与设备进行通信(Android)最近leader决定把app与设备之间的通信改为wifi,通过http协议实现设备之间的通信。相对与之前的蓝牙通信,的确简单不少&#xff0…

工作汇报ppt案例_【赠书】开工大吉!今年一定要干过写PPT的!

不知不觉,春节就过去了,新年开工,朋友圈里晒满了开工红包,领了开工礼就意味着真正新的一年开始了。虽然假期的慵懒安逸留下了倦怠的后遗症,但状态依旧切换到工作模式,毕竟每年都希望能比过去更进一步&#…

android webview 长按复制,Android webview 点击或长按有蒙层 – 热爱改变生活

Android 使用 webview 加载本地 html,在本地 html 上面点击的时候会有一层橙色的蒙层,使用下面的代码可以去掉。body, div, dl, dt, dd, ul, ol, li, h1, h2, h3, h4, h5, h6, pre, code, form, fieldset, legend, input, button, textarea, p, blockquo…

postscript打印机什么意思_涨知识|你不知道的关于打印机的打印过程和打印机驱动的那些事...

以前一直以为打印很简单,不就是编辑好文件按个“打印”就行了?但其实打印过程可以复杂到你分分钟“怀疑人生”。你以为的打印过程可能是这样的 ↓。我们看到的打印过程然而,真正的打印过程是这样的 ↓。实际上的打印过程打印机打印一页文件或…

python dicom图像分割_python读取DICOM头文件的实例

这篇文章主要介绍了关于python 读取DICOM头文件的实例,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 用dicompyler软件打开dicom图像,头文件如图所示:当然也可以直接读取: ds dicom.read_…

索尼android电视图片轮播,电视投屏居然还能这样玩?

原标题:电视投屏居然还能这样玩?现如今,投屏几乎成为大家日常生活必不可少的一种观影方式,通过电视投屏可以带来更清晰的画面效果,成为追剧党以及各类球赛爱好者的不二之选。那么今天小智就以索尼电视为例,…

python源码多平台编译_提升Python程序运行效率的6个方法

Python是一个很酷的语言,因为你可以在很短的时间内利用很少的代码做很多事情。不仅如此,它还能轻松地支持多任务,比如多进程等。Python批评者有时会说Python执行缓慢。本文将尝试介绍6个技巧,可加速你的Python应用程序。 1.让关键…