数理统计中的卡方分布,t分布和F分布

有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有显式表达式,它们被称为统计中的“三大抽样分布”。这三大抽样分布即为著名的卡方分布,t分布F分布

1 卡方分布

1.1 定义

1.2 性质

2 t分布

2.1 定义

2.2 性质

3 F分布

3.1 定义

3.2 性质

4 正态总体样本均值和样本方差的分布

4.1 正态变量线性函数的分布​

4.2 正态变量样本均值和样本方差的分布

5 几个重要推论

6 总结

 



1 卡方分布

1.1 定义

设随机变量 X 是自由度为 n 的 χ2 随机变量, 则其概率密度函数为

\Gamma(\cdot )表示的是一个gamma函数,它是整数k的封闭形式。gamma函数的介绍如下伽马函数的总结。

\chi _{n}^{2} 的密度函数 g_{n}(x) 形状如下图

\chi _{n}^{2}密度函数的支撑集 (即使密度函数为正的自变量的集合) 为(0, +∞), 从上图可见当自由度 n 越大, \chi _{n}^{2} 的密度曲线越趋于对称, n
越小, 曲线越不对称. 当 n = 1, 2 时曲线是单调下降趋于 0. 当 n ≥ 3时曲线有单峰, 从 0 开始先单调上升, 在一定位置达到峰值, 然后单下降趋向于 0。

若 X ∼ \chi _{n}^{2}, 记 P(x> c)=\alpha,则 c=\chi _{n}^{2}(\alpha ) 称为 \chi _{n}^{2} 分布的上侧 \alpha 分位数, 如下图所示。当\alphan 给定时可查表求出 \chi _{n}^{2}(a) 之值,如\chi _{10}^{2}(0.01)=23.209\chi _{5}^{2}(0.05)=12.592 等。

1.2 性质

χ2 变量具有下列性质:


2 t分布

说起t分布,首先要提一句u分布,正态分布(normal distribution)是许多统计方法的理论基础。正态分布的两个参数μ和σ决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normaldistribution),亦称u分布。根据中心极限定理,通过抽样模拟试验表明,在正态分布总体中以固定 n 抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,σ)。所以,对样本均数的分布进行u变换,也可变换为标准正态分布N (0,1)

由于在实际工作中,往往σ(总体方差)是未知的,常用s(样本方差)作为σ的估计值,为了与u变换区别,称为t变换统计量t 值的分布称为t分布

2.1 定义

设随机变量 T ∼ t_{n}, 则其密度函数为

该密度函数的图形如下

t_{n}的密度函数与标准正态分布 N(0, 1) 密度很相似, 它们都是关于原点对称, 单峰偶函数, 在 x = 0 处达到极大. 但 t_{n} 的峰值低于
N(0, 1) 的峰值, t_{n} 的密度函数尾部都要比 N(0, 1) 的两侧尾部粗一些. 容易证明:

此处 \varphi (x)N(0, 1) 变量的密度函数。

若T ∼ t_{n},记P(\left | T \right |> c)=\alpha,则c={t_{n}}(\alpha /2)为自由度为nt分布的双侧\alpha分位数(如上图所示). 当给定 \alpha 时, {t_{n}}(\alpha ), {t_{n}}(\alpha /2)
等可通过查表求出. 例如 {t_{12}}(0.05)=1.782 ,{t_{9}}(0.025)=2.262等。

t 分布是英国统计学家 W.S. Gosset 在 1908 年以笔名 Student发表的论文中提出的, 故后人称为 “学生氏 (Student) 分布” 或 “t
布”。

2.2 性质

t 变量具有下列的性质:


3 F分布

3.1 定义

若随机变量 Z ∼F_{m,n}, 则其密度函数为

自由度为 m, n F 分布的密度函数如下图:

 

注意 F 分布的自由度 m n 是有顺序的, 当 m\neq n时, 若将自由度 m n 的顺序颠倒一下, 得到的是两个不同的 F 分布. 从上图
可见对给定 m = 10, n 取不同值时f_{m,n}(x) 的形状, 我们看到曲线是偏态的, n 越小偏态越严重。

若 F ∼ F_{m,n}, 记 P(F> c)=\alpha, 则 c=F_{m,n}(\alpha ) 称为 F 分布的上侧 \alpha 分位数 (见上图). 当 m, n\alpha 给定时, 可以通过查表求出
F_{m,n}(\alpha )之值, 例如F_{4,10}(0.05)=3.48,F_{10,15}(0.01)=3.80 等. 在区间估计和假设检验问题中常常用到.

3.2 性质

F 变量具有下列的性质:

以上性质中 (1) 和 (2) 是显然的, (3) 的证明不难. 尤其性质 (3)在求区间估计和假设检验问题时会常常用到. 因为当 α 为较小的数,
如 α = 0.05 或 α = 0.01, m, n 给定时, 从已有的 F 分布表上查不到 F_{m,n}(1-0.05)F_{m,n}(1-0.01) 之值, 但它们的值可利用性质(3) 求得, 因为 F_{n,m}(0.05)F_{n,m}(0.01) 是可以通过查 F 分布表求得的.


4 正态总体样本均值和样本方差的分布

为方便讨论正态总体样本均值和样本方差的分布, 我们先给出正态随机变量的线性函数的分布.

4.1 正态变量线性函数的分布

4.2 正态变量样本均值和样本方差的分布

下述定理给出了正态变量样本均值和样本方差的分布和它们的独立性.


5 几个重要推论

下面几个推论在正态总体区间估计和假设检验问题中有着重要应用.


6 总结

数据在使用前要注意采用有效的方法收集数据, 如设计好抽样方案, 安排好试验等等. 只有有效的收集了数据, 才能有效地使用数据,开展统计推断工作.获得数据后, 根据问题的特点和抽样方式确定抽样分布, 即统计模型. 基于统计模型, 统计推断问题可以按照如下的步骤进行:

  1. 确定用于统计推断的合适统计量;
  2. 寻求统计量的精确分布; 在统计量的精确分布难以求出的情形,可考虑利用中心极限定理或其它极限定理找出统计量的极限分布.
  3. 基于该统计量的精确分布或极限分布, 求出统计推断问题的精确解或近似解.
  4. 根据统计推断结果对问题作出解释

其中第二步是最重要, 但也是最困难的一步. 统计三大分布及正态总体下样本均值和样本方差的分布, 在寻求与正态变量有关的统计量精确分布时, 起着十分重要作用. 尤其在求区间估计和假设检验问题时可以看得十分清楚

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/405467.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电路设计时:TVS 管的最大钳位电压 VCMAX 应不大于电路的最大允许安全电压

TVS(管,也称为瞬态抑制二极管,是一种用于保护电子电路免受瞬态过电压损害的半导体器件。它能够在极短的时间内响应过电压事件,如电源浪涌、雷击、静电放电等,提供一个低阻抗的放电路径,从而限制电压在安全范围内。TVS管的最大钳位电压(V_CMAX)是指TVS管在规定的测试条件…

wpa_supplicant无线网络配置

From: http://blog.163.com/wxiongn126/blog/static/11788203820102262748358/ 目前可以使用wireless-tools 或wpa_supplicant工具来配置无线网络。请记住重要的一点是,对无线网络的配置是全局性的,而非针对具体的接口。 wpa_supplicant是一个较好的选…

关于绑定了GridView控件后怎么截取字符串和CSS样式来控制表头不换行

第一种&#xff1a; <HTML> <HEAD> <TITLE> New Document </TITLE> <style type"text/css"> .aa{ display: block; width: 200px; overflow: hidden; whi…

Bringing up interface eth0: Device eth0 does not seem to be present, delaying initialization

克隆虚拟机后&#xff0c;网卡无法启动&#xff0c;并报如下错误&#xff1a; 解决办法1.修改虚拟机克隆机的HWADDR为ifconfig -a的MAC地址 形如&#xff1a;HWADDR"xx:xx:xx:xx:xx:xx" 2.然后再做以下操作 # rm -rf /etc/udev/rules.d/70-persistent-net.rules # re…

在计算机发展的早期 计算机主要用于,全国网络统考《计算机应用基础》选择题复习...

全国网络统考《计算机应用基础》选择题复习 全国网络统考《计算机应用基础》选择题复习第一章计算机基础知识【例题与解析】、一般认为&#xff0c;世界上第一台电子计算机诞生于()。年年年年【解析一般认为&#xff0c;世界上第一台数字计算机于年在美国宾夕法尼亚大学研制成功…

数理统计中95%置信区间的含义

95%置信区间&#xff0c;意味着如果你用同样的步骤&#xff0c;去选样本&#xff0c;计算置信区间&#xff0c;那么100次这样的独立过程&#xff0c;有95%的概率你计算出来的区间会包含真实参数值&#xff0c;即大概会有95个置信区间会包含真值。而对于某一次计算得到的某一个置…

ubuntu tree 显示中文的方法

From: http://zhanxw.com/blog/2011/03/ubuntu-tree-%E6%98%BE%E7%A4%BA%E4%B8%AD%E6%96%87%E7%9A%84%E6%96%B9%E6%B3%95/ 解决方法&#xff1a;tree -N 正确的输出&#xff1a; …… | – 闻亭迎春-3.jpg |– 清华大学校园风物.rar |– 清华大学画册.pdf |– 清华大学矢量校…

MySQL相关文件

每一个数据库都会在MySQL数据目录下存在一个以数据库名称命令的文件夹&#xff0c;用来存放该数据库中的表数据文件。每种存储引擎会有各自的数据文件&#xff0c;命名方式和存放位置。 1) db.opt文件 新建数据库时&#xff0c;会在数据库目录下生成这个文件。用来定义数据…

岁月在变迁,彼此在成长。而我在流浪

岁月在变迁&#xff0c;彼此在成长。而我在流浪转载于:https://www.cnblogs.com/DTWolf/p/4638640.html

Linux 程序后台运行与删除

一、查看进程&#xff1a;ps 或 ps -a 二、命令后台运行&#xff1a; sudo ./runmyled.o& 命令后边跟个&, 返回进程id号 三、查看当前的进程&#xff1a; 四、删除进程&#xff1a;sudo kill id1 id2 id3

jquery html 片段,十条jQuery代码片段助力Web开发效率提升

JQuery是继prototype之后又一个优秀的Javascript库。它是轻量级的js库 &#xff0c;它兼容CSS3&#xff0c;还兼容各种浏览器(IE 6.0, FF 1.5, Safari 2.0, Opera 9.0)&#xff0c;jQuery2.0及后续版本将不再支持IE6/7/8浏览器。jQuery使用户能更方便地处理HTML(标准通用标记语…

React开发(255):react项目理解 ant design 注意报错提示

if (res.data.records.length 0 && pageUserIndex > 1) {

10 个在线正则表达式测试网站。

正则表达式&#xff0c;提供了简洁、灵活的手段&#xff0c;用于匹配文本字符串&#xff0c;如特定的字符&#xff0c;文字或字符样式。它对于初学者理解和使用所有的正则表达式语法是个头疼的事情。幸运的是&#xff0c;你可以获得在线帮助。 在这篇文章中&#xff0c;列举了1…

移动端开发——javascript

javascript(简称js)语言在移动前端应用很广。可以说必不可少&#xff0c;许多效果都是和js相关的。包括现在移动端的一些框架。jqmobi、jqtouch、sencha touch、jquerymobile等等。这些都是基于js而进行编写的。这篇暂时不讨论这些框架。以后会慢慢介绍其中的一两个框架的具体使…

Linux 源码编译安装过程-以安装XZ解压为例

一、描述 Linux安装软件一般有两种安装方式&#xff1a;安装包安装和源码安装。 1、安装包安装。安装包安装比较简单&#xff0c;例如采用apt-get install 软件名 命令&#xff0c;安装 deb 包的 Linux 操作系统&#xff08;例如Raspberry Debian、Ubuntu等&#xff09;中&a…

服装企业信息化计算机化的趋势,服装企业信息化建设的研究.pdf

服装企业信息化建设研究摘要随着信息经济时代的来临和经济全球化的进一步加快&#xff0c;信息化的浪潮正席卷全球&#xff0c;信息化革命正在打破并重组现存的国际经济秩序和结构&#xff0c;并促使其由物质型向信息型经济转变。随着经济的全球化趋势&#xff0c;如果没有信息…

symantec backup exec 2010 基本错误总结

1 由于介质服务器死机导致的作业失败2 由于网络阻塞或中断导致的作业失败3 由于设备出错、空间不足或损坏导致的作业失败4 由于相互关联的靠前作业失败牵涉靠后复制作业出错导致的作业失败5 由于作业时间安排不当导致的作业失败&#xff08;涉及到磁带的单进程写入&#xff09;…