深度解析统计学四大分布:Z、卡方、t 与 F 的关联与应用

统计学关键分布:Z、卡方、t、F 的关系探秘与应用指南

A/B实验系列相关文章(置顶)

1. A/B实验之置信检验(一):如何避免误判和漏报
2. A/B实验之置信检验(二):置信检验精要
3. A/B实验之置信检验(三):序贯检验
4. 卡方分布:理论、应用与实例解析
5. 深入理解P值与置信度检验:概念、方法及实例解析
6. 深度解析统计学四大分布:Z、卡方、t 与 F 的关联与应用
7. 中心极限定理:以番茄为引串联 Z、卡方、t 、F 分布

一、引言

在统计学领域,Z分布、卡方分布、t分布与F分布是极为重要的概率分布,它们在数据的分析与推断中发挥着关键作用。无论是科学研究、质量控制,还是工业界 AB Test 等场景,这些分布都为理解和解读数据提供了有力工具。本文将深入探讨t分布与F分布的产生背景、构造思路、特点及适用场景,并与Z分布、卡方分布进行对比,辅以具体例子,助力读者全面掌握这些重要概念。

二、四种分布的对比

为更清晰地理解这四种分布,以下从常见数学角度进行对比:

分布名称定义与公式分布形状参数特点均值与方差常见应用场景与其他分布关系
Z分布(标准正态分布)若随机变量 Z Z Z的概率密度函数为 f ( z ) = 1 2 π e − z 2 2 f(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}} f(z)=2π 1e2z2 − ∞ < z < + ∞ -\infty < z < +\infty <z<+,则 Z Z Z服从标准正态分布,记作 Z ∼ N ( 0 , 1 ) Z \sim N(0, 1) ZN(0,1)钟形对称,关于 z = 0 z = 0 z=0对称无额外参数,固定为均值 μ = 0 \mu = 0 μ=0,标准差 σ = 1 \sigma = 1 σ=1均值 E ( Z ) = 0 E(Z)=0 E(Z)=0,方差 D ( Z ) = 1 D(Z)=1 D(Z)=11. 总体标准差已知时,对总体均值的假设检验,如 Z = X ˉ − μ σ n Z=\frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}} Z=n σXˉμ用于单样本均值检验
2. 大样本情况下,对比例的假设检验
是正态分布的标准化形式,许多其他分布在一定条件下可近似为正态分布进而与Z分布关联
卡方分布 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,,Xn是相互独立且都服从标准正态分布 N ( 0 , 1 ) N(0, 1) N(0,1)的随机变量,则 Y = ∑ i = 1 n X i 2 Y = \sum_{i=1}^{n}X_{i}^{2} Y=i=1nXi2服从自由度为 n n n的卡方分布,记作 Y ∼ χ 2 ( n ) Y \sim \chi^{2}(n) Yχ2(n)当自由度 n n n较小时,分布呈右偏态;随着 n n n增大,逐渐趋近于正态分布自由度 n n n n n n决定分布形状均值 E ( χ 2 ( n ) ) = n E(\chi^{2}(n)) = n E(χ2(n))=n,方差 D ( χ 2 ( n ) ) = 2 n D(\chi^{2}(n)) = 2n D(χ2(n))=2n1. 总体方差的区间估计与假设检验
2. 拟合优度检验,判断样本数据是否符合某种理论分布
3. 独立性检验,判断两个分类变量是否相互独立
1. 若 Z ∼ N ( 0 , 1 ) Z \sim N(0, 1) ZN(0,1),则 Z 2 ∼ χ 2 ( 1 ) Z^{2} \sim \chi^{2}(1) Z2χ2(1)
2. 是 t t t分布和 F F F分布构造的基础之一
t分布设随机变量 X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1) Y ∼ χ 2 ( n ) Y \sim \chi^{2}(n) Yχ2(n),且 X X X Y Y Y相互独立,则 T = X Y n T = \frac{X}{\sqrt{\frac{Y}{n}}} T=nY X服从自由度为 n n n t t t分布,记作 T ∼ t ( n ) T \sim t(n) Tt(n)与标准正态分布类似,关于 t = 0 t = 0 t=0对称,但在小样本时尾部比标准正态分布更厚,极端值出现概率更大自由度 n n n n n n影响分布形状 n > 1 n > 1 n>1时,均值 E ( t ( n ) ) = 0 E(t(n)) = 0 E(t(n))=0;当 n > 2 n > 2 n>2时,方差 D ( t ( n ) ) = n n − 2 D(t(n))=\frac{n}{n - 2} D(t(n))=n2n1. 总体标准差未知时,对总体均值的假设检验,如单样本 t t t检验、独立样本 t t t检验、配对样本 t t t检验
2. 小样本情况下的区间估计
1. 当自由度 n n n较大( n ≥ 30 n \geq 30 n30)时, t t t分布近似于标准正态分布
2. 若 T ∼ t ( n ) T \sim t(n) Tt(n),则 T 2 ∼ F ( 1 , n ) T^{2} \sim F(1, n) T2F(1,n)
F分布设随机变量 U ∼ χ 2 ( n 1 ) U \sim \chi^{2}(n_1) Uχ2(n1) V ∼ χ 2 ( n 2 ) V \sim \chi^{2}(n_2) Vχ2(n2),且 U U U V V V相互独立,则 F = U n 1 V n 2 F=\frac{\frac{U}{n_1}}{\frac{V}{n_2}} F=n2Vn1U服从自由度为 ( n 1 , n 2 ) (n_1, n_2) (n1,n2) F F F分布,记作 F ∼ F ( n 1 , n 2 ) F \sim F(n_1, n_2) FF(n1,n2),其中 n 1 n_1 n1为分子自由度, n 2 n_2 n2为分母自由度形状取决于自由度 ( n 1 , n 2 ) (n_1, n_2) (n1,n2),通常为右偏态,随着 n 1 n_1 n1 n 2 n_2 n2增大,逐渐趋近于正态分布两个自由度 n 1 n_1 n1 n 2 n_2 n2,共同决定分布形状均值 E ( F ( n 1 , n 2 ) ) = n 2 n 2 − 2 E(F(n_1,n_2))=\frac{n_2}{n_2 - 2} E(F(n1,n2))=n22n2 n 2 > 2 n_2 > 2 n2>2),方差 D ( F ( n 1 , n 2 ) ) = 2 n 2 2 ( n 1 + n 2 − 2 ) n 1 ( n 2 − 2 ) 2 ( n 2 − 4 ) D(F(n_1,n_2))=\frac{2n_2^{2}(n_1 + n_2 - 2)}{n_1(n_2 - 2)^2(n_2 - 4)} D(F(n1,n2))=n1(n22)2(n24)2n22(n1+n22) n 2 > 4 n_2 > 4 n2>41. 方差齐性检验,判断两个总体方差是否相等
2. 单因素方差分析,检验多个总体均值是否相等
3. 回归方程的显著性检验
F ∼ F ( n 1 , n 2 ) F \sim F(n_1, n_2) FF(n1,n2),则 1 F ∼ F ( n 2 , n 1 ) \frac{1}{F} \sim F(n_2, n_1) F1F(n2,n1)

三、四种分布的关系

  1. Z分布与其他分布的关系
    • 与卡方分布
      若随机变量 Z Z Z 服从标准正态分布,即 Z ∼ N ( 0 , 1 ) Z \sim N(0, 1) ZN(0,1),则 Z 2 Z^2 Z2 服从自由度为 1 1 1 的卡方分布,可表示为:
      Z 2 ∼ χ 2 ( 1 ) Z^2 \sim \chi^{2}(1) Z2χ2(1)
      这是因为卡方分布定义为相互独立且服从标准正态分布 N ( 0 , 1 ) N(0, 1) N(0,1) 的随机变量的平方和。在此情形下,仅有一个标准正态分布随机变量 Z Z Z,其平方 Z 2 Z^2 Z2 便构成了自由度为 1 1 1 的卡方分布。
    • 与t分布
      t分布基于标准正态分布(Z分布)与卡方分布构造。当总体标准差 σ \sigma σ 已知时,对于样本均值 X ˉ \bar{X} Xˉ,其标准化后的统计量服从Z分布,常用于总体均值的假设检验,如单样本情形下的检验统计量为:
      Z = X ˉ − μ σ n Z = \frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}} Z=n σXˉμ
      然而,当总体标准差 σ \sigma σ 未知,需通过样本标准差 s s s 进行估计时,构造的检验统计量服从t分布。设 X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1) Y ∼ χ 2 ( n ) Y \sim \chi^{2}(n) Yχ2(n),且 X X X Y Y Y 相互独立,则 T = X Y n T = \frac{X}{\sqrt{\frac{Y}{n}}} T=nY X 服从自由度为 n n n 的t分布,记作 T ∼ t ( n ) T \sim t(n) Tt(n)
      在大样本情况下(通常 n ≥ 30 n \geq 30 n30),t分布逐渐趋近于标准正态分布。这是由于随着样本量 n n n 的增大,样本标准差 s s s 对总体标准差 σ \sigma σ 的估计愈发精确,使得t分布的不确定性逐渐减小,从而趋近于Z分布。
    • 与F分布
      通过t分布与F分布的关系,可间接建立Z分布与F分布的联系。已知若 T ∼ t ( n ) T \sim t(n) Tt(n),则有:
      T 2 ∼ F ( 1 , n ) T^{2} \sim F(1, n) T2F(1,n)
      在大样本时, T T T 近似服从Z分布,由此在一定条件下,借助t分布实现了Z分布与F分布的关联。此外,在涉及F分布的方差分析等检验中,若满足正态分布假设,Z分布的性质会在推导过程中间接体现。例如,在方差分析的理论推导中,样本均值的抽样分布在一定程度上与正态分布相关,进而与Z分布产生联系,而这种联系又通过F分布的构造与性质在分析过程中得以体现。
  2. 卡方分布与其他分布的关系
    • 与t分布
      t分布由一个服从标准正态分布的随机变量 X X X 和一个服从卡方分布的随机变量 Y Y Y 构造而成。设 X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1) Y ∼ χ 2 ( n ) Y \sim \chi^{2}(n) Yχ2(n),且 X X X Y Y Y 相互独立,则:
      T = X Y n T = \frac{X}{\sqrt{\frac{Y}{n}}} T=nY X
      T T T 服从自由度为 n n n 的t分布。在此构造中,卡方分布的自由度 n n n 直接决定了t分布的自由度。卡方分布随机变量 Y Y Y 反映了样本方差的相关信息,与标准正态分布随机变量 X X X 相结合,使得t分布适用于总体标准差未知时的统计推断。例如,在单样本t检验中,通过样本数据计算出的 T T T 值,依据t分布进行总体均值的假设检验,而其中样本方差的信息通过 Y ∼ χ 2 ( n ) Y \sim \chi^{2}(n) Yχ2(n) 得以体现。
    • 与F分布
      F分布由两个独立的卡方分布随机变量构造。设 U ∼ χ 2 ( n 1 ) U \sim \chi^{2}(n_1) Uχ2(n1) V ∼ χ 2 ( n 2 ) V \sim \chi^{2}(n_2) Vχ2(n2),且 U U U V V V 相互独立,则:
      F = U n 1 V n 2 F = \frac{\frac{U}{n_1}}{\frac{V}{n_2}} F=n2Vn1U
      F F F 服从自由度为 ( n 1 , n 2 ) (n_1, n_2) (n1,n2) 的F分布。卡方分布的自由度 n 1 n_1 n1 n 2 n_2 n2 分别作为分子自由度和分母自由度,直接决定了F分布的自由度,进而影响F分布的形状与性质。在方差分析中,通过对不同组样本方差基于卡方分布性质的分析,构建F统计量进行多个总体均值是否相等的检验。例如,组间方差和组内方差分别与卡方分布相关,通过两者的比值构造出F统计量,依据F分布判断不同总体均值是否存在显著差异。
  3. t分布与F分布的关系
    T ∼ t ( n ) T \sim t(n) Tt(n),则:
    T 2 ∼ F ( 1 , n ) T^{2} \sim F(1, n) T2F(1,n)
    这一关系在统计检验转换及理论推导中具有重要意义。例如,在某些假设检验中,原本基于t分布的检验可通过此关系转化为基于F分布的检验,为数据分析提供了更多的方法选择与灵活性。在回归分析中,对回归系数的显著性检验有时会利用该关系,将基于t分布的检验与基于F分布的检验相联系,从不同角度验证模型的有效性。例如,在一元线性回归中,对回归系数的t检验与对回归方程整体显著性的F检验之间存在内在联系,通过 T 2 ∼ F ( 1 , n ) T^{2} \sim F(1, n) T2F(1,n) 的关系,可在不同检验方法之间进行转换和验证。

四、t分布

(一)定义

设随机变量 X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1),即 X X X 服从标准正态分布。
设随机变量 Y ∼ χ 2 ( n ) Y \sim \chi^{2}(n) Yχ2(n),即 Y Y Y 服从自由度为 n n n 的卡方分布。
X X X Y Y Y 相互独立。
则随机变量 T T T 定义为:
T = X Y n T = \frac{X}{\sqrt{\frac{Y}{n}}} T=nY X
T T T 服从自由度为 n n n t t t 分布,记作 T ∼ t ( n ) T \sim t(n) Tt(n)

(二)“t”的由来

t分布由威廉·戈塞特(William Sealy Gosset)发现并提出。当时,戈塞特在爱尔兰都柏林的吉尼斯啤酒厂工作,受公司规定限制,他只能以笔名“Student”发表研究成果。在其早期关于小样本统计的研究中,使用字母“t”来表示基于小样本的新统计量。后续为纪念他的贡献,该分布被命名为t分布,“t”也就成为此分布的特定标识。

(三)产生背景

在统计学发展早期,常假定总体服从正态分布且总体标准差已知,基于此发展出如Z检验等统计方法。然而在现实中,总体标准差往往未知。例如,研究某工厂生产的零件长度,虽可假设其服从正态分布,但因生产过程中原材料细微差异、机器磨损等因素,确切的总体标准差难以获取。在这种情况下,传统基于已知总体标准差的方法不再适用,t分布便应运而生。

(四)构造思路

t分布基于标准正态分布和卡方分布构造。
已知 X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1),它可衡量数据与均值的偏离程度。
同时,引入 Y ∼ χ 2 ( n ) Y \sim \chi^{2}(n) Yχ2(n),卡方分布与样本方差紧密相关,能反映样本数据的离散程度。例如,从一批产品中抽取 n n n 个样本,通过计算样本与样本均值差的平方和等运算,可得到符合卡方分布的量。

X X X Y Y Y 相互独立,构造 T T T 如下:
T = X Y n T = \frac{X}{\sqrt{\frac{Y}{n}}} T=nY X
分子 X X X 衡量样本均值与总体均值的标准化差异,分母 Y n \sqrt{\frac{Y}{n}} nY 是对样本标准差估计的一种标准化度量。通过这种构造,将样本均值与总体均值的差异,与样本标准差的估计联系起来,以适应总体标准差未知的情况。

(五)特点

  1. 对称性:t分布的概率密度函数关于 t = 0 t = 0 t=0 对称,与标准正态分布类似,即t分布在 t t t 轴两侧形状相同。
  2. 与正态分布的关系:当自由度 n n n 逐渐增大时,t分布逐渐趋近于标准正态分布 N ( 0 , 1 ) N(0, 1) N(0,1)。一般而言,当 n ≥ 30 n \geq 30 n30 时,t分布与标准正态分布已非常接近,实际应用中可近似使用标准正态分布。但在小样本情况( n < 30 n < 30 n<30)下,t分布的尾部比标准正态分布更厚,极端值出现的概率相对较大。
  3. 均值与方差:对于 T ∼ t ( n ) T \sim t(n) Tt(n),当 n > 1 n > 1 n>1 时:
    E ( T ) = 0 E(T) = 0 E(T)=0
    n > 2 n > 2 n>2 时:
    D ( T ) = n n − 2 D(T)=\frac{n}{n - 2} D(T)=n2n

(六)适用场景与示例

  1. 单样本t检验:用于检验单个样本的均值是否等于某个已知值。
    例如,已知某种植物在常规环境下平均高度为 μ 0 \mu_0 μ0,现改变种植环境,抽取 n n n 株植物测量高度。假设抽取 n = 20 n = 20 n=20 株,测量后计算样本均值 x ˉ \bar{x} xˉ,样本标准差 s s s
    原假设 H 0 : μ = μ 0 H_0: \mu = \mu_0 H0:μ=μ0,备择假设 H 1 : μ ≠ μ 0 H_1: \mu \neq \mu_0 H1:μ=μ0
    计算t统计量:
    t = x ˉ − μ 0 s n t = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}} t=n sxˉμ0
    若计算出的t值对应的P值小于预先设定的显著性水平(如 α = 0.05 \alpha = 0.05 α=0.05),则拒绝原假设,认为新环境下植物平均高度与 μ 0 \mu_0 μ0 有显著差异。
  2. 独立样本t检验:用于比较两个独立样本的均值是否来自同一总体。
    例如,在药物临床试验中,将患者随机分为两组,一组服用新药,一组服用安慰剂。假设新药组有 n 1 = 30 n_1 = 30 n1=30 人,安慰剂组有 n 2 = 35 n_2 = 35 n2=35 人,治疗后测量某项指标。
    原假设 H 0 : μ 1 = μ 2 H_0: \mu_1 = \mu_2 H0:μ1=μ2 μ 1 \mu_1 μ1 为新药组指标均值, μ 2 \mu_2 μ2 为安慰剂组指标均值),备择假设 H 1 : μ 1 ≠ μ 2 H_1: \mu_1 \neq \mu_2 H1:μ1=μ2
    计算t统计量:
    t = x ˉ 1 − x ˉ 2 s 1 2 n 1 + s 2 2 n 2 t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} t=n1s12+n2s22 xˉ1xˉ2
    其中, x ˉ 1 \bar{x}_1 xˉ1 x ˉ 2 \bar{x}_2 xˉ2 为两组样本均值, s 1 2 s_1^2 s12 s 2 2 s_2^2 s22 为两组样本方差。根据t分布判断新药是否对治疗疾病有显著效果。
  3. 配对样本t检验:用于检验配对数据的均值差异。
    例如,对同一批学生在培训前后进行成绩测试,假设抽取 n = 50 n = 50 n=50 名学生。
    原假设 H 0 : μ d = 0 H_0: \mu_d = 0 H0:μd=0 μ d \mu_d μd 为培训前后成绩差值的均值),备择假设 H 1 : μ d ≠ 0 H_1: \mu_d \neq 0 H1:μd=0
    计算t统计量:
    t = d ˉ s d n t = \frac{\bar{d}}{\frac{s_d}{\sqrt{n}}} t=n sddˉ
    其中, d ˉ \bar{d} dˉ 为成绩差值的样本均值, s d s_d sd 为成绩差值的样本标准差。通过t分布判断培训是否有效。

五、F分布

(一)定义

设随机变量 U ∼ χ 2 ( n 1 ) U \sim \chi^{2}(n_1) Uχ2(n1),即 U U U 服从自由度为 n 1 n_1 n1 的卡方分布。
设随机变量 V ∼ χ 2 ( n 2 ) V \sim \chi^{2}(n_2) Vχ2(n2),即 V V V 服从自由度为 n 2 n_2 n2 的卡方分布。
U U U V V V 相互独立。
则随机变量 F F F 定义为:
F = U n 1 V n 2 F=\frac{\frac{U}{n_1}}{\frac{V}{n_2}} F=n2Vn1U
F F F 服从自由度为 ( n 1 , n 2 ) (n_1, n_2) (n1,n2) F F F 分布,记作 F ∼ F ( n 1 , n 2 ) F \sim F(n_1, n_2) FF(n1,n2),其中 n 1 n_1 n1 称为分子自由度, n 2 n_2 n2 称为分母自由度。

(二)“F”的由来

F分布由著名统计学家罗纳德·艾尔默·费希尔(Ronald Aylmer Fisher)提出。为纪念费希尔在方差分析等统计学领域的卓越贡献,乔治·W·斯内德克(George W. Snedecor)将这种用于方差分析和比较的分布命名为F分布,“F”取自费希尔(Fisher)的首字母。费希尔在统计学发展中地位举足轻重,提出了诸多重要统计方法与理论,F分布便是其中之一,在方差分析、回归分析等方面应用广泛。

(三)产生背景

在实际研究中,常需比较多个总体的方差或均值,如比较不同肥料对农作物产量的影响,或不同教学方法对学生成绩的影响等。为有效解决这类问题,F分布被引入统计学。它主要用于分析不同组数据的离散程度,帮助判断不同组数据之间的差异是由随机因素造成,还是确实存在显著差异。

(四)构造思路

F分布基于两个独立的卡方分布构造。
已知两个独立随机变量 U ∼ χ 2 ( n 1 ) U \sim \chi^{2}(n_1) Uχ2(n1) V ∼ χ 2 ( n 2 ) V \sim \chi^{2}(n_2) Vχ2(n2),其中 n 1 n_1 n1 n 2 n_2 n2 分别是它们的自由度。
构造 F F F 如下:
F = U n 1 V n 2 F=\frac{\frac{U}{n_1}}{\frac{V}{n_2}} F=n2Vn1U
分子 U n 1 \frac{U}{n_1} n1U 是对自由度为 n 1 n_1 n1 的卡方分布变量 U U U 的平均化处理,反映一种平均离散程度;分母 V n 2 \frac{V}{n_2} n2V 是对自由度为 n 2 n_2 n2 的卡方分布变量 V V V 的平均化处理,反映另一种平均离散程度。通过两者的比值,可比较这两种离散程度之间的关系。

(五)特点

  1. 非负性:F分布的取值范围是 ( 0 , + ∞ ) (0, +\infty) (0,+),因为它由两个卡方分布随机变量的比值构成,而卡方分布本身是非负的。
  2. 形状依赖自由度:F分布的形状取决于分子自由度 n 1 n_1 n1 和分母自由度 n 2 n_2 n2。不同的自由度组合会导致F分布的形状差异较大。一般来说,当 n 1 n_1 n1 n 2 n_2 n2 都较小时,F分布呈右偏态;随着 n 1 n_1 n1 n 2 n_2 n2 的增大,F分布逐渐趋近于正态分布。
  3. 倒数性质:若 F ∼ F ( n 1 , n 2 ) F \sim F(n_1, n_2) FF(n1,n2),则:
    1 F ∼ F ( n 2 , n 1 ) \frac{1}{F} \sim F(n_2, n_1) F1F(n2,n1)
    这一性质在一些统计计算和检验中非常有用,例如在双侧F检验中,可利用此性质简化计算。

(六)适用场景与示例

  1. 方差齐性检验:用于判断两个总体的方差是否相等。
    例如,在比较两个班级学生的考试成绩稳定性时,假设班级A有 n 1 = 40 n_1 = 40 n1=40 名学生,班级B有 n 2 = 45 n_2 = 45 n2=45 名学生。
    计算两个班级成绩的样本方差 s 1 2 s_1^2 s12 s 2 2 s_2^2 s22,构造F统计量:
    F = s 1 2 s 2 2 F = \frac{s_1^2}{s_2^2} F=s22s12(假设 s 1 2 ≥ s 2 2 s_1^2 \geq s_2^2 s12s22
    原假设 H 0 : σ 1 2 = σ 2 2 H_0: \sigma_1^2 = \sigma_2^2 H0:σ12=σ22 σ 1 2 \sigma_1^2 σ12 σ 2 2 \sigma_2^2 σ22 为两个班级成绩的总体方差),备择假设 H 1 : σ 1 2 ≠ σ 2 2 H_1: \sigma_1^2 \neq \sigma_2^2 H1:σ12=σ22。根据F分布判断两个班级成绩的方差是否相同,以决定后续使用何种统计方法进行均值比较。
  2. 单因素方差分析:用于检验多个总体均值是否相等。
    例如,研究三种不同品种的小麦在相同种植条件下的产量是否有显著差异。假设每种品种种植 n = 25 n = 25 n=25 块地,分别计算每个品种小麦产量的均值和组内方差。
    原假设 H 0 : μ 1 = μ 2 = μ 3 H_0: \mu_1 = \mu_2 = \mu_3 H0:μ1=μ2=μ3 μ 1 \mu_1 μ1 μ 2 \mu_2 μ2 μ 3 \mu_3 μ3 为三种品种小麦产量的总体均值),备择假设 H 1 H_1 H1:至少有两个总体均值不相等。通过计算组间方差和组内方差构造F统计量:
    F = 组间方差 组内方差 F = \frac{组间方差}{组内方差} F=组内方差组间方差
    依据F分布判断这些总体均值是否来自同一个总体。
  3. 回归方程的显著性检验:在回归分析中,检验自变量对因变量的解释能力是否显著。
    例如,建立一个关于销售额与广告投入、价格等自变量的回归方程。
    原假设 H 0 H_0 H0:所有自变量的系数都为0,即自变量对因变量无显著影响。
    通过计算回归平方和与残差平方和构造F统计量:
    F = 回归平方和 / 自变量个数 残差平方和 / ( n − 自变量个数 − 1 ) F = \frac{回归平方和 / 自变量个数}{残差平方和 / (n - 自变量个数 - 1)} F=残差平方和/(n自变量个数1)回归平方和/自变量个数
    其中, n n n 为样本数量。根据F分布判断回归方程整体是否显著,即所有自变量作为一个整体对因变量是否有显著影响。

六、结论

Z分布、卡方分布、t分布与F分布在统计学中各具重要作用且相互关联。t分布解决了总体标准差未知时样本推断总体的难题,尤其在小样本情况下表现出色;F分布则主要用于方差比较和多总体均值检验等场景。深入理解这些分布的定义、特点、应用场景以及它们之间的关系,对科研工作者、数据分析人员以及各领域决策者至关重要,有助于从数据中挖掘有价值的信息,做出科学合理的决策。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/892820.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Cesium在vue3中的简单使用

目录 一、介绍 二、创建和基础配置 2.1 使用vite创建vue3项目 2.2 安装所需依赖 2.3 修改配置文件vite.config.js 2.4 配置路由文件 2.5 使用路由文件 三、使用cesium原本的进行渲染 3.1 渲染效果 3.2 代码实现 3.2.1 默认效果代码 3.2.2 空白地图效果代码 3.2.3 修改默…

【Uniapp-Vue3】使用defineExpose暴露子组件的属性及方法

如果我们想要让父组件访问到子组件中的变量和方法&#xff0c;就需要使用defineExpose暴露&#xff1a; defineExpose({ 变量 }) 子组件配置 父组件配置 父组件要通过onMounted获取到子组件的DOM 传递多个属性和方法 子组件 父组件

小米vela系统(基于开源nuttx内核)——openvela开源项目

前言 在 2024 年 12 月 27 日的小米「人车家全生态」合作伙伴大会上&#xff0c;小米宣布全面开源 Vela 操作系统。同时&#xff0c;OpenVela 项目正式上线 GitHub 和 Gitee&#xff0c;采用的是比较宽松的 Apache 2.0 协议&#xff0c;这意味着全球的开发者都可以参与到 Vela…

1.15寒假作业

web&#xff1a;nss靶场ez_ez_php 打开环境&#xff0c;理解代码 使用个体传参的方法&#xff0c;首先代码会检查file参数的前三个字符是不是php&#xff0c;如果是就输出nice&#xff0c;然后用include函数包含file&#xff0c;绕过不是则输出hacker&#xff0c;如果没有file…

openharmony display

https://github.com/openharmony/drivers_peripheral/blob/master/display/README_zh.md 源码路径&#xff0c;这里是对rk3588的display层适配 device/soc/rockchip/rk3588/hardware/display ├── include └── src ├── display_device &#xff08;代码量最大的部分&…

如何在linux系统上完成定时任务

任务背景 1.需要每小时更新一次github的host端口&#xff1b; 2.需要每天早上七点半准时启动电脑。 更新github的host端口 在/past/to/路径里新建一个host_update.sh文件&#xff0c;运行以下命令获得访问&#xff0c;运行和修改这个文件路径的权限&#xff1a; sudo chmod…

osg中实现模型的大小、颜色、透明度的动态变化

以博饼状模型为对象,实现了模型大小、颜色、透明度的动态变化。 需要注意的是一点: // 创建材质对象osg::ref_ptr<osg::Material> material = new osg::Material;material->setDiffuse(osg::Material::FRONT_AND_BACK, osg::Vec4(0.0, 1.0, 0.0, 0.5));// 获取模型的…

golang之数据库操作

1.导入必要的包 import("database/sql"_ "github.com/go-sql-driver/mysql" //使用此作为数据库驱动 ) 2.相关操作 连接数据库 使用sql.Open()函数进行数据库的连接 db, err : sql.Open("mysql", "user:passwordtcp(127.0.0.1:3306)/db…

为ARM64架构移植Ubuntu20.04换源的发现

在为ARM64架构(RK3566)移植ubuntu20.04的时候发现在更换为国内源之后&#xff0c;无法正常完成apt update,报错为: Ign:25 http://mirrors.aliyun.com/ubuntu focal-updates/main arm64 Packages …

源码编译安装httpd 2.4,提供系统服务管理脚本并测试

总结需要安装的包 sudo yum groupinstall "Development Tools" -y #httpd的依赖包yum install tar -y #tar压缩包sudo yum install apr-devel apr-util-devel #APR库 提供跨平台接口的库sudo yum install pcre pcre-devel # PCRE库和 pcre-config工具--提供PCRE库…

【混合开发】CefSharp+Vue桌面应用程序开发

为什么选择CefSharpVue做桌面应用程序 CefSharp 基于 Chromium Embedded Framework (CEF) &#xff0c;它可以将 Chromium 浏览器的功能嵌入到 .NET 应用程序中。通过 CefSharp&#xff0c;开发者可以在桌面应用程序中集成 Web 技术&#xff0c;包括 HTML、JavaScript、CSS 等…

从0开始学习搭网站第二天

前言&#xff1a;今天比较惭愧&#xff0c;中午打铲吃了一把&#xff0c;看着也到钻二了&#xff0c;干脆顺手把这个赛季的大师上了&#xff0c;于是乎一直到网上才开始工作&#xff0c;同样&#xff0c;今天的学习内容大多来自mdn社区mdn 目录 怎么把文件上传到web服务器采用S…

nacos环境搭建以及SpringCloudAlibaba脚手架启动环境映射开发程序

1&#xff1a;下载nacos 地址&#xff1a;https://github.com/alibaba/nacos/tags 2:选择server的zip包下载 3:启动mysql服务&#xff0c;新建数据库&#xff1a;nacos_yh 4&#xff1a;解压下载的nacos_server 进入conf目录 5&#xff1a;mysql运行sql脚本变得到下面的表 6&a…

Spring MVC流程一张图理解

由于现在项目中大部分都是使用springboot了&#xff0c;但是ssm中的springmvc还是可以了解一下 1 、用户发送请求至前端控制器 DispatcherServlet 。 2 、 DispatcherServlet 收到请求调用 HandlerMapping 处理器映射器。 3 、处理器映射器找到具体的处理器 ( 可以根据 xml 配…

数据分析如何正确使用ChatGPT进行辅助?

目录 1.数据介绍 2.特征工程 3.EDA分析 4.数据相关性分析 5.分析总结 一篇优秀的学术论文&#xff0c;肯定有新颖、适当的论证视角&#xff0c;选择恰当的研究方法&#xff0c;搭建逻辑严密、平衡的论证框架&#xff0c;把有力的数据分析紧密结合起来&#xff0c;这样一篇…

学习 Git 的工作原理,而不仅仅是命令

Git 是常用的去中心化源代码存储库。它是由 Linux 创建者 Linus Torvalds 创建的&#xff0c;用于管理 Linux 内核源代码。像 GitHub 这样的整个服务都是基于它的。因此&#xff0c;如果您想在 Linux 世界中进行编程或将 IBM 的 DevOps Services 与 Git 结合使用&#xff0c;那…

赛灵思(Xilinx)公司Artix-7系列FPGA

苦难从不值得歌颂&#xff0c;在苦难中萃取的坚韧才值得珍视&#xff1b; 痛苦同样不必美化&#xff0c;从痛苦中开掘出希望才是壮举。 没有人是绝对意义的主角&#xff0c; 但每个人又都是自己生活剧本里的英雄。滑雪&#xff0c;是姿态优雅的“贴地飞行”&#xff0c;也有着成…

openplant实时数据库(二次开发)

资源地址 我的网盘〉软件>数据库>openplant>openplant实时数据库(二次开发)

SpringBoot链接Kafka

一、SpringBoot生产者 &#xff08;1&#xff09;修改SpringBoot核心配置文件application.propeties, 添加生产者相关信息 # 连接 Kafka 集群 spring.kafka.bootstrap-servers192.168.134.47:9093# SASL_PLAINTEXT 和 SCRAM-SHA-512 认证配置 spring.kafka.properties.securi…

Win11下python 调用C++动态链接库dll

这里写自定义目录标题 Win11下python 调用C动态链接库dll环境修改C语言代码Visual Studio 2019生成dllPython 加载DLLpython 数据类型适配python调用函数 Win11下python 调用C动态链接库dll 在一些耗时的函数上考虑使用C进行加速&#xff0c;涉及把cpp文件转为dll&#xff0c;…