【数理统计】5-假设检验、参数与非参数检验

文章目录

  • 一、前言
  • 二、参数检验和非参数检验
    • 2.1 卡方检验(非参数检验)
      • 2.1.1 单因素卡方检验例子
      • 2.1.2 双因素卡方检验
    • 2.2 t检验(参数检验)
      • 2.2.1 单样本t检验(One-Sample t-Test)
      • 2.2.2 独立样本t检验(Independent Samples t-Test)
        • 2.2.2.1 当两样本方差相等时
        • 2.2.2.2 当两样本方差不相等时
      • 2.2.3 配对样本t检验(Paired Samples t-Test)
    • 2.3 F 检验
    • 2.4 方差分析(非参数检验)
    • 2.5 秩和检验(威尔科克森秩和检验/曼-惠特尼 U 检验)(非参数检验)


一、前言

假设检验(hypothesis testing),又称统计假设检验,是一种用于判断样本与样本、样本与总体的差异是由抽样误差引起还是由本质差别造成的统计推断方法。具体而言,假设检验通过以下步骤进行:

  1. 设立假设(Set the Hypothesis):通常包括原假设(H0)和备择假设(H1)。原假设一般表示没有效应或没有差异,而备择假设表示存在效应或差异。

  2. 设定显著性水平(Set the Significance Level):常用的显著性水平有0.05、0.01等,这个值表示在多大程度上可以接受拒绝原假设的风险。

  3. 计算检验统计量(Calculate Test Statistic):根据样本数据计算出相应的统计量,如z值、t值等。

  4. 确定决策标准(Set Criteria for a Decision):根据显著性水平和检验统计量确定是否拒绝原假设。

  5. 做出结论(Make a Conclusion):根据计算结果和决策标准,判断是否有足够证据拒绝原假设。

假设检验的核心在于通过系统的方法判断数据是否支持某种假设,从而为统计推断提供依据。

假设检验的一个简单例子如下:

假设你怀疑一枚硬币可能不是公平的,即它落在正面和反面的概率不相等。你希望通过实验来验证这一假设。

  1. 设立假设

    • 原假设(H0):硬币是公平的,即正面和反面的概率都是50%。
    • 备择假设(H1):硬币不是公平的,即正面和反面的概率不是50%。
  2. 选择检验统计量

    • 你选择通过投掷硬币100次,记录出现正面的次数作为检验统计量。
  3. 确定拒绝域

    • 设定显著性水平为0.05。根据正态分布,当硬币是公平时,正面出现次数的期望值为50,标准误差为 100 ∗ 0.5 ∗ 0.5 = 5 \sqrt{100 * 0.5 * 0.5} = 5 1000.50.5 =5。选择z检验,并确定正态分布下95%置信区间为[40, 60]。
  4. 计算检验统计量

    • 进行实验,假设结果是硬币正面出现了65次。
    • 计算z值:(65 - 50) / 5 = 3。
  5. 做出决策

    • z值3显著超出了设定的拒绝域[40, 60],因此我们有足够的证据拒绝原假设。

结论:根据实验结果,可以认为这枚硬币不是公平的。

二、参数检验和非参数检验

参数检验非参数检验是统计推断的两种基本方法:

  1. 参数检验(Parametric tests):

    • 假设数据来自某种已知分布(如正态分布)。
    • 通过样本数据对总体参数(如均值、方差)进行估计和检验。
    • 需要满足一定的前提条件,例如数据的独立性和正态性。
    • 例子:t检验、方差分析(ANOVA) 。
  2. 非参数检验(Nonparametric tests):

    • 不需要假设数据来自某种特定分布。
    • 适用于总体分布未知或知道甚少的情况。
    • 更加灵活,但在某些情况下,统计效率较低。
    • 例子:卡方检验(Chi-square test)、秩和检验(Rank-sum test) 。

参数检验适用于已知总体分布且样本量较大时,而非参数检验则在样本量较小或总体分布未知时更为合适 。

2.1 卡方检验(非参数检验)

卡方检验(Chi-Square Test)是一种常用的假设检验方法,主要用于分析两个或多个分类变量之间是否存在关联性。它属于非参数检验方法,常用于医学、工程、产品设计等领域。

卡方检验的根本思想是比较实际观察值和理论期望值之间的差异,从而判断变量之间的关联性是否显著。

卡方统计量的计算公式为:
χ 2 = ∑ ( O i − E i ) 2 E i \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} χ2=Ei(OiEi)2

其中: O i O_i Oi 为第 i i i 类的观察频数(实际值), E i E_i Ei 为第 i i i 类的期望频数(理论值)

卡方检验主要分为单因素卡方检验单因素卡方检验

  • 单因素卡方检验(Chi-Square Test for Independence)用于检验两个分类变量是否存在统计关联。它通过比较实际观测值与理论期望值来判断变量之间的关系。
  • 双因素卡方检验(Chi-Square Test for Homogeneity)用于检验两个或多个分类变量在不同样本中的分布是否相同。其步骤类似于单因素卡方检验,但涉及多个样本的列联表

2.1.1 单因素卡方检验例子

假设我们想研究某个学校男女生比例是否符合预期的1:1。我们随机调查了该学校的200名学生,其中120个男生,80个女生。

性别实际人数
男生120
女生80

为了检验该学校的男女比例是否显著不同于1:1,我们可以使用单因素卡方检验,步骤如下:

  1. 计算期望频数:期望人数:假设学校男女比例为1:1,期望男生和女生人数均为100。

    • 男生期望频数:100
    • 女生期望频数:100
  2. 计算卡方统计量

χ 2 = ∑ i = 1 2 ( O i − E i ) 2 E i = ( 120 − 100 ) 2 100 + ( 80 − 100 ) 2 100 = 400 100 + 400 100 = 4 + 4 = 8 \chi^2 = \sum_{i=1}^{2} \frac{(O_i - E_i)^2}{E_i}=\frac{(120 - 100)^2}{100} + \frac{(80 - 100)^2}{100}=\frac{400}{100} + \frac{400}{100} = 4 + 4 = 8 χ2=i=12Ei(OiEi)2=100(120100)2+100(80100)2=100400+100400=4+4=8

  1. 计算自由度 d f = n − 1 = 2 − 1 = 1 df=n-1=2-1=1 df=n1=21=1

  2. 查卡方分布表得临界值:

    以下是自由度为1的卡方分布表,列出了不同显著性水平(α)下的临界值:

显著性水平 (α)卡方临界值 (χ²)
0.102.706
0.053.841
0.0255.024
0.016.635
0.0057.879
0.00110.828

根据上表可知:在自由度为1的情况下,查卡方分布表,显著性水平为0.05时,临界值为3.841

  1. 得出结论

    由于 χ 2 = 8 > 3.841 \chi^2=8>3.841 χ2=8>3.841,因此我们拒绝零假设,认为该学校的男女比例显著不同于1:1

2.1.2 双因素卡方检验

假设我们想检验性别与是否喜欢看电影之间是否有关系。我们调查了100人,其中男性有30人喜欢看电影,20人不喜欢看电影;女性有10人喜欢看电影,40人不喜欢看电影。

  1. 列出列联表
喜欢看电影不喜欢看电影合计
男性302050
女性104050
合计4060100
  1. 计算期望频数

    根据列联表和公式: E i j = 第i行合计 × 第j列合计 总合计 E_{ij} = \frac{\text{第i行合计} \times \text{第j列合计}}{\text{总合计}} Eij=总合计i行合计×j列合计

    可以计算期望频数如下:

E 11 = 50 × 40 100 = 20 , E 12 = 50 × 60 100 = 30 E 21 = 50 × 40 100 = 20 , E 22 = 50 × 60 100 = 30 E_{11} = \frac{50 \times 40}{100} = 20, E_{12} = \frac{50 \times 60}{100} = 30 \\ E_{21} = \frac{50 \times 40}{100} = 20, E_{22} = \frac{50 \times 60}{100} = 30 E11=10050×40=20,E12=10050×60=30E21=10050×40=20,E22=10050×60=30

  1. 计算卡方统计量

    将实际值和期望值代入卡方公式计算:
    χ 2 = ( 30 − 20 ) 2 20 + ( 20 − 30 ) 2 30 + ( 10 − 20 ) 2 20 + ( 40 − 30 ) 2 30 = 10 + 3.33 + 5 + 3.33 = 21.66 \chi^2 = \frac{(30-20)^2}{20} + \frac{(20-30)^2}{30} + \frac{(10-20)^2}{20} + \frac{(40-30)^2}{30} = 10 + 3.33 + 5 + 3.33 = 21.66 χ2=20(3020)2+30(2030)2+20(1020)2+30(4030)2=10+3.33+5+3.33=21.66

  2. 计算自由度 d f = ( 行数 − 1 ) × ( 列数 − 1 ) = ( 2 − 1 ) × ( 2 − 1 ) = 1 × 1 = 1 df=(行数-1) \times (列数-1)=(2-1) \times (2-1)=1 \times 1 = 1 df=(行数1)×(列数1)=(21)×(21)=1×1=1

  3. 查表得临界值: 3.841 3.841 3.841

  4. 得出结论

    由于 χ 2 > 3.841 \chi^2 > 3.841 χ2>3.841,所以我们拒绝原假设,认为性别与是否喜欢看电影之间不存在关系。

2.2 t检验(参数检验)

t检验是一种统计方法,用于比较两个样本均值是否显著不同。它主要用于样本量较小(通常小于30)且样本服从正态分布的情况。t检验包括单样本t检验、独立样本t检验和配对样本t检验。

t检验是一种有效的统计工具,适用于样本量较小的情况,通过计算t值并与临界值比较来判断均值差异是否显著。

公式:
t = ( X ‾ − Y ‾ ) V a r ( X ‾ − Y ‾ ) t=\frac{(\overline{X}-\overline{Y})}{\sqrt{Var(\overline{X}-\overline{Y})}} t=Var(XY) (XY)
其中, V a r ( X ‾ − Y ‾ ) Var(\overline{X}-\overline{Y}) Var(XY) 代表的是两组样本均值之差的方差。具体来说,这表示的是两个独立样本的均值之差的方差,用于评估两个样本均值之间的变异程度。不同类型的t检验之间的区别就在于如何估计和计算 V a r ( X ‾ − Y ‾ ) Var(\overline{X}-\overline{Y}) Var(XY)

2.2.1 单样本t检验(One-Sample t-Test)

单样本t检验用于检验样本均值是否与已知的总体均值有显著差异。

其实我们可以想象一下,把样本当成样本X,而总体当成样本Y。

公式:

V a r ( X ‾ − Y ‾ ) = s 2 n Var(\overline{X}-\overline{Y}) = \frac{s^2}{n} Var(XY)=ns2

t = ( X ‾ − Y ‾ ) V a r ( X ‾ − Y ‾ ) = ( X ‾ − μ ) s 2 n t=\frac{(\overline{X}-\overline{Y})}{\sqrt{Var(\overline{X}-\overline{Y})}}=\frac{(\overline{X}-\mu)}{\sqrt{\frac{s^2}{n}}} t=Var(XY) (XY)=ns2 (Xμ)

d f = n − 1 df=n-1 df=n1

其中, X ‾ \overline{X} X 是样本均值, μ \mu μ是总体均值, s s s是样本标准差, n n n是样本量

例子:假设我们有一个样本数据,测量了10位学生的数学成绩,分别是85, 90, 78, 92, 88, 76, 95, 89, 83, 91。已知总体均值 μ \mu μ 85 85 85。我们想知道这10个同学的成绩均值是否与总体均值没有显著差异。

  1. 首先提出假设
  • 零假设( H 0 H_0 H0):样本均值与总体均值相等(即,样本均值与总体均值没有显著差异)
  • 备择假设( H 1 H_1 H1):样本均值与总体均值不相等(即,样本均值与总体均值有显著差异)。
  1. 然后计算样本均值和样本标准差

X ‾ = 867 10 = 86.7 , s 2 = 340.1 10 − 1 = 37.79 \overline{X}=\frac{867}{10}=86.7, \ s^2=\frac{340.1}{10-1}=37.79 X=10867=86.7, s2=101340.1=37.79

  1. 然后计算t统计量

t = 86.7 − 85 37.79 10 ≈ 0.874 t = \frac{86.7-85}{\sqrt{\frac{37.79}{10}}}\approx 0.874 t=1037.79 86.7850.874

  1. 然后查t分布表,根据自由度(n-1=9)和设定的显著性水平(如0.05)确定临界值

    以下是自由度为9时的t分布临界值表可以根据不同的显著性水平(α值)提供的 t 值:

α(显著性水平)单侧临界值(tα,9)双侧临界值(tα/2,9)
0.101.3831.833
0.051.8332.262
0.0252.2622.821
0.012.8213.250
0.0053.2503.690
0.0013.6904.297
  • 单侧临界值(tα,9):用于单侧t检验。当你只关心一种方向的显著性时使用,如检验某值是否显著大于或小于某个参考值。

  • 双侧临界值(tα/2,9):用于双侧t检验。当你关心双向的显著性时使用,如检验某值是否显著不同于某个参考值(不论是大于还是小于)。

    在这里我们只关注样本均值是否显著不同于总体均值,因此采用双边检验。

    我们假设显著性水平为 0.05 0.05 0.05,已知自由度为 9 9 9,那么对应的临界值是 2.262 2.262 2.262

  1. 得出结论

    由于计算出的t统计量的绝对值 0.874 0.874 0.874 小于 2.262 2.262 2.262,因此我们不可以拒绝原假设,即样本均值与总体是显著相同的。

2.2.2 独立样本t检验(Independent Samples t-Test)

独立样本t检验用于比较两个独立样本的均值是否显著不同。

2.2.2.1 当两样本方差相等时

公式:

V a r ( X ‾ − Y ‾ ) = s p 2 n + s p 2 m Var(\overline{X}-\overline{Y}) = \frac{s_p^2}{n}+\frac{s_p^2}{m} Var(XY)=nsp2+msp2

t = ( X ‾ − Y ‾ ) V a r ( X ‾ − Y ‾ ) = ( X ‾ − Y ‾ ) s p 2 n + s p 2 m t=\frac{(\overline{X}-\overline{Y})}{\sqrt{Var(\overline{X}-\overline{Y})}}=\frac{(\overline{X}-\overline{Y})}{\sqrt{\frac{s_p^2}{n}+\frac{s_p^2}{m}}} t=Var(XY) (XY)=nsp2+msp2 (XY)

d f = m + n − 2 df=m+n-2 df=m+n2

其中, X ‾ \overline{X} X Y ‾ \overline{Y} Y是样本均值, n n n m m m 是样本量, s p s_p sp加权平均标准差,其计算公式如下:
s p = ( n − 1 ) s X 2 + ( m − 1 ) s Y 2 m + n − 2 s_p = \sqrt{\frac{(n-1)s_X^2+(m-1)s_Y^2}{m+n-2}} sp=m+n2(n1)sX2+(m1)sY2
其中, s X 2 s_X^2 sX2 s Y 2 s_Y^2 sY2 是样本方差。

例子:假设我们正在研究两种不同的教学方法对学生考试成绩的影响。我们随机抽取了两个独立的学生组,分别使用不同的教学方法,并在学期结束时对他们进行相同的考试。数据如下:

  • 教学方法A组(样本X):学生考试成绩:[85, 90, 78, 92, 88]
  • 教学方法B组(样本Y):学生考试成绩:[80, 85, 79, 84, 83]

我们可以通过独立样本t检验来判断这两种教学方法是否对学生的考试成绩有显著不同的影响。

  1. 首先提出假设
  • 零假设( H 0 H_0 H0):教学方法A和B对考试成绩没有显著不同的影响
  • 备择假设( H 1 H_1 H1):教学方法A和B对考试成绩有显著不同的影响
  1. 然后计算样本均值和标准差
  • 教学方法A组:样本均值 X ‾ = 86.6 \overline{X}=86.6 X=86.6,样本方差 s X 2 = 29.8 s_X^2=29.8 sX2=29.8
  • 教学方法B组:样本均值 Y ‾ = 82.2 \overline{Y}=82.2 Y=82.2,样本方差 s Y 2 = 6.71 s_Y^2=6.71 sY2=6.71
  1. 计算 t 统计量

s p 2 = 29.8 5 + 6.71 5 = 7.302 , t = 86.6 − 82.2 7.302 ≈ 1.629 s_p^2 = \frac{29.8}{5} + \frac{6.71}{5} = 7.302, \ t = \frac{86.6-82.2}{\sqrt{7.302}} \approx 1.629 sp2=529.8+56.71=7.302, t=7.302 86.682.21.629

  1. 查表得临界值

    自由度 d f = m + n − 2 = 5 + 5 − 2 = 8 df=m+n-2=5+5-2=8 df=m+n2=5+52=8,设定显著性水平(通常为0.05),对于双尾检验,显著性水平为0.05意味着每尾的显著性水平是0.025。

    查表得对应临界值为 2.306 2.306 2.306

  2. 得出结论

    由于 ∣ 1.629 ∣ < 2.306 |1.629| < 2.306 ∣1.629∣<2.306,故我们不能拒绝原假设,表明在显著性水平为0.05的情况下,这两种教学方法对学生考试成绩的影响没有显著差异。

2.2.2.2 当两样本方差不相等时

公式:

V a r ( X ‾ − Y ‾ ) = s X 2 n + s Y 2 m Var(\overline{X}-\overline{Y}) = \frac{s_X^2}{n}+\frac{s_Y^2}{m} Var(XY)=nsX2+msY2

t = ( X ‾ − Y ‾ ) V a r ( X ‾ − Y ‾ ) = ( X ‾ − Y ‾ ) s X 2 n + s Y 2 m t=\frac{(\overline{X}-\overline{Y})}{\sqrt{Var(\overline{X}-\overline{Y})}}=\frac{(\overline{X}-\overline{Y})}{\sqrt{\frac{s_X^2}{n}+\frac{s_Y^2}{m}}} t=Var(XY) (XY)=nsX2+msY2 (XY)

d f = ( s X 2 / n + s Y 2 / m ) 2 ( s X 2 / n ) 2 n − 1 + ( s Y 2 / m ) 2 m − 1 df=\frac{(s_X^2/n+s_Y^2/m)^2}{\frac{(s_X^2/n)^2}{n-1} + \frac{(s_Y^2/m)^2}{m-1}} df=n1(sX2/n)2+m1(sY2/m)2(sX2/n+sY2/m)2

其中, s X 2 s_X^2 sX2 s Y 2 s_Y^2 sY2 是样本方差, X ‾ \overline{X} X Y ‾ \overline{Y} Y是样本均值, n n n m m m 是样本量

例子:假设我们正在研究两种不同的教学方法对学生考试成绩的影响。我们随机抽取了两个独立的学生组,分别使用不同的教学方法,并在学期结束时对他们进行相同的考试。数据如下:

  • 教学方法A组(样本X):学生考试成绩:[85, 90, 78, 92, 88]
  • 教学方法B组(样本Y):学生考试成绩:[80, 85, 79, 84, 83]

我们可以通过独立样本t检验来判断这两种教学方法是否对学生的考试成绩有显著不同的影响。

  1. 首先提出假设
  • 零假设( H 0 H_0 H0):教学方法A和B对考试成绩没有显著不同的影响
  • 备择假设( H 1 H_1 H1):教学方法A和B对考试成绩有显著不同的影响
  1. 然后计算样本均值和标准差
  • 教学方法A组:样本均值 X ‾ = 86.6 \overline{X}=86.6 X=86.6,样本方差 s X 2 = 29.8 s_X^2=29.8 sX2=29.8
  • 教学方法B组:样本均值 Y ‾ = 82.2 \overline{Y}=82.2 Y=82.2,样本方差 s Y 2 = 6.71 s_Y^2=6.71 sY2=6.71
  1. 计算 t 统计量

t = 86.6 − 82.2 s X 2 5 + s Y 2 5 ≈ 2.32 t = \frac{86.6-82.2}{\sqrt{\frac{s_X^2}{5}+\frac{s_Y^2}{5}}} \approx 2.32 t=5sX2+5sY2 86.682.22.32

  1. 查表得临界值

    自由度(四舍五入):
    d f = ( s X 2 / n + s Y 2 / m ) 2 ( s X 2 / n ) 2 n − 1 + ( s Y 2 / m ) 2 m − 1 = ( 29.8 / 5 + 6.71 / 5 ) 2 ( 29.8 / 5 ) 2 4 + ( 6.71 / 5 ) 2 4 ≈ 5.714 ≈ 6 df=\frac{(s_X^2/n+s_Y^2/m)^2}{\frac{(s_X^2/n)^2}{n-1} + \frac{(s_Y^2/m)^2}{m-1}}=\frac{(29.8/5+6.71/5)^2}{\frac{(29.8/5)^2}{4} + \frac{(6.71/5)^2}{4}} \approx 5.714 \approx 6 df=n1(sX2/n)2+m1(sY2/m)2(sX2/n+sY2/m)2=4(29.8/5)2+4(6.71/5)2(29.8/5+6.71/5)25.7146

    设定显著性水平(通常为0.05),对于双尾检验,显著性水平为0.05意味着每尾的显著性水平是0.025。

    查表得对应临界值为 2.447 2.447 2.447

  2. 得出结论

    由于 ∣ 2.32 ∣ < 2.447 |2.32| < 2.447 ∣2.32∣<2.447,故我们不能拒绝原假设,表明在显著性水平为0.05的情况下,这两种教学方法对学生考试成绩的影响没有显著差异。

2.2.3 配对样本t检验(Paired Samples t-Test)

配对样本t检验用于比较成对数据(即两组数据的量相同,n=m)的均值差异,如同一组人在不同时间或不同条件下的测试成绩。

公式:

V a r ( X ‾ − Y ‾ ) = s d 2 n Var(\overline{X}-\overline{Y}) = \frac{s_d^2}{n} Var(XY)=nsd2

t = ( X ‾ − Y ‾ ) V a r ( X ‾ − Y ‾ ) = ( X ‾ − Y ‾ ) s d 2 n t=\frac{(\overline{X}-\overline{Y})}{\sqrt{Var(\overline{X}-\overline{Y})}}=\frac{(\overline{X}-\overline{Y})}{\sqrt{\frac{s_d^2}{n}}} t=Var(XY) (XY)=nsd2 (XY)

其中, X ‾ \overline{X} X Y ‾ \overline{Y} Y是样本均值, n n n m m m 是样本量, s d s_d sd两个样本差值的标准差,其计算公式如下:
s d = ∑ ( d i − d ‾ ) 2 n − 1 s_d = \sqrt{\frac{\sum{(d_i - \overline{d})^2}}{n-1}} sd=n1(did)2
其中, d i d_i di 是第 i i i 对样本的差值, d ‾ \overline{d} d 是样本的差值的均值。
d f = n − 1 df = n-1 df=n1

例子:假设我们想要比较某药物在治疗前后对血压的影响。我们从 5 个患者那里收集了数据,每个患者在服药前和服药后的血压如下:

患者治疗前血压治疗后血压
1150140
2160155
3170165
4155150
5165160

我们可以使用配对样本 t 检验来确定药物是否显著降低了血压。

  1. 计算差值

    首先,我们计算每对样本的差值:

患者治疗前血压治疗后血压差值 (治疗后 - 治疗前)
1150140-10
2160155-5
3170165-5
4155150-5
5165160-5
  1. 计算差值的平均值和标准差

    差值的平均值 (Mean) 为:
    X ‾ − Y ‾ = d ˉ = − 10 + − 5 + − 5 + − 5 + − 5 5 = − 6 \overline{X} - \overline{Y} = \bar{d} = \frac{-10 + -5 + -5 + -5 + -5}{5} = -6 XY=dˉ=510+5+5+5+5=6

    差值的方差为:
    s d 2 = ( − 10 + 6 ) 2 + ( − 5 + 6 ) 2 + ( − 5 + 6 ) 2 + ( − 5 + 6 ) 2 + ( − 5 + 6 ) 2 5 − 1 = 16 4 = 4 s_d^2 = \frac{(-10+6)^2 + (-5+6)^2 + (-5+6)^2 + (-5+6)^2 + (-5+6)^2}{5-1} = \frac{16}{4} = 4 sd2=51(10+6)2+(5+6)2+(5+6)2+(5+6)2+(5+6)2=416=4

  2. 计算 t 值

t = ( X ‾ − Y ‾ ) s d 2 n = − 6 4 5 ≈ − 6.71 t = \frac{(\overline{X}-\overline{Y})}{\sqrt{\frac{s_d^2}{n}}}=\frac{-6} {\sqrt{\frac{4}{5}}} \approx -6.71 t=nsd2 (XY)=54 66.71

  1. 查找 t 分布表中的临界值

    对于自由度为 n − 1 = 4 n - 1 = 4 n1=4 和显著性水平 α = 0.05 \alpha = 0.05 α=0.05,单尾检验的临界值为 2.132 2.132 2.132

  2. 得出结论

    因为 ∣ t ∣ = 6.71 > 2.132 |t|=6.71> 2.132 t=6.71>2.132,所以我们可以拒绝原假设,认为药物显著降低了血压。

2.3 F 检验

F检验是一种用于比较两个样本方差的方法,通常用于评估两个总体是否具有相同的方差。在统计分析中,F检验广泛用于方差分析(ANOVA),比较多个样本均值的方差。

F检验的统计量 F F F 的计算公式为:

F = s 1 2 s 2 2 F = \frac{s_1^2}{s_2^2} F=s22s12

其中:

  • s 1 2 s_1^2 s12 是第一个样本的方差。
  • s 2 2 s_2^2 s22 是第二个样本的方差。

F统计量服从自由度为 ( n 1 − 1 , n 2 − 1 ) (n_1-1, n_2-1) (n11,n21) 的F分布,其中 n 1 n_1 n1 n 2 n_2 n2 分别是两个样本的大小。

F检验步骤

  1. 假设检验:

    • 原假设 ( H_0 ):两个总体的方差相等,即 σ 1 2 = σ 2 2 \sigma_1^2 = \sigma_2^2 σ12=σ22
    • 备择假设 ( H_1 ):两个总体的方差不相等,即 σ 1 2 ≠ σ 2 2 \sigma_1^2 \neq \sigma_2^2 σ12=σ22
  2. 计算F统计量:

    • 计算两个样本的方差 s 1 2 s_1^2 s12 s 2 2 s_2^2 s22
    • 计算F统计量 F = s 1 2 s 2 2 F = \frac{s_1^2}{s_2^2} F=s22s12
  3. 查找临界值:

    • 根据给定的显著性水平(如 α = 0.05 \alpha = 0.05 α=0.05)和样本大小,从F分布表中查找对应的临界值。
  4. 比较F统计量与临界值:

    • 如果 F F F 大于临界值,则拒绝原假设,认为两个总体方差不相等。
    • 如果 F F F 小于或等于临界值,则不拒绝原假设,认为两个总体方差相等。

例子:假设我们有两个样本,分别代表两个不同教学方法下的学生成绩。我们想比较这两个教学方法是否在成绩上有不同的方差。

  • 样本1(教学方法A): [ 85 , 90 , 88 , 92 , 87 ] [85, 90, 88, 92, 87] [85,90,88,92,87]
  • 样本2(教学方法B): [ 78 , 85 , 82 , 88 , 80 ] [78, 85, 82, 88, 80] [78,85,82,88,80]
  1. 计算两个样本的方差:

    • 样本1方差 s 1 2 = 6.7 s_1^2 = 6.7 s12=6.7
    • 样本2方差 s 2 2 = 14.5 s_2^2 = 14.5 s22=14.5
  2. 计算F统计量:

F = 6.7 14.5 = 0.46 F = \frac{6.7}{14.5} = 0.46 F=14.56.7=0.46

  1. 查找临界值:

    • 自由度 ( 4 , 4 ) (4, 4) (4,4) ,显著性水平 α = 0.05 \alpha = 0.05 α=0.05 对应的临界值(查表)约为 6.39 6.39 6.39
  2. 比较F统计量与临界值:

    • 0.46 0.46 0.46 小于 6.39 6.39 6.39,因此不拒绝原假设。

结论:在显著性水平 α = 0.05 \alpha = 0.05 α=0.05 下,我们没有足够的证据表明两个教学方法的方差不同。

2.4 方差分析(非参数检验)

方差分析(Analysis of Variance, ANOVA)是一种统计方法,用于比较三个或三个以上样本均值之间的差异是否显著。方差分析主要用于确定因变量在不同处理组间的变异是否显著大于组内的变异,从而推断组间均值是否存在显著差异。

公式

单因素方差分析的基本公式包括:

  1. 总变差(Total Sum of Squares, SST)

S S T = ∑ i = 1 n ( X i − X ˉ ) 2 SST = \sum_{i=1}^{n} (X_i - \bar{X})^2 SST=i=1n(XiXˉ)2

其中, X i X_i Xi 是观测值, X ˉ \bar{X} Xˉ 是总体均值, n n n 是观测值的总数。

  1. 组间变差(Sum of Squares Between Groups, SSB)

S S B = ∑ j = 1 k n j ( X ˉ j − X ˉ ) 2 SSB = \sum_{j=1}^{k} n_j (\bar{X}_j - \bar{X})^2 SSB=j=1knj(XˉjXˉ)2

其中, X ˉ j \bar{X}_j Xˉj 是第 j j j 组的均值, n j n_j nj 是第 j j j 组的观测值数目, k k k 是组的总数。

  1. 组内变差(Sum of Squares Within Groups, SSW)

S S W = ∑ j = 1 k ∑ i = 1 n j ( X i j − X ˉ j ) 2 SSW = \sum_{j=1}^{k} \sum_{i=1}^{n_j} (X_{ij} - \bar{X}_j)^2 SSW=j=1ki=1nj(XijXˉj)2

其中, X i j X_{ij} Xij 是第 j j j 组中的第 i i i 个观测值, X ˉ j \bar{X}_j Xˉj 是第 j j j 组的均值。

  1. 均方(Mean Square, MS)
  • 组间均方 M S B MSB MSB

M S B = S S B k − 1 MSB = \frac{SSB}{k-1} MSB=k1SSB

  • 组内均方 M S W MSW MSW

M S W = S S W n − k MSW = \frac{SSW}{n-k} MSW=nkSSW

  1. F统计量

F = M S B M S W F = \frac{MSB}{MSW} F=MSWMSB

例子:假设我们有三个不同教学方法下的学生成绩,我们想比较这三个教学方法是否在成绩上有显著差异。

  • 教学方法A: [ 85 , 90 , 88 , 92 , 87 ] [85, 90, 88, 92, 87] [85,90,88,92,87]
  • 教学方法B: [ 78 , 85 , 82 , 88 , 80 ] [78, 85, 82, 88, 80] [78,85,82,88,80]
  • 教学方法C: [ 90 , 93 , 91 , 95 , 89 ] [90, 93, 91, 95, 89] [90,93,91,95,89]
  1. 计算每组的均值
  • 方法A均值 X ˉ A = 88.4 \bar{X}_A = 88.4 XˉA=88.4
  • 方法B均值 X ˉ B = 82.6 \bar{X}_B = 82.6 XˉB=82.6
  • 方法C均值 X ˉ C = 91.6 \bar{X}_C = 91.6 XˉC=91.6

总均值 X ˉ = 87.53 \bar{X} = 87.53 Xˉ=87.53

  1. 计算组间变差(SSB)

S S B = 5 ( 88.4 − 87.53 ) 2 + 5 ( 82.6 − 87.53 ) 2 + 5 ( 91.6 − 87.53 ) 2 = 115.93 SSB = 5(88.4 - 87.53)^2 + 5(82.6 - 87.53)^2 + 5(91.6 - 87.53)^2 = 115.93 SSB=5(88.487.53)2+5(82.687.53)2+5(91.687.53)2=115.93

  1. 计算组内变差(SSW)

S S W A = ( 85 − 88.4 ) 2 + ( 90 − 88.4 ) 2 + ( 88 − 88.4 ) 2 + ( 92 − 88.4 ) 2 + ( 87 − 88.4 ) 2 = 30.8 SSW_A = (85-88.4)^2 + (90-88.4)^2 + (88-88.4)^2 + (92-88.4)^2 + (87-88.4)^2 = 30.8 SSWA=(8588.4)2+(9088.4)2+(8888.4)2+(9288.4)2+(8788.4)2=30.8
S S W B = ( 78 − 82.6 ) 2 + ( 85 − 82.6 ) 2 + ( 82 − 82.6 ) 2 + ( 88 − 82.6 ) 2 + ( 80 − 82.6 ) 2 = 60.8 SSW_B = (78-82.6)^2 + (85-82.6)^2 + (82-82.6)^2 + (88-82.6)^2 + (80-82.6)^2 = 60.8 SSWB=(7882.6)2+(8582.6)2+(8282.6)2+(8882.6)2+(8082.6)2=60.8
S S W C = ( 90 − 91.6 ) 2 + ( 93 − 91.6 ) 2 + ( 91 − 91.6 ) 2 + ( 95 − 91.6 ) 2 + ( 89 − 91.6 ) 2 = 27.2 SSW_C = (90-91.6)^2 + (93-91.6)^2 + (91-91.6)^2 + (95-91.6)^2 + (89-91.6)^2 = 27.2 SSWC=(9091.6)2+(9391.6)2+(9191.6)2+(9591.6)2+(8991.6)2=27.2
S S W = S S W A + S S W B + S S W C = 118.8 SSW = SSW_A + SSW_B + SSW_C = 118.8 SSW=SSWA+SSWB+SSWC=118.8

  1. 计算均方(MS)
  • 组间均方 M S B MSB MSB

M S B = S S B k − 1 = 115.93 2 = 57.97 MSB = \frac{SSB}{k-1} = \frac{115.93}{2} = 57.97 MSB=k1SSB=2115.93=57.97

  • 组内均方 M S W MSW MSW

M S W = S S W n − k = 118.8 12 = 9.9 MSW = \frac{SSW}{n-k} = \frac{118.8}{12} = 9.9 MSW=nkSSW=12118.8=9.9

  1. 计算F统计量

F = M S B M S W = 57.97 9.9 = 5.86 F = \frac{MSB}{MSW} = \frac{57.97}{9.9} = 5.86 F=MSWMSB=9.957.97=5.86

  1. 查找临界值

    • 自由度 ( 2 , 12 ) (2, 12) (2,12),显著性水平 α = 0.05 \alpha = 0.05 α=0.05 对应的临界值(查表)约为 3.89。
  2. 比较F统计量与临界值

    • 5.86 5.86 5.86 大于 3.89,因此拒绝原假设,认为三个教学方法在成绩上有显著差异。

结论:在显著性水平 α = 0.05 \alpha = 0.05 α=0.05 下,我们有足够的证据表明不同教学方法对学生成绩的影响有显著差异。

2.5 秩和检验(威尔科克森秩和检验/曼-惠特尼 U 检验)(非参数检验)

**秩和检验(威尔科克森秩和检验/曼-惠特尼 U 检验)**是一种非参数统计检验,用于比较两个独立样本的中位数是否有显著差异。下面简述其原理、公式,并通过一个例子帮助理解。

秩和检验的基本思想是将两个样本的数据合并,然后按升序排列,为每个数据赋予秩值(排名)。然后分别计算两个样本的秩和,根据秩和的分布判断两个样本是否来自相同的总体。

公式

假设有两个独立样本 X X X Y Y Y,它们的样本量分别为 n 1 n_1 n1 n 2 n_2 n2

  1. X X X Y Y Y 合并,按升序排列,赋予秩值。
  2. 分别计算两个样本的秩和 R 1 R_1 R1 R 2 R_2 R2

曼-惠特尼 U 检验的统计量 U U U 定义为:
U 1 = R 1 − n 1 ( n 1 + 1 ) 2 U_1 = R_1 - \frac{n_1(n_1 + 1)}{2} U1=R12n1(n1+1)
U 2 = R 2 − n 2 ( n 2 + 1 ) 2 U_2 = R_2 - \frac{n_2(n_2 + 1)}{2} U2=R22n2(n2+1)

其中:

  • R 1 R_1 R1 是样本 X X X 的秩和
  • R 2 R_2 R2 是样本 Y Y Y 的秩和

检验统计量 U U U 是两个 U U U 值中的较小者:
U = min ⁡ ( U 1 , U 2 ) U = \min(U_1, U_2) U=min(U1,U2)

例子:假设有两个独立样本:

  • 样本 X X X:2, 4, 6
  • 样本 Y Y Y:1, 3, 5
  1. 合并并排序

合并后排序的样本为:1, 2, 3, 4, 5, 6

  1. 赋予秩值

1 的秩值为 1,2 的秩值为 2,依此类推:

秩值
11
22
33
44
55
66
  1. 计算秩和
  • 样本 X X X 的秩和 R 1 R_1 R1 = 2 + 4 + 6 = 12
  • 样本 Y Y Y 的秩和 R 2 R_2 R2 = 1 + 3 + 5 = 9
  1. 计算 U 统计量

U 1 = R 1 − n 1 ( n 1 + 1 ) 2 = 12 − 3 ( 3 + 1 ) 2 = 12 − 6 = 6 U_1 = R_1 - \frac{n_1(n_1 + 1)}{2} = 12 - \frac{3(3 + 1)}{2} = 12 - 6 = 6 U1=R12n1(n1+1)=1223(3+1)=126=6
U 2 = R 2 − n 2 ( n 2 + 1 ) 2 = 9 − 3 ( 3 + 1 ) 2 = 9 − 6 = 3 U_2 = R_2 - \frac{n_2(n_2 + 1)}{2} = 9 - \frac{3(3 + 1)}{2} = 9 - 6 = 3 U2=R22n2(n2+1)=923(3+1)=96=3

取较小者:
U = min ⁡ ( U 1 , U 2 ) = min ⁡ ( 6 , 3 ) = 3 U = \min(U_1, U_2) = \min(6, 3) = 3 U=min(U1,U2)=min(6,3)=3

  1. 确定临界值并做出结论

通过查找 Mann-Whitney U 检验的临界值表,根据给定的显著性水平 α \alpha α 和样本量 n 1 , n 2 n_1, n_2 n1,n2,可以确定是否拒绝零假设。

假设 α = 0.05 \alpha = 0.05 α=0.05,查找表格发现临界值为 2。如果 U U U 小于等于 2,拒绝零假设;否则不拒绝。在此例子中, U = 3 U = 3 U=3,大于临界值 2,因此不拒绝零假设,即两个样本中位数没有显著差异。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/26219.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Rust reqwest 简明教程

概述 reqwest 是 Rust 中一个非常流行和强大的 HTTP 客户端库&#xff0c;它提供了一种简单的方式来发送 HTTP 请求并处理响应。reqwest 支持阻塞和非阻塞&#xff08;异步&#xff09;请求&#xff0c;使其适合于各种不同的应用场景。在这篇博文中&#xff0c;我们将详细介绍…

【数据分析】统计学基础及Python具体实现

各位大佬好 &#xff0c;这里是阿川的博客&#xff0c;祝您变得更强 个人主页&#xff1a;在线OJ的阿川 大佬的支持和鼓励&#xff0c;将是我成长路上最大的动力 阿川水平有限&#xff0c;如有错误&#xff0c;欢迎大佬指正 Python 初阶 Python–语言基础与由来介绍 Python–…

查找最佳分数Π

查找分子或分母不大于一亿的分数Π private static final int MAX_N 100000000;private static void findPIByDivider() {Log.d("findPI", "findPIByDivider start MAX_N" MAX_N);long curtime System.currentTimeMillis();double lastRet 1;int selec…

计算机网络 —— 数据链路层(VLAN)

计算机网络 —— 数据链路层&#xff08;VLAN&#xff09; 什么是VLAN为什么要有VLANVLAN如何实现IEEE 802.1Q 我们今天来看VLAN&#xff1a; 什么是VLAN VLAN&#xff08;Virtual Local Area Network&#xff0c;虚拟局域网&#xff09;是一种网络技术&#xff0c;它将一个物…

一颗万能的PD协议芯片,能芯Type-C PD协议芯片“ECP5705”, 它是如何实现PD直流风扇应用呢?

文章目录 文章目录 前言 一、PD风扇方案介绍 二、芯片介绍 三、PD风扇-供电方式 四、能芯科技 PD 协议芯片ECP5705-应用场景 总结 前言 随着USB Type-C接口的普及和PD取电芯片的出现&#xff0c;使得小型家电和电动工具可以通过统一的USB Type-C接口进行充电&#xff0c;极大地…

2024年IntelliJ系列最新专业版安装码教程!(持续更新)

本教程适用于 J B 全系列产品&#xff0c;包括 Pycharm、IDEA、WebStorm、Phpstorm、Datagrip、RubyMine、CLion、AppCode 等。 2018-2024 均适用&#xff01; &#xff08;直接复制&#xff0c;拿走不谢&#xff09; 9H1390TRAK-eyJsaWNlbnNlSWQiOiI5SDEzOTBUUkFLIiwibGljZW…

Threejs-05、设置响应式画布与全屏控制。

1、自适应屏幕大小 你会发现,我们前面写好的代码,在页面尺寸发生改变的时候,并不能自适应的改变尺寸,而出现空白或者滚动条突出的情况。所以监听屏幕大小的改变,来重新设置相机的宽高比例和渲染器的尺寸大小,代码如下: // 监听画面变化,更新渲染画面 window.addEven…

MFC绘图

文章目录 消息组成消息的作用获取消息翻译消息常见消息WM_DESTROYWM_SYSCOMMAND 消息循环的阻塞发送消息字符串资源加速键资源GDI绘图对象-画笔位图绘制文本绘制字体模式对话框动态库特点线程创建线程 互斥事件信号量 消息组成 窗口句柄消息ID消息的两个参数消息产生的时间消息…

公路建设中边坡监测规范解析

边坡是山区公路或高速公路建设中的重要工程&#xff0c;但由于地形、地质等原因&#xff0c;边坡往往存在较高的塌方、滑坡、泥石流等风险。因此&#xff0c;边坡监测成为了十分必要的工作。本文将介绍边坡监测规范&#xff0c;希望能对相关工作者提供一些帮助。 点击输入图片描…

618这些卷王显示器,彻底杀疯了

该说不说&#xff0c;今年取消预售模式的第一个 618 终于让我看到了一些年中购物节该有的样子。 小忆估摸着不少同学的钱包君都有在这段时间被狠狠搜刮一番吧。 趁着活动热度还在&#xff0c;咱们今天再给大家添一把火&#xff0c;带来一期有关显示器的专题。 众所周知&#…

littlefs性能分析提升

littlefs性能分析 分析的目的很简单&#xff1a;希望支持掉电安全&#xff0c;或者说具有奔溃一致性特性的文件系统&#xff0c;他的读写速度能得到提升。如果了解了瓶颈所在&#xff0c;也可触类旁通。 本次分析&#xff0c;使用了大量的对比测试&#xff1a; littlefs读&a…

在Visual Studio Code中使用pytest进行AWS Lambda函数测试的最佳实践

背景/引言 在现代软件开发中&#xff0c;自动化测试已经成为保证代码质量的重要一环。对于AWS Lambda函数开发者来说&#xff0c;使用pytest进行单元测试和集成测试是一个高效且可靠的方法。本文将介绍在Visual Studio Code中使用pytest测试AWS Lambda函数的最佳实践&#xff…

RESTful API最佳实践:Python构建指南

目录 一、引言 二、RESTful API设计原则 三、Python构建RESTful API的技术栈 四、Flask构建RESTful API实践 安装Flask 定义路由和资源 处理HTTP方法 错误处理 数据验证和序列化 使用Flask扩展 五、最佳实践案例 七、结论 一、引言 在当今的软件开发领域&#…

SpringBoot 项目创建和 IDEA 常见问题

1、 Cannot save Files 问题(无法自动保存项目文件) Cannot save ....../HelloWord.java. Unable to create a backup file (HelloWord.java~). The file left unchanged. 原因&#xff1a;DIEA无法在保存前备份文件 解决办法&#xff1a;找到 Files --> Settings... -->…

谁是最会写作文的AI“考生”?“阅卷老师”ChatGPT直呼惊艳!

文章推荐 粽叶飘香&#xff0c;端午安康&#xff01;AI视频送祝福啦~ AI日报&#xff5c;文生语音大模型国内外均有突破&#xff0c;Pika完成6亿新融资&#xff0c;视频大模型也不远了&#xff01; ⭐️搜索“可信AI进展“关注公众号&#xff0c;获取当日最新AI资讯 一年一…

Claude3 注册及升级教程(包含封号解决方法)

前言 最近大家呼声很高的 Claude3 &#xff0c;它的 注册以及升级 教程来了&#xff01;&#xff01;&#xff01; &#xff08;还有封号情况的解决方式放在了后面&#xff09; 废话不多说&#xff0c;直接进入教程。 Claude 3 注册 前期准备工作 一个国外的邮箱账号&#…

HarmonyOS Next 系列之HTTP请求封装和Token持久化存储(四)

系列文章目录 HarmonyOS Next 系列之省市区弹窗选择器实现&#xff08;一&#xff09; HarmonyOS Next 系列之验证码输入组件实现&#xff08;二&#xff09; HarmonyOS Next 系列之底部标签栏TabBar实现&#xff08;三&#xff09; HarmonyOS Next 系列之HTTP请求封装和Token…

windows上修改Podman的镜像配置源加速

目录 前言解决办法1. 打开window的Powershell 2. 修改registries.conf3. 重启podman即可 扩展内容1. 国内镜像源地址2. 阿里加速地址 前言 今天在电脑上准备通过podman安装mysql&#xff0c;结果执行安装命令后&#xff0c;网络不通没法下载镜像。 解决办法 将默认镜像源修改…

释放创意潜力:AI写作助手如何助力内容创作?

内容为王&#xff0c;在内容创作的世界中尤为重要。然而&#xff0c;面对写作时常常感到无从下手&#xff1a;有时缺乏灵感&#xff0c;有时难以表达清楚自己的想法。AI写作助手的出现&#xff0c;为这些问题提供了创新的解决方案&#xff0c;极大地改变了内容创作的过程。 今…

C++: shared_ptr是线程安全的吗

导读 C面试中有时会有这样一个问题&#xff0c;shared_ptr是线程安全的吗&#xff1f;对此问题&#xff0c;我们需要从三个并发场景进行考虑&#xff0c;拷贝shared_ptr的安全性、对shared_ptr赋值的安全性和读写shared_ptr指向内存区域的安全性。 对于以上问题&#xff0c;首…