1.什么是t检验?
t检验是一种用于比较两个样本均值之间差异是否显著的统计方法。它通常用于以下几种情况:
(1)单样本 t 检验:用于检验一个样本的平均值是否与一个已知的总体平均值(或者一个假设的总体平均值)有显著差异。
(2) 独立样本 t 检验:用于比较两个不相关样本的平均值是否有显著差异。
(3) 配对样本 t 检验:用于比较两个相关样本的平均值是否有显著差异。
t检验的原理基于t 分布,它考虑了样本的大小和标准误差,以及样本均值之间的差异。在进行t 检验时,我们首先计算t 统计量,然后根据 t分布表或软件工具确定对应的P 值,最后根据显著性水平(通常为0.05)对 P 值进行解释,以决定是否拒绝原假设。如果 P 值小于显著性水平,我们就有充分的理由拒绝原假设,即认为两个样本均值之间存在显著差异。
下面通过三个实验来解释单样本t检验、独立样本t检验和配对样本t检验。
实验一:单样本t检验
假如你在一家灯泡厂工作,研发部门设计了一款新灯泡,老板给了你10个新灯泡的随机抽样使用寿命的数据,并且告诉你,旧灯泡的平均使用寿命是650小时,他想知道新灯泡与旧灯泡在使用寿命上有没有差异?
老板给你的数据如下图:
要判断新灯泡与旧灯泡在使用寿命上是否有显著差异,可以使用单样本 t 检验。
首先,我们需要设立假设:
-
零假设(H0):新灯泡的平均使用寿命等于旧灯泡的平均使用寿命,即 μ = 650。
-
备择假设(H1):新灯泡的平均使用寿命不等于旧灯泡的平均使用寿命,即 μ ≠ 650。
然后,我们计算样本的均值和标准差:
(计算结果来自chatgpt,不一定准确,看个过程就行了)
接下来,我们计算 t 统计量:
最后,我们根据 t 分布表或者软件工具,以及设定的显著性水平,查找对应的P 值。
经过计算得到:
t 统计量: 11.515668433444345
P 值: 1.0928281446144152e-06
P 值非常接近于零,远小于通常的显著性水平0.05。因此,我们可以得出结论,新灯泡与旧灯泡在使用寿命上存在显著差异。
实验二:独立样本t检验
假如你的老板并不知道旧灯泡的使用寿命怎么办?那我们只能对旧灯泡也进行随机抽样,两样本是相互独立的,所以我们进行独立样本t检验。
下图是新旧灯泡的随机抽样数据:
首先,我们将计算两组数据的均值和标准差,然后使用独立样本t 检验来比较这两组数据的均值是否存在显著差异。
用软件算更容易些,
这里的 t 统计量是 11.074,表示两组样本的平均值之间的差异相对于它们的方差的大小。而 P 值非常接近于零。因此,我们可以得出结论,两种灯泡的平均使用寿命之间存在显著差异。
第三次实验:配对样本t检验
假设为了避免线路和电压对测试结果的影响,老板决定用相同的线路和电压对新旧灯泡进行配对测试。我们需要用到配对t检验来判断新旧灯泡的使用寿命差别是否显著。
实验得到的数据如下图:
配对 t 检验用于比较同一组中两个相关样本的均值是否有显著差异。
首先,让我们计算每对数据的差值,然后计算这些差值的平均值、标准差和样本数量。接下来,我们将使用配对t 检验来确定这些差异是否显著。
差值 = 新灯泡使用寿命 - 旧灯泡使用寿命
用代码算一下结果,
P值大于0.05,所以我们没办法说两组灯泡有显著差异。