目录
- 一、基础知识
- 1.1 显著性检验
- 1.2 等方差T检验、异方差T检验
- 1.3 单尾p、双尾p
- 1.3.1 检验目的不同
- 1.3.2 用法不同
- 1.3.3 如何选择
- 二、Excel
- 2.1 统计分析工具
- 2.1.1 添加统计分析工具
- 2.1.2 数据分析
- 2.2 公式 -> 插入函数 -> T.TEST
- 三、RStudio
一、基础知识
参考:
- 1.什么是显著性检验? 2.为什么要做显著性检验? 3.怎么做显著性检验?
- excel----检验
- 如何用python来做假设检验
- 【统计科普】五分钟轻松掌握三大 t 检验 - 独立样本t检验、配对样本t检验与单样本t检验
1.1 显著性检验
- 什么是显著性检验?
- 在统计学中,显著性检验是“统计假设检验”(Statistical hypothesis testing)的一种,显著性检验是用于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法。
- 若原假设为真,而检验的结论却劝你放弃原假设。此时,我们把这种错误称之为第一类错误。通常把第一类错误出现的概率记为α
- 若原假设不真,而检验的结论却劝你采纳原假设。此时,我们把这种错误称之为第二类错误。通常把第二类错误出现的概率记为β
- 通常只限定犯第一类错误的最大概率α, 不考虑犯第二类错误的概率β。我们把这样的假设检验称为显著性检验,概率α称为显著性水平。显著性水平是数学界约定俗成的,一般有α =0.05,0.01的情况。代表着显著性检验的结论错误率必须低于5%或1%
- 为什么要做显著性检验?
- 怎么做显著性检验?
- 在这个问题下可以根据显著性水平α和0.05的关系由法则"大同小异"得出是否存在显著差异。
- “大同”:显著性水平α>0.05,王先森的两家分公司销售额大致相同,不存在显著性差异。
- “小异”:显著性水平α<0.05,王先森的两家分公司销售额不相同,存在显著性差异。
1.2 等方差T检验、异方差T检验
- 等方差T检验(Equal variance T-test):这种T检验假设两个样本的方差相等。当两个样本的方差相似时,可以使用等方差T检验。
- 异方差T检验(Unequal variance T-test):这种T检验假设两个样本的方差不相等。当两个样本的方差差异较大时,应该使用异方差T检验。
- 如果样本的方差差异较小,可以选择等方差T检验,否则选择异方差T检验。
- 自由度=n-1
注:
结果显示
1.3 单尾p、双尾p
- 双尾T检验(Two-tailed T-test):这种T检验用于检测两个样本之间的差异是否显著。它能够检测到样本均值在两个方向上的差异,即是否存在统计学上显著的差异。
- 单尾T检验(One-tailed T-test):这种T检验用于检测两个样本之间的差异是否显著,并且指定了一个方向。它只检测样本均值在指定方向上的差异,即是否存在统计学上显著的正向或负向差异。
- 如果你对分割结果的差异没有明确的方向性假设,可以选择双尾T检验。如果你有一个明确的方向性假设,可以选择单尾T检验。
- 双尾=单尾*2
1.3.1 检验目的不同
- 双尾检验(也就是双侧检验)是要检验样本平均数和总体平均数,或样本成数有没有显著差异。
- 单尾检验(也就是单侧检验)目的是检验样本所取自的总体参数值是否大于或小于某个特定值。
1.3.2 用法不同
- 研究目的是想判断两个数据的均值是否不同, 需要用双尾检验。
- 研究目的是仅仅想知道一个数据的均值是不是高于(或低于)另一个数据, 则可以采用单尾检验。
1.3.3 如何选择
- 如果假设中有一参数和另一参数方向性的比较,比如"大于"、“好于”、"差于"等,一般选择单尾检验。
- 如果只是检验两参数之间是否有差异,就选择双尾检验。
- 如果问题是:中学生中,男女生的身高是否存在性别差异, 因为实际的差异可能是男生平均身高比女生高,也可能是男生平均比女生矮。这两种情况都属于存在性别差异。需要用双尾检验。
- 如果问题为:中学生中,男生的身高是否比女生高,这个时候需要采用单尾检验。
- 要比较的两个样本统计量的总体参数事先无法肯定哪个大或者哪个小时,就要用双尾检验,所得到的检验结果取P双尾值。否则就取P单尾值。单尾检验强调的是方向性。
二、Excel
注意: 有两种方式,一种是统计分析工具,一种是公式。
2.1 统计分析工具
2.1.1 添加统计分析工具
文件 -> 选项 -> 加载项 -> 转到 -> 选中”分析工具库“和”分析工具库-VBA“ -> 确定
2.1.2 数据分析
数据 -> 数据分析 -> t-检验:双样本等方差假设 -> 确定
- 依次选择所要对比的两列数据,然后回车。α(A)是显著性水平,0.05代表95%的可信度。
- 输出结果:
- df:自由度,用于其他统计量计算;
- P:显著性水平,估计总体参数落在某一区间内,可能犯错误的概率;
- 查看差异显著性(可信度):
- 差异显著:0.01 < P value < 0.05
- 差异极显著:P value < 0.01
2.2 公式 -> 插入函数 -> T.TEST
三、RStudio
"t.test()"函数:两独立样本的T检验。
- 导入数据:
data<-read.csv("C:\\Users\\30330\\Desktop\\iou.csv", header = T)
- 数据分组:假设你的数据具有两个组别,分别命名为"Ours"和"FCN"。
group1 <- data$Ours
group2 <- data$FCN
- 执行T检验:
result <- t.test(group1, group2)
- 打印T检验结果:
print(result)
- 结果显示: