【小白学机器学习12】假设检验之3:t 检验 (t检验量,t分布,查t值表等)

目录

1 t 检验的定义

1.1 来自维基百科和百度百科

1.2 别名

1.3 和其他检验的区别

2 适用情况:

2.1 关于样本情况

2.2 适合检查的情况

2.2.1 单样本均值检验(One-sample t-test)

2.2.2  两独立样本均值检验(Independent two-sample t-test)

2.2.3 配对样本均值检验(Dependent t-test for paired samples)

2.2.4 回归系数的显著性检验(t-test for regression coefficient significance)

3 构造T检验量 t-stat

3.1  t 统计量是什么?

3.1.1 t统计量公式

3.1.2  几个核心统计量的推导

3.2 t 统计量的另外一个公式,线性回归里每个参数的t值

3.3  构造t 统计量

3.3.1 单样本的t,构造过程

3.3.2 双样本的t,构造过程

3.3.3 配对样本t检验

3.4 t统计量的意义

4 t分布

4.1 T分布曲线,类正态分布

4.2 和正态分布的区别

5 实操查表,T值表

5.1 查表方法

5.2 T值表

5.3 判断标准

6  例题

6.1 先获得关键参数信息

6.2 进行h0 h1假设

6.3 计算t值

6.4 根据双边检验显著度α/2,查表得到t值,然后比较

6.5 得到结论

参考文章


1 t 检验的定义

1.1 来自维基百科和百度百科

  • 学生t 检验(英语:Student's t-test)是指零假设成立时的任一检验统计有学生t分布的统计假设检验,属于参数统计。
  • 学生t检验常作为检验一群来自正态分配总体的独立样本之期望值是否为某一实数,或是二(两)群来自正态分配总体的独立样本之期望值的差是否为某一实数。
  • 举个简单的例子,在某个学校中我们可以从某个年级中随机抽样一群男生,以检验该年级男生与全校男生之身高差异程度是否如我们所假设的某个值。

1.2 别名

  • t检验
  • 学生t检验
  • Student t-test

1.3 和其他检验的区别

  • T检验和Z检查,都是比较均值差异的,而不是比较方差齐性的,也就是都是比较 均值齐性的,也可以叫成 Homogeneity of  Average ?
  • 而F检验,是检测方差齐性,Homogeneity of Variances,就是检查两者的方差是不是相同

2 适用情况:

2.1 关于样本情况

  • t检验,适合样本数里<30 或大都可以
  • 但是Z只适应样本数量比较大的时候

2.2 适合检查的情况

2.2.1 单样本均值检验(One-sample t-test)

  • 用于检验 总体方差未知、正态数据或近似正态的 单样本的均值 是否与 已知的总体均值相等

2.2.2  两独立样本均值检验(Independent two-sample t-test)

  • 用于检验 两对独立的 正态数据或近似正态的 样本的均值 是否相等,这里可根据总体方差是否相等分类讨论

2.2.3 配对样本均值检验(Dependent t-test for paired samples)

  • 用于检验 一对配对样本的均值的差 是否等于某一个值

2.2.4 回归系数的显著性检验(t-test for regression coefficient significance)

  • 用于检验 回归模型的解释变量对被解释变量是否有显著影响

3 构造T检验量 t-stat

3.1  t 统计量是什么?

3.1.1 t统计量公式

  • t-stat= t=(average(x)-u) / (s/✔n)
  • t 检验量,比较的是均值average(x)
    •  单样本t 检验量,比较的是均值average(x) 和u的差异
    •  量样本t 检验量,比较的是均值average(x1) 和average(x2)

3.1.2  几个核心统计量的推导

  • t 检验量
  • 因为核心是 average(x),所以其标准差为 (s/✔n)
    • 如果   X                                 ~N(u,δ) , 符合正态分布
    • 那么  average(X)                  ~N(u,δ/✔n) ,符合正态分布,average(x) ~N(u,s✔n)
    • 那么   average(X)-u / (δ/✔n)    ~N(0,1)  符合标准正态分布 
  • (n-1)s**2符合k2分布
  • t = average(X)-u / (δ/✔n)  就是构造的一个符合标准正态分布的t变量

3.2 t 统计量的另外一个公式,线性回归里每个参数的t值

  • 每个回归系数的t值  → t-统计量=回归系数 / 回归系数标准误差 
  • 如果有多组样本,SE 标准误是标准差SD的平均值, SE=SD/✔n
  • 回归系数标准误(standard error of regression coefficient)

3.3  构造t 统计量

3.3.1 单样本的t,构造过程

3.3.2 双样本的t,构造过程

3.3.3 配对样本t检验

3.4 t统计量的意义

  • T统计值是用来判断参数的显著程度的
  • 应用回归预测法时应首先确定变量之间是否存在相关关系。但是如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果。
  • 查表要根据,自由度df,显著度α
  • 如果T值,小于查表所得T值,那么就认为落在大概率的区间,接受原假设H0

4 t分布

4.1 T分布曲线,类正态分布

4.2 和正态分布的区别

  • 在概率论和统计学中,t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知或者在样本数量足够多时,则应该用正态分布来估计总体均值。 [1]
  • t分布曲线形态与n(确切地说与自由度df)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。

5 实操查表,T值表

5.1 查表方法

  • 需要查表
  • 自由度n-1,显著度α
  • 查t界值表中自由度为n-1,双侧α,如果是单边检验,那么查到的t(α, n-1)
  • 查t界值表中自由度为n-1,双侧α,如果是双边检验,那么查到的t(α/2, n-1)
  • 然后查到的t值,作为比较的参数指标

5.2 T值表

  • 纵列是自由度df
  • 横列是概率p,也就是显著度α
  • 表里查的不是p,而是t值,不同概率对应的 t的边界值

5.3 判断标准

  • 一般,Z和T检验量的实际值越大,对应的p概率值就越小!就越要拒绝相等的假设

6  例题

6.1 先获得关键参数信息

  • 样本均值,方差
  • 总体均值
  • 样本数量
  • 自由度,要剔除统计量的影响

6.2 进行h0 h1假设

  • h0 假设两者均值相同

6.3 计算t值

6.4 根据双边检验显著度α/2,查表得到t值,然后比较

6.5 得到结论

  • t检验量    1.774823935    <    2.032        
  • 考虑正态曲线分布                
  • 可以知道,这个t落在大概率的曲线下方部分                                
  • 因此接受假设h0,认为两者没有明显差异    

参考文章

一文详解t检验 - 知乎不排除书写错误,文中几乎所有的公式都给出了详细的证明。 仅为教科书相关内容,不代表学术前沿。关于实验的设计与分析,可看 混乱数据分析:设计的实验引子t检验(t test)又称学生t检验(Student t-test)可以说…https://zhuanlan.zhihu.com/p/138711532icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/138711532

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/800223.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024.4.6力扣每日一题——树节点的第 K 个祖先

2024.4.6 题目来源我的题解方法一 哈希表 超内存方法二 树上倍增 题目来源 力扣每日一题&#xff1b;题序&#xff1a;1483 我的题解 方法一 哈希表 超内存 使用一个哈希表存储每个节点的祖先节点。 时间复杂度&#xff1a;O(n) 空间复杂度&#xff1a;O( n 2 n^2 n2) class…

hydra九头蛇

一、hydra简介 Hydra是一款非常强大的暴力破解工具&#xff0c;它是由著名的黑客组织THC开发的一款开源暴力破解工具。Hydra是一个验证性质的工具&#xff0c;主要目的是&#xff1a;展示安全研究人员从远程获取一个系统认证权限。 目前该工具支持以下协议的爆破&#xff1a; A…

2024年华为OD机试真题-启动多任务排序-Java-OD统一考试(C卷)

题目描述: 一个应用启动时,会有多个初始化任务需要执行,并且任务之间有依赖关系,例如A任务依赖B任务,那么必须在B任务执行完成之后,才能开始执行A任务。 现在给出多条任务依赖关系的规则,请输入任务的顺序执行序列,规则采用贪婪策略,即一个任务如果没有依赖的任务,则…

蓝桥杯小白入门赛第9场第4题 字典树考试

问题描述 蓝桥学院最近教学了字典树这一数据结构,小蓝是全班的第一名,他不仅掌握了普通字典树,还自学了 01 字典树的使用。为了展示自己的能力,他向全班同学出了以下问题: 给定一个长度为 N N N 的数组 A A A , 你能否求出表达式 ∑ i = 1 N ∑ j = i + 1 N f ( A i …

【网站项目】农业信息管理系统

&#x1f64a;作者简介&#xff1a;拥有多年开发工作经验&#xff0c;分享技术代码帮助学生学习&#xff0c;独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。&#x1f339;赠送计算机毕业设计600个选题excel文件&#xff0c;帮助大学选题。赠送开题报告模板&#xff…

基于STM32f103芯片的应用程序在线升级功能框架的实现

目录 基于STM32f103芯片的应用程序在线升级功能框架的实现 一、原理简介 二、KEIL软件主要设置 三、应用程序app部分 四、Bootloader部分 五、补充部分 基于STM32f103芯片的应用程序在线升级功能框架的实现 一、原理简介 我们在使用stm32的过程中&#xff0c;如果需要对…

[C#]OpenCvSharp改变图像的对比度和亮度

目的 访问像素值mat.At<T>(y,x) 用0初始化矩阵Mat.Zeros 饱和操作SaturateCast.ToByte 亮度和对比度调整 g(x)αf(x)β 用α(>0)和β一般称作增益(gain)和偏置(bias)&#xff0c;分别控制对比度和亮度 把f(x)看成源图像像素&#xff0c;把g(x)看成输出图像像素…

Spring Boot集成Spring Retry快速入门Demo

1.Retry介绍 Spring Retry 提供了自动重新调用失败的操作的功能。这在错误可能是暂时的&#xff08;例如瞬时网络故障&#xff09;的情况下很有用。从2.2.0版本开始&#xff0c;重试功能已从Spring Batch中撤出&#xff0c;成为一个独立的新库&#xff1a;Spring Retry 使用场景…

蓝桥杯第十五届抱佛脚(十)贪心算法

蓝桥杯第十五届抱佛脚&#xff08;十&#xff09;贪心算法 贪心算法基本概念 贪心算法是一种在算法设计中常用的方法&#xff0c;它在每一步选择中都采取在当前状态下最好或最优&#xff08;即最有利&#xff09;的选择&#xff0c;从而希望导致结果是最好或最优的算法。 贪…

身份证实名认证接口的价格一般是多少呢?基于PHP身份核验接口

身份证实名认证接口分为身份证二要素、三要素、三要素人像核验接口&#xff0c;被广泛的应用于婚恋、交友、电商等等一系列行业领域&#xff0c;身份证实名认证需要实时数据&#xff0c;对于数据源来说也需要可靠&#xff0c;那么&#xff0c;身份证实名认证的价格是不是很贵呢…

小小算式(1 + 2) * (3 + 4)背后的大道理

目录 前缀表示法&#xff08;波兰表达式&#xff09; 中缀表达法 后缀表达法&#xff08;逆波兰表达式&#xff09; 三种表达法的相互转换 练习&#xff1a;逆波兰表达式求值 前缀表示法&#xff08;波兰表达式&#xff09; 波兰表示法&#xff08;英语&#xff1a;Polis…

Python学习,记录不熟悉知识点

目录 Set&#xff08;集合&#xff09; 集合内置方法完整列表 根据字符串的表达式计算结果 ​编辑 条件控制&#xff1a; if – elif – else match...case 循环语句&#xff1a; while循环 for循环 在同一行中有多个赋值操作&#xff08;先计算&#xff0c;再赋值&…

【Vue】Vue3中的OptionsAPI与CompositionAPI

文章目录 OptionsAPICompositionAPI对比总结 OptionsAPI 中文名:选项式API通过定义methods,computed,watch,data等属性方法&#xff0c;处理页面逻辑。以下是OptionsAPI代码结构 实例代码: <script lang"ts">// js或者tsimport { defineComponent } from vu…

javaScript手写专题——防抖/节流/闭包/Promise/深浅拷贝

目录 目录 一、 防抖/节流/闭包/定时器 编写一个组件&#xff0c;在input中输入文本&#xff0c;在给定的数据中查找相关的项目&#xff0c;并渲染搜索结果列表 1.新增InputSearch.vue组件 key的作用 2.新增 InputView.vue 3.添加路由 4.效果演示 follow up加上防抖怎么处理 1.…

「51媒体网」邀请媒体采访报道对企业宣传有何意义?

传媒如春雨&#xff0c;润物细无声的&#xff0c;大家好&#xff0c;我是51媒体网胡老师。 邀请媒体采访报道对企业宣传具有多重意义&#xff1a; 提升品牌知名度和曝光度&#xff1a;媒体是信息传播的重要渠道&#xff0c;通过媒体的报道&#xff0c;企业及其活动、产品能够迅…

软考信息处理技术员2024年5月报名流程及注意事项

2024年5月软考信息处理技术员报名入口&#xff1a; 中国计算机技术职业资格网&#xff08;http://www.ruankao.org.cn/&#xff09; 2024年软考报名时间暂未公布&#xff0c;考试时间上半年为5月25日到28日&#xff0c;下半年考试时间为11月9日到12日。不想错过考试最新消息的…

k8s删除namespace失败一直处于Terminating状态

获取Terminating状态的namespace ~ kubectl get namespace NAME STATUS AGE bluehelix Active 146d broker Active 146d cattle-fleet-cluster…

Sketch是免费软件吗?这款软件支持导入!

Sketch 是一款针对网页、图标、插图等设计的矢量绘图软件。Sketch 的操作界面非常简单易懂&#xff0c;帮助全世界的设计师创作出许多不可思议的作品。但是同时&#xff0c;Sketch 也有一些痛点&#xff1a;使用 Sketch 需要安装 InVision、Abstract 、Zeplin 等插件&#xff0…

配置 施耐德 modbusTCP 分布式IO子站 PRA0100

模块官方介绍&#xff1a;https://www.schneider-electric.cn/zh/product/BMXPRA0100 1. 总体步骤 2. 软件组态&#xff1a;在 Unity Pro 软件中创建编辑 PRA 模块工程 2.1 新建项目 模块箱硬件型号如下 点击 Unity Pro 软件左上方【新建】按钮&#xff0c;选择正确的 DIO …

记一次C语言内存越界(内存越界 段错误 Segmentation fault )

1 背景 最近在用C重构原来用C写的SDK&#xff0c;发现一个内存越界问题&#xff0c;记录下来&#xff0c;以供后续参考。 2 问题 代码如下: #include <stdio.h> #include <stdlib.h>int array1[4] {1, 2, 3, 4}; int array2[4] {5, 6, 7, 8};int main(int arg…