《机器学习》2.4假设检验 t分布 F分布

目录

 t发布

注意是这个东西服从t分布

数据服从t分布通常是在以下情况下:

以下是一些具体的例子,说明在何种情况下数据会服从t分布:

t检验

交叉验证t检验

样本方差​编辑

F分布(fisher

Friedman检验是一种非参数统计方法,

Friedman检验中提到的“F分布”和之前提到的F分布不是同一个东西,

Friedman检验=》所有的算法的相同=》被拒绝的话=》后续检验=》某两个算法相同=?拒绝否

 


 t发布

t分布,也称为学生t分布(Student's t-distribution),是一种概率分布,它被用来估计一个或多个小样本的均值,当总体的标准差未知时。t分布由威廉·戈塞特(William Gosset)在1908年以笔名“学生”(Student)发表,因此得名。

t分布的形状类似于正态分布(高斯分布),但它的尾部更厚,这意味着它在尾部有更高的概率密度。这种分布的形状由一个参数决定,即自由度(degrees of freedom,df)。自由度通常等于样本大小减去1(n-1)。随着自由度的增加,t分布逐渐接近正态分布。

t分布的数学表达式为:

其中:

  • XˉXˉ 是样本均值
  • μμ 是总体均值
  • ss 是样本标准差
  • nn 是样本大小

t分布常用于假设检验,特别是当样本量较小且总体标准差未知时。在这些情况下,t检验(t-test)可以用来确定两个样本均值之间的差异是否统计上显著。t分布也用于构建小样本均值的置信区间。

注意是这个东西服从t分布

变量符合t分布通常是在以下情况下:

  1. 样本均值的分布:当你从正态分布的总体中抽取一个样本,并且样本量较小(通常认为小于30),那么样本均值除以其标准误差(即样本标准差除以样本量的平方根)将遵循t分布。

  2. 未知总体标准差:当总体标准差未知,并且需要用样本标准差来估计时,样本均值的标准误差将使用t分布来计算置信区间或进行假设检验。

  3. 小样本数据:在样本量较小的情况下,t分布比正态分布更能准确地描述样本均值的分布情况,因为它考虑了样本量小所引起的额外变异性。

具体来说,以下变量或统计量符合t分布:

  • t统计量:在假设检验中,t统计量通常定义为

    t=Xˉ−μs/nt=s/n​Xˉ−μ​

    其中,XˉXˉ 是样本均值,μμ 是总体均值,ss 是样本标准差,nn 是样本量。当总体是正态分布且样本量较小时,这个统计量遵循t分布。
  • 置信区间:在构建均值的置信区间时,如果样本量较小且总体标准差未知,那么置信区间的计算将基于t分布。

  • 差异检验:在比较两个独立样本均值或配对样本均值差异的假设检验中,如果样本量较小,那么这些检验的统计量通常遵循t分布。

需要注意的是,t分布的准确性依赖于数据来自正态分布的假设。如果总体分布不是正态的,或者数据存在异常值,那么t分布可能不是一个准确的模型。在实际应用中,通常通过样本数据的正态性检验(如Shapiro-Wilk检验)来评估数据是否符合正态分布的假设。如果数据不满足正态性假设,可能需要使用非参数统计方法。

数据服从t分布通常是在以下情况下:

  1. 小样本量:当样本量较小(通常小于30)时,样本均值的分布更接近t分布而不是正态分布。这是因为小样本量下,样本标准差对总体标准差的估计不够精确,导致样本均值的分布有更厚的尾部。

  2. 总体标准差未知:当总体标准差未知,且需要使用样本标准差来估计时,样本均值的分布会服从t分布。这是因为样本标准差的变异性会增加样本均值分布的不确定性。

  3. 正态性假设:t分布的使用假设数据来自一个正态分布的总体。如果数据显著偏离正态分布,那么t分布可能不是最合适的分布来描述样本均值的分布。

  4. 独立性:数据点之间应该是独立的。如果数据点之间存在相关性,那么t分布的假设可能不成立。

在实际应用中,t分布常用于t检验(t-test),这是一种统计检验,用于比较两个小样本均值的差异是否显著。t检验包括独立样本t检验(用于比较两个独立样本的均值)和配对样本t检验(用于比较同一组样本在两种不同条件下的均值)。

此外,t分布也用于构建小样本均值的置信区间,以及在回归分析中对回归系数进行假设检验。

总之,当样本量小、总体标准差未知、数据来自正态分布总体且数据点独立时,数据会服从t分布

以下是一些具体的例子,说明在何种情况下数据会服从t分布:

  1. 小样本均值的置信区间

    • 假设你想要估计某种新药对降低血压的效果。你随机选取了10名高血压患者作为样本,测量他们在服用药物前后的血压变化。由于样本量较小(n=10),你使用样本标准差来估计总体标准差,并构建均值血压变化的置信区间。这种情况下,样本均值的分布会服从t分布。
  2. 小样本均值的假设检验

    • 一个研究者想要比较两组学生的考试成绩,一组接受了新的教学方法,另一组接受了传统教学方法。每组只有15名学生。研究者想要检验新教学方法是否有效。由于样本量较小,他使用独立样本t检验来比较两组的均值,这个检验基于t分布。
  3. 配对样本的假设检验

    • 一个心理学家想要研究冥想对减少焦虑的效果。她让一组志愿者在冥想前后完成焦虑量表。由于数据是配对的(冥想前后的焦虑分数),并且样本量较小(比如n=20),她使用配对样本t检验来确定冥想是否有显著效果。这个检验同样基于t分布。
  4. 单样本均值的假设检验

    • 一个工厂的质量控制部门想要检验他们生产的零件的平均重量是否符合标准。他们随机抽取了25个零件进行称重。由于他们不知道总体标准差,他们使用样本标准差来估计,并进行单样本t检验来比较样本均值和标准重量。这种情况下,样本均值的分布会服从t分布。
  5. 回归分析中的假设检验

    • 在回归分析中,研究者可能会使用t检验来检验单个回归系数是否显著不为零。例如,一个经济学家可能使用回归模型来预测房价,其中一个自变量是房屋的面积。他使用t检验来确定房屋面积对房价是否有显著影响。在这种情况下,回归系数的检验统计量服从t分布。

这些例子展示了在实际研究中,当样本量较小且总体标准差未知时,t分布是如何被用来构建置信区间和进行假设检验的。

t检验

交叉验证t检验

2.4 P40

5*2交叉验

样本方差

F分布(fisher

F分布,也称为Fisher-Snedecor分布,是一种连续概率分布,它在统计学中被用来比较两个样本的方差。F分布由两个独立的卡方分布变量的比值构成,每个变量都除以其相应的自由度。F分布的形状由两个参数决定,即分子的自由度(df1)和分母的自由度(df2)。

F分布的数学表达式为:

其中:

  • χ12χ12​ 是分子的卡方分布变量
  • χ22χ22​ 是分母的卡方分布变量
  • df1df1​ 是分子的自由度
  • df2df2​ 是分母的自由度

F分布常用于方差分析(ANOVA)和回归分析中。在方差分析中,F检验被用来确定三个或更多样本均值之间的差异是否统计上显著。在回归分析中,F检验被用来检验模型中所有自变量的联合显著性。

F分布的形状通常是偏斜的,且只有正值。随着自由度的增加,F分布逐渐接近正态分布。F分布的均值和方差取决于自由度的大小。

总之,F分布是一种用于比较两个样本方差的分布,它在统计学中被广泛应用于方差分析和回归分析。

Friedman检验是一种非参数统计方法,

Friedman检验是一种非参数统计方法,它用于比较多个相关样本的差异。 这种检验特别适用于处理重复测量或匹配组的情况,因此在心理学、医学和社会科学等领域中非常受欢迎。

Friedman检验与F分布的关系在于,Friedman检验的结果可以用来计算一个统计量,这个统计量在零假设下(即所有相关样本的总体没有差异)近似地服从F分布。 具体来说,Friedman检验的统计量是通过比较各个相关样本的秩和来计算的,而这个统计量的分布与F分布有关。

在Friedman检验中,如果检验的结果是统计量较大,对应的p值较小(通常小于显著性水平,如0.05),那么我们拒绝原假设,认为至少有两个样本之间存在显著差异。 这个统计量的分布与F分布相似,因为它涉及到两个自由度的比值,这两个自由度分别对应于组间和组内的变异。

总结来说,Friedman检验的统计量在原假设下近似地服从F分布,这使得我们可以使用F分布的特性来确定检验的显著性。

Friedman检验中提到的“F分布”和之前提到的F分布不是同一个东西,

  1. Friedman检验的“F分布”

    • Friedman检验是一种非参数统计方法,用于比较多个相关样本的均值是否存在显著差异。
    • 在Friedman检验中,统计量(通常是卡方统计量)的分布被用作检验的基础,这个统计量在原假设下近似服从卡方分布,而不是直接服从F分布。
    • Friedman检验的结果通常需要查表或使用软件来确定p值,这个p值与卡方分布的临界值有关。
  2. 传统的F分布

    • F分布是由两个独立的卡方分布变量各除以其自由度后的比值构成的,是一种非对称分布,且位置不可互换。
    • F分布广泛应用于方差分析(ANOVA)、回归方程的显著性检验等,它描述了两个样本方差的比率分布。
    • F分布的统计量(F值)是通过比较两个样本方差(或方差的估计)来计算的,这个F值的分布与F分布有关。

简而言之,Friedman检验中的“F分布”是指检验统计量在原假设下近似服从的分布,而传统的F分布是指在方差分析和回归分析中使用的统计量的分布。两者虽然都与统计量的分布有关,但它们描述的是不同类型的统计检验和不同的应用场景。Friedman检验的统计量近似服从卡方分布,而传统的F分布是描述两个方差比值的分布。

Friedman检验=》所有的算法的相同=》被拒绝的话=》后续检验=》某两个算法相同=?拒绝否

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/64226.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java aspose word 模板根据数据导出pdf

支持以功能&#xff1a; 1、字符串占位符替换。 2、占位符循环替换。 3、图片替换。 4、基础图标&#xff0c;折现、饼图、柱状图。 本案例运行环境&#xff1a; 1、aspose word21.1版本。 2、jdk 18。 话不多说直接上代码。 <!-- 图表相关 --><dependency><gro…

Go 语言结构

Go 语言结构 Go 语言,也称为 Golang,是一种由 Google 开发和支持的静态类型、编译型编程语言。它于 2009 年首次发布,旨在提高多核处理器、网络资源和大型代码库的性能。Go 语言以其简洁的语法、并发支持和强大的标准库而闻名,特别适合构建高性能的网络服务和分布式系统。…

安装与认识wireshark

免责声明 学习视频来自B 站 up 主泷羽 sec&#xff0c;如涉及侵权马上删除文章。 笔记的只是方便各位师傅学习知识&#xff0c;以下代码、网站只涉及学习内容&#xff0c;其他的都与本人无关&#xff0c;切莫逾越法律红线&#xff0c;否则后果自负。 Wireshark安装入门之软件…

Linux高性能服务器编程 | 读书笔记 |9.定时器

9. 定时器 网络程序需要处理定时事件&#xff0c;如定期检测一个客户连接的活动状态。服务器程序通常管理着众多定时事件&#xff0c;有效地组织这些定时事件&#xff0c;使其在预期的时间被触发且不影响服务器的主要逻辑&#xff0c;对于服务器的性能有至关重要的影响。为此&…

如何使用PHP和phpSpider搭建强大的爬虫系统

要使用PHP和phpSpider搭建一个强大的爬虫系统&#xff0c;可以按照以下步骤进行&#xff1a; 一、安装PHP环境 下载PHP&#xff1a;可以通过PHP的官方网站下载最新版本的PHP安装包。安装PHP&#xff1a;根据操作系统的不同&#xff0c;按照官方文档或安装向导进行安装。安装完…

边界层气象:脉动量预报方程展开 | 湍流脉动速度方差预报方程 | 平均湍流动能收支方程推导

写成分量形式 原始式子&#xff1a; ∂ u i ′ ∂ t u ‾ j ∂ u i ′ ∂ x j u j ′ ∂ u ‾ i ∂ x j u j ′ ∂ u i ′ ∂ x j − 1 ρ ‾ ⋅ ∂ p ′ ∂ x i g θ v ′ θ ‾ v δ i 3 f ϵ i j 3 u j ′ v ∂ 2 u i ′ ∂ x j 2 ∂ ( u i ′ u j ′ ‾ ) ∂ x j…

QT 国际化(翻译)

QT国际化&#xff08;Internationalization&#xff0c;简称I18N&#xff09;是指将一个软件应用程序的界面、文本、日期、数字等元素转化为不同的语言和文化习惯的过程。这使得软件能够在不同的国家和地区使用&#xff0c;并且可以根据用户的语言和地区提供本地化的使用体验。…

onnx graph surgeon 的使用详解

文章目录 1. onnx graph surgeon 介绍1.1 作用1.2 onnx-surgeon vs onnx.helper1.2.1 结构对比1.2.2 使用的对比1.3 graph surgeon的使用1.3.1 创建onnx1.3.2 导出子图1.3.3 替换算子2. 案例实战2.1 案例1:onnx创建2.2 案例2:onnx 创建2.3 案例3:子图的提取2.4 案例4:算子替…

3D 生成重建034-NerfDiff借助扩散模型直接生成nerf

3D 生成重建034-NerfDiff借助扩散模型直接生成nerf 文章目录 0 论文工作1 论文方法2 实验结果 0 论文工作 感觉这个论文可能能shapE差不多同时期工作&#xff0c;但是shapE是生成任意种类。 本文提出了一种新颖的单图像视图合成方法NerfDiff&#xff0c;该方法利用神经辐射场 …

【CNN卷积神经网络算法】卷积神经网络

卷积神经网络整体架构 总结 输入层&#xff1a;原始数据&#xff08;图像&#xff09; 例如可以输入一张RGB图像&#xff0c;其可以标示为一个三维矩阵&#xff0c;宽W高H和通道数C3对应着RGB卷积层&#xff1a;提取局部特征&#xff0c;变换输入数据为丰富的特征图 网络使用多…

HarmonyOS Next 元服务新建到上架全流程

HarmonyOS Next 元服务新建到上架全流程 接上篇 这篇文章的主要目的是介绍元服务从新建到上家的完整流程 在AGC平台上新建一个项目 链接 一个项目可以多个应用 AGC新建一个元服务应用 新建一个本地元服务项目 如果成功在AGC平台上新建过元服务&#xff0c;那么这里会自动显…

Mac/Windows端长期破解myBase8方法(无需安装火绒)

提醒 不管哪个端&#xff0c;都需要先退出myBase。 Mac 进入用户根目录/Users/c0ny100&#xff0c;即下边是Macintosh HD > 用户 > [你的用户名]这个界面然后按ShiftCommond.&#xff0c;显示隐藏文件。找到.Mybase8.ini文件 打开.Mybase8.ini文件&#xff0c;删除Fir…

【网络安全】【Kali Linux】简单ICMP主机探测

一、参考资料 《Python安全攻防——渗透测试实战指南》&#xff0c;吴涛 等编著&#xff0c;机械工业出版社&#xff0c;2021年10月 二、探测原理 ICMP&#xff08;ping命令&#xff09; 三、脚本编写 1、导入所需的库&#xff1a; 2、扫描功能函数&#xff1a; 3、主函数…

Oracle进行exp导出密码中有特殊字符报EXP-00056和ORA-12154错处理

今天&#xff0c;业务人员反馈&#xff0c;在本地进行exp导出时报错&#xff0c;报错内容如下&#xff1a; 在Oracle密码中有特殊字符时&#xff0c;需要加引号&#xff0c;但引号怎么加呢&#xff1f;总结如下&#xff1a; 1、在windows系统中 exp 用户名/“““密码”””n…

MVC流程分析

DisaptcherServlet本质是servlet&#xff0c;执行init()方法&#xff0c;自启动底层执行代码&#xff0c; 作用&#xff1a; 1、读取springmvc配置文件&#xff0c;创建Controller对象&#xff0c;放入容器中&#xff0c;map<"id",对象> 2、接收用户请求&#…

OELOVE 6.0城市列表模板

研究了好久OELOVE6.0源码&#xff0c;一直想将城市列表给单独整出来&#xff0c;做地区排名&#xff0c;但是PHP程序都是加密的&#xff0c;非常难搞&#xff0c;做二开都是要命的处理不了&#xff0c;在这里有一个简单方法可以处理城市列表&#xff0c;并且可以自定义TDK&…

fiddler设置抓取https,还抓取不到https如何解决?

一、清楚 C:\Users\Admin\AppData\Roaming\Microsoft\Crypto\RSA 目录下所有文件&#xff08;首次安装fiddler请忽略&#xff09; 二、清除电脑上的根证书&#xff0c;WINR快捷键&#xff0c;输入&#xff1a;certmgr.msc&#xff0c; 然后回车&#xff0c;查找所有fiddler证书…

【知识】总体标准差和样本标准差有什么区别

转载请注明出处&#xff1a;小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你&#xff0c;欢迎[点赞、收藏、关注]哦~ 总体标准差和样本标准差之间的区别主要在于它们的计算方式&#xff0c;特别是在分母的选择上。这种差异是因为我们通常在实际应用中并不总是能够得到整…

WebGL后处理与Cesium后处理阶段

在 Cesium 中&#xff0c;Material 是一个强大的工具&#xff0c;用于定义几何体外观。它允许开发者通过 顶点着色器&#xff08;Vertex Shader&#xff09;和 片段着色器&#xff08;Fragment Shader&#xff09;实现自定义效果。以下将从 Material 架构、着色器编程、以及 GP…

es 3期 第15节-词项查询与跨度查询实战运用

#### 1.Elasticsearch是数据库&#xff0c;不是普通的Java应用程序&#xff0c;传统数据库需要的硬件资源同样需要&#xff0c;提升性能最有效的就是升级硬件。 #### 2.Elasticsearch是文档型数据库&#xff0c;不是关系型数据库&#xff0c;不具备严格的ACID事务特性&#xff…