假设检验统计量的选择

假设检验的本质是检验两组数据是否存在显著性差异,或者是否相关

如抛硬币概率与0.5有差距,我们可以通过假设检验来确定到底是偶然性还是硬币被动了手脚。

数据分类

我们收集的数据分为两种

分类型:如性别(男,女),年龄分组(儿童,成人,老人)

数值型:如身高,体重

我们针对不同的数据类型组合以及数据量会构造不同的统计量来检验其变量之间是否存在显著差异

对以下组合,采取不同策略

  • 分类-分类,使用卡方检验

  • 分类-数值,使用t检验或f检验

  • 数值-数值,使用相关性检验

根据不同的显著性水平\alpha(一般为0.5%)和自由度n查表得到统计量的临界值

卡方检验

都是针对分类变量进行检验

  1. 卡方拟合度检验,针对分类变量与期望之间的差距,如扔骰子,抛硬币

$$
\chi^2=\sum\frac{\left(f_o-f_e\right)^2}{f_e}
$$

  • f_o 为观察到的频率observe

  • f_e 为期望的评论 expect

  • 自由度为分类数-1

  1. 卡方独立性检验,用于检验两个分类变量之间是否存在关系,如理性感性思维偏好与不同专业是否存在关系

因为得到的是一个r*c的数量分布表格(row*column) ,而我们没有预先的期望,就根据下面公式计算每格的期望

$$
f_e=\frac{f_rf_c}n
$$

  • f_r f_c 分别为列联表的行和和纵和

  • 自由度为df=(r-1)*(c-1)

前提

  1. 每个观测值只落在一个类别中

  2. 观测值之间相互独立

  3. 期望频次不能太小,即多次试验

t检验

检验两组数据的均数是否存在显著差异,即分类变量和数值变量的关系

$$
t=\frac{|\overline{x_1}-\overline{x_2}|}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}
$$

如公式所示,将组间差异与组内差异相除得到t分布,即如果存在显著差异,那么组间差异会大,组内差异会更小,t会越大

  1. 独立样本t检验,针对两个独立数值变量的优劣比较,如比较两个班级的成绩谁更好

  • 自由度df=n_1+n_2-2 因为两个平均数

  1. 配对样本t检验 ,针对数值变量的先后比较,如经过培训后同一批人水平是否有显著提升

  2. 单样本t检验,针对一个数值变量与已知的比较,如样本同学智商与平均智商是否存在显著差异

前提

  1. 被测变量在总体和样本中呈正态分布

中心极限定理可以知道,大量独立同分布的随机变量的和(或平均值)的分布趋向于正态分布。(可以参考高尔顿板实验)

  1. 方差齐性,两组样本直接方差相差不多,样本量很大时,一般问题不大

f检验

其实可以看出,t分布都是两组数据量的比较,其本质其实是数据量和一个分类量的关系

因为求解中只需要计算方差,也称方差分析ANOVA

如果分类数为3以上,就需要使用f检验了,公式如下

$$
F=\frac{SSB}{SSW}
$$

  • 自由度 df_b=k-1 k为组数 df_w=N_t-k N_t为总样本量

  • 定义总平均数为\overline{x} 每组的平均数为\overline{x_k} 样本为x_{ki}

  • sum of square SS 离差平方和 SS=\sum_{i=1}^n(x_i-\bar{x})^2

  • between 组间差异,每组的平均值与总平均值求SS再乘上样本数量后再求和

  • within 组内差异,每组样本与自己的平均值求SS再求和

这里我们用的单因素方差分析,如,多个学科学生的推理能力是否存在显著差异

多因素方差分析,如添加是否喝咖啡这个习惯的考量

重复测量方差分析,对同一组学生进行训练,分别测量不同时间后的能力差异

相关性检验

常用皮尔逊相关系数

$$
r=\frac{\sum(X_i-\bar{X})(Y_i-\bar{Y})}{\sqrt{\sum(X_i-\bar{X})^2\sum(Y_i-\bar{Y})^2}}
$$

相关性检验并不能确定因果关系,只能表明两个变量之间是否存在关联。

越接近1,越相关,越接近0,越独立

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/10401.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Excel中实现md5加密

1.注意事项 (1)在Microsoft Excel上操作 (2)使用完,建议修改的配置全部还原,防止有风险。 2.准备MD5宏插件 MD5加密宏插件放置到F盘下(直接F盘下,不用放到具体某一个文件夹下) 提示:文件在文章顶部&…

C语言实现动态加载.so动态库,使用,错误捕获以及卸载

动态库 概述 动态库的扩展名是.so。 动态库是被加载,调用的时候是根据内存地址去调用,而不是将代码复制到文件中。 动态库可以同时被多个进程使用。 实战案例:构建 libmath.so 动态库 准备源文件 calc.h 定义加法:int add…

【教程向】从零开始创建浏览器插件(三)解决 Chrome 扩展中弹出页面、背景脚本、内容脚本之间通信的问题

第三步:解决 Chrome 扩展中弹出页面、背景脚本、内容脚本之间通信的问题 Chrome 扩展开发中,弹出页面(Popup)、背景脚本(Background Script)、内容脚本(Content Script)各自拥有独立…

互联网轻量级框架整合之HibernateMyBatis

持久层框架 Hibernate 假设有个数据表&#xff0c;它有3个字段分别是id、rolename、note, 首先用IDEA构建一个maven项目Archetype选择org.apache.maven.archetypes:maven-archetype-quickstart即可&#xff0c;配置如下pom <project xmlns"http://maven.apache.org/…

攻防世界-web-unseping

题目 知识点 PHP代码审计PHP序列化和反序列化PHP中魔术方法命令执行绕过方式 解读源码 <?php highlight_file(__FILE__);class ease{private $method;private $args;function __construct($method, $args) {$this->method $method;$this->args $args;}function …

【算法】动态规划之背包DP问题(2024.5.11)

前言&#xff1a; 本系列是学习了董晓老师所讲的知识点做的笔记 董晓算法的个人空间-董晓算法个人主页-哔哩哔哩视频 (bilibili.com) 动态规划系列 【算法】动态规划之线性DP问题-CSDN博客 01背包 步骤&#xff1a; 分析容量j与w[i]的关系&#xff0c;然后分析是否要放…

户籍管理系统的设计与实现

【免费】户籍管理系统的设计与实现.zip资源-CSDN文库https://download.csdn.net/download/JW_559/89296790 ​​​​​​​户籍管理系统的设计与实现 摘 要 当今社会人们生活质量越来越高&#xff0c;人们对生活品质的追求不断提升&#xff0c;对于孩子求学&#xff0c;变更住…

Selenium中的隐式等待和显式等待

在Selenium中&#xff0c;“等待”在执行测试中起着重要作用。在本文中&#xff0c;您将学习Selenium中“隐式”和“显式”等待的各个方面。 在本文中&#xff0c;您将学习到 1. 为什么我们需要在selenium中等待&#xff1f; 2. 隐瞒等待 3. 明确等待 4. 流利的等待 为什么…

Join优化规则及应用层BI系统实践

目录 一、背景 二、查询优化器概述​编辑 2.1 System R Optimizer 2.2 Volcano Optimizer 2.3 Cascade Optimizer 三、Join相关优化规则 3.1 JoinReorder 3.1.1 少量表的Reorder 3.1.2 大量表的Reorder 3.1.3 星型模型的Reorder 3.2 外连接消除 3.3 Join消除 3.4 谓…

UDP多播

1 、多播的概念 多播&#xff0c;也被称为组播&#xff0c;是一种网络通信模式&#xff0c;其中数据的传输和接收仅在同一组内进行。多播具有以下特点&#xff1a; 多播地址标识一组接口&#xff1a;多播使用特定的多播地址&#xff0c;该地址标识一组接收数据的接口。发送到多…

C#面:Session 喜欢丢值且占内存,Cookis不安全,请问 C# 可以用什么办法代替这两种原始的方法

可以使用 用 ViewState&#xff0c;stateserver。 在 C# 中&#xff0c;ViewState、StateServer 和 Session 都是用于在 Web 应用程序中存储和管理状态信息的机制。它们可以用来在不同的页面之间传递数据或者在同一页面的不同请求之间保持数据的持久性。 ViewState&#xff1…

[Vision Board创客营]--使用openmv识别阿尼亚

文章目录 [Vision Board创客营]使用openmv识别阿尼亚介绍环境搭建训练模型上传图片生成模型 使用结语 [Vision Board创客营]使用openmv识别阿尼亚 &#x1f680;&#x1f680;五一和女朋友去看了《间谍过家家 代号&#xff1a;白》&#xff0c;入坑二刺螈&#xff08;QQ头像也换…

在prompt使用占位符实现提高信息替换成功率和替换位置准确率【prompt】【LLM】

文章目录 问题占位符解决 问题 造数据集的时候遇到的&#xff0c;llm不能很好的帮你替换&#xff0c;替换的内容不对&#xff0c;或者是替换的位置不对&#xff0c;比如这里就是替换位置不对&#xff0c;只盯着doc2替换&#xff0c;无视你的替换位置的变化。 待处理文本 {&quo…

函数作用域(局部变量和全局变量)(狠狠爱住啦)

在Python中&#xff0c;变量可以分为局部变量和全局变量两种类型&#xff0c;它们的作用域不同&#xff0c;对于程序的执行有着不同的影响。 在函数内部定义的变量属于局部作用域&#xff0c;在函数外部定义的变量属于全局作用域。在函数内部&#xff0c;可以使用 global 关键…

小程序地理位置接口申请教程来啦4步学会

小程序地理位置接口有什么功能&#xff1f; 如果我们提审后驳回理由写了“当前提审小程序代码包中地理位置相关接口( chooseAddress、getLocation )暂未开通&#xff0c;建议完成接口开通后或移除接口相关内容后再进行后续版本提审”&#xff0c;如果你也碰到类似问题&#xff…

电火灶是燃气灶吗?节能、环保效果怎么样?

随着科技的进步&#xff0c;厨房中的传统设备也逐步被新型、高效且环保的设备所替代。电火灶&#xff0c;作为一种新型的电火烹饪设备&#xff0c;逐渐进入人们的视野。那么&#xff0c;电火灶是否与传统的燃气灶有所区别&#xff1f;其节能与环保效果又如何呢&#xff1f;下面…

使用 Spring Boot 构建 RESTful API 的最佳实践

在现代的软件开发中&#xff0c;构建高效、稳定的 RESTful API 是非常重要的一环。Spring Boot 是一个流行的 Java 开发框架&#xff0c;它提供了简化开发的工具和约定&#xff0c;使得构建 RESTful API 变得更加简单和快速。 本文将介绍使用 Spring Boot 构建 RESTful API 的…

2024.5.8 关于 SpringCloud —— Ribbon 的基本认知

目录 Ribbon 负载均衡原理 工作流程 Ribbon 负载均衡规则 Ribbon 负载均衡自定义化 代码方式修改规则 配置文件方式修改规则 小总结 Ribbon 设定饥饿加载 Ribbon 负载均衡原理 工作流程 order-service 使用 RestTemplate 发送请求&#xff0c;随后该请求将会被 Ribbon 所…

【强训笔记】day20

NO.1 思路&#xff1a;先判断能对砍几个回合&#xff0c;取最小值&#xff0c;因为回合数是整数&#xff0c;所以可能存在都大于0的情况&#xff0c;再判断一下如果都存活就再对砍一次&#xff0c;直到一家存活或者都死亡。 代码实现&#xff1a; #include<iostream>u…

土地档案管理关系参考论文(论文 + 源码)

【免费】javaEE土地档案管理系统.zip资源-CSDN文库https://download.csdn.net/download/JW_559/89296786 土地档案管理关系 摘 要 研究土地档案管理关系即为实现一个土地档案管理系统。土地档案管理系统是将现有的历史纸质档案资料进行数字化加工处理&#xff0c;建成标准化的…