如何设计统计量及相关假设检验

一、如何设置H0和H1假设

谁做H0,谁做H1,在统计学的假设检验里是有约定俗成的规定的。即:status quo(默认/现状)是H0,而新观点或试图challenge现状的是H1。H1也叫research hypothesis,所以我们做research、发文章就是要reject H0,而希望H1接受。
在这里插入图片描述

步骤和原则

1. 明确研究问题:
首先,需要明确你想要回答的研究问题或验证的假设。

2. 设定原假设(H0):

H0 一般是希望被检验和拒绝的假设,因为它通常代表现状或默认状态。

3. 设定备择假设(H1):

H1 是我们希望找到证据支持的假设。

二、 如何理解显著性水平和p值之间的关系

p 值的定义

p 值(p-value)是一个概率值,用于衡量在原假设(H0)为真时,观测数据(或比观测数据更极端的数据)出现的概率。它反映了数据与原假设的一致性。

理解 p 值

假设我们进行一个假设检验,下面是详细步骤和解释:

1. 设定假设:

  • 原假设(H0):没有效果或没有差异。例如,假设一个新药对血压没有影响。
  • 备择假设(H1):存在效果或存在差异。例如,假设新药对血压有影响。

2. 选择显著性水平( α \alpha α):

  • 通常设定为 0.05,这意味着我们允许有 5% 的概率犯第一类错误,即错误地拒绝原假设。

3. 收集数据:

  • 例如,我们收集了一组使用新药和一组使用安慰剂的患者的血压数据。

4. 计算检验统计量和 p 值:

  • 使用适当的统计方法(例如 t 检验),计算出一个检验统计量(例如 t 值),并基于此计算出 p 值。

p 值的含义

  • p 值是 0.03:这表示在原假设为真(即新药对血压没有影响)的情况下,获得与实际观测数据一样极端(或更极端)的结果的概率是 0.03(即 3%)。
    • 换句话说,如果新药确实对血压没有影响,那么我们观测到这种数据的概率是 3%。这么小的概率事件发生了,那我们是不是应该质疑原假设,认为原假设不正确。

决策依据

  • p 值 ≤ α(例如 0.03 ≤ 0.05):我们拒绝原假设 H0,认为数据提供了足够的证据支持备择假设 H1。也就是说,我们认为新药对血压有显著影响。
  • p 值 > α(例如 0.07 > 0.05):我们不能拒绝原假设 H0,认为数据没有提供足够的证据支持备择假设 H1。也就是说,我们认为新药对血压没有显著影响。

举例说明

假设我们研究新药对降低血压的影响,进行了独立样本 t 检验,得到以下结果:

  • 原假设 H0:新药对血压没有影响(新药组和对照组的平均血压相同)。

  • 备择假设 H1:新药对血压有影响(新药组和对照组的平均血压不同)。

  • 显著性水平 α:0.05。

  • 计算得到的 p 值:0.03。

解释:

  • p 值 0.03 表示在新药对血压没有影响的情况下,获得与实际观测数据一样极端或更极端结果的概率是 3%。
  • 由于 p 值(0.03)小于显著性水平 αα(0.05),我们拒绝原假设 H0,认为新药对血压有显著影响。

直观理解

可以把 p 值看作是对原假设 H0 的质疑程度:

  • 小 p 值:数据与原假设 H0 的一致性很低,因此我们更倾向于认为原假设不成立(拒绝原假设)。
  • 大 p 值:数据与原假设 H0 的一致性较高,因此我们没有足够的理由拒绝原假设。

总结

p 值衡量了在原假设为真时,观测到当前数据的概率。通过比较 p 值和预设的显著性水平 αα,我们可以判断是否拒绝原假设,从而得出是否存在显著差异的结论。

三、如何选择合适统计量

选择合适的统计量(statistic)进行假设检验是统计分析中的关键步骤,具体的选择取决于数据的性质、样本量、研究问题以及假设检验的类型。下面是选择合适统计量的一些指导原则和常见的统计量。
指导原则

1. 数据类型:

  • 定量数据(连续数据):如测量值、体重、温度等。
  • 定性数据(分类数据):如类别、性别、品牌等。

2. 分布类型:

  • 正态分布:数据服从正态分布。
  • 非正态分布:数据不服从正态分布。

3. 样本量:

  • 大样本: 通常指样本量大于 30。
  • 小样本: 通常指样本量小于 30。

4. 假设检验类型:

  • 均值检验:比较两个或多个组的均值。
  • 比例检验:比较两个或多个组的比例。
  • 相关性检验:检验两个变量之间的关系。
  • 方差分析:比较多个组的方差。

常见统计量

1. 均值检验:

  • 单样本 t 检验(One-Sample t-Test):用于检验单个样本均值是否与已知值有显著差异。适用于小样本且数据服从正态分布。
  • 独立样本 t 检验(Independent Samples t-Test):用于检验两个独立样本均值是否有显著差异。适用于小样本且数据服从正态分布。
  • 配对样本 t 检验(Paired Samples t-Test):用于检验两个相关样本均值是否有显著差异。适用于小样本且数据服从正态分布。
  • Z 检验(Z-Test):用于检验两个独立样本均值是否有显著差异,适用于大样本。

2. 比例检验:

  • 卡方检验(Chi-Square Test):用于检验分类数据的比例是否有显著差异。适用于大样本。
  • Z 检验(Z-Test):用于检验两个比例是否有显著差异,适用于大样本。

3. 相关性检验:

  • 皮尔逊相关系数(Pearson Correlation Coefficient):用于检验两个连续变量之间的线性关系,适用于数据服从正态分布。
  • 斯皮尔曼等级相关系数(Spearman Rank Correlation Coefficient):用于检验两个连续变量或顺序变量之间的关系,不要求数据服从正态分布。

4. 方差分析(ANOVA):

  • 单因素方差分析(One-Way ANOVA):用于比较多个组的均值是否有显著差异。
  • 双因素方差分析(Two-Way ANOVA):用于比较两个因素对多个组的均值的影响。

5. 非参数检验:

  • 曼-惠特尼 U 检验(Mann-Whitney U Test):用于检验两个独立样本的中位数是否有显著差异,不要求数据服从正态分布。
  • 威尔科克森符号秩检验(Wilcoxon Signed-Rank Test):用于检验两个相关样本的中位数是否有显著差异,不要求数据服从正态分布。
  • 克鲁斯卡尔-沃利斯检验(Kruskal-Wallis Test):用于比较三个或更多独立样本的中位数是否有显著差异,不要求数据服从正态分布。

选择步骤

1. 确定研究问题: 明确需要检验的假设类型(如均值、比例、相关性等)。
2. 数据类型和分布: 根据数据类型和分布选择合适的统计量。
3. 样本量: 根据样本量选择合适的检验方法(如 t 检验或 Z 检验)。
4. 检验假设: 根据假设检验的类型(如单尾或双尾检验)选择适当的统计量。

实例

假设我们要比较两组学生的考试成绩是否有显著差异:

  • 数据类型: 连续数据(考试成绩)。
  • 分布类型: 假设数据服从正态分布。
  • 样本量: 两组学生样本量都小于 30。

根据这些信息,我们可以选择 独立样本 t 检验 来比较两组学生的考试成绩是否有显著差异。

通过以上步骤和指导原则,可以有效选择合适的统计量来进行假设检验,从而得出可靠的结论。

四、统计量和p值有什么关系

统计量(test statistic)和 p 值之间的关系是非常密切的。统计量是从样本数据计算得出的一个值,用于评估数据与原假设(H0)的偏离程度。p 值则是基于统计量计算出来的概率值,用于衡量在原假设为真的情况下,观测到当前统计量或更极端的统计量的概率。

关系总结

  1. 统计量的计算

    • 统计量是从样本数据计算得出的一个值,具体计算方法取决于所使用的假设检验类型。
    • 例如,对于 t 检验,统计量是 t 值;对于卡方检验,统计量是 (\chi^2) 值;对于 z 检验,统计量是 z 值。
  2. 统计量与分布

    • 每种假设检验都有对应的统计分布,如 t 分布、正态分布、卡方分布等。
    • 统计量的位置在对应的统计分布上决定了 p 值。
  3. p 值的计算

    • p 值是根据统计量在对应统计分布中的位置计算得出的概率值。
    • 它表示在原假设为真的情况下,获得与观测数据一样极端或更极端的统计量的概率。

例子解释

1. 单样本 t 检验

假设我们有一个样本数据集,样本均值为 x ˉ = 105 \bar{x} = 105 xˉ=105,样本标准差为 s = 15 s = 15 s=15,样本大小为 n = 30 n = 30 n=30,已知均值为 μ 0 = 100 \mu_0 = 100 μ0=100

  1. 计算 t 统计量
    t = x ˉ − μ 0 s / n = 105 − 100 15 / 30 = 5 2.738 ≈ 1.83 t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}} = \frac{105 - 100}{15 / \sqrt{30}} = \frac{5}{2.738} \approx 1.83 t=s/n xˉμ0=15/30 105100=2.73851.83

  2. 确定 t 分布

    • 自由度 ( d f = n − 1 = 29 ) (df = n - 1 = 29) (df=n1=29)
  3. 查找 t 分布表或使用统计软件

    • 对应 t 值 1.83,在自由度为 29 的 t 分布中查找 p 值。
    • 假设查找结果为 p 值大约是 0.038。
  4. p 值解释

    • p 值 0.038 表示在原假设为真的情况下,获得 t 统计量等于或大于 1.83 的概率是 0.038。
2. 双尾检验

假设进行一个双尾 t 检验:

  • 原假设(H0):样本均值等于总体均值( μ = 0 \mu = 0 μ=0)。
  • 备择假设(H1):样本均值不等于总体均值。

假设计算出的 t 统计量为 2.0。

  1. 计算统计量
    t = 2.0 t = 2.0 t=2.0

  2. 查找 t 分布表

    • 对应 t 值 2.0 和自由度 df 查找 p 值。
  3. 计算 p 值

    • 双尾检验中,p 值是两个尾部的和:
      p = 2 × P ( T > 2.0 ) p = 2 \times P(T > 2.0) p=2×P(T>2.0)

假设查找到的 p 值为 0.05。

关系总结

  • 统计量:从数据中计算得出,用于评估数据与原假设的偏离程度。
  • p 值:基于统计量计算出的概率值,表示在原假设为真时,观测到当前统计量或更极端统计量的概率。

使用统计软件计算

在实际操作中,通常使用统计软件来计算统计量和 p 值。例如,使用 Python 的 scipy.stats 模块:

from scipy import stats# 样本数据
sample_data = [105, 100, 95, 110, 120, 90, 85, 105, 100, 110]
# 已知均值
mu_0 = 100# 计算 t 统计量和 p 值
t_stat, p_value = stats.ttest_1samp(sample_data, mu_0)print(f"t 统计量: {t_stat}")
print(f"p 值: {p_value}")

这段代码会输出 t 统计量和对应的 p 值,帮助你判断是否拒绝原假设。

总结

统计量和 p 值是密切相关的。统计量通过衡量样本数据与原假设的偏离程度,p 值则通过统计量在对应分布中的位置,反映了在原假设为真时,观测到当前数据或更极端数据的概率。理解统计量和 p 值的关系,有助于在假设检验中做出正确的决策。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/45656.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【多个Python版本存在,使用pip+不同版本安装库时,windows弹出打开方式窗口的解决方法】

问题描述 电脑上存在python3.9,3.10,3.11,安装顺序也是先安装3.9,然后3.10,最后3.11,那么直接使用pip安装,会装在3.11的位置,经过搜索可以通过pip版本,比如pip3.9 insta…

如何在勒索软件攻击中幸存下来:最佳备份实践、勒索拦截方案

无论身处什么业务或行业,数据都是您业务的关键资产。没有针对数据进行安全可靠的备份保护,您将会受到许多“可能性”的威胁,无论数据丢失是由于在键盘上洒了饮料还是遭受到了勒索软件的攻击。 为了确保业务不被中断,企业数据不会…

Python: 初识Python

文章目录 1. Python的背景知识1.1 Python是咋来的?1.2 Python的特点1.3 Python能干啥?1.4 Python的缺点 2. 搭建Python环境2.1 安装Python2.2 安装PyCharm2.3 用pycharm编写python程序 1. Python的背景知识 1.1 Python是咋来的? 由Guido van Rossum于1989年圣诞节为打发无…

一个用于管理多个 Node.js 版本的安装和切换开源工具

大家好,今天给大家分享一个用于管理多个Node.js版本的工具 NVM(Node Version Manager),它允许开发者在同一台机器上安装和使用不同版本的Node.js,解决了版本兼容性问题,为开发者提供了极大的便利。 在开发环…

路网双线合并单线——ArcGISpro 解决方法

路网双线合并成单线是一个在地图制作、交通规划以及GIS分析中常见的需求。双线路网定义:具有不同流向、不同平面结构的道路。此外,车道数较多的道路(例如,双黄实线车道数大于4的道路)也可以视为双线路网,本…

iPhone 如何修改锁屏密码?修改密码的具体步骤总结

修改 iPhone 锁屏密码 当你还记得当前设置的锁屏密码时,想要修改密码就非常的简单了,只需要简单的点几下就可以重新设置新密码,下面是具体的操作步骤: 首先我们进入设置应用程序,然后找到“面容 ID 与密码”。 然后需…

(01)Unity使用在线AI大模型(使用百度千帆服务)

目录 一、概要 二、环境说明 三、申请百度千帆Key 四、使用千帆大模型 四、给大模型套壳 一、概要 在Unity中使用在线大模型分为两篇发布,此篇文档为在Python中使用千帆大模型,整体实现逻辑是:在Python中接入大模型—>发布为可传参的…

护眼台灯的功能作用有哪些?深挖台灯护眼是真的吗

随着现代生活方式的改变,孩子们面临着越来越多的视力挑战。在近视学生中,近10%为高度近视,且占比随年级升高而增长。幼儿园6岁儿童中有1.5%为高度近视,而高中阶段则达到了17.6%。为了守护孩子们的视力健康,在科技飞速发…

无符号数和有符号数的转换

1、有符号数转换成无符号数 1.1 例一 首先,我们需要清楚 C语言中负数是以补码的形式进行存储的。 示例:负数-1, (此处,假设是8位二进制表示) 对应正数的原码:0000 0001;取反&…

通俗易懂多图透彻讲解二叉树的遍历--前序, 中序和后序

二叉树的遍历是一个数据结构中经常会遇到的知识点, 具体又分为前序, 中序和后序三种. 什么是树? 先来理解一下什么是树, 从一个我们相对熟悉的家谱树(Family Tree)说起吧. 家族的根是爷爷, 然后生了两个娃, 大伯和你爸爸. 继续往下, 有堂哥堂姐, 还有你以及你妹, 等等. 一个…

简化流程,强化协作——揭秘可道云TeamOS文档审批的实用魅力

在团队协作的过程中,文档审批是确保信息安全和流程规范的重要环节。然而,传统的文档审批流程往往繁琐且僵化,难以满足团队快速响应和灵活协作的需求。 可道云teamOS的文档审批功能,以其独特的灵活性和便捷性,为团队带…

java——Junit单元测试

测试分类 黑盒测试:不输入代码,给输入值,看程序能够给出期望的值。 白盒测试:写代码,关注程序具体执行流程。 JUnit单元测试 一个测试框架,供java开发人员编写单元测试。 是程序员测试,即白…

PBT激光穿透率测量仪

在现代材料科学与工业制造领域,激光技术以其高精度、高效率和非接触性等特点,成为了不可或缺的测量与加工手段。其中,PBT(聚对苯二甲酸丁二醇酯)作为一种重要的热塑性工程塑料,因其优异的机械性能、耐热性和…

嵌入式全栈设计思路:STM32G4+ChibiOS+FreeRTOS+PID控制+PFC算法构建高效智能电源管理系统(附代码示例)

智能电源管理系统是一个基于STM32G4微控制器的高性能数字电源控制解决方案。本项目旨在设计一个功能全面、高效稳定的电源管理系统,可广泛应用于工业控制、新能源、通信设备等领域。 1.1 系统主要特点 高精度数字电源控制:利用STM32G4的高性能ADC和定时器,实现精确…

HTML5+CSS3小实例:纯CSS实现奥运五环

实例:纯CSS实现奥运五环 技术栈:HTML+CSS 效果: 源码: 【HTML】 <!DOCTYPE html> <html lang="zh-CN"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-sca…

网页数据抓取:融合BeautifulSoup和Scrapy的高级爬虫技术

网页数据抓取&#xff1a;融合BeautifulSoup和Scrapy的高级爬虫技术 在当今的大数据时代&#xff0c;网络爬虫技术已经成为获取信息的重要手段之一。Python凭借其强大的库支持&#xff0c;成为了进行网页数据抓取的首选语言。在众多的爬虫库中&#xff0c;BeautifulSoup和Scrap…

在Android Jetpack Compose中实现夜间模式

在Android Jetpack Compose中实现夜间模式 随着用户对夜间模式需求的增加,Android开发者需要掌握如何在应用中实现这一功能。Jetpack Compose作为现代Android UI工具包,提供了简便且灵活的方式来实现夜间模式。本文将详细介绍如何在Jetpack Compose中实现夜间模式,包括配置…

Linux系统之玩转fortune命令

Linux系统之好玩的fortune命令 一、fortune命令介绍1.1 fortune简介1.2 fortune中英文 二、本地环境介绍2.1 本地环境规划2.2 本次实践介绍 三、检查本地环境3.1 检查本地操作系统版本3.2 检查系统内核版本 四、fortune英文版的使用4.1 安装fortune英文版4.2 命令帮助4.3 fortu…

安卓手机刷入Magisk面具教程

手机如果想获取 Root 权限&#xff0c;刷入面具是必要的做法。本期文章将会教你如何刷入 Magisk 面具。 准备工作 Magisk: 关注微信公众号 heStudio Community回复 magisk 获取下载链接。第三方 Recovery&#xff08;官方 Recovery 能玩出什么花样&#xff1f;&#xff1f;&a…