统计分析方法-非参数检验-python

文章目录

  • 前言
  • 非参数检验
    • 特点
  • 常见的非参数检验
  • 一、Cliff's Delta
    • 动机
    • 定义
  • 二、Wilcoxon Signed-Rank Test
    • 定义
  • 三、 Friedman检验
    • 适用场景
    • 公式
  • python 代码
    • Wilcoxon Signed-Rank Test和 cliffs delta
    • Friedman


前言

记录一下自非参数检验的学习过程,如有不对请纠正。

非参数检验

非参数检验是一类统计检验方法,它不对数据的分布作出严格假设,尤其是正态性假设。与参数检验(如t检验、ANOVA)不同,非参数检验不需要数据符合特定的分布,因此在处理不符合正态分布的数据或分类数据时非常有用。

特点

无需分布假设: 不要求数据符合特定的分布,如正态分布。
适用于各种数据类型: 不仅适用于连续型数据,还适用于有序数据和分类数据。
鲁棒性: 对异常值和数据的分布形态不敏感。
应用广泛: 常用于小样本和分布未知的数据集。

常见的非参数检验

Mann-Whitney U检验:用于比较两个独立样本的中位数。
Wilcoxon Signed-Rank Test:用于比较两个相关样本的中位数差异。
Kruskal-Wallis检验:用于比较多个独立样本的中位数。
Friedman检验:用于比较多个相关样本的中位数。(至少三组)

注:这些非参数检验在小样本的情况下至少需要5个样本。

一、Cliff’s Delta

Cliff’s Delta(Cliff’s δ)是一个非参数检验,用于衡量两个独立样本之间的差异。它通过比较两个样本的每对数据点来评估一个样本中的值在另一个样本中的值之前或之后出现的频率。(一般用于假设检验的有用补充分析)
The Cliff’s Delta statistic is a non-parametric effect size measure that quantifies the amount of difference between two groups of observations beyond p-values interpretation. This measure can be understood as a useful complementary analysis for the corresponding hypothesis testing.

动机

大致意思:认为非参数检验中仅靠p-value只能表明A和B存在显著差异,但是其差异量的大小是未知的。参考链接
The main contribution of ESMs to the correct interpretation of hypothesis testing has been earlier noticed by Fisher (1925), who argued that p-values do not really inform about the magnitude of a difference between two groups of observations. For example, if treatments A and B produce a statistically significant difference on the dependent variable, the amount of such discrepancy remains unknown. It is correctly concluded that the difference is important, but the researcher can not claim how important it is.

定义

Cliff’s Delta表示两个组的效果大小,范围在-1到1之间:

δ = 1 表示所有值在样本A中都大于样本B。
δ = -1 表示所有值在样本B中都大于样本A。
δ = 0 表示两个样本没有差异。

具体的假设,例如δ>0.33时,则认为ES(effect size)较大。
在这里插入图片描述

二、Wilcoxon Signed-Rank Test

Wilcoxon Signed-Rank Test(威尔科克森符号秩检验)是一个非参数统计检验,用于比较两个相关样本或配对样本的中位数差异。它是一种用于检验配对差异是否对称分布的无假设检验方法。

定义

该检验用于评估在一组配对数据中的差异是否显著。适用于:

1.两个配对样本。
2.相关样本之间的比较。
3. 如果p-value的值小于0.05(统计学中一般有0.1,0.05以及0.01),则说明配对样本之间的差异显著。

三、 Friedman检验

Friedman检验是一种非参数统计检验,用于比较多个相关样本(配对样本)的中位数差异。它是用于检测多组相关样本之间是否存在显著差异的有效方法,通常用于重复测量设计或块设计中的数据分析。

适用场景

重复测量设计: 同一组对象在不同条件下的测量结果。
块设计: 实验对象被分成多个块,每个块中的实验对象在所有处理条件下都进行测量。

公式

在这里插入图片描述

在这里插入图片描述
注:本领域一般使用Friedman计算三组样本之间是否存在显著性差异,如果存在。则继续使用其它非参数检验比较两组之间的显著性差异。

python 代码

Wilcoxon Signed-Rank Test和 cliffs delta

from scipy import stats
def cliffs_delta(lst1, lst2):"""Cliff's Delta test"""from cliffs_delta import cliffs_deltareturn cliffs_delta(lst1, lst2)
def wilcoxon_signed_rank_test(lst1, lst2):"""Wilcoxon Signed-Rank Test"""return stats.wilcoxon(lst1, lst2)data1 = [93.40 ,98.69,99.87,99.31 ,99.77 ,97.84]
data2 = [93.4,96.77,97.71,91.67,97.97 ,95.73]cliffs_delta_value = cliffs_delta(data1, data2)
wilcoxon_statistic, wilcoxon_p_value = wilcoxon_signed_rank_test(data1, data2)print("Cliff's Delta:", cliffs_delta_value)
print("Wilcoxon Signed-Rank Test p-value:", wilcoxon_p_value)

Friedman

# -- coding:utf-8 --
import numpy as np
import scipy.stats as stats# 示例数据,表示三个模型在六个数据集上的性能
# 计算方差和均值是为了比较在模型的总体稳定性和泛化性。
model1 = [93.40 ,96.77 ,97.71 ,91.67 ,97.97 ,95.73]
model2 = [85.85 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/29327.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[AI资讯·0618] 快手AI模型“可灵“在质量优于Sora,OpenAI和谷歌发布新技术推动AI视频推理发展,Gemini1.5Pro在该榜单中表现突出

AI资讯 陕西推出AI千亿级发展计划,五大产业集群,智算超3000P试了快手的视频AI,竟然有点领先“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?Gemini视频推理遥遥领先GPT-4o,首个视频多模态基准Video-MME国…

dockerhub无法拉取镜像后,国内怎么拉取镜像?

一、比如你拉取的镜像在hub.docker 你要拉取的镜像前面加前缀: m.daocloud.io 这里比如我要拉取: nginx-ingress:latest 正常我们是 docker pull nginx/nginx-ingress 现在因为某些原因,我们需要下面这样写: docker pull …

重新定义DPU——中科驭数2024产品发布会,6月19日诚邀莅临!

数据中心正经历着前所未有的变革,DPU作为数据中心第三颗主力芯片,正引领行业步入一个高效、灵活的算力新时代。 中科驭数在业内率先完成三代DPU芯片研发迭代,并完成规模化商用落地。一路以来,我们衷心地感谢客户和合作伙伴的鼎力…

避雷!又6本期刊被On Hold!ELSEVIER旗下影响因子高达10+SSCI上榜

【SciencePub学术】继《INFORMATION SCIENCES》被On Hold 之后,又新增3本SCIE期刊、3本SSCI期刊被列入On Hold名单。其中包含ELSEVIER旗下影响因子高达10的《RESOURCES POLICY》。 官方现在对期刊质量的管控越来越严格了,被标记为On Hold后的期刊中&…

【自动驾驶】串口通信控制与反馈

文章目录 串口通信控制与反馈通讯协议上行数据帧解析下行数据帧解析串口通信控制与反馈 通讯协议 上行数据指的是机器人底盘向上位机发送的状态数据, 下行数据指的是上位机向机器人底盘发送的控制信息。 上行数据帧解析 机器人运动底盘通过串口发送的数据包格式,如下表所…

SQL Server入门-SSMS简单使用(2008R2版)-1

环境: win10,SQL Server 2008 R2 参考: SQL Server 新建数据库 - 菜鸟教程 https://www.cainiaoya.com/sqlserver/sql-server-create-db.html 第 2 课:编写 Transact-SQL | Microsoft Learn https://learn.microsoft.com/zh-cn/…

LabVIEW电池管理系统测试平台

随着混合动力汽车技术的快速发展,对电池管理系统(BMS)的测试需求显著增加。利用LabVIEW软件开发了一款电池管理系统测试平台,通过模拟电池行为验证BMS的控制策略,从而降低成本、缩短开发周期,并提高整车的能…

基于MYSQL的JAVA初级优化措施

世界是草台班子,这句话视乎很流行! 经历过几家创业公司的项目优化,以及大公司项目. 很多优化非常初级,用心点都能自己找出来! 其实主要原因当初是为了赶进度,能省则省.什么设计啊? 什么性能压测啊. 都省掉吧! 质量都要靠测试人员帮忙找出来,更何况是性能问题呢! 那怕是配齐了…

线上扭蛋机小程序开发,潮玩时代的创新发展

随着互联网的发展,扭蛋机市场也进行了创新发展,线上扭蛋机小程序为市场带来了新活力。扭蛋机小程序将传统的模式与互联网结合,打造一个便捷有趣的扭蛋机市场。 一、扭蛋机小程序 在扭蛋机小程序上,用户通过扭蛋机抽取各种系列的…

如何查看Linux系统中占用CPU资源高的进程

在Linux系统中,管理进程并监控其资源使用情况是一项重要的任务。当系统性能下降或响应变慢时,通常是由于某个或多个进程占用了过多的CPU资源。为了找出这些进程并采取相应的措施,我们可以使用多种命令行工具。以下是几种常用的方法&#xff0…

Ubuntu乌班图安装VIM文本编辑器工具

系列文章目录 Ubuntu-24.04-live-server-amd64安装界面中文版 Ubuntu-24.04-live-server-amd64启用ssh Ubuntu安装qemu-guest-agent 文章目录 系列文章目录前言一、安装VIM?二、VIM基本设置总结 前言 从centos转到Ubuntu发现默认安装没有vi 一、安装VIM&#xff1…

SpringMVC系列十一: 文件上传与自定义拦截器

文章目录 SpringMVC文件上传基本介绍需求分析 / 图解应用实例-代码实现 自定义拦截器什么是拦截器自定义拦截器执行流程分析图自定义拦截器应用实例快速入门注意事项和细节Debug执行流程 多个拦截器多个拦截器执行流程示意图应用实例1代码实现注意事项和细节 应用实例2 作业布置…

HTML 全局属性介绍及示例

HTML 全局属性是一组可以在任何HTML元素中使用的属性。这些属性提供了一种方式来定义元素的通用行为或外观。以下是一些常见的HTML全局属性及其示例。 id id 属性为元素提供了一个唯一的标识符。它不能在 <head>, <html>, <meta>, <script>, <sty…

9.2.2 DeepLab系列模型中每一代的创新是什么?是为了解决什么问题?

9.2.2 DeepLab系列模型中每一代的创新是什么&#xff1f;是为了解决什么问题&#xff1f; 前情回顾&#xff1a;9.2.1 简述图像分割中经常用到的编码器-解码器网络结构的设计理念。 DeepLab是Google 团队提出的一系列图像分割算法。 DeepLab v1在2014年被提出&#xff0c;并在…

微信小程序接入lottie动画

1、注意&#xff1a;canvas渲染出来的层级太高&#xff0c;当有弹窗的情况会暴露在弹窗外 模拟器上会有这个问题&#xff0c;线上版本不会有 2、需求 需要把lottie动画在小程序的环境下进行展示 3、什么是lottie动画 由Airbnb开发并开源。允许设计师将复杂的矢量动画导出为…

欢迎莅临ARCHE-2024,共享智慧档案盛宴!

敬邀参观&#xff01;2024第三届上海国际智慧档案展览会&#xff08;ARCHE-2024&#xff09;将于2024年6月19-21日在上海跨国采购会展中心盛大开幕。深圳市铨顺宏科技有限公司将展示最新的智慧档案技术与解决方案&#xff0c;展位号H010-H011。期待您的光临&#xff0c;共同探索…

对比 Axios 和 Fetch:选择最适合的 HTTP 请求方法

在前端开发中&#xff0c;处理 HTTP 请求是一个常见且重要的任务。JavaScript 提供了多种方式来发送网络请求&#xff0c;其中最受欢迎的两种方式分别就是 Fetch API 和 Axios。尽管两者都能完成同样的任务&#xff0c;即从客户端向服务器发送请求并接收响应&#xff0c;但它们…

无线麦克风推荐哪些品牌?一文读懂家用无线麦克风哪个牌子好!

​在这个充满创意与表达的时代&#xff0c;无线领夹麦克风以其独特的魅力&#xff0c;成为了声音创作者们的得力助手。它小巧便携&#xff0c;功能强大&#xff0c;无论是日常拍摄、直播互动还是专业演出&#xff0c;都能轻松应对&#xff0c;让你的声音随时随地清晰传递。那么…

编程精粹—— Microsoft 编写优质无错 C 程序秘诀 04:对程序进行逐步跟踪

这是一本老书&#xff0c;作者 Steve Maguire 在微软工作期间写了这本书&#xff0c;英文版于 1993 年发布。2013 年推出了 20 周年纪念第二版。我们看到的标题是中译版名字&#xff0c;英文版的名字是《Writing Clean Code ─── Microsoft’s Techniques for Developing》&a…

建筑工地通常那种考勤机好用?

建筑工地通常那种考勤机好用&#xff1f; 大量从乡村前往城市的务工者&#xff0c;所从事的多为建筑工程类行业&#xff0c;此种行业对学历与技能的要求不高&#xff0c;而工资水平倒也尚可&#xff0c;正因如此才吸引了众多劳动者。那要怎样管好工地上的项目呢&#xff1f;首要…