统计分析方法-非参数检验-python

文章目录

  • 前言
  • 非参数检验
    • 特点
  • 常见的非参数检验
  • 一、Cliff's Delta
    • 动机
    • 定义
  • 二、Wilcoxon Signed-Rank Test
    • 定义
  • 三、 Friedman检验
    • 适用场景
    • 公式
  • python 代码
    • Wilcoxon Signed-Rank Test和 cliffs delta
    • Friedman


前言

记录一下自非参数检验的学习过程,如有不对请纠正。

非参数检验

非参数检验是一类统计检验方法,它不对数据的分布作出严格假设,尤其是正态性假设。与参数检验(如t检验、ANOVA)不同,非参数检验不需要数据符合特定的分布,因此在处理不符合正态分布的数据或分类数据时非常有用。

特点

无需分布假设: 不要求数据符合特定的分布,如正态分布。
适用于各种数据类型: 不仅适用于连续型数据,还适用于有序数据和分类数据。
鲁棒性: 对异常值和数据的分布形态不敏感。
应用广泛: 常用于小样本和分布未知的数据集。

常见的非参数检验

Mann-Whitney U检验:用于比较两个独立样本的中位数。
Wilcoxon Signed-Rank Test:用于比较两个相关样本的中位数差异。
Kruskal-Wallis检验:用于比较多个独立样本的中位数。
Friedman检验:用于比较多个相关样本的中位数。(至少三组)

注:这些非参数检验在小样本的情况下至少需要5个样本。

一、Cliff’s Delta

Cliff’s Delta(Cliff’s δ)是一个非参数检验,用于衡量两个独立样本之间的差异。它通过比较两个样本的每对数据点来评估一个样本中的值在另一个样本中的值之前或之后出现的频率。(一般用于假设检验的有用补充分析)
The Cliff’s Delta statistic is a non-parametric effect size measure that quantifies the amount of difference between two groups of observations beyond p-values interpretation. This measure can be understood as a useful complementary analysis for the corresponding hypothesis testing.

动机

大致意思:认为非参数检验中仅靠p-value只能表明A和B存在显著差异,但是其差异量的大小是未知的。参考链接
The main contribution of ESMs to the correct interpretation of hypothesis testing has been earlier noticed by Fisher (1925), who argued that p-values do not really inform about the magnitude of a difference between two groups of observations. For example, if treatments A and B produce a statistically significant difference on the dependent variable, the amount of such discrepancy remains unknown. It is correctly concluded that the difference is important, but the researcher can not claim how important it is.

定义

Cliff’s Delta表示两个组的效果大小,范围在-1到1之间:

δ = 1 表示所有值在样本A中都大于样本B。
δ = -1 表示所有值在样本B中都大于样本A。
δ = 0 表示两个样本没有差异。

具体的假设,例如δ>0.33时,则认为ES(effect size)较大。
在这里插入图片描述

二、Wilcoxon Signed-Rank Test

Wilcoxon Signed-Rank Test(威尔科克森符号秩检验)是一个非参数统计检验,用于比较两个相关样本或配对样本的中位数差异。它是一种用于检验配对差异是否对称分布的无假设检验方法。

定义

该检验用于评估在一组配对数据中的差异是否显著。适用于:

1.两个配对样本。
2.相关样本之间的比较。
3. 如果p-value的值小于0.05(统计学中一般有0.1,0.05以及0.01),则说明配对样本之间的差异显著。

三、 Friedman检验

Friedman检验是一种非参数统计检验,用于比较多个相关样本(配对样本)的中位数差异。它是用于检测多组相关样本之间是否存在显著差异的有效方法,通常用于重复测量设计或块设计中的数据分析。

适用场景

重复测量设计: 同一组对象在不同条件下的测量结果。
块设计: 实验对象被分成多个块,每个块中的实验对象在所有处理条件下都进行测量。

公式

在这里插入图片描述

在这里插入图片描述
注:本领域一般使用Friedman计算三组样本之间是否存在显著性差异,如果存在。则继续使用其它非参数检验比较两组之间的显著性差异。

python 代码

Wilcoxon Signed-Rank Test和 cliffs delta

from scipy import stats
def cliffs_delta(lst1, lst2):"""Cliff's Delta test"""from cliffs_delta import cliffs_deltareturn cliffs_delta(lst1, lst2)
def wilcoxon_signed_rank_test(lst1, lst2):"""Wilcoxon Signed-Rank Test"""return stats.wilcoxon(lst1, lst2)data1 = [93.40 ,98.69,99.87,99.31 ,99.77 ,97.84]
data2 = [93.4,96.77,97.71,91.67,97.97 ,95.73]cliffs_delta_value = cliffs_delta(data1, data2)
wilcoxon_statistic, wilcoxon_p_value = wilcoxon_signed_rank_test(data1, data2)print("Cliff's Delta:", cliffs_delta_value)
print("Wilcoxon Signed-Rank Test p-value:", wilcoxon_p_value)

Friedman

# -- coding:utf-8 --
import numpy as np
import scipy.stats as stats# 示例数据,表示三个模型在六个数据集上的性能
# 计算方差和均值是为了比较在模型的总体稳定性和泛化性。
model1 = [93.40 ,96.77 ,97.71 ,91.67 ,97.97 ,95.73]
model2 = [85.85 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/29327.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# OpenCvSharp函数形参-Size

在C#中使用OpenCvSharp库时,Mat类是用于表示图像的主要数据结构之一。Mat类的构造函数之一是Mat(Size size, int type),其中size和type是两个重要的参数。下面是对这两个参数的详细解释和使用方法。📸 参数解释🔍 Size size: S…

[AI资讯·0618] 快手AI模型“可灵“在质量优于Sora,OpenAI和谷歌发布新技术推动AI视频推理发展,Gemini1.5Pro在该榜单中表现突出

AI资讯 陕西推出AI千亿级发展计划,五大产业集群,智算超3000P试了快手的视频AI,竟然有点领先“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?Gemini视频推理遥遥领先GPT-4o,首个视频多模态基准Video-MME国…

dockerhub无法拉取镜像后,国内怎么拉取镜像?

一、比如你拉取的镜像在hub.docker 你要拉取的镜像前面加前缀: m.daocloud.io 这里比如我要拉取: nginx-ingress:latest 正常我们是 docker pull nginx/nginx-ingress 现在因为某些原因,我们需要下面这样写: docker pull …

重新定义DPU——中科驭数2024产品发布会,6月19日诚邀莅临!

数据中心正经历着前所未有的变革,DPU作为数据中心第三颗主力芯片,正引领行业步入一个高效、灵活的算力新时代。 中科驭数在业内率先完成三代DPU芯片研发迭代,并完成规模化商用落地。一路以来,我们衷心地感谢客户和合作伙伴的鼎力…

避雷!又6本期刊被On Hold!ELSEVIER旗下影响因子高达10+SSCI上榜

【SciencePub学术】继《INFORMATION SCIENCES》被On Hold 之后,又新增3本SCIE期刊、3本SSCI期刊被列入On Hold名单。其中包含ELSEVIER旗下影响因子高达10的《RESOURCES POLICY》。 官方现在对期刊质量的管控越来越严格了,被标记为On Hold后的期刊中&…

10.Python使用chromedriver加selenium模拟人工对浏览器进行操作

在使用python时如果需要对浏览器进行一些操作,我们会用到两个常用的框架,今天一起来看一下。 chromedriver 浏览器驱动,可以理解为一个没有界面的chrome浏览器. Chromedriver 是一个自动化测试工具,它允许开发者通过编程的方式控制 Google Chrome 浏览器,用于自动化测试…

【自动驾驶】串口通信控制与反馈

文章目录 串口通信控制与反馈通讯协议上行数据帧解析下行数据帧解析串口通信控制与反馈 通讯协议 上行数据指的是机器人底盘向上位机发送的状态数据, 下行数据指的是上位机向机器人底盘发送的控制信息。 上行数据帧解析 机器人运动底盘通过串口发送的数据包格式,如下表所…

具体使用Java注解的方式

具体使用Java注解的方式 1.使用预定义注解: 预定义注解是Java提供的一些内置注解,可以直接在代码中使用。例如,Override、Deprecated、SuppressWarnings等。 Override public void run() {// 重写父类的run()方法// ... }Deprecated public…

SQL Server入门-SSMS简单使用(2008R2版)-1

环境: win10,SQL Server 2008 R2 参考: SQL Server 新建数据库 - 菜鸟教程 https://www.cainiaoya.com/sqlserver/sql-server-create-db.html 第 2 课:编写 Transact-SQL | Microsoft Learn https://learn.microsoft.com/zh-cn/…

LabVIEW电池管理系统测试平台

随着混合动力汽车技术的快速发展,对电池管理系统(BMS)的测试需求显著增加。利用LabVIEW软件开发了一款电池管理系统测试平台,通过模拟电池行为验证BMS的控制策略,从而降低成本、缩短开发周期,并提高整车的能…

PostgreSQL内核开发——添加内核函数

在PostgreSQL内核的学习过程中,可以尝试向内核中添加一些函数,扩展PostgreSQL的功能。同时可以增加自己对PG内核的理解。这里我们以简单的添加一个helloworld函数为例,分析一下这个过程中涉及到的相关源码。 PostgreSQL添加pg_helloworld函数 这里总结一下如何向PostgreSQ…

如何零基础学办公软件?沈阳电脑办公软件培训

你说的办公软件是指常用办公软件吧,一般就是office三件套:Word、Excel、PowerPoint,建议直接上手开始完成几个稍微复杂一点的任务: word,建议排版一份毕业论文,找一个大学生的毕业论文,或者随便…

基于MYSQL的JAVA初级优化措施

世界是草台班子,这句话视乎很流行! 经历过几家创业公司的项目优化,以及大公司项目. 很多优化非常初级,用心点都能自己找出来! 其实主要原因当初是为了赶进度,能省则省.什么设计啊? 什么性能压测啊. 都省掉吧! 质量都要靠测试人员帮忙找出来,更何况是性能问题呢! 那怕是配齐了…

线上扭蛋机小程序开发,潮玩时代的创新发展

随着互联网的发展,扭蛋机市场也进行了创新发展,线上扭蛋机小程序为市场带来了新活力。扭蛋机小程序将传统的模式与互联网结合,打造一个便捷有趣的扭蛋机市场。 一、扭蛋机小程序 在扭蛋机小程序上,用户通过扭蛋机抽取各种系列的…

如何查看Linux系统中占用CPU资源高的进程

在Linux系统中,管理进程并监控其资源使用情况是一项重要的任务。当系统性能下降或响应变慢时,通常是由于某个或多个进程占用了过多的CPU资源。为了找出这些进程并采取相应的措施,我们可以使用多种命令行工具。以下是几种常用的方法&#xff0…

Ubuntu乌班图安装VIM文本编辑器工具

系列文章目录 Ubuntu-24.04-live-server-amd64安装界面中文版 Ubuntu-24.04-live-server-amd64启用ssh Ubuntu安装qemu-guest-agent 文章目录 系列文章目录前言一、安装VIM?二、VIM基本设置总结 前言 从centos转到Ubuntu发现默认安装没有vi 一、安装VIM&#xff1…

SpringMVC系列十一: 文件上传与自定义拦截器

文章目录 SpringMVC文件上传基本介绍需求分析 / 图解应用实例-代码实现 自定义拦截器什么是拦截器自定义拦截器执行流程分析图自定义拦截器应用实例快速入门注意事项和细节Debug执行流程 多个拦截器多个拦截器执行流程示意图应用实例1代码实现注意事项和细节 应用实例2 作业布置…

Mongodb UPDATE, 使用$position指定向数组中插入新元素的位置

学习mongodb,体会mongodb的每一个使用细节,欢迎阅读威赞的文章。这是威赞发布的第72篇mongodb技术文章,欢迎浏览本专栏威赞发布的其他文章。如果您认为我的文章对您有帮助或者解决您的问题,欢迎在文章下面点个赞,或者关…

HTML 全局属性介绍及示例

HTML 全局属性是一组可以在任何HTML元素中使用的属性。这些属性提供了一种方式来定义元素的通用行为或外观。以下是一些常见的HTML全局属性及其示例。 id id 属性为元素提供了一个唯一的标识符。它不能在 <head>, <html>, <meta>, <script>, <sty…

vue2+echart 树状图节点密集,可滚动鼠标缩放, 尺寸根据节点调整

vue2echart 树状图节点密集&#xff0c;可滚动鼠标缩放&#xff0c; 尺寸根据节点调整 <template><div ref"chart" style"width: 100%; height: 600px;"></div> </template><script> import * as echarts from echarts;exp…