(四)相关性分析 学习简要笔记 #统计学 #CDA学习打卡

目录

一. 相关性分析简介

二. 相关性分析方法

1)连续型变量vs连续型变量:Pearson/Spearman

(a)Pearson

(b)Spearman等级相关系数

2)二分类变量(自然)vs连续型变量:Point-biserial

3)无序分类变量vs连续型变量:ANOVA

4)有序分类变量VS连续型变量

5)二分类变量vs二分类变量:卡方检验联合Cramer's V

(a)卡方检验指标

6)二分类变量(有序)vs连续型变量:Biserial

7)有序分类变量vs有序分类变量:Kendall秩相关系数


一. 相关性分析简介

上一期的假设检验、方差分析基本上都是围绕差异性分析,不论是单个总体还是两个总体及以上,总之都是属于研究“区别”,而本期则关注“联系”。变量之间的关系分为函数关系和相关关系,本期重点探讨的是不同类型变量之间的相关性。

常见变量类型以及相关性分析方法如下图:

二. 相关性分析方法

1)连续型变量vs连续型变量:Pearson/Spearman

(a)Pearson

Pearson相关系数度量了两个连续变量之间的线性相关程度,表达公式如下:

  • Pandas计算Pearson相关系数

  • scipy计算Pearson相关系数

(b)Spearman等级相关系数

Pearson相关系数要求连续变量的取值服从正态分布,而Spearman等级相关系数可以衡量非线性关系变量间的相关系数,是一种非参数的统计方法,可以用于定序变量或不满足正态分布假设的等间隔数据。表达公式如下:

对两个变量成对的取值分别按照从小到大(或者从大到小)顺序编秩,Ri代表xi的秩次,Qi代表yi的秩次,Ri-Qi为xi、yi的秩次之差。

2)二分类变量(自然)vs连续型变量:Point-biserial

假设想要研究性别对于某种疾病是否存在影响:有一个二元变量“性别”(男、女)和一个连续型变量“疾病指数”。我们想要计算性别与疾病指数之间的相关系数,就需要用到Point-biserial相关系数。

3)无序分类变量vs连续型变量:ANOVA

假设我们想要比较不同教育水平的学生在CDA考试成绩上是否存在显著差异。我们有一个无序分类变量“教育水平”(高中、本科、研究生)和一个连续型变量“考试成绩”。

4)有序分类变量VS连续型变量

将连续型变量离散化后当做有序分类,然后用有序分类变量VS有序分类变量的方法。

5)二分类变量vs二分类变量:卡方检验联合Cramer's V

一项研究调查了不同性别的成年人对在公众场合吸烟的态度,结果如表所示。那么,性别与对待吸烟的态度之间的相关程度。

(a)卡方检验指标

卡方检验时有多种指标可表示效应量,可结合数据类型及交叉表格类型综合选择:

6)二分类变量(有序)vs连续型变量:Biserial

7)有序分类变量vs有序分类变量:Kendall秩相关系数

Kendall秩相关系数也是一种非参数的等级相关度量,类似于Spearman等级相关系数。

Bye!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/742.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

macos知名的清理软件 cleanmymac和腾讯柠檬哪个好 cleanmymacx有必要买吗

MacOS是一款优秀的操作系统,但是随着使用时间的增加,它也会产生一些不必要的垃圾文件,占用磁盘空间和内存资源,影响系统的性能和稳定性。为了保持MacOS的清洁和高效,我们需要使用一些专业的清理软件来定期扫描和清除这…

CentOS服务器安装宝塔(图文详解)

宝塔的操作其实就是类似于把linux的指令使用方式,通过宝塔这个第三方工具进行可视化展示,但其实,他还是在操作linux,只是不需要你去记那么多的指令,宝塔把大多数的工具都集成到自己里面,这样你就可以在宝塔…

信号量Semaphore

什么是信号量? C中的信号量(Semaphore)是一种同步对象,用于控制对共享资源的访问,以防止多个线程或进程同时访问同一资源,从而避免数据不一致的问题。信号量通过维护一个计数值来实现这一功能,…

【Golang】Gin教学-获取请求信息并返回

安装Gin初始化Gin处理所有HTTP请求获取请求的URL和Method获取请求参数根据Content-Type判断请求数据类型处理JSON数据处理表单数据处理文件返回JSON响应启动服务完整代码测试 Gin是一个用Go(又称Golang)编写的HTTP Web框架,它具有高性能和简洁…

Event loop(Message loop)

事件循环(消息循环) 浏览器的进程模型 进程 程序运行需要有它自己专属的内存空间,可以把这块内存空间简单的理解为进程 每个应用至少有一个进程,进程之间相互独立,即使要通信,也需要双方同意。 线程 …

Java并发体系--atomic--字段类

atomic--字段类 Atomic字段类是一种原子操作类,用于实现多线程环境下对共享变量的原子操作。它可以确保在并发情况下,对共享变量的操作是原子性的,不会出现线程安全问题。 Atomic字段类提供了一些方法,比如get()和set()方法用…

【Linux学习】Linux权限(二)

文章目录 🚀Linux权限管理🚀修改文件的所有者🚀修改文件或目录的所属组🚀同时修改为念的拥有者与所属组🚀文件类型🚀file指令🚀目录权限🚀umask指令🚀粘滞位 &#x1f68…

Ubuntu22.04.4 - Redis - 笔记

一、安装 sudo apt update sudo apt install redis-serverrootzheng:/etc# redis-cli --version redis-cli 6.0.16二、配置文件修改 配置文件地址 /etc/redis/redis.conf 1、开启远程访问 # 注释掉绑定地址#bind 127.0.0.1,让Redis可远程访问 # bind 127.0.0.1 …

论系统的安全架构的三个论点写一篇论文

撰写一篇围绕系统的安全架构三个论点的论文能够提供深刻的见解关于如何构建一个既安全又可靠的系统。接下来,我们将详细探讨这三个论点,并提供一个论文大纲来指导你如何组织和展开你的论述。 论文大纲 1. 引言 简要介绍系统安全架构的重要性&#xff…

Linux 内核的汇编级别的系统调用

2024年4月19日,周五下午 Linux 内核支持多种汇编级别的系统调用,这些系统调用通常以软中断(soft interrupt)的方式实现。 这里列举了一些常见的汇编级别的系统调用: x86 架构下的 int 0x80 调用:在 x86 架…

网盘——私聊

在私聊这个功能实现中,具体步骤如下: 1、实现步骤: A、客户端A发送私聊信息请求(发送的信息包括双方的用户名,聊天信息) B、如果双方在线则直接转发给B,不在线则回复私聊失败,对方…

TLV262x系列单电源运算放大器

这份文件是德州仪器(Texas Instruments)关于TLV262x系列单电源运算放大器的数据手册。以下是该文件的核心内容概要: 产品系列描述: TLV262x系列是德州仪器(Texas Instruments)推出的一系列低功耗、宽带宽的…

Sping源码(七)—ConfigurationClassPostProcessor创建流程

序言 前两篇文章介绍了invokeBeanFactoryPostProcessors的执行流程,和自定义实现BeanDefinitionRegistryPostProcessor类的方式方法。 这篇文章会主要介绍Spring启动加载xml时,ConfigurationClassPostProcessor类是如何加载到Spring中,并且…

VScode 里面使用 python 去直接调用 CUDA

上一个 帖子主要分享了如何 去将 C 程序 打包成一个package。 我们最后的 目的实际上是想把 CUDA 的程序 打包成 一个 Package , C 程序只是起到了桥梁的作用: 首先:CUDA 程序 和 C 的程序一样, 都有一个 .cu 的源文件和 一个 .…

【数学建模】最优旅游城市的选择问题:层次分析模型(含MATLAB代码)

层次分析法(The analytic hierarachy process,简称AHP)是一种常用的决策分析方法,其基本思路是将复杂问题分解为多个组成部分,然后对这些部分进行逐一评估和比较,最后得出最优解决方案。(例如&a…

JVM知识点总结二

参考文章:【Java面试题汇总】JVM篇(2023版)_jvm面试题2023-CSDN博客 1、说说你了解的JVM内存模型: JVM由三部分组成:类加载子系统、运行时数据区、执行引擎 JVM内存模型: 内存模型里的运行时数据区&#…

mongodb 实现两个集合的关联并分页查询

问题描述 实现两个集合的关联并分页查询。 假设&#xff1a; collection1中有deviceId等字段&#xff0c;collection2 中有deviceId、unitName等字段&#xff0c; 关联这两个colltion&#xff0c;并分页查询 代码实现 public ResponseEntity<String> getPageList(Reque…

ruby 配置代理 ip(核心逻辑)

在 Ruby 中配置代理 IP&#xff0c;可以通过设置 Net::HTTP 类的 Proxy 属性来实现。以下是一个示例&#xff1a; require net/http// 获取代理Ip&#xff1a;https://www.kuaidaili.com/?refrg3jlsko0ymg proxy_address 代理IP:端口 uri URI(http://www.example.com)Net:…

机器学习 | 使用Scikit-Learn实现分层抽样

在本文中&#xff0c;我们将学习如何使用Scikit-Learn实现分层抽样。 什么是分层抽样&#xff1f; 分层抽样是一种抽样方法&#xff0c;首先将总体的单位按某种特征分为若干次级总体&#xff08;层&#xff09;&#xff0c;然后再从每一层内进行单纯随机抽样&#xff0c;组成…

Django项目使用uwsgi+nginx部署上线

Django项目使用uwsginginx部署上线 前言settings 配置安装uwsgi 和配置uwsgi推荐配置文件启用wsgi不使用nginx的配置&#xff08;不推荐&#xff09;使用nginx的配置 安装 nginx和配置niginx 配置 运行参考资料 前言 代码已经开发完成&#xff0c;正式部署上线 settings 配置…