特征工程使用卡方检测的作用

特征工程使用卡方检测的作用

news/2025/4/27 1:39:44/文章来源:https://blog.csdn.net/cuisidong1997/article/details/134330009

卡方检验主要可以用于处理计数数据的拟合问题。具体说，它可以检验单变量多项分类上的实计数和理论次数分布之间的差异显著性。
它是卡方检验中的一个主要测试指标，卡方检验是一种用途很广的计数资料的假设检验方法，它属于非参数检验的范畴，主要是比较两个及两个以上样本率( 构成比）以及两个分类变量的关联性分析，其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
卡方值是非参数检验中的一个统计量，主要用于非参数统计分析中。它的作用是检验数据的相关性。如果卡方值的显著性（即SIG.）小于0.05，说明两个变量是显著相关的。

卡方检测的详细原理看这篇文章：https://www.freesion.com/article/37741515017/

1. 首先import包和实验数据

from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import chi2
from sklearn.datasets import load_iris

导入IRIS数据集

iris = load_iris()
print(iris.data) # 查看数据

结果输出：

array([[ 5.1, 3.5, 1.4, 0.2],
[ 4.9, 3. , 1.4, 0.2],
[ 4.7, 3.2, 1.3, 0.2],
[ 4.6, 3.1, 1.5, 0.2],
[ 5. , 3.6, 1.4, 0.2],
[ 5.4, 3.9, 1.7, 0.4],
[ 4.6, 3.4, 1.4, 0.3],
…)

2. 使用卡方检验来选择特征

# 选择k个最佳特征

model1 = SelectKBest(chi2, k=2)
# iris.data是特征数据，iris.target是标签数据，该函数可以选择出k个特征
model1.fit_transform(iris.data, iris.target)

结果输出为：

array([[ 1.4, 0.2],
[ 1.4, 0.2],
[ 1.3, 0.2],
[ 1.5, 0.2],
[ 1.4, 0.2],
[ 1.7, 0.4],
[ 1.4, 0.3],
…)

可以看出后使用卡方检验，选择出了后两个特征。如果我们还想查看卡方检验的p值和得分，可以使用第3步。

3. 查看p-values和scores

# 得分

print(model1.scores_ )
# 得分输出为：可以看出后两个特征得分最高，与我们第二步的结果一致
array([ 10.81782088, 3.59449902, 116.16984746, 67.24482759])

查看P值

print(model1.pvalues_)
# p值输出为：可以看出后两个特征的p值最小，置信度也最高，与前面的结果一致。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/137127.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

包教包会：Mysql主从复制搭建

包教包会：Mysql主从复制搭建

笑小枫的专属目录一、无聊的理论知识1. 主从复制原理2. 主从复制的工作过程3. MySQL四种同步方式二、docker下安装、启动mysql1. 安装主库2. 安装从库三、配置Master(主)四、配置Slave(从)五、链接Master(主)和Slave(从)六、主从复制排错1. 错误：error connectin…

阅读更多...

Xcode消除编译器警告的方法

Xcode消除编译器警告的方法

在iOS 不断的升级中，我们经常会遇到一些旧的api或者是属性已经弃用，系统提示采用新的API或者属性替换，可是为了版本上的兼容我们可能还是会用一些就的API或属性，这是系统编译出现黄色的警告，有强迫症的同学看了会非常不…

阅读更多...

win10 下 ros + Qt 工程CMakeLists.txt

win10 下 ros + Qt 工程CMakeLists.txt

win10 下 ros Qt 工程CMakeLists.txt 系统：win10 ros: melodic Qt: 5.12.12 源码目录: D:\workspace\catkin_qt 示例代码 https://github.com/ncnynl/ros-qt.git 由于示例代码是Qt4 ，目前我是用QT5,所以CMakeLists.txt 修改如下 CMakeLists.txt #####…

阅读更多...

asp.net core weapi 结合identity完成登录注册

asp.net core weapi 结合identity完成登录注册

1.安装所需要的nuget包 <PackageReference Include"Microsoft.AspNetCore.Identity.EntityFrameworkCore" Version"6.0.24" /><PackageReference Include"Microsoft.EntityFrameworkCore" Version"6.0.24" /><PackageR…

阅读更多...

npm和yarn的一些命令

npm和yarn的一些命令

文章目录前言前言提示：生命并不短暂，短暂的是人。 --阿多尼斯 yarn config set registry https://registry.npmjs.org --globalnpm install -g cnpm --registryhttps://registry.npm.taobao.org # 切换淘宝源： yarn config set registry…

阅读更多...

算法--数据结构

算法--数据结构

这里写目录标题本节内容链表与邻接表链表主要思想链表操作初始化在head结点后面插入普通插入删除操作例子双链表（双向循环链表）主要思想操作初始化双向插入删除第k个点邻接表主要思想栈和队列栈主要思想主要操作队列主要思想操作单调栈与单调队列…

阅读更多...

通用工作站设计方案：807-ORI-S3R500 -多路PCIe3.0的单CPU通用工作站

通用工作站设计方案：807-ORI-S3R500 -多路PCIe3.0的单CPU通用工作站

ORI-S3R500 -多路PCIe3.0的单CPU通用工作站 (研华工业计算机IPC-610，IPC940 升级款) 一、机箱功能和技术指标： 系统系统型号 ORI-SR500 主板支持 EEB(12*13)/CEB(12*10.5)/ATX(12*9.6)/Mi cro ATX 前置硬盘最大支持2个3.5寸1个2.5寸SATA …

阅读更多...

驱动基石之_tasklet中断下半部_工作队列_中断线程化处理

驱动基石之_tasklet中断下半部_工作队列_中断线程化处理

tasklet中断下半部 linux的中断分为两个部分： 1.中断上半部：在中断上半部期间，不允许被其他中断打断，直到中断上半部的服务函数执行完。 2.中断下半部：中断下半部，在执行中断下半部服务函数的期间&#xf…

阅读更多...

10 个适用于 Windows 的最佳 PDF 编辑器，用于轻松编辑 PDF 文件

10 个适用于 Windows 的最佳 PDF 编辑器，用于轻松编辑 PDF 文件

PDF 是当今最流行的文件格式之一。Adobe 于 1993 年开发了 PDF 文件格式。PDF（便携式文档格式）主要用于存储复杂的文本文档和电子书。PDF 文件包含固定的布局属性，并且可以存储大量文本和图形。PDF 文件格式主要用于分发大型文档。使用 PDF…

阅读更多...

【中间件篇-Redis缓存数据库03】Redis高级特性和应用(发布订阅、Stream)

【中间件篇-Redis缓存数据库03】Redis高级特性和应用(发布订阅、Stream)

Redis高级特性和应用(发布订阅、Stream) 发布和订阅 Redis提供了基于“发布/订阅”模式的消息机制，此种模式下，消息发布者和订阅者不进行直接通信,发布者客户端向指定的频道( channel)发布消息，订阅该频道的每个客户端都可以收到该消息。 …

阅读更多...

安卓常见设计模式3.2------工厂模式，工厂方法模式，抽象工厂模式对比（Kotlin版）

安卓常见设计模式3.2------工厂模式，工厂方法模式，抽象工厂模式对比（Kotlin版）

1. 都是创建型模式工厂模式（Factory Pattern）、工厂方法模式（Factory Method Pattern）和抽象工厂模式（Abstract Factory Pattern）都是创建型设计模式，它们之间有以下区别： 工厂模式…

阅读更多...

asp.net校园招聘管理系统VS开发sqlserver数据库web结构c#编程Microsoft Visual Studio

asp.net校园招聘管理系统VS开发sqlserver数据库web结构c#编程Microsoft Visual Studio

一、源码特点 asp.net 校园招聘管理系统是一套完善的web设计管理系统，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为vs2010，数据库为sqlserver2008，使用c#语言开发应用技术：asp.net c#s…

阅读更多...

HackTheBox-Starting Point--Tier 2---Base

HackTheBox-Starting Point--Tier 2---Base

文章目录一题目二过程记录2.1 打点2.2 权限获取2.3 横向移动2.4 权限提升一题目 Tags Web、Vulnerability Assessment、Custom Applications、Source Code Analysis、Authentication、Apache、PHP、Reconnaissance、Web Site Structure Discovery、SUDO Exploitation、Au…

阅读更多...

ubuntu18.04 通过创建服务实现开机自启, 启动指定脚本

ubuntu18.04 通过创建服务实现开机自启, 启动指定脚本

下面是具体的操作过程切换目录到root cd /root/ 新建一个脚本 vi myscript.sh 添加内容：设置指定网卡的ip地址 (这里根据自己需要修改) #!/bin/bash ifconfig enp0s3 10.20.60.113 赋予执行权限 chmod x myscript.sh 新建一个服务 vi /etc/systemd/system/myscr…

阅读更多...

XOR Construction

XOR Construction

思路： 通过题目可以得出结论 b1^b2a1 b2^b3a2 ....... bn-1^bnan-1 所以就可以得出 (b1^b2)^(b2^b3)a1^a2 b1^b3a1^a2 有因为当确定一个数的时候就可以通过异或得到其他所有的数，且题目所求的是一个n-1的全排列那么求出a的前缀异或和arr之后…

阅读更多...

原型制作神器ProtoPie的使用Unity与网页跨端交互

原型制作神器ProtoPie的使用Unity与网页跨端交互

什么是ProtoPie？ ProtoPie是一款面向设计师的软件原型设计工具，例如制作App界面交互展示，制作好的原型可以一键发布到Web服务器，就可以浏览器访问。由于其内置了大量常用交互类型，以及"程序化"模块&#xf…

阅读更多...

【Redis】掌握篇--Redis与SSM进行整合

【Redis】掌握篇--Redis与SSM进行整合

🥳🥳Welcome Huihuis Code World ! !🥳🥳 接下来看看由辉辉所写的关于Redis的相关操作吧目录 🥳🥳Welcome Huihuis Code World ! !🥳🥳 一.Redis与SSM的整合 1.添加Redis依赖 …

阅读更多...

Go语言函数参数

Go语言函数参数

文章目录 Go语言函数参数1. **函数参数的定义**：2. **参数的数量**：3. **参数的数据类型**：4. **参数的命名**：5. **参数的传递**：6. **参数的传递方式**：7. **空白标识符**： Go语言函数参数在…

阅读更多...

RabbitMQ Demo

RabbitMQ Demo

1.首先安装RabbitMQ服务器，项目中添加RabbitMQ客户端库。以下是一个简单的示例，演示了如何在C#应用程序中发送和接收消息： using RabbitMQ.Client; using System; using System.Text;class Program {static void Main(){var factory new Co…

阅读更多...

Pytorch实战教程（二十八）-交通标志识别

Pytorch实战教程（二十八）-交通标志识别

0. 前言在道路交通场景中，交通标志识别作为驾驶辅助系统与无人驾驶车辆中不可缺少的技术，为车辆行驶中提供了安全保障。在道路上行驶的车辆，道路周围的环境包括许多重要的交通标志信息，根据交通标志信息在道路上做出正确的驾驶行为，通常能够避免发生交通事故。交通标志识…

阅读更多...

最新文章