sklearn.preprocessing.RobustScaler(解释和原理,分位数,四分位差)

提示:sklearn.preprocessing.RobustScaler(解释和原理,分位数,四分位差)

文章目录

    • @[TOC](文章目录)
  • 一、RobustScaler 是什么?
  • 二、代码
    • 1.代码
    • 2.输出结果
  • 总结

提示:以下是本篇文章正文内容,下面案例可供参考

一、RobustScaler 是什么?

RobustScaler 的居中和缩放统计基于百分位数,因此不会受到少数非常大的边缘异常值的影响。
计算公式如下(具体计算公式以官网提供的代码为准):

value_result = (value-Media)/(Q1-Q3)
Q1的位置 = 1 * (n + 1) / 4
Q3的位置 =  3 *(n + 1) / 4
n : 表示数据的个数。
media : 中位数
Q1 : 是第 1 个四分位数(第 25 个分位数)
Q3 : 第 3 个四分位数(第 75 个分位数)

在这里插入图片描述

二、代码

1.代码

import pandas as pd
from sklearn.preprocessing import RobustScalerdata = pd.DataFrame({'a': [1, 2, 3, 4, 6, 5, 6],'b': [5, 6, 6, 5, 6, 5, 6],'c': [9, 100, 2, 6, 5, 6, 8]}
)
print(data.values)robustlizer = RobustScaler(quantile_range=(25.0, 75.0))
robustlizer_data = robustlizer.fit_transform(data)
print(robustlizer.get_params())
print(robustlizer_data)

2.输出结果

[[  1   5   9][  2   6 100][  3   6   2][  4   5   6][  6   6   5][  5   5   6][  6   6   8]]
{'copy': True, 'quantile_range': (25.0, 75.0), 'unit_variance': False, 'with_centering': True, 'with_scaling': True}
[[-1.         -1.          1.        ][-0.66666667  0.         31.33333333][-0.33333333  0.         -1.33333333][ 0.         -1.          0.        ][ 0.66666667  0.         -0.33333333][ 0.33333333 -1.          0.        ][ 0.66666667  0.          0.66666667]]

第一列数据:【1,2,3,4,6,5,6】,重排列:1,2,3,4,5,6,6
media=4
Q1的位置 =(n + 1) / 4 = (7+1)/ 4 = 2,则Q1 = 2,同理Q3 =6
value_result[0] = (1-4)/(6-3)=-1
其他同理

总结

1,由于中位数的选取和分位点的选取规则不一样,可能导致不同的结果,尤其在处理的数据较少时,可能影响较大。
2,根据Q1,Q3的计算公式可得,有时候计算的为分数,所以在这个时候Q1和Q3的取法可能有很大的不同。
3,当数据量足够,数据较密集时,可以看到和计算公式就很吻合。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/715728.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ELK学习

ELK 一、ELK介绍 😄 “ELK”是三个开源项目的首字母缩写,这三个项目分别是:Elasticsearch、Logstash 和 Kibana。Elasticsearch 是一个搜索和分析引擎。Logstash 是服务器端数据处理管道,能够同时从多个来源采集数据&#xff0…

网络编程(IP、端口、协议、UDP、TCP)【详解】

目录 1.什么是网络编程? 2.基本的通信架构 3.网络通信三要素 4.UDP通信-快速入门 5.UDP通信-多发多收 6.TCP通信-快速入门 7.TCP通信-多发多收 8.TCP通信-同时接收多个客户端 9.TCP通信-综合案例 1.什么是网络编程? 网络编程是可以让设…

Redis的事务

在 Redis 中,事务(Transaction)是一组命令的集合,可以作为一个单独的操作来执行,保证这组命令要么全部执行成功,要么全部执行失败,具有原子性。在 Redis 中,事务是通过 MULTI、EXEC、…

repo介绍和安装

介绍 https://blog.devwiki.net/2023/11/27/Windows-repo.html 安装: https://blog.csdn.net/ysy950803/article/details/104188793

网络安全-appcms-master

一、环境 gethub上面自己找appcms-master 二、开始闯关 原理:在评论的时候提交可以提交到管理员列表去,管理员一看cookie和地址就被盗走了 点进去软件后会发现提交按钮 随便提交一下看看 放到div标签里面是不是有可能可以做,看看后台吧 那…

初学者如何学习python

Python 作为当今最受欢迎的编程语言之一,已经被包括谷歌、优步、Instagram 等知名公司广泛采用于他们的应用程序开发。由于其易学易用的特性,Python 成为了编程初学者的首选语言。特别是在机器学习和数据科学领域,Python 的应用更是让它成为了…

VUE CLI3项目搭建 ESLint配置

VUE项目框架配置 一、工具准备 Node.js安装 安装方法:点击查看WebStorm安装 下载地址:点击查看 二、环境准备 镜像准备 1.查看代理:npm get registry 2.设置淘宝镜像 2.1临时使用. npm --registry https://registry.npm.taobao.org ins…

【电机仿真】空间矢量脉宽调制(SVPWM)算法与实现

前言 文章【电机仿真】永磁同步电机模型中所提及了PMSM数学模型,模型算法是电机控制的理论基础,但在实际控制中,需要将这两部分具象化。实际电机所需要的总是三相电流或者电压,控制对象为逆变器中的开关器件,我们需要将…

springboot基于web的音乐网站论文

音乐网站 摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了音乐网站的开发全过程。通过分析音乐网站管理的不足,创建了一个计算机管理音乐网站的方案。文章介绍了音乐网站的系统分析部分&#xff0c…

114.龙芯2k1000-pmon(13)- 串口如何用

本文是讲原理图的部分,跟pmon的关系不大!! 参考手册:《龙芯2K1000处理器用户手册.pdf》 刚刚看数据手册,让我是有点惊讶,但是也让我迷惑。(一个串口复用为4个是啥意思?)…

Java项目:32 基于springboot的课程作业管理系统(含源码数据库+文档免费送)

作者主页:源码空间codegym 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文中获取源码 项目介绍 管理员:首页、个人中心、公告信息管理、班级管理、学生管理、教师管理、课程类型管理、课程信息管理、学生选课管理、作业布置管理…

CK98-数学家键盘配置

官方驱动和说明书下载地址 https://www.coolkiller.cn/download/lists_6.html 介绍:https://new.qq.com/rain/a/20221229A09B1M00 官方CK-98数学家驱动版本(谨慎更新) 如果升级驱动出现问题,重启驱动软件后会默认让你恢复的。 …

[蓝桥杯 2020 省 AB3] 日期识别

每日一道算法题之日期识别 一、题目描述二、思路三、C代码 一、题目描述 题目来源:洛谷 【蓝桥杯 2020 第三轮省赛 AB 组 F 题】小蓝要处理非常多的数据, 其中有一些数据是日期。 在小蓝处理的日期中有两种常用的形式:英文形式和数字形式。英文形式采用…

利用小蜜蜂AI智能问答ChatGPT+AI高清绘图生成图文故事案例

利用小蜜蜂AI智能问答ChatGPTAI高清绘图生成图文故事案例 这段时间利用小蜜蜂AI网站做了一些编程、绘图以及数据分析方面的案例。再过几个月,我的大孙子就要出生了。我要用小蜜蜂AI智能问答和AI高清绘图为大孙子生成一个1-9的数字图文故事。 小蜜蜂AI网站可以扫如…

程序项目打包发布方法,采用InstallShield软件

重点: 1.程序项目做出来了,需要打包发布给用户。如何打包是关键。 2.采用InstallShield软件进行发布。 步骤一:创建一个依赖三方库配置环境的bat文件的项目。 (主要测试三方库打包 和如果有bat文件,需要先创建环境&…

读书笔记-三国演义-曹操

魏武帝曹操(155年-220年),是中国东汉末年至三国时期的重要政治家、军事家和文学家,同时也是三国时期魏国的建立者。他以其雄才大略、果断机敏的领导才能以及卓越的军事才华而闻名于世。 生平 曹操出生于豫州谯县&…

C++STL排序原理简介

../chromedriver 一份简化的代码(可读性较强)一份简化的代码(可读性较强) 一份简化的代码(可读性较强) c 的sort用了很多年,一直不知道具体是怎么写的 决定看看代码,以下文章结构可能有点混乱,建议读者同时打开vs同步跳转 https://www.geeksf…

一文认识蓝牙(验证基于Aduino IDE的ESP32)

1、简介 蓝牙技术是一种无线通信的方式,利用特定频率的波段(2.4GHz-2.485GHz左右),进行电磁波传输,总共有83.5MHz的带宽资源。 1.1、背景 蓝牙(Bluetooth)一词取自于十世纪丹麦国王哈拉尔Haral…

Thread.start() run()

Thread.start() & run() public static void main(String[] args) { new Thread(new Runnable() {Overridepublic void run() {System.out.println("2432");}}).start(); }public class Thread implements Runnable {//通过构造方法调用init方法,在…

Springboot+vue的商业辅助决策系统的设计与实现(有报告)。Javaee项目,springboot vue前后端分离项目

演示视频: Springbootvue的商业辅助决策系统的设计与实现(有报告)。Javaee项目,springboot vue前后端分离项目 项目介绍: 本文设计了一个基于Springbootvue的前后端分离的商业辅助决策系统的设计与实现,采…