【异常分析:四分位距与3σ原则】

文章目录

    • 前言
    • 四分位距(IQR)
    • 3σ原则
    • 使用步骤
      • 计算四分位距
      • 应用3σ原则
    • 代码

前言

异常分析的目标是识别数据中的异常值,这些异常值可能是由于错误的记录、设备故障或者其他未知原因导致的。四分位距(interquartile range, IQR)和3σ原则(3 sigma rule)是两个常用的工具。

四分位距(IQR)

四分位距是统计学中用于度量数据离散程度的一种方法。它是指数据的上四分位数(Q3)与下四分位数(Q1)之间的差值,通常用于识别数据集中的离群值。计算四分位距的公式如下:

IQR=Q3-Q1

其中,Q1是数据的25th百分位数,Q3是数据的75th百分位数。

3σ原则

3σ原则是一种基于正态分布的统计学原则,用于判断数据中的异常值。根据3σ原则,如果数据服从正态分布,那么大约有68%的数据值落在均值加减一个标准差范围内,大约有95%的数据值落在均值加减两个标准差范围内,大约有99.7%的数据值落在均值加减三个标准差范围内。因此,超出均值加减三个标准差范围的数据可以被视为异常值。

使用步骤

计算四分位距

import numpy as np# 计算第一四分位数(Q1)
Q1 = np.percentile(data, 25)# 计算第三四分位数(Q3)
Q3 = np.percentile(data, 75)# 计算四分位距(IQR)
IQR = Q3 - Q1

应用3σ原则

# 计算数据的均值和标准差
mean = np.mean(data)
std_dev = np.std(data)# 计算异常值的阈值
threshold = 3 * std_dev# 根据3σ原则判断异常值
outliers = [x for x in data if abs(x - mean) > threshold]

代码

import numpy as np
import matplotlib.pyplot as plt# 示例数据
data = [100, 150, 200, 250, 300, 350, 400, 450, 500, 1000]# 计算四分位距
Q1 = np.percentile(data, 25)  # 第一四分位数
Q3 = np.percentile(data, 75)  # 第三四分位数
IQR = Q3 - Q1  # 四分位距
print("第一四分位数:", Q1)
print("第三四分位数:", Q3)
print("四分位距:", IQR)
print("异常值范围:", (Q1 - 1.5 * IQR, Q3 + 1.5 * IQR))# 应用3σ原则识别异常值
mean = np.mean(data)
std_dev = np.std(data)
threshold = 3 * std_dev
outliers = [x for x in data if abs(x - mean) > threshold]
print("异常值:", outliers)# 可视化
# 箱型图
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.boxplot(data)
plt.xlabel('数据')
plt.title('数据和异常值')
plt.show()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/22291.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

H5进度条样式,自定义进度条

进度条样式预览 实现代码&#xff1a; <view class"mainPro"><view class"proBg"><view class"proDetail" :style"{ width: ${schedule}% }"></view></view><view class"proTxt">完成进…

【StableDiffusion】2024.6.4 亲测成功,无魔法 Civitai 镜像,国内下载 Civitai 模型的方法

一、废话不说&#xff0c;直接开始 废话&#xff1a;请注意&#xff0c;这个插件不是万能的&#xff0c;有一些模型无法下载&#xff0c;大概能下载 70% 左右的模型 1.github下载插件 https://github.com/tzwm/sd-webui-model-downloader-cn/tree/main 这个步骤不用我多说了…

Spring boot集成通义千问大模型实现智能问答

Spring boot集成通义千问大模型实现智能问答 背景 我在用idea进行java开发时发现了通义灵码这款免费的智能代码补全插件&#xff0c;用了一段时间了&#xff0c;感觉很不错。就想着在自己的项目中也能集成通义千问大模型实现智能回答&#xff0c;毕竟对接openai需要解决网络问…

SQL注入-时间盲注

SQL时间盲注&#xff08;Time-based Blind SQL Injection&#xff09;&#xff0c;又叫延时注入&#xff0c;是一种SQL注入攻击技术&#xff0c;用于在无法直接获取查询结果或查看响应内容变化的情况下&#xff0c;通过引入时间延迟来推断数据库的信息&#xff1b;时间盲注依赖…

什么是真正的高效阅读,高效阅读的方法和技巧

一、教程描述 查理芒格说他认识的厉害的人没有一个不读书的&#xff0c;为什么我们也读书却成不了厉害的那个人呢&#xff1f;所以这绝对不是书的问题&#xff0c;而是人的问题。阅读应该带有目的性&#xff0c;要帮我们解决实际问题。如果读一本书只是读完它&#xff0c;那读…

如何理解与学习数学分析——第一部分——数学分析概观

第1 部分&#xff1a;数学分析概观(Studying Analysis) 1. 数学分析之面目(What is Analysis like?) 本章说明了分析中的定义、定理和证明。 它介绍了一些符号&#xff0c;并解释了如何使用数学分析中的这些数学符号和数学词汇、以及应该把它们读成什么。它指出了这种类型的…

CANDela studio的State

State主要用来查看&#xff0c;点击State Groups&#xff0c;可以看到session和security下面有多少个会话和security level&#xff0c;所以删除和新建都不能在这里操作。 Dependencies没有安装插件&#xff0c;看不到图形不要紧&#xff0c;点击下面那个图标&#xff0c;就能编…

【好物推荐】夏日肌肤守护者:护肤皂

随着夏日的到来&#xff0c;高温、潮湿和紫外线成为了肌肤的三大挑战。在这个季节里&#xff0c;护肤不仅仅是为了美观&#xff0c;更是对肌肤健康的一种保护。在众多护肤产品中&#xff0c;护肤皂因其清洁力强、使用方便等特点&#xff0c;成为了夏季护肤的得力助手。今天&…

【Java基础】字符集

【Java基础】字符集 0. 预备知识1.计算机中的存储规则2. Unicode、UTF-83. 为什么出现乱码4. 如何防止产生乱码 0. 预备知识 字符集&#xff08;Character Set&#xff09;是多个字符的集合&#xff0c;它规定了字符在计算机中的编码方式。 字符集的定义与作用 字符集是各种…

11 - 员工奖金(高频 SQL 50 题基础版)

11- 员工奖金 -- join和left join的区别 -- 如果是join则右侧的数据有的就插&#xff0c;没的就啥也不干&#xff0c;交白卷&#xff0c;也不留null -- 但是left join让右侧数据在没有对应数据时补上了null select e.name,b.bonus from Employee e left join bonus b on e.empI…

SpringBoot 统一返回格式

目录 一、为什么要统一返回&#xff1f; 二、全局异常处理代码 三、统一返回对象代码 四、使用方法 五、结果展示 一、为什么要统一返回&#xff1f; 在Spring Boot应用中&#xff0c;为了保持API接口的响应格式统一&#xff0c;通常会采用全局异常处理和自定义返回对象的方…

Java进制转换

进制介绍 二进制&#xff1a;0B开头&#xff0c;0-1 八进制&#xff1a;0开头&#xff0c;0-7 十进制&#xff1a;0-9 十六进制&#xff1a;0x开头&#xff0c;0-9和A-F public class Binary{public static void main(String[] args){//二进制 10int n10B1010//十进制 1010int…

[协议]TCP协议

TCP,UDP协议工作在传输层 TCP基于连接&#xff1b; UDP基于非连接 TCP三次握手 UDP:不能保证丢包&#xff0c;传输稳定性不如TCP;

场外期权怎么做?

对于中国的投资者而言&#xff0c;场外期权交易目前主要由特定的券商提供&#xff0c;并且仅对机构开放。个人投资者无法直接参与此类交易&#xff0c;但可以通过与这些券商合作的机构公司进行询价和下单。场外期权交易涉及一系列严谨的步骤&#xff0c;以下是其基本流程&#…

QT中将资源文件(image、qss、qm等)封装到静态库中,程序该如何引用静态库中的资源文件

1、静态库 2、主程序中使用第三方库中的资源文件 核心代码: int main(int argc, char *argv[]) {QApplication a(argc, argv

【C++】优先级队列仿函数

目录 一.priority_queue的使用 二.仿函数 三、priority_queue的模拟实现 首先&#xff0c;我们先来了解一下什么是优先级队列 priority_queue&#xff0c;翻译为优先级队列&#xff0c;是一种容器适配器 底层容器可以是任何标准容器类模板&#xff0c;也可以是其他特定设计…

面试一个多月,我上岸了!

大家好&#xff0c;我是枫哥&#xff0c;&#x1f31f;阿里云技术专家、&#x1f4dd;资深面试官、&#x1f339;Java跳槽网课堂创始人。拥有多年一线研发经验&#xff0c;曾就职过科大讯飞、美团网、平安等公司。目前组建的团队&#xff0c;专注Java技术分享&#xff0c;一对一…

PromptPort:为大模型定制的创意AI提示词工具库

PromptPort&#xff1a;为大模型定制的创意AI提示词工具库 随着人工智能技术的飞速发展&#xff0c;大模型在各行各业的应用越来越广泛。而在与大模型交互的过程中&#xff0c;如何提供精准、有效的提示词成为了关键。今天&#xff0c;就为大家介绍一款专为大模型定制的创意AI…

九、从0开始卷出一个新项目之瑞萨RZN2L生产烧录固件(jflash擦写读外挂flash)

目录 七、生产烧录固件(jflash擦/写/读外挂flash) 7.1 flash母片读写 7.2 jflash擦/写/读外挂flash 九、从0开始卷出一个新项目之瑞萨RZN2L 七、生产烧录固件(jflash擦写读外挂flash) 七、生产烧录固件(jflash擦/写/读外挂flash) 7.1 flash母片读写 略 7.2 jflash擦/写/读…

【Java】使用 BeanUtils.copyProperties 11个坑(注意事项)

目录 背景 坑1&#xff1a;类型不匹配 坑2&#xff1a;属性名称不一致 坑3&#xff1a;BeanUtils.copyProperties 是浅拷贝 坑4&#xff1a;Null 值覆盖 坑5&#xff1a;注意引入的包 坑6&#xff1a;Boolean 类型数据 is 开头属性的坑 坑7&#xff1a;查不到字段引用 …