使用Python绘制QQ图并分析数据

使用Python绘制QQ图并分析数据

在这篇博客中,我们将探讨如何使用Python中的pandas库和matplotlib库来绘制QQ图(Quantile-Quantile Plot),并分析数据文件中的内容。QQ图是一种常用的统计图表,用于检查一组数据是否服从某种理论分布(如正态分布)。
在这里插入图片描述

数据:

链接:https://pan.baidu.com/s/1ug1bRyoIcMwJg9Bx_1DU3A?pwd=1234
提取码:1234

代码示例

以下是一个完整的代码示例,展示了如何读取数据文件并绘制QQ图:

import pandas as pd
import pylab as plt
from scipy.stats import norm, probplot# 读取数据文件
df = pd.read_csv('data9_5.txt', header=None)# 提取甲班成绩
d = df.values[0]# 计算均值和标准差
mu = d.mean()
s = d.std()
sd = sorted(d)
n = len(d)# 计算分位数
x = (plt.arange(n) + 1 / 2) / n
yi = norm.ppf(x, mu, s)# 设置字体和大小
plt.rc('font', size=16)
plt.rc('font', family='SimHei')
plt.rc('axes', unicode_minus=False)# 绘制QQ图
plt.subplot(121)
plt.plot(yi, sd, 'o', label='QQ图')
plt.plot(sd, sd, label='参照直线')
plt.legend()# 使用probplot绘制QQ图
plt.subplot(122)
probplot(d, plot=plt)# 显示图像
plt.show()
代码解释
  1. 导入库

    import pandas as pd
    import pylab as plt
    from scipy.stats import norm, probplot
    

    我们导入了pandas库来处理数据,pylab作为绘图工具,以及scipy.stats中的normprobplot函数来进行统计分析。

  2. 读取数据文件

    df = pd.read_csv('data9_5.txt', header=None)
    

    我们使用pandasread_csv函数读取数据文件data9_5.txt,并将其存储在数据框df中。由于文件没有列标题,我们使用header=None参数。

  3. 提取甲班成绩

    d = df.values[0]
    

    我们提取数据框的第一行(即甲班)的成绩数据。

  4. 计算均值和标准差

    mu = d.mean()
    s = d.std()
    sd = sorted(d)
    n = len(d)
    

    我们计算数据的均值mu和标准差s,并对数据进行排序sd,获取数据的长度n

  5. 计算分位数

    x = (plt.arange(n) + 1 / 2) / n
    yi = norm.ppf(x, mu, s)
    

    我们计算数据的分位数x,并使用norm.ppf函数计算理论分布的分位数yi

  6. 设置字体和大小

    plt.rc('font', size=16)
    plt.rc('font', family='SimHei')
    plt.rc('axes', unicode_minus=False)
    

    我们使用rc函数设置字体为SimHei(黑体),并将字体大小设置为16,以确保图表中的中文标签能够正确显示。

  7. 绘制QQ图

    plt.subplot(121)
    plt.plot(yi, sd, 'o', label='QQ图')
    plt.plot(sd, sd, label='参照直线')
    plt.legend()
    

    在第一个子图中,我们绘制了QQ图,使用圆点表示实际数据的分位数,并使用参照直线表示理论分布的分位数。

  8. 使用probplot绘制QQ图

    plt.subplot(122)
    probplot(d, plot=plt)
    

    在第二个子图中,我们使用probplot函数绘制QQ图,进一步验证数据是否服从正态分布。

  9. 显示图像

    plt.show()
    

    最后,我们使用show函数显示绘制的QQ图。

QQ图的意义

QQ图(Quantile-Quantile Plot)用于比较数据的分位数与理论分布的分位数。如果数据点接近参照直线,则说明数据服从该理论分布。在本例中,我们检查了甲班成绩是否服从正态分布。

总结

通过这篇博客,我们学习了如何使用Python读取数据文件并绘制QQ图。我们使用了pandas库来处理数据,并使用matplotlib库和scipy.stats库绘制了QQ图。这些图表可以帮助我们更好地理解数据的分布情况及其与理论分布的吻合程度。

希望这篇博客对你有所帮助!如果你有任何问题或建议,欢迎在评论区留言。谢谢阅读!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/43597.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

VUE+Spring Flux实现SSE长连接

VUE代码 // 初始化EventSourceinitEventSource(url) {const token getAccessToken();const eventSource new EventSourcePolyfill(url, {headers: {Authorization: Bearer ${token},tenant-id: getTenantId(),}});eventSource.onerror (e) > {console.log("SSE连接错…

C# 下sendmessage和postmessage的区别详解与示例

文章目录 1、SendMessage2、PostMessage3、两者的区别: 总结 在C#中,SendMessage和PostMessage是两个用于Windows编程的API,它们用于向窗口发送消息。这两个方法都位于System.Windows.Forms命名空间中,通常用于自动化Windows应用程…

GitHub:现代软件开发的协作平台

引言 在现代软件开发中,协作工具的选择至关重要。GitHub作为全球最大的代码托管平台,已经成为开发者们不可或缺的工具。自2008年成立以来,GitHub不仅改变了代码托管和协作的方式,还在开源软件的发展中扮演了重要角色。本文将详细…

科普文:分布式系统的架构设计模式

一、分布式架构基本概念 分布式架构是一种计算机系统设计方法,它将一个复杂的系统划分为多个自治的组件或节点,并通过网络进行通信和协作。每个组件或节点在功能上可以相互独立,但又能够通过消息传递或共享数据来实现协同工作。分布式架构主要…

值传递与引用传递:深入理解Java中的变量赋值和参数传递机制

在Java中,理解值传递(值拷贝)与引用传递(地址拷贝)之间的区别对于正确处理数据结构和对象至关重要。本文将通过示例代码深入探讨这两种机制,并解释它们如何影响程序的行为。 值传递(值拷贝&…

获取脚本执行时间

在运行一些脚本时,时间会过期,这时就需要重新更新token,下面做了一个demo判断时间是否过期 import datetime import time starttimedatetime.datetime.now() # 时间进行格式化 starttimestarttime.strftime("%Y-%m-%d %H:%M:%S") …

高效利用iCloud指南

高效利用 iCloud 需要了解其各种功能和最佳实践,以充分发挥其云存储和同步能力。以下是详细的指南: ### 1. 设置和管理 iCloud 存储 **初始设置** - 确保在所有设备(iPhone、iPad、Mac)上使用同一 Apple ID 登录 iCloud。 - 在设…

iPaaS丨企业应用及数据集成的重要性和挑战

在激烈的市场竞争中,企业服务总线和数据总线扮演着企业神经网络的角色,它们将不同的业务部门、系统以及数据紧密相连,保障信息流通无阻,实现资源的高效分配。这样的集成不仅提高了企业的运营效率,还增强了企业的适应性…

虚拟机因断电进入./#状态解决办法

现象: 解决:先查看错误日志:journalctl -p err -b查看自己虚拟机中标黄部分的名字 之后运行:xfs_repair -v -L /dev/sda #这里sda用你自己标黄的 最后重启 reboot 即可。

使用Dockerfile和ENTRYPOINT运行Python 3脚本

在Docker中运行Python 3脚本是一种常见的部署应用程序的方式。通过使用Dockerfile,我们可以定义一个包含Python环境和应用程序的Docker镜像。在Dockerfile中,我们可以使用ENTRYPOINT指令来指定当容器启动时应该运行的命令。 **一、创建Dockerfile** 首先…

在Linux上运行macOS:深度解析OSX-KVM项目

在Linux上运行macOS:深度解析OSX-KVM项目 在现代开发和测试环境中,能够在不同操作系统之间无缝切换是至关重要的。对于开发者而言,如何在Linux系统上运行macOS一直是一个挑战。然而,OSX-KVM项目为我们提供了一种高效的解决方案&a…

R包:ggsci期刊配色

介绍 不同期刊配色大多数时候不一样,为了更好符合期刊图片颜色的配色,有人开发了ggsci这个R包。它提供以下函数: scale_color_palname() scale_fill_palname() 对应不同期刊的color和fill函数。 导入数据R包 library("ggsci")…

如何一起解压缩多个小压缩包unzip multiprt zip file

这个问题有两种解读,一种是需要解压这个文件夹里面的所有zip文件。另一个是压缩文件时候存成了多个part,需要一起解压缩。 环境 Ubuntu22.04 解决方法 解压当前文件夹所有zip文件 unzip your/folder/*.zip解压同一压缩文件的多个part sudo apt ins…

SpringBoot使用@RestController处理GET和POST请求

在Spring MVC中,RestController注解的控制器类可以处理多种HTTP请求方法,包括GET和POST。这些请求方法通过特定的注解来映射,比如GetMapping用于GET请求,PostMapping用于POST请求。这些注解是RequestMapping的特定化版本&#xff…

2024年全面导入APS系统:提升工厂生产效率的策略

在快速变化的市场环境中,急单、插单、订单设计变更、订单交期变更、订单取消、供应链移动等问题已经是制造业时时刻刻都在面对的问题,在订单量下降的市场环境下,企业本身的业务工作反而越来越忙碌。在此背景下,当今制造业企业亟需…

JavaScript高级程序设计(第四版)--学习记录之函数(下)

函数内部 ES5中,函数内部存在两个特殊的对象:arguments和this。ES6新增了new.target属性。 arguments arguments对象其实还有一个callee属性,是一个指向arguments对象所在函数的指针。 function fb(num){ if(num<=1){ return 1; }else{ return num * fb(num-1); } }/*这个…

【pytorch24】Visdom可视化

TensorboardX pytorch有一个工具借鉴了tensorboard pip install tensorboardX 有查看变量的数值、监听曲线等功能 如何使用 新建SummaryWriter()实例 要把监听的数据&#xff0c;比如说要监听dummy_s1[0]&#xff08;y 坐标&#xff09;存放到data/scalar1中&#xff0c;…

ASPICE是汽车软件开发中的质量保证流程

复杂的汽车系统对软件的质量和可靠性提出了极高的要求。为了确保汽车软件的高质量和可靠性&#xff0c;ASPICE&#xff08;Automotive SPICE&#xff0c;汽车软件过程改进和能力确定&#xff09;流程应运而生。本文将对ASPICE流程进行详细介绍。 一、ASPICE概述 ASPICE是汽车行…

【React】React18 Hooks 之 useContext

目录 useContext1、Provider和 useContext2、Provider 和Consumer3、Provider 嵌套4、React.createContext提供的Provider和class的contextType属性5、读、写Context&#xff08;1&#xff09;父组件修改Context&#xff08;2&#xff09;子组件修改Context 好书推荐 useContex…

NPDP有什么价值?究竟值不值得去考?

NPDP其实就是产品经理国际资格认证&#xff0c;是美国产品开发管理协会发起的&#xff0c;集理论、方法和实践一体&#xff0c;在新产品开发方面有一个很全面的知识体系。是国际公认的新产品开发专业认证&#xff0c;具有权威性。 NPDP能够很好地帮你在做新产品的道路上少走弯…