Python | Bootstrap图介绍

在进入Bootstrap 图之前,让我们先了解一下Bootstrap(或Bootstrap 抽样)是什么。

Bootstrap 抽样(Bootstrap Sampling):这是一种方法,我们从一个数据集中重复地取一个样本数据来估计一个总体参数。它用于确定总体的各种参数。

Bootstrap图

Bootstrap图是从数据样本计算的统计量分布的图形表示。它通常用于可视化统计量的可变性和不确定性,例如平均值或标准差,通过显示统计量在许多Bootstrap数据样本上的分布。

在bootstrap图中,x轴表示统计量的值,y轴表示这些值的频率。为每个Bootstrap样本绘制一条线,线的高度表示该样本中统计值的频率。线的分布表示统计量在Bootstrap样本上的分布。

Bootstrap图是理解统计量中的不确定性的强大工具,特别是当数据的潜在分布未知或复杂时。它还可以用来生成统计量的置信区间,并比较不同统计量的分布。

需要注意的是,Bootstrap是一种重新估计技术,用于估计样本中统计量的不确定性,而无需对数据的潜在分布进行任何假设。它可用于估计标准误差、置信区间和执行假设检验。

Bootstrap plot:Bootstrap plot是一种图形方法,用于测量总体的任何期望统计特征的不确定性。它是置信区间的一种替代方法。(也用于计算统计量的数学方法)。

如何使用Bootstrap

通常,我们可以用数学方法计算总体统计量的不确定性,使用置信区间。然而,在许多情况下,推导出的不确定性公式在数学上是难以处理的。在这种情况下,我们使用Bootstrap plot。

假设,我们有5000人在一个公园里,我们需要找到整个人口的平均体重。测量每个人的体重然后取平均值是不可行的。这就是bootstrap抽样的用武之地。

我们从人群中随机抽取5人一组,然后求出平均值。然后,我们做同样的过程8-10次。通过这种方式,我们可以更有效地获得对总体平均权重的良好估计。

举个例子:

让我们考虑一个例子,了解Bootstrap图如何使从大量人口中获得关键信息变得更容易。假设我们有3000个随机生成的统一数字的样本数据。我们取出30个数字的子样本,并找到其平均值。我们对另一个随机子样本再次这样做,依此类推。

我们绘制了上述信息的bootstrap 图,只需查看它,我们就可以很容易地给予关于所有3000个数字的平均值的很好的估计。还有各种其他有用的信息可以从bootstrap 图中获得,例如:

  • 哪个子样本的方差最小,
  • 哪个子样本创建最小置信区间等。

Python简单实现

import pandas as pd
import numpy as nps = pd.Series(np.random.uniform(size=500))
pd.plotting.bootstrap_plot(s)

在这里插入图片描述
说明:

  1. Bootstrap图给出了总体所需信息的估计值,而不是精确值。
  2. 它高度依赖于给定的数据集。当大量子集具有重复样本时,它不能给予好的结果。
  3. 当我们获得的信息高度依赖于尾值时,Bootstrap图变得无效。

Bootstrap的优缺点

优点:

  • 它是一种非参数方法,这意味着它不需要对数据的潜在分布进行任何假设。
  • 它可用于估计各种统计量的标准误差和置信区间。
  • 它可以用来估计统计量的不确定性,即使样本量很小。
  • 它可用于执行假设检验和比较不同统计量的分布。
  • 在统计、金融、机器学习等多个领域有着广泛的应用。

缺点:

  • 它可能是计算密集型的,特别是在处理大型数据集时。
  • 它可能不适用于所有类型的数据,例如高度偏斜或重尾分布。
  • 它可能不适合估计具有非常大方差的统计数据的不确定性。
  • 它可能不适用于估计不平滑或方差差异很大的统计数据的不确定性。
  • 它可能并不总是一个很好的替代其他统计方法,如渐近方法,当大样本量可用时。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/745494.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt教程 — 3.1 深入了解Qt 控件:Buttons按钮

目录 1 Buttons按钮简介 1.1 Buttons按钮简介 1.2 Buttons按钮如何选择 2 如何使用Buttons按钮 2.1 QPushButton使用-如何自定义皮肤 2.2 QToolButton使用-如何设置帮助文档 2.3 QRadioButton使用-如何设置开关效果 2.4 QRadioButton使用-如何设置三态选择框 2.5 QCom…

学习使用postman软件上传文件发起api接口请求

学习使用postman软件上传文件发起api接口请求 设置headers头信息设置body 设置headers头信息 如图设置: KEY:Content-Type VALUE:multipart/form-data 设置body 设置需要上传的key对应的类型为File,上传类型 设置需要上传的文件…

留学生课设|R语言|研究方法课设

目录 INSTRUCTIONS Question 1. Understanding Quantitative Research Question 2. Inputting data into Jamovi and creating variables (using the dataset) Question 3. Outliers Question 4. Tests for mean difference Question 5. Correlation Analysis INSTRUCTIO…

如何安装ES

Elasticsearch入门安装 ES的官方地址:Elasticsearch 平台 — 大规模查找实时答案 | Elastic 我们进到网页可以看到platform(平台) 我们可以看到Elasticsearch logstash kibanba beats 这几个产品 Elasticsearch:分布式&…

某夕夕商品数据抓取逆向之webpack扣取

逆向网址 aHR0cHM6Ly93d3cucGluZHVvZHVvLmNvbQ 逆向链接 aHR0cHM6Ly93d3cucGluZHVvZHVvLmNvbS9ob21lL2JveXNoaXJ0 逆向接口 aHR0cHM6Ly9hcGl2Mi5waW5kdW9kdW8uY29tL2FwaS9naW5kZXgvdGYvcXVlcnlfdGZfZ29vZHNfaW5mbw 逆向过程 请求方式:GET 参数构成 【anti_content】…

基于Transformer的经典目标检测之DETR

背景 DETR,即DEtection TRansformer,是由尼古拉斯卡里翁及其团队于2020年在Facebook AI Research首次提出的,它在目标检测领域开创了一种新的波潮。 虽然目前并未保持最先进(State Of The Art)的地位,但DET…

vr虚拟现实游戏世界介绍|数字文化展览|VR元宇宙文旅

虚拟现实(VR)游戏世界是一种通过虚拟现实技术创建的沉浸式游戏体验,玩家可以穿上VR头显,仿佛置身于游戏中的虚拟世界中。这种技术让玩家能够全方位、身临其境地体验游戏,与游戏中的环境、角色和物体互动。 在虚拟现实游…

IP在网络通信中的重要作用

IP,全称Internet Protocol,即网际互连协议,是TCP/IP体系中的网络层协议。IP作为整个TCP/IP协议族的核心,是构成互联网的基础。它的作用重大且深远,下面将详细阐述IP的定义及其在网络通信中的重要作用。 首先&#xff0…

SpringBoot中的配置文件优先级、bootstrap和application的区别

SpringBoot中的配置文件优先级 SpringBoot项目当中支持的三类配置文件: application.properties application.yml application.yaml 在SpringBoot项目当中,我们要想配置一个属性,可以通过这三种方式当中的任意一种来配置都可以&#xff0…

Elastic Agent 的安装及使用

概述 Elastic Agent是Elastic Stack中的一个全新组件,旨在简化和统一监控和集成管理流程。它是一个轻量级的代理,可以部署到各种不同类型的主机和容器中,用于收集系统指标、日志和事件数据,并将其发送到Elasticsearch进行存储和分…

SpringBoot(自定义转换器+处理Json+内容协商)

文章目录 1.自定义转换器1.代码实例1.save.html2.编写两个bean1.Car.java2.Monster.java 3.WebConfig.java 配置类来自定义转换器4.测试 2.注意事项和细节1.debug查看转换器总数1.打断点2.执行到断点后,选左边的1923.可以看出,加上自定义的转换器一共125…

分类预测 | Matlab实现GSWOA-KELM混合策略改进的鲸鱼优化算法优化核极限学习机的数据分类预测

分类预测 | Matlab实现GSWOA-KELM混合策略改进的鲸鱼优化算法优化核极限学习机的数据分类预测 目录 分类预测 | Matlab实现GSWOA-KELM混合策略改进的鲸鱼优化算法优化核极限学习机的数据分类预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 GSWOA-KELM分类&#xff0…

react04- mvc 、 mvvm

MVC与MVVM stackoverflow论坛网站 react前端框架 使用框架前: 操作dom > js获取dom元素,事件侦听,修改数据,设置样式。。。 操作dom问题: 直接操作dom,会造成大量的回流、重绘,消耗大量性能操作起来也…

论文阅读——RingMo

RingMo: A Remote Sensing Foundation Model With Masked Image Modeling 与自然场景相比,RS图像存在以下困难。 1)分辨率和方位范围大:受遥感传感器的影响,图像具有多种空间分辨率。此外,与自然图像的实例通常由于重…

尚硅谷SpringBoot3笔记 (二) Web开发

Servlet,SpringMVC视频推荐:53_尚硅谷_servlet3.0-简介&测试_哔哩哔哩_bilibili HttpServlet 是Java Servlet API 的一个抽象类,用于处理来自客户端的HTTP请求并生成HTTP响应。开发人员可以通过继承HttpServlet类并重写其中的doGet()、do…

【图论】计算图的n-hop邻居个数,并绘制频率分布直方图

计算图的n-hop邻居个数,并绘制频率分布直方图 在图论中,n-hop邻居(或称为K-hop邻居)是指从某个顶点出发,通过最短路径(即最少的边数)可以到达的所有顶点的集合,其中n(或…

JVM及垃圾回收算法

一、JVM 1、jvm的内存组成 五大内存区域,分1.7和1.8 1.堆内存:引用类型的数据,内部组成:1.新生代(伊甸区和幸存者区)2.老年代。该区域经常发生垃圾回收的操作 堆是JVM中最大的一块内存区域,用…

【爬虫】requests.post请求中的data和json使用区别

请求体是键值对形式(无花括号),请求时需要使用data参数处理。 代码: data {...} ret requests.post(url, headersheaders, datadata)请求体是字典形式(有花括号),请求时需要使用json参数处理。…

派对游戏2024年新局面:二超多强,市场细分

2023年末,《元梦之星》上线迎战《蛋仔派对》,网腾大战打响。 这场战役从开局就进入到了白热化,双方投入真金白银来拉拢玩家,于春节这一亲朋相聚最适合派对游戏的时段集中发力,互有胜负。 目前《元梦之星》略处下风&a…

Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4

Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 相关链接:arxiv 关键字:Questioning LLaMA、GPT-3.5/4、guiding principles、prompting、large language models 摘要 本文介绍了26个旨在简化查询和提示大型语言模型&…