数据分布之指数分布(sample database classicmodels _No.10)

数据分布之指数分布(sample database classicmodels _No.10)

准备工作,可以去下载 classicmodels 数据库具体如下
点击:classicmodels

也可以去 下面我的博客资源下载
https://download.csdn.net/download/tomxjc/88685970


文章目录

  • 数据分布之指数分布(sample database classicmodels _No.10)
  • 什么是指数分布?
  • 指数分布代码
  • SQL 查询说明
  • 截图
  • 判断和结论
    • 判断
    • 结论


什么是指数分布?

数据分布类型分析
指数分布(Exponential Distribution):
如果经过分组统计后,组的计数逐渐减少,尤其在初始的几个组中频率较高,然后逐步下降,则这可能符合指数分布的特点。
指数分布通常用于描述事件之间的时间间隔,如付款时间的间隔。它具有无记忆性,且通常是右偏的,这意味着较小的间隔频率较高,间隔时间越长的频次越低。

指数分布代码

WITH PaymentIntervals AS (SELECT customerNumber,DATEDIFF(paymentDate, LAG(paymentDate) OVER (PARTITION BY customerNumber ORDER BY paymentDate)) AS interval_daysFROM paymentsWHERE customerNumber IS NOT NULL
),
RangeStats AS (-- 计算最小值、最大值和区间宽度SELECT MIN(interval_days) AS min_interval,MAX(interval_days) AS max_interval,(MAX(interval_days) - MIN(interval_days)) / 20 AS interval_widthFROM PaymentIntervalsWHERE interval_days IS NOT NULL
)
-- 分组统计不同的时间间隔区间
SELECT FLOOR((interval_days - (SELECT min_interval FROM RangeStats)) / (SELECT interval_width FROM RangeStats)) AS group_index,COUNT(*) AS count
FROM PaymentIntervals, RangeStats
WHERE interval_days IS NOT NULL
GROUP BY group_index
ORDER BY group_index;

SQL 查询说明

CTE PaymentIntervals:

计算每个客户两次付款之间的时间间隔(interval_days)。
使用LAG函数计算相邻两次付款的时间差,按客户编号和付款日期排序。
CTE RangeStats:

计算时间间隔的最小值(min_interval)、最大值(max_interval),以及20个区间的宽度(interval_width)。
区间宽度计算为 (MAX(interval_days) - MIN(interval_days)) / 20。
主查询:

使用计算得到的区间宽度,将时间间隔分为20个组。
使用 FLOOR((interval_days - min_interval) / interval_width) 来确定每个时间间隔属于哪一个组。
对每个组统计时间间隔出现的次数。

截图

在这里插入图片描述

判断和结论

数据特征分析

集中性:
数据的高频部分出现在index为1、2,计数分别为21和21。
数据的频次在最初几个组中较高,然后逐渐减少。

下降趋势:
从index为3之后,计数开始逐渐减少,但减少的方式并不十分规则,而是有起伏。
在后半部分(index为13到20),计数值比较小,大部分为5以下,且逐步趋近于1。

整体形态:
高峰出现在前面几个组,然后频次逐渐下降。
没有明显的对称性,即没有明显的从高峰向两侧对称递减的趋势。
指数分布与正态分布的特点

指数分布:
指数分布是右偏的,通常在开始部分具有较高的频率,然后逐渐快速下降。
特征是单调递减的频次分布,事件发生的时间间隔越短,频率越高,随着间隔时间增大,频率显著下降。

正态分布:
正态分布是钟形的,数据集中在均值附近,并且两侧对称递减。
特征是具有明显的峰值,峰值两侧逐渐下降,呈现出较好的对称性。

判断

是否符合指数分布:
从图表看数据在最初几个index(0到4)中频次较高,然后逐渐减少,这与指数分布的特点较为接近。
从index 之后的计数下降趋势不十分规律,但整体来看,频次有向下递减的趋势,因此可以认为与指数分布较为接近。

是否符合正态分布:
您的数据并没有呈现出对称的钟形曲线,频次高峰在初期,并没有出现均匀的对称下降趋势。
因此,数据不符合正态分布。

结论

根据您提供的分组结果,这组数据更符合指数分布的特点,因为:

数据在初期有较高的频率,然后逐步下降。
尽管下降的幅度有一些起伏,但整体上符合指数分布的单调递减特征。
这种分布通常用于描述事件之间的时间间隔,例如客户付款时间间隔的分布,短间隔时间发生的次数更多,随着时间间隔增加,频率逐渐减少。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/60965.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++语言之类与对象1

什么是类 类是一种抽象的数据类型,作为对象的蓝图或模板,它将具有相同属性和行为的对象进行统一抽象封装。其中属性描述对象的特征,如 “汽车” 类中的颜色、品牌等;方法则定义对象可执行的操作,像 “汽车” 类的启动、…

Elasticsearch 和 Kibana 8.16:Kibana 获得上下文和 BBQ 速度并节省开支!

作者:来自 Elastic Platform Product Team Elastic Search AI 平台(Elasticsearch、Kibana 和机器学习)的 8.16 版本包含大量新功能,可提高性能、优化工作流程和简化数据管理。 使用更好的二进制量化 (Better Binary Quantizatio…

Everything介绍

Everything 是一款由 David Carpenter 开发的,适用于 Windows 操作系统的文件搜索工具。以下是它的主要功能和特点: 极快的搜索速度: Everything 通过索引本地存储设备上的文件和文件夹名称,实现快速检索。无论是在拥有少量文件的…

【Golang】——Gin 框架简介与安装

文章目录 1. Gin 框架概述1.1 什么是 Gin 框架?1.2 为什么选择 Gin?1.3 使用场景 2. 安装 Go 与 Gin 框架2.1 安装 Go 语言环境2.2 初始化 Go 项目2.3 安装 Gin 框架 3. 编写第一个 Gin 应用3.1 Gin 最小化示例代码代码解读3.2 运行程序3.3 测试服务 4. …

RGB与YCbCr转换算法

目录 RGB与YCbCr转换算法RGB与YCbCr色域介绍RGB模型YCbCr色域简介YCbCr的应用YUV 和 YCbCr 的区别 色彩转换公式 RGB 转 YCbCr 实现RGB 转 YCbCr 的 Matlab 实现RGB 转 YCbCr 的 FPGA 实现 YCbCr 转 RGB 实现YCbCr 转 RGB 的 Matlab 实现YCbCr 转 RGB 的 FPGA 实现 RGB与YCbCr转…

WebRTC视频 04 - 视频采集类 VideoCaptureDS 中篇

WebRTC视频 01 - 视频采集整体架构 WebRTC视频 02 - 视频采集类 VideoCaptureModule WebRTC视频 03 - 视频采集类 VideoCaptureDS 上篇 WebRTC视频 04 - 视频采集类 VideoCaptureDS 中篇(本文) WebRTC视频 05 - 视频采集类 VideoCaptureDS 下篇 一、前言…

MAC上的Office三件套报53错误解决方案(随笔记)

目录 现象原因解决方式1. 可视化2. 命令行 参考链接 现象 最近Mac Mini M4非常热门,我也种草买了一台丐中丐版本来体验一下。 在安装Office三件套后,遇到了一个53的错误: Run-time error 53:File not found: Library/Application Support/A…

人工智能与SEO优化中的关键词策略解析

内容概要 在当今数字化快速发展的时代,人工智能(AI)与搜索引擎优化(SEO)的结合正变得愈发重要。关键词策略是SEO优化的一项基础工作,它直接影响到网站的可见性和流量。通过运用智能算法,企业能…

一个可自由添加so动态库的框架

有文件描述符的队列原型 #include <iostream> #include <queue> #include <mutex> #include <sys/epoll.h> #include <sys/eventfd.h> #include <thread> #include <unistd.h> #include <vector> #include <optional>t…

【数据库】如何保证数据库迁移过程中数据的一致性?

在数据库迁移过程中&#xff0c;保证数据的一致性是非常重要的&#xff0c;尤其是在涉及到多个表、多个数据库或分布式系统的情况下。以下是一些确保数据一致性的最佳实践和方法&#xff1a; 1. 备份数据 在开始迁移之前&#xff0c;进行全面的数据备份是确保数据一致性的第…

第二十二章 TCP 客户端 服务器通信 - TCP设备的OPEN和USE命令关键字

文章目录 第二十二章 TCP 客户端 服务器通信 - TCP设备的OPEN和USE命令关键字TCP设备的OPEN和USE命令关键字TCP设备的OPEN和USE命令关键字 第二十二章 TCP 客户端 服务器通信 - TCP设备的OPEN和USE命令关键字 TCP设备的OPEN和USE命令关键字 可以使用位置参数(如上所述)或关键…

React面试高频核心问题

基础部分 React的核心特性是什么&#xff1f; 组件化&#xff08;基于组件&#xff09;单向数据流&#xff08;单向数据流&#xff09;虚拟 DOM&#xff08;Virtual DOM&#xff09;JSX&#xff08;JavaScript XML&#xff09; React的生命周期方法有哪些&#xff1f; React 16…

Kubernetes 10 问,测测你对 k8s 的理解程度

Kubernetes 10 问 假设集群有 2 个 node 节点&#xff0c;其中一个有 pod&#xff0c;另一个则没有&#xff0c;那么新的 pod 会被调度到哪个节点上&#xff1f; 应用程序通过容器的形式运行&#xff0c;如果 OOM&#xff08;Out-of-Memory&#xff09;了&#xff0c;是容器重…

【网络安全面经】OSI七层模型每层都有什么协议

1. 物理层 协议举例&#xff1a; IEEE802.3&#xff08;以太网&#xff09;&#xff1a;它定义了在局域网&#xff08;LAN&#xff09;中使用的有线连接标准。例如&#xff0c;在办公室的有线网络环境中&#xff0c;计算机通过以太网线连接到交换机&#xff0c;就是基于IEEE80…

Spring:IoC/DI加载properties文件

Spring框架可以通过Spring的配置文件完成两个数据源druid和C3P0的配置&#xff08;Spring&#xff1a;IOC/DI配置管理第三方bean&#xff09;&#xff0c;但是其中包含了一些问题&#xff0c;我们来分析下: 这两个数据源中都使用到了一些固定的常量如数据库连接四要素&#xf…

时钟之CSS+JS版

写在前面 此版本绘制的时钟基于CSSJS模式。 优点操作简单&#xff0c;缺点当然是不够灵活。下一篇会基于HTML5的canvas标签&#xff0c;使用JS绘制。会更灵活&#xff0c;元素更加丰富。 HTML代码 <div class"box"><article class"clock"><…

浪潮服务器(BMC)监控易监测指标解读

监控易是一款功能全面的IT基础设施监控软件&#xff0c;它能够对各类IT硬件设备进行实时监控&#xff0c;确保系统的稳定运行。在本次解读中&#xff0c;我们将重点关注监控易对浪潮服务器&#xff08;BMC&#xff09;的监测指标&#xff0c;以便更好地了解服务器的运行状态。 …

云计算虚拟化-kvm创建虚拟机

作者介绍&#xff1a;简历上没有一个精通的运维工程师。希望大家多多关注作者&#xff0c;下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 虚拟化&#xff0c;简单来说就是把一台服务器/PC电脑&#xff0c;虚拟成多台独立的虚拟机&#xff0c;每台虚拟机之间相互隔…

<QNAP 453D QTS-5.x> 日志记录:在 Docker 中运行的 Flask 应用安装 自签名 SSL 证书 解决 Chrome 等浏览器证书安全

原因&#xff1a;Chrome 不信任 ssc 证书 使启用了 HTTPS&#xff0c;即使有使用 自签名证书 (self-signed certificate 非由可信的证书颁发机构 【CA&#xff0c;Certificate Authority】签发的&#xff09;。浏览器 Chrome 默认不信任自签名证书&#xff0c;也会报 NET::ERR_…

模板——实现泛型编程的有力武器

模板——实现泛型编程的有力武器 我们为什么需要模板&#xff1f;模板 前言&#xff1a;关于模板&#xff0c;相信大家都有所而闻&#xff0c;以下是我对C模板的个人看法&#xff0c;希望能够帮助到你们呀&#xff01; 我们为什么需要模板&#xff1f; 请到大家看这一段代码&a…