【MySQL】探索 MySQL 窗口函数(Window Functions)


缘分让我们相遇乱世以外
命运却要我们危难中相爱
也许未来遥远在光年之外
我愿守候未知里为你等待
我没想到为了你我能疯狂到
山崩海啸没有你根本不想逃
我的大脑为了你已经疯狂到
脉搏心跳没有你根本不重要
                     🎵 邓紫棋《光年之外》


在大数据分析和处理的过程中,我们经常需要对数据进行复杂的分析和计算。传统的 SQL 聚合函数(如 SUM, AVG, MAX, MIN 等)虽然强大,但它们在处理一些特定需求时显得力不从心,比如需要在保留行级别信息的同时进行聚合计算。这时候,窗口函数(Window Functions)便显得尤为重要。本文将深入探讨 MySQL 窗口函数的使用及其强大之处。

什么是窗口函数?

窗口函数允许我们在不改变行级别数据的前提下,执行复杂的聚合和分析操作。与传统的聚合函数不同,窗口函数不会对结果进行分组,它会为每一行返回一个值,并且这个值是基于某个“窗口”内的行计算得出的。

基本语法

窗口函数的基本语法如下:

window_function() OVER ([PARTITION BY partition_expression][ORDER BY sort_expression][frame_clause]
)

window_function(): 窗口函数的名称,例如 ROW_NUMBER(), RANK(), DENSE_RANK(), SUM(), AVG() 等。
PARTITION BY partition_expression: 可选项,定义窗口的分区。
ORDER BY sort_expression: 可选项,定义窗口的排序。
frame_clause: 可选项,定义窗口的范围。

常见的窗口函数

  1. ROW_NUMBER()
    ROW_NUMBER() 函数为结果集的每一行分配一个唯一的行号。
SELECTname,department,salary,ROW_NUMBER() OVER (PARTITION BY department ORDER BY salary DESC) AS row_num
FROMemployees;

上述查询为每个部门的员工按薪资降序排列,并分配一个行号。

  1. RANK() 和 DENSE_RANK()
    RANK() 和 DENSE_RANK() 函数类似,但处理排名相同时有所不同:

RANK(): 如果有两个相同的排名,下一名的排名会跳过。
DENSE_RANK(): 如果有两个相同的排名,下一名的排名不会跳过。

SELECTname,department,salary,RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS rank,DENSE_RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS dense_rank
FROMemployees;
  1. 聚合函数作为窗口函数
    常见的聚合函数如 SUM(), AVG(), MAX(), MIN() 也可以作为窗口函数使用。
SELECTdepartment,employee,salary,SUM(salary) OVER (PARTITION BY department) AS total_salary,AVG(salary) OVER (PARTITION BY department) AS avg_salary
FROMemployees;

上述查询计算了每个部门的总薪资和平均薪资,并将结果保留在每一行。

  1. 窗口范围(Frame)
    窗口函数的强大之处还在于它可以定义窗口的范围。范围可以使用 ROWS 或 RANGE 子句定义。
SELECTemployee,sale_date,sales,SUM(sales) OVER (PARTITION BY employeeORDER BY sale_dateROWS BETWEEN 2 PRECEDING AND CURRENT ROW) AS moving_sum
FROMsales;

上述查询计算了每个员工在当前行及之前两行内的销售额的移动和。

实际案例

假设我们有一个销售数据表 sales,包含以下字段:sale_id, employee, sale_date, amount。我们希望计算每个员工的累计销售额。

CREATE TABLE sales (sale_id INT AUTO_INCREMENT PRIMARY KEY,employee VARCHAR(50),sale_date DATE,amount DECIMAL(10, 2)
);INSERT INTO sales (employee, sale_date, amount) VALUES
('Alice', '2024-01-01', 100.00),
('Alice', '2024-01-02', 200.00),
('Alice', '2024-01-03', 150.00),
('Bob', '2024-01-01', 50.00),
('Bob', '2024-01-02', 300.00),
('Bob', '2024-01-03', 200.00);SELECTemployee,sale_date,amount,SUM(amount) OVER (PARTITION BY employee ORDER BY sale_date) AS cumulative_sales
FROMsales;

查询结果如下:

+----------+------------+--------+------------------+
| employee | sale_date  | amount | cumulative_sales |
+----------+------------+--------+------------------+
| Alice    | 2024-01-01 | 100.00 |           100.00 |
| Alice    | 2024-01-02 | 200.00 |           300.00 |
| Alice    | 2024-01-03 | 150.00 |           450.00 |
| Bob      | 2024-01-01 |  50.00 |            50.00 |
| Bob      | 2024-01-02 | 300.00 |           350.00 |
| Bob      | 2024-01-03 | 200.00 |           550.00 |
+----------+------------+--------+------------------+

总结

MySQL 窗口函数为我们提供了强大的数据分析能力,允许在不改变行级别数据的情况下进行复杂的聚合和计算。通过掌握窗口函数的使用,你可以更高效地处理和分析数据,从而获得更深入的业务洞察。

无论是对每个分区的累计和,还是排名和行号的计算,窗口函数都能大显身手。希望这篇文章能帮助你更好地理解和使用 MySQL 窗口函数,让你的数据分析工作更加得心应手。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/21237.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java web应用性能分析之【jvisualvm远程连接云服务器】

Java web应用性能分析之【java进程问题分析概叙】-CSDN博客 Java web应用性能分析之【java进程问题分析工具】-CSDN博客 前面整理了java进程问题分析和分析工具,现在可以详细看看jvisualvm的使用,一般java进程都是部署云服务器,或者托管IDC机…

【MySQL】探索 MySQL 中的 CASE WHEN 表达式

缘分让我们相遇乱世以外 命运却要我们危难中相爱 也许未来遥远在光年之外 我愿守候未知里为你等待 我没想到为了你我能疯狂到 山崩海啸没有你根本不想逃 我的大脑为了你已经疯狂到 脉搏心跳没有你根本不重要 🎵 邓紫棋《光年之外》 在数据库查…

每周统计-20240531

用于测试程序的稳定性: 龙虎榜: 成交额: 封成比: 收盘前放量: 开盘抢筹: 封单额:

论文阅读:Correcting Motion Distortion for LIDAR HD-Map Localization

目录 概要 Motivation 整体架构流程 技术细节 小结 论文地址:http://arxiv.org/pdf/2308.13694.pdf 代码地址:https://github.com/mcdermatt/VICET 概要 激光雷达的畸变矫正是一个非常重要的工作。由于扫描式激光雷达传感器需要有限的时间来创建…

YOLOv5训练数据集的配置文件格式与使用技巧

文章目录 一 概述二 配置文件说明2.1 官方配置文件解析2.2 自定义数据集配置文件2.3 其他格式指定数据集路径2.4 多个数据集路径指定 三 总结注意事项 一 概述 本文档主要记录 YOLOv5 算法在进行模型训练前,关于加载数据集的配置文件的说明。 默认情况下&#xff…

RPC-----RCF

RPC RPC(Remote Procedure Call Protocol)——远程过程调用协议。 RCF

linux命令:调试必备工具dmesg

在服务器上进行芯片调试时,我们会遇到各种各样的问题,很多问题与操作系统相关。此时就需要了解操作系统发生了哪些事件。 dmesg 是linux系统中用来打印或控制内核缓冲区内容的命令。这个环形缓冲区记录了系统启动以来发生的各种事件消息,包括…

ChatTTS改良版 - 高度逼真的人类情感文本生成语音工具(TTS)本地一键整合包下

先介绍下ChatTTS 和之前发布的 Fish Speech 类似,都是免费开源的文本生成语音的AI软件,但不同的是,ChatTTS测试下来,对于人类情感语调的模仿,应该是目前开源项目做的最好的,是一款高度接近人类情感、音色、…

MYSQL学习笔记-基础篇

一、SQL 1、DDL 2、DML 3、DQL 4、DCL 主要包括用户管理和权限控制 1)DCL-管理用户 --查询用户 use mysql select * from user;--新增用户 CREATE USER 用户名主机名 IDENTIFIED BY 密码eg: create user hahalocalhost identied by 123; cre…

ppo-clip的本质以及它为什么是另一种ppo-KL-penalty

显然&#xff0c;clip在优势函数A>0且重采样比例过大时截断了上限&#xff0c;在优势函数A<0且重采样比例过小时也截断了负值的上限。 我以第一种情况解释clip的作用。 首先&#xff0c;所有选择的action都是RL中你希望增大概率的action。 当A>0时&#xff0c;说明这…

WordPress中借助Table of Contents Plus+Widget Options插件,实现仅在文章侧边栏显示文章目录的功能

本文转自博主的个人博客&#xff1a;https://blog.zhumengmeng.work,欢迎大家前往查看。 原文链接&#xff1a;点我访问 序言&#xff1a;今天心血来潮&#xff0c;写了一篇文章&#xff0c;忽然发现自己的文章极少有目录&#xff0c;这对于长文章的阅读来说是十分不利的&#…

【自动驾驶】针对低速无人车的线控底盘技术

目录 术语定义 一般要求 操纵装置 防护等级 识别代号 技术要求 通过性要求 直线行驶稳定性 环境适应性要求 功能安全要求 信息安全要求 故障处理要求 通信接口 在线升级(OTA) 线控驱动 动力性能 驱动控制响应能力 线控制动 行车制动 制动响应能力 线控转向 总体要求 线控…

车联网安全入门——ICSim模拟器使用

文章目录 车联网安全入门——ISCim模拟器使用介绍主要特点&#xff1a;使用场景&#xff1a; 安装使用捕获can流量candumpcansnifferwiresharkSavvyCAN主要特点&#xff1a;使用场景&#xff1a; 重放can报文cansendSavvyCAN 总结 车联网安全入门——ISCim模拟器使用 &#x1…

SQL刷题笔记day8——SQL进阶——表与索引操作

目录 1 创建一张新表 2 修改表 3 删除表 4 创建索引 5 删除索引 1 创建一张新表 我的答案 create table if not exists user_info_vip (id int(11) primary key auto_increment Comment自增ID, # 有了主键就不用写not nul了 uid int(11) unique not null Comment用户ID, …

发现真正的诉求

在不久前&#xff0c;我在负责一个项目&#xff0c;设计了一个方案。但是&#xff0c;与我一同合作的同事对其中的一个设计点持有异议。我们尝试讨论解决&#xff0c;但似乎没有找到共识。然而&#xff0c;尽管双方的观点没有达成一致&#xff0c;我们都清楚地表达了自己的想法…

272 基于matlab的形态滤波和局域值分解(LMD)的齿轮故障诊断

基于matlab的形态滤波和局域值分解&#xff08;LMD&#xff09;的齿轮故障诊断&#xff0c;GUI交互界面。通过形态滤波对一维信号进行降噪处理&#xff0c;并通过LMD局部均值分解提取故障信号&#xff0c;最后提取处故障频率。程序已调通&#xff0c;可直接运行。 272 形态滤波…

[AIGC] DAG模型在任务调度中有什么优势?

DAG(Directed Acyclic Graph&#xff0c;有向无环图)在任务调度中的应用带来了以下优势&#xff1a; 清晰的任务依赖关系&#xff1a;在DAG模型中&#xff0c;任务以节点的形式存在&#xff0c;任务间的依赖关系通过有向边来表示。这使得任务关系清晰明了&#xff0c;易于理解和…

Mysql学习经验总结(一)

Mysql的简介&#xff1a; MySql是一个开源的关系型数据库管理系统&#xff0c;广泛应用于Web应用程序的数据存储和管理。它支持多用户并发访问&#xff0c;具有高性能、稳定可靠、易于使用和管理的特点。 MySql官网提供了详细的文档、下载、社区等资源&#xff0c;官网的地址…

微信小程序的服务调取

微信小程序的服务调取概述 微信小程序允许开发者通过网络请求与服务器进行交互&#xff0c;从而实现数据的上传和下载。这是通过小程序提供的API&#xff0c;如wx.request、wx.downloadFile、wx.uploadFile等来完成的。这些API使得小程序可以从远程服务器获取数据&#xff0c;…

文档智能开源软件

文档智能介绍&#xff1a; 文档智能通常指的是利用人工智能技术来处理和分析文档内容&#xff0c;以实现自动化、智能化的文档管理。文档智能的应用领域非常广泛&#xff0c;包括但不限于&#xff1a; 1. **文档识别**&#xff1a;使用OCR&#xff08;光学字符识别&#xff0…