MySQL中的ROW_NUMBER窗口函数简单了解下

ROW_NUMBER() 是 MySQL8引入的窗口函数之一,它为查询结果集中的每一行分配一个唯一的顺序号(行号)。这个顺序号是基于窗口函数的 ORDER BY 子句进行排序的,可以根据指定的排序顺序生成连续的整数值。

ROW_NUMBER() 在分页、去重、分组内排序等场景中非常有用。

本文涉及到的脚本测试请在个人测试库进行。

使用场景

  • **分页查询:**使用 ROW_NUMBER() 可以生成每行的序号,结合 WHERELIMIT 子句实现高效的分页查询。尤其是在没有 OFFSET 支持的情况下,ROW_NUMBER() 允许你在分页时进行灵活的排序。
  • **去除重复数据:**可以利用 ROW_NUMBER() 来给每一行打上唯一标识,之后选择每组的第一行,从而有效地去除重复数据。
  • **分组内排序:**可以按组对数据进行排序,并为每个组中的行分配一个行号。这个场景通常用于比如给每个订单中的商品按价格排序,并为每个订单挑选排名第一的商品。
  • **数据排名:**使用 ROW_NUMBER() 可以为查询结果中的数据进行排名,适用于例如学生成绩排名、销售业绩排名等场景。

语法

ROW_NUMBER() OVER (PARTITION BY partition_expression ORDER BY order_expression) AS row_num
  • PARTITION BY:可选,按指定字段分组。相同分组内的行号会重新从 1 开始。
  • ORDER BY:指定排序字段,行号的生成顺序由此决定。

示例

假设有一个电商数据库,包含 ordersorder_items 表,使用 ROW_NUMBER() 来展示几种常见场景。


示例 1:为每个订单中的商品按价格排名

可以为每个订单中的商品按价格进行排序,并为每个商品分配一个排名。

-- 创建 orders 表
CREATE TABLE orders (order_id INT AUTO_INCREMENT PRIMARY KEY,customer_name VARCHAR(100),order_date DATE
);-- 创建 order_items 表
CREATE TABLE order_items (order_item_id INT AUTO_INCREMENT PRIMARY KEY,order_id INT,product_name VARCHAR(100),quantity INT,unit_price DECIMAL(10, 2),FOREIGN KEY (order_id) REFERENCES orders(order_id)
);-- 插入数据
INSERT INTO orders (customer_name, order_date) VALUES
('Alice', '2024-10-01'),
('Bob', '2024-10-02'),
('Charlie', '2024-10-03');INSERT INTO order_items (order_id, product_name, quantity, unit_price) VALUES
(1, 'Laptop', 1, 1000.00),
(1, 'Phone', 2, 500.00),
(1, 'Tablet', 1, 300.00),
(2, 'Headphones', 2, 100.00),
(2, 'Mouse', 1, 50.00),
(3, 'Smartwatch', 1, 150.00),
(3, 'Laptop', 1, 800.00);

查询:为每个订单中的商品按 unit_price 排序,给出排名

SELECT oi.order_id, oi.product_name, oi.unit_price,ROW_NUMBER() OVER (PARTITION BY oi.order_id ORDER BY oi.unit_price DESC) AS `rank`
FROM order_items oi;

结果

order_idproduct_nameunit_pricerank
1Laptop1000.001
1Phone500.002
1Tablet300.003
2Headphones100.001
2Mouse50.002
3Laptop800.001
3Smartwatch150.002

在这个例子中,使用 ROW_NUMBER() 按照每个 order_id 对商品按 unit_price 从高到低排序,并为每个商品分配了一个行号(排名)。

如果只想获取每个订单中价格最高的商品,可以在查询外层再加一个 WHERE rank = 1 来筛选。


示例 2:去除重复数据

假设 order_items 表中有重复的记录,可以利用 ROW_NUMBER() 给每一行编号,然后只保留每组中第一个出现的记录(行号为 1)。

插入重复数据

INSERT INTO order_items (order_id, product_name, quantity, unit_price) VALUES
(1, 'Laptop', 1, 1000.00),  -- 重复记录
(2, 'Mouse', 1, 50.00),     -- 重复记录
(3, 'Smartwatch', 1, 150.00);

查询:去除重复记录

WITH ranked_items AS (SELECT oi.order_item_id, oi.order_id, oi.product_name, oi.unit_price,ROW_NUMBER() OVER (PARTITION BY oi.order_id, oi.product_name ORDER BY oi.order_item_id) AS rnFROM order_items oi
)
SELECT order_item_id, order_id, product_name, unit_price
FROM ranked_items
WHERE rn = 1;
order_item_idorder_idproduct_nameunit_price
11Laptop1000.00
21Phone500.00
31Tablet300.00
42Headphones100.00
52Mouse50.00
73Laptop800.00
63Smartwatch150.00

在这个查询中,ROW_NUMBER() 根据 order_idproduct_name 为每一组商品打上编号,PARTITION BY 确保每个订单中同一个商品只保留一次。WHERE rn = 1 确保每个分组只保留第一条记录,从而去除了重复的商品条目。

示例 3:分页查询

假设需要分页展示订单项,每页展示 2 条数据。可以使用 ROW_NUMBER() 来为查询结果生成行号,并结合 WHERE 子句限制显示特定页的数据。

查询:分页显示第二页数据(每页显示 2 条)

WITH ranked_items AS (SELECT oi.order_item_id, oi.order_id, oi.product_name, oi.unit_price,ROW_NUMBER() OVER (ORDER BY oi.order_item_id) AS rnFROM order_items oi
)
SELECT order_item_id, order_id, product_name, unit_price
FROM ranked_items
WHERE rn BETWEEN 3 AND 4;

结果

order_item_idorder_idproduct_nameunit_price
31Tablet300.00
42Headphones100.00

在这个分页查询中,ROW_NUMBER() 为查询结果集中的每一行分配了一个行号,然后通过 WHERE rn BETWEEN 3 AND 4 获取第 2 页的结果(假设每页 2 条数据)。

总结

ROW_NUMBER() 在 MySQL 中是一个强大的窗口函数,具有以下几个主要用途:

  • 分页查询:通过生成行号来实现高效分页。
  • 去重:利用分组和行号,可以去除重复数据。
  • 分组排序:对每个分组内的数据进行排序并生成排名。
  • 数据排名:计算排名或为数据按某种规则分配顺序。

MySQL 8.0 引入的窗口函数使得许多复杂的查询变得更加简洁和高效,特别是在处理排名、去重和分页等场景时。

关于作者

来自全栈程序员nine的探索与实践,持续迭代中。(技术交流codetrend)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/62298.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从 App Search 到 Elasticsearch — 挖掘搜索的未来

作者:来自 Elastic Nick Chow App Search 将在 9.0 版本中停用,但 Elasticsearch 拥有你构建强大的 AI 搜索体验所需的一切。以下是你需要了解的内容。 生成式人工智能的最新进展正在改变用户行为,激励开发人员创造更具活力、更直观、更引人入…

CTF之密码学(费纳姆密码)

一、作为二进制替换密码的费纳姆密码 定义:费纳姆密码是一种由二进制产生的替换密码,也被称为弗纳姆密码(Vernam cipher)。它采用二进制表示法,将明文转化为二进制数字,并通过与密钥进行模2加法运算来产生密…

若依框架部署在网站一个子目录下(/admin)问题(

部署在子目录下首先修改vue.config.js文件: 问题一:登陆之后跳转到了404页面问题,解决办法如下: src/router/index.js 把404页面直接变成了首页(大佬有啥优雅的解决办法求告知) 问题二:退出登录…

【贪心算法第六弹——334.递增的三元子序列(easy)】

目录 1.题目解析 题目来源 测试用例 2.算法原理 3.实战代码 代码解析 本题属于最长递增子序列的简化版本,只需要判断能不能组成三位的递增子序列即可,建议先去看博主的另一篇博客可以更好的理解本篇博客:300.最长递增子序列 1.题目解析…

c++(斗罗大陆)

这次&#xff0c;作者编了斗罗大陆的武魂、魂力等级&#xff0c;目前只写到了11级 #include<iostream> #include<conio.h> #include<windows.h> #include<stdlib.h> #include<stdio.h> #include<time.h> #include<strin…

Perl编程语言简介

文章目录 前言基础语法一. 变量1. 标量2. 数组3. 哈希 二. 控制结构1. 条件语句2. 循环语句 三. 自定义函数与作用域四. 文件读写五. 正则表达式1. 模式匹配2. 替换 六. 模块和包七. 面向对象的编程 总结 前言 Perl&#xff08;Practical Extraction and Report Language&…

《TCP/IP网络编程》学习笔记 | Chapter 16:关于 I/O 流分离的其他内容

《TCP/IP网络编程》学习笔记 | Chapter 16&#xff1a;关于 I/O 流分离的其他内容 《TCP/IP网络编程》学习笔记 | Chapter 16&#xff1a;关于 I/O 流分离的其他内容分离 I/O 流2 次 I/O 流分离分离「流」的好处「流」分离带来的 EOF 问题 文件描述符的的复制和半关闭终止「流」…

LeetCode数组题

参考链接 代码随想录 讲解视频链接 数组题 1、(两数之和)给定一个整数数组 nums 和一个整数目标值 target&#xff0c;请你在该数组中找出 和为目标值 target 的那 两个 整数&#xff0c;并返回它们的数组下标。你可以假设每种输入只会对应一个答案&#xff0c;并且你不能使用…

Unity-Lightmap入门篇

&#xff1a;&#xff1a;这是一个实战文章&#xff0c;并没有知识分享&#xff0c;或理论知识&#xff1b;完全没有 关键字&#xff1a; “lightmap","全局光照”&#xff0c;“light Probe" (会混合一些中英文搜索&#xff0c;或者全英文搜索&#xff09; …

海康VsionMaster学习笔记(学习工具+思路)

一、前言 VisionMaster算法平台集成机器视觉多种算法组件&#xff0c;适用多种应用场景&#xff0c;可快速组合算法&#xff0c;实现对工件或被测物的查找测量与缺陷检测等。VM算法平台依托海康威视在图像领域多年的技术积淀&#xff0c;自带强大的视觉分析工具库&#xff0c;可…

Python双向链表、循环链表、栈

一、双向链表 1.作用 双向链表也叫双面链表。 对于单向链表而言。只能通过头节点或者第一个节点出发&#xff0c;单向的访问后继节点&#xff0c;每个节点只能记录其后继节点的信息&#xff08;位置&#xff09;&#xff0c;不能向前遍历。 所以引入双向链表&#xff0c;双…

爬虫技术深度解析:XPath与CSS选择器的结合优势

在现代网络爬虫技术中&#xff0c;数据提取的准确性和效率至关重要。XPath和CSS选择器作为两种主流的元素定位工具&#xff0c;在爬虫领域中扮演着重要角色。本文将深入探讨XPath和CSS选择器在爬虫中的结合优势&#xff0c;并提供详细的代码示例&#xff0c;以帮助开发者更好地…

linux安全管理-防火墙配置

1. 开启系统防火墙 1、检查内容 检查操作系统是否开启防火墙&#xff1b; 2、配置要求 操作系统开启防火墙&#xff1b; 3、配置方法 systemctl status firewalld ##查看系统防火墙运行状态 systemctl start firewalld ##启动防火墙 systemctl restart firewalld ##重启防火墙…

【数据结构笔记】习题

渐进分析 【2010-THU-Mid】f(n) O(g(n))&#xff0c;当且仅当g(n) Ω(f(n))。&#xff08;√&#xff09; 【2010-THU-Mid】若f(n) O(n^2)且g(n) O(n)&#xff0c;则以下结论正确的是&#xff08;AD&#xff09; A. f(n) g(n) O(n^2) B. f(n) / g(n) O(n) C. g(n) O(f(…

Python 中的装饰器是什么?

装饰器是Python中一种非常强大的功能&#xff0c;它允许你在不修改原始函数代码的前提下&#xff0c;增加额外的功能或改变函数的行为。 装饰器本质上是一个接受函数作为参数的函数&#xff0c;并返回一个新的函数。 通过装饰器&#xff0c;我们可以轻松地实现诸如日志记录、…

ES实用面试题

一、es是什么&#xff0c;为什么要用它&#xff1f; ES通常是Elasticsearch的简称&#xff0c;它是一个基于Lucene构建的开源搜索引擎。Elasticsearch以其分布式、高扩展性和实时数据分析能力而闻名&#xff0c;广泛用于全文搜索、日志分析、实时监控等多种场景。 基本特点&am…

适用于学校、医院等低压用电场所的智能安全配电装置

引言 电力&#xff0c;作为一种清洁且高效的能源&#xff0c;极大地促进了现代生活的便捷与舒适。然而&#xff0c;与此同时&#xff0c;因使用不当或维护缺失等问题&#xff0c;漏电、触电事件以及电气火灾频发&#xff0c;对人们的生命安全和财产安全构成了严重威胁&#xf…

Java开发中对List<Map<String, Object>>集合去重并按大小拆分子列表

Java开发中对List< Map< String, Object > >集合去重并按大小拆分子列表 一、使用场景二、实现步骤三、相关知识四、代码示例 一、使用场景 在处理大量List<Map<String, Object>>集合的数据时&#xff0c;为确保数据的唯一性&#xff0c;需要先根据Ma…

智能桥梁安全运行监测系统守护桥梁安全卫士

一、方案背景 桥梁作为交通基础设施中不可或缺的重要组成部分&#xff0c;其安全稳定的运行直接关联到广大人民群众的生命财产安全以及整个社会的稳定与和谐。桥梁不仅是连接两地的通道&#xff0c;更是经济发展和社会进步的重要纽带。为了确保桥梁的安全运行&#xff0c;桥梁安…

【Python爬虫五十个小案例】爬取豆瓣电影Top250

博客主页&#xff1a;小馒头学python 本文专栏: Python爬虫五十个小案例 专栏简介&#xff1a;分享五十个Python爬虫小案例 &#x1fab2;前言 在这篇博客中&#xff0c;我们将学习如何使用Python爬取豆瓣电影Top250的数据。我们将使用requests库来发送HTTP请求&#xff0c;…