mysql怎么显示结果窗口_mysql8中窗口函数

在以前的MySQL版本中是没有窗口函数的,直到MySQL8.0才引入了窗口函数。窗口函数是对查询中的每一条记录执行一个计算,并且这个计算结果是用与该条记录相关的多条记录得到的。

1.窗口函数与聚合函数

窗口函数与聚合函数很像,他们都是在一组记录而不是整张表上执行的。但是,一个聚合函数在一组记录执行后只返回一条结果而窗口函却会对改分组内的每行记录都返回一个结果。

2.常见的窗口函数

MySQL8.0中定义的窗口函数主要有以下几种:

函数名

参数

描述

cume_dist()

累计分布值。即分组值小于等于当前值的行数与分组总行数的比值。取值范围为(0,1]。

dense_rank()

不间断的组内排序。使用这个函数时,可以出现1,1,2,2这种形式的分组。

first_value()

是;first_value(expr)

返回分组内截止当前行的第一个值。

lag()

是;lag(expr,[N,[default]])

从当前行开始往前取第N行,如果N缺失默认为1。若没有没有,则默认返回default。default默认值为NULL

last_value()

是;last_value(expr)

返回分组内截止当前行的最后一个值。

lead()

是;lead(expr,[N,[default]])

从当前行开始往后取第N行。函数功能与lag()相反,其余与lag()相同。

nth_value()

是;nth_value(expr,N)

返回分组内截止当前行的第N行。first_value\last_value\nth_value函数功能相似,只是返回分组内截止当前行的不同行号的数据。

ntile()

是;ntile(N)

返回当前行在分组内的分桶号。在计算时要先将改分组内的所有数据划分成N个桶,之后返回每个记录所在的分桶号。返回范围从1到N

percent_rank()

累计百分比。该函数的计算结果为:小于该条记录值的所有记录的行数/该分组的总行数-1. 所以改记录的返回值为[0,1]

rank()

间断的组内排序。其排序结果可能出现如下结果:1,1,3,4,4,6

row_number()

当前行在其分组内的序号。不管其排序结果中是否出现重复值,其排序结果都为:1,2,3,4,5

注:‘参数’列说明该函数是否可以加参数。“否”说明该函数的括号内不可以加参数。expr即可以代表字段,也可以代表在字段上的计算,比如sum(col)等。以下相同。

3. over子句

over子句可以指定如何将记录划分分区以供窗口函数处理。如果over()为空,则是将整个查询记录作为一个分组。如果over子句不为空,则其可以指定查询记录划分分组的方式以及记录在分组内部的排序方式。除此之外,over子句也可以和聚合函数一起用。如果聚合函数后出现over子句,那么这些聚合函数也就变成了窗口函数。如果没有over子句,则他们仍然是聚合函数。可以使用over子句的聚合函数主要有以下几种:

avg()、bit_and()、bit_or()、bit_xor()、count()、max()、min()、stddev_pop()、stddev()、std()、stddev_samp()、sum()、var_pop()、variance()、var_samp()

而对于前一部分中介绍的窗口函数来说,over()子句是强制必须要有的。

over子句中常见的语法形式为:

over_clause:

{OVER (window_spec) | OVER window_name}

其中:

window_spec:

[window_name] [partition_clause] [order_clause] [frame_clause]

window_name: 是指在查询语句定义的window子句。如果遇到group by、having子句order by子句,那么window子句要放到having子句和order by子句中间。其语法如下:

WINDOW window_name AS (window_spec)

[, window_name AS (window_spec)] ...

window_spec:

[window_name] [partition_clause] [order_clause] [frame_clause]

从语法结构可以看出来window子句其实只是把放在over()括号中的内容单独抽出来。

partition_clause:即parittion by expr子句。用来指定记录分组方式。语法中的expr不仅可以是字段本身,也可以是计算表达式。比如,记录中有个timestramp类型的字段 ts,在MySQL中,partition by ts 和partition by hour(ts)都是有效的。

order_clause: 即 order by expr desc|asc,expr desc|asc。 用来指定分组内的排序方式。

frame_clause: 用来指定当前分组中的子集划分方式。frame可以在依据当前行的位置在每个分组内移动。使用frame来计算流水流水总和(从分区开始到当前行)及滚动平均(rolling averages)。

其语法结构如下:

frame_clause:

frame_units frame_extent

frame_units:

{ROWS | RANGE}

frame_extent:

{frame_start | frame_between}

frame_between:

BETWEEN frame_start AND frame_end

frame_start, frame_end:

{ CURRENT ROW

| UNBOUNDED PRECEDING

| UNBOUNDED FOLLOWING

|expr PRECEDING

| expr FOLLOWING

}

其中:

frame_units用来指示当前行和frame的关系

ROWS: 用来定义frame的开始行和结束行(偏移量依据的是位置);RANGE: 定义frame的区间。(偏移量的基准为当前行的值)

frame_entent用来指示frame的开始行和结束行。一种是通过指定start和end(frame_start,frame_end。frame_end可以不指定,没有明确给出的话当前行默认为结束行),另一种使用between(frame_between)。frame_between的语法很简单。下面来看frame_start和frame_end。

current row:和rows一起用时,边界就是当前行。和range一起用时,边界是当前行的对等点(个人理解,这里所说的对等点应为与当前行的值相等的所有记录)。

unbounded precceding:使用它时,每个分区的第一行即为边界。

unbounded following:使用它时,每个分区的第一行即为边界。

expr preceding\expr following: 可以由expr个性化的设置向上(preceding)向下(following)的偏移量。

4.代码示例

表结构如下:

2344dbe5457d1998e06b7dd20f4039bb.png

4.1 row_number\dense_rank\ rank

select order_date,sum(quantity) as quantity,

rank()over(ORDER BY sum(quantity) desc) as rank_result,

dense_rank()over(ORDER BY sum(quantity) desc) as dense_result,

row_number()over(ORDER BY sum(quantity) desc) as row_result

from spm_order

group by order_date

-- 限定一部分数据,没有实际意义,能展示出这三个函数的区别就可以了

having quantity>=98

order by quantity desc

运行结果如下:

0461da96c45bc45e941655e71df33513.png

从上面结果看出:

rank()函数一旦遇到重复值,序号会断。比如2个7之后下个出现的序号是9。

dense_rank()函数中即使有重复值,但是序号是连续的。2个7之后下个出现的序号是8。

row_number()不会出现相同的序号。

4.2 cume_dist\percent_rank

select order_date,num,

cume_dist()over(order by num asc) as cume_result,

percent_rank()over(order by num asc) as percent_result

from (select order_date,count(1) as num

from spm_order

group by order_date

having num>=27)a

order by num asc

代码运行结果如下

c299229fb35f1e2e3335a5aba1626958.png

分析如下:

cume_dist():首先总的记录有10条。当num=27时,num小于等于27的值共有5个,所以其cume_dist()值为0.5;当num=28时,小于等于28的值共有7个,所以cume_dist()值为0.7; 以此类推。

percent_rank().当num=27时,num小于27的记录数为0,所以percent_rank()为0;当num=28时,num<28的记录数共有5个,所以percent_rank()的值为5/9; 而当num=29时,其cume_dist()=7/9;以此类推,直到最大值36对应的值为1.

这两个函数的作用有点像计算中位数。

4.3 first_value\last_value\nth_value

select sales_name,year_date,num,

first_value(num)over(PARTITION by sales_name order by year_date asc) as first_result,

last_value(num)over(PARTITION by sales_name order by year_date asc) as last_result,

nth_value(num,2)over(PARTITION by sales_name order by year_date asc) as nth_result

from (select sales_name,year(order_date)as year_date,count(1) as num

from spm_order

where sales_name in ('杨健','楚杰','洪光')

group by year(order_date),sales_name

order by sales_name asc,year_date asc)a

代码运行结果如下(要注意,这三个函数计算结果都是截止当前行)

7af70ece6dfe0ea660d3cc52b049c777.png

4.4 ntile()

select sales_name,year_date,num,

ntile(8)over(order by num asc) as n_bin

from (select sales_name,year(order_date)as year_date,count(1) as num

from spm_order

where sales_name in ('杨健','楚杰','洪光')

group by year(order_date),sales_name

order by sales_name asc,year_date asc)a

代码运行结果如下:

d3b14a7cbf8683481b08412600821ad8.png

从结果上进行分析:

首先,分桶号从1到N,都会出现;

其次,关于每个桶应该有多少条记录。可以假设有N个桶,m个球(球数为总记录数),标号从1到N,依次往1号桶到N号桶里投球,每次只投1个球。循环往复,直到m个球全都投入到N个桶中。最后每个桶里有多少球,现在每个桶里就有多少条记录。

4.5 lag\lead

select sales_name,year_date,num,

lag(num,2)over(PARTITION by sales_name order by year_date asc) as lag_result,

lead(num,2)over(PARTITION BY sales_name order by year_date asc) as lead_result

from (select sales_name,year(order_date)as year_date,count(1) as num

from spm_order

where sales_name in ('杨健','楚杰','洪光')

group by year(order_date),sales_name

order by sales_name asc,year_date asc)a

代码运行结果如下:

e6787af63a0b5bbbcc54b4a806c8251f.png

注意,lag()和lead()函数中出现的字段可以与over()子句中order by中出现的字段不一致。在代码lag(num,2)中2代表的想要取数的那一行相比当前行的偏移量(lead中也类似)。

4.6 聚合函数

select sales_name,year_date,num,

sum(num)over(PARTITION by sales_name) as sum_order,

avg(num)over(PARTITION by sales_name) as mean_order

from (select sales_name,year(order_date)as year_date,count(1) as num

from spm_order

where sales_name in ('杨健','楚杰','洪光')

group by year(order_date),sales_name

order by sales_name asc,year_date asc)a

代码运行结果如下:

a97530c92d379eab0b03420f7287e5c0.png

4.7 order by子句

select sales_name,year_date,num,

sum(num)over(partition by sales_name) as count_1,

count(num)over(partition by sales_name order by num) as count_2

from (select sales_name,year(order_date)as year_date,count(1) as num

from spm_order

where sales_name in ('杨健','楚杰','洪光')

group by year(order_date),sales_name

order by sales_name asc,year_date asc)a

代码运行结果如下:

32adac98012d9867bc8e855353deb52e.png

当frame_clause不存在的时候,默认的frame与order by子句是否存在有关:

如果有order by子句,则默认的frame是从当前分区第一行到当前行。即在此种情况下,默认的frame为 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW

如果没有order by子句,则默认的frame是指该分区。如果此时也没有partition by子句,则相当于全部数据。

4.8 window子句

select sales_name,year(order_date) as year_1,count(1) as num,

sum(count(1)) over w as sales_order,

sum(count(1)) over (w_1) as year_order,

rank()over(w order by count(1) desc) as rank_order

-- 三种写法都是符合语法规范的

from spm_order

where sales_name in ('杨健','楚杰','洪光')

group by sales_name,year(order_date)

window w as (PARTITION by sales_name),

w_1 as (PARTITION by year(order_date))

order by sales_order

代码运行结果如下:

80cb1cb529576c3778ffb1493497ea19.png

4.9 rows和range

rows和range是不能单独使用的,但是因为实在不理解这两个用法上的区别,所以就进行了单独的验证。

select sales_name,month_1,rn_1,num,

sum(num)over(order by month_1 rows between 2 preceding and 1 preceding) as month_row,

sum(num)over(order by month_1 range between 2 preceding and 1 preceding) as month_range,

sum(num)over(order by rn_1 range between 2 preceding and 1 preceding) as rn_range

from (SELECT sales_name,month(order_date) as month_1,count(1) as num,

-- 由于rank()over()返回的是unsigned,当相减结果为负时(between子句会用到减法)会报错,所以这里转成signed类型

cast(rank()over(order by month(order_date)) as signed) as rn_1

from spm_order

where sales_name in ('洪光','范彩')

group by sales_name,month(order_date))a

order by month_1 asc

代码运行结果如下:

e650743b9f7645045b96c25fdea9c0da.png

对以上代码分析:

首先,在这里我新建了一个rn_1列。rn_1列和month_1的区别在于,month_1的数据是连续的,而rn_1列是有中断的(两个1之后出现的是3,我是故意要创建一个中断的序列,来分析一下range的作用范围)

先来看month_row的区别,month_row列的计算结果为当前行在分区中按month_1升序排序之后排在其前面的两行(between and限定的)的sum求和值。所以rows后面的between and限定的偏移量是基于他们在分区中的排列位置的。

再来看month_range,通过分析其实验结果可以发现,month_range列的计算为分区内month_1=当前行-1和month_1=当前行-2(-1,-2是由between an子句决定的。preceding代表负,following代表正)所有列的sum求和值。再来看rn_range, rn_range列的计算结果为分区内month_1=当前行-2的所有里列的sum求和值。所以,rang后面的between and限定的偏移量依据的是当前行的数值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/532086.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

log4jdbc mysql_[简单]log4jdbc-log4j2配置简记_MySQL

log4jdbc-log4j2&#xff0c;就不多说了&#xff0c;不了解的可以谷歌&#xff0c;附上log4jdbc-log4j2的官方链接&#xff1a;https://code.google.com/p/log4jdbc-log4j2/ &#xff0c;上面有非常详细的介绍。简单的贴下配置文件&#xff0c;其他的见附件&#xff1a;databas…

vb实时错误6 溢出_java内存溢出系列(6): Out of swap space?

本文是java内存溢出系列第6小篇。JVM启动参数指定了最大内存限制。如 -Xmx 以及相关的其他启动参数. 假若JVM使用的内存总量超过可用的物理内存, 操作系统就会用到虚拟内存。错误信息 java.lang.OutOfMemoryError: Out of swap space? 表明, 交换空间(swap space,虚拟内存) 不…

java备份还原mysql数据库_Java备份还原Mysql数据库

///实体类package com.ews.util;/*** 系统备份展示对象** */public class DataFile {private String fileName;//备份文件的名称private String fileDate;//备份文件的日期private String filePath;//备份文件的地址private String fileSize;//备份文件的大小public String get…

mysql 查看锁_别吵吵,分布式锁也是锁

Tomcat是这个系统的核心组成部分&#xff0c; 每当有用户请求过来&#xff0c;Tomcat就会从线程池里找个线程来处理&#xff0c;有的执行登录&#xff0c;有的查看购物车&#xff0c;有的下订单&#xff0c;看着属下们尽心尽职地工作&#xff0c;完成人类的请求&#xff0c;Tom…

php解析js的 arraybuffer_JS的所谓的第七种数据类型Symbol

首先&#xff0c;为什么说叫所谓呢&#xff1f;因为在2007年之前Js给予我们typeof解析数据类型的一共有六种(一直有争议&#xff0c;但是我们暂时就按typeof来算)functionNumberObjectbooleanStringundefined但当我们去 typeof Symbol () 的时候&#xff0c;会惊奇的发现&#…

Ubuntu系统如何安装和卸载CUDA和CUDNN

背景 最近在学习PaddlePaddle在各个显卡驱动版本的安装和使用&#xff0c;所以同时也学习如何在Ubuntu安装和卸载CUDA和CUDNN&#xff0c;在学习过程中&#xff0c;顺便记录学习过程。在供大家学习的同时&#xff0c;也在加强自己的记忆。本文章以卸载CUDA 8.0 和 CUDNN 7.05 …

session.merge 缓存不更新_如何保证缓存与数据库双写时的数据一致性?

在做系统优化时&#xff0c;想到了将数据进行分级存储的思路。因为在系统中会存在一些数据&#xff0c;有些数据的实时性要求不高&#xff0c;比如一些配置信息。基本上配置了很久才会变一次。而有一些数据实时性要求非常高&#xff0c;比如订单和流水的数据。所以这里根据数据…

java替换图片中文字_Java 添加、替换、删除Word中的图片

文档中&#xff0c;可以通过图文混排的方式来增加内容的可读性&#xff0c;相比纯文本文档&#xff0c;在内容展现方式上也更具美观性。在给文档添加图片时&#xff0c;可设置图片的文本环绕方式、旋转角度、图片高度/宽度等&#xff1b;另外&#xff0c;也可对文档中已有的图片…

kafka如何保证不重复消费又不丢失数据_Kafka写入的数据如何保证不丢失?

我们暂且不考虑写磁盘的具体过程&#xff0c;先大致看看下面的图&#xff0c;这代表了 Kafka 的核心架构原理。Kafka 分布式存储架构那么现在问题来了&#xff0c;如果每天产生几十 TB 的数据&#xff0c;难道都写一台机器的磁盘上吗?这明显是不靠谱的啊!所以说&#xff0c;这…

不允许输入特殊字符的正则表达式_JavaScript正则表达式常用技巧

正则表达式是用于匹配字符串中字符组合的模式。在 JavaScript 中&#xff0c;正则表达式也是对象。这些模式被用于 RegExp 的 exec 和 test 方法, 以及 String 的 match、matchAll、replace、search 和 split 方法。正则表达式的掌握程度能粗略地看出程序员的技术底子&#xff…

latex 算法_GitHub项目awesome-latex-drawing新增内容(四):绘制贝叶斯网络

近期&#xff0c;我们整理和开源了一个基于LaTeX的科技绘图项目&#xff0c;并将其取名为awesome-latex-drawing&#xff08;GitHub网址为&#xff1a;https://github.com/xinychen/awesome-latex-drawing&#xff09;&#xff0c;案例包括贝叶斯网络、图模型、矩阵/张量示意图…

mysql中的生日应该是什么类型_MySQL中的定点数类型

上一篇文章我们唠叨了浮点数&#xff0c;知道了浮点数存储小数是不精确的。本篇继续唠叨一下MySQL中的另一种存储小数的方式 —— 定点数。浮点数文章闪现&#xff1a;什么, 0.3 - 0.2 ≠ 0.1 ? 什么鬼定点数类型正因为用浮点数表示小数可能会有不精确的情况&#xff0c;在一些…

string转为char数组_StringBuilder的区别是什么?String是不可变?一点课堂(多岸学院)...

String和StringBuffer、StringBuilder的区别可变性简单的来说&#xff1a;String 类中使用 final 关键字字符数组保存字符串&#xff0c;private final char value[]&#xff0c;所以 String 对象是不可变的。而StringBuilder 与 StringBuffer 都继承自 AbstractStringBuild…

mysql 升级 openssl_【1分钟教程】LNMP架构应用实战 Openssl升级操作

由于实际生产环境需求&#xff0c;需要将LNMP环境中的openssl版本升级至目前最新版本openssl-1.1.0c&#xff0c;这玩意升级还真的不是一般的麻烦&#xff0c;由于它与系统各种服务都有相关的联系&#xff0c;比如ssh服务等&#xff0c;因此&#xff0c;升级非常的繁琐,所以今天…

miui秒解bl锁_MIUI12解锁bl篇(原谅我的过失,接上篇文章)

求原谅真心求原谅由于我的疏忽&#xff0c;上期教程不完整&#xff0c;对大家造成不便在这里给大家真诚道歉&#xff01;对不起&#xff01;请收下我的膝盖&#xff01;&#xff01;&#xff01;我的上个教程小米手机MIUI系统降级任意版本通用教程&#xff0c;MIUI12→MIUI9因为…

usbserialcontroller驱动安装不了_win10-有NVIDIA独显提示未安装控制面板的离线安装方式...

最近越来越多的用户反映NVIDIA显卡驱动设置不了啦&#xff0c;找不到NVIDIA显卡的控制面板。 也不知道NVIDIA在什么版本开始驱动安装包就不自带NVIDIA显卡控制面板了。 全新安装的显卡驱动就没有控制面板&#xff1b;或者Windows 10自带更新了显卡新版驱动后导致没有。 每次带N…

vue 点击li 中的img 怎么不冒泡_Vue全解

一.Vue实例内存图&#xff1a;1.把Vue的实例命名为vm&#xff0c;vm对象封装了对视图的所有操作包括数据读写、事件绑定、DOM更新2.vm的构造函数是Vue&#xff0c;按照ES6的说法vm所属的类是Vue3.options是new Vue的参数一般称为选项或构造选项1.options里面有什么英文文档搜op…

terminal services 找不到_电脑局域网中查看不到其他计算机或无法连接的解决办法...

在办公环境中&#xff0c;电脑经常需要打开网络&#xff0c;进行一些文件共享的操作&#xff0c;但是有时会出现很多无法共享的情况&#xff0c;之前有一篇文章讲过解决办法&#xff0c;今天再来将一下具体无法共享的错误提示和相对应的处理方法&#xff0c;主要有以下几种情况…

如何避免mysql回表查询_mysql如何避免回表查询

《迅猛定位低效SQL&#xff1f;》留了一个尾巴&#xff1a;select id,name where name‘shenjian‘select id,name,sexwhere name‘shenjian‘多查询了一个属性&#xff0c;为何检索过程完全不同&#xff1f;什么是回表查询&#xff1f;什么是索引覆盖&#xff1f;如何实现索引…

springmvc的工作原理_SpringMVC工作原理

1 简介SpringMVC框架是以请求为驱动&#xff0c;围绕Servlet设计&#xff0c;将请求发给控制器&#xff0c;然后通过模型对象&#xff0c;分派器来展示请求结果视图。其中核心类是DispatcherServlet&#xff0c;它是一个Servlet&#xff0c;顶层是实现的Servlet接口。2 运行原理…