HiveSql中的函数家族(二)

一、窗口函数

1、什么是窗口函数

        在 SQL 中,窗口函数(Window Functions)是一种特殊的函数,它允许在查询结果集的特定窗口(通常是一组行)上执行聚合、分析和计算操作,而无需聚合整个结果集。窗口函数可以用来解决许多复杂的数据分析问题,例如计算排名、累积总数、移动平均值等。窗口函数通常与 OVER 子句一起使用,该子句用于定义窗口的大小和位置。

窗口函数的一般语法结构如下:

<窗口函数>([参数]) OVER ([PARTITION BY 列1, 列2, ...][ORDER BY 列3 [ASC|DESC]][ROWS | RANGE 关键字][窗口范围或行数定义]
)
  • <窗口函数> 是要执行的窗口函数,例如 SUM、AVG、ROW_NUMBER 等。
  • PARTITION BY 子句可选,用于对结果集进行分区,将数据划分为不同的分组。
  • ORDER BY 子句可选,用于对每个分区内的行进行排序。
  • ROWSRANGE 关键字指定窗口的类型,ROWS 表示窗口以行数为单位,RANGE 表示窗口以值范围为单位。
  • 窗口范围或行数定义用于指定窗口的大小和位置,例如 ROWS BETWEEN 3 PRECEDING AND 1 FOLLOWING 表示窗口包括当前行及其前面的三行和后面的一行。

2、常用的窗口函数

  1. ROW_NUMBER():为结果集中的每一行分配一个唯一的数字序号。

    语法格式:

    ROW_NUMBER() OVER (ORDER BY 列1 [ASC|DESC])
  2. RANK():为结果集中的每一行分配一个排名,如果有相同的值,则会跳过相同的排名。

    语法格式:

    RANK() OVER (ORDER BY 列1 [ASC|DESC])
  3. DENSE_RANK():为结果集中的每一行分配一个密集排名,如果有相同的值,则仍然连续分配排名。

    语法格式:

    DENSE_RANK() OVER (ORDER BY 列1 [ASC|DESC])
  4. SUM():计算指定列的总和,可以在窗口内计算。

    语法格式:

    SUM(列1) OVER (PARTITION BY 列2 ORDER BY 列3 [ASC|DESC])
  5. AVG():计算指定列的平均值,可以在窗口内计算。

    语法格式:

    AVG(列1) OVER (PARTITION BY 列2 ORDER BY 列3 [ASC|DESC])
  6. LEAD():获取结果集中当前行后面的指定行数的值。

    语法格式:

    LEAD(列1, offset, default_value) OVER (ORDER BY 列2 [ASC|DESC])
  7. LAG():获取结果集中当前行前面的指定行数的值。

    语法格式:

    LAG(列1, offset, default_value) OVER (ORDER BY 列2 [ASC|DESC])

  8. FIRST_VALUE():获取结果集中指定列的第一个值。

    语法格式:

    FIRST_VALUE(列1) OVER (ORDER BY 列2 [ASC|DESC])
  9. LAST_VALUE():获取结果集中指定列的最后一个值。

    语法格式:

    LAST_VALUE(列1) OVER (ORDER BY 列2 [ASC|DESC] ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING)
  10. COUNT():计算指定列的行数,可以在窗口内计算。

    语法格式:

    COUNT(列1) OVER (PARTITION BY 列2 ORDER BY 列3 [ASC|DESC])
  11. MAX():获取指定列的最大值,可以在窗口内计算。

    语法格式:

    MAX(列1) OVER (PARTITION BY 列2 ORDER BY 列3 [ASC|DESC])
  12. MIN():获取指定列的最小值,可以在窗口内计算。

    语法格式:

    Min(列1) OVER (PARTITION BY 列2 ORDER BY 列3 [ASC|DESC])
  13. NTILE():将结果集分成指定数量的桶,并为每个桶分配一个编号。

    语法格式:

    NTILE(number_of_buckets) OVER (ORDER BY 列1 [ASC|DESC])
  14. PERCENT_RANK():计算结果集中每行的百分比排名。

    语法格式:

    PERCENT_RANK() OVER (ORDER BY 列1 [ASC|DESC])
  15. CUME_DIST():计算结果集中每行的累积分布值。

    语法格式:

    CUME_DIST() OVER (ORDER BY 列1 [ASC|DESC])
  16. ROW_NUMBER():为结果集中的每一行分配一个唯一的数字序号。

        语法格式:        

ROW_NUMBER() OVER (ORDER BY 列1 [ASC|DESC])

二、CTE语法

CTE语法类似子查询,可以将一个select语句计算的结果当成一个新的临时表使用。

-- 子查询,将子查询的结果当做表使用
select empno,ename from (
select * from emp) t1;
-- 基本用法
with 临时表名 as(查询语句)
select * from 临时表名-- 多个计算结果保存
with tb1 as(查询语句),,tb2 as(查询语句 select * from tb1),tb3 as(查询语句).....
select * from tb3 join tb2
with tb1 as(select * from emp)
select ename,sal from tb1;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/825592.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

FTP客户端Transmit 5 for Mac中文激活版

Transmit 5是一款功能强大的Mac FTP客户端软件&#xff0c;它由Panic公司开发&#xff0c;为用户提供简单、高效的文件传输体验。 Transmit 5 for Mac中文激活版下载 Transmit 5支持多种传输协议&#xff0c;如FTP、SFTP、WebDAV和Amazon S3等&#xff0c;满足用户不同的文件传…

【公司UI自动化学习】

公司课程链接&#xff1a;https://l.jd.com/student/project/project.du?project_id697509403 公司的课程&#xff0c;是给一个学习方向。 一、 PC自动化 1&#xff09;什么项目适合 2&#xff09;PC自动化介入时间点 3&#xff09;自动化率&#xff1a; 频繁改动的&…

不需要GPU就可以玩转模型,同时支持本地化部署

简单一款不需要GPU就可以在Win 机器跑的模型&#xff1a;Ollama&#xff1b;用于本地运行和部署大型语言模型&#xff08;LLMs&#xff09;的开源工具 关于Ollama的简要介绍 平台兼容性&#xff1a;Ollama支持多种操作系统&#xff0c;包括macOS、Linux和Windows&#xff0c;…

华为手机无法弹出wifi上网认证页面处理

华为手机无法弹出wifi上网认证页面 连wifi后跳到上图界面卡住&#xff0c;不跳转到单位的上网认证界面。 打开手机的设置应用&#xff0c;点击上面的WLAN选项。 点击上面的更多WLAN设置选项。 关闭WLAN安全检测就可以正常弹出上网认证界面&#xff0c; 正常弹出上网认证界面&a…

C++类和对象 中(六大默认成员函数)

前言 紧接着上一篇文章&#xff0c;接下来我们来认识下类的六大默认成员函数&#xff0c;如下图。之所以叫他默认成员函数&#xff0c;是因为即使我们不写&#xff0c;编译器会默认帮我们写&#xff0c;但只要我们自己显示的写了&#xff0c;编译器就不会帮我们生成对应的成员函…

H3C交换机FTP与TFTP

一、设备作为服务器端 服务器端配置&#xff1a;首先保证服务器和客户端网络联通&#xff0c;开启 FTP 服务&#xff0c;配置访问 FTP 服务器的账号密码权限。 system-view # 登录系统界面 intg1/0/1 …

windows平台编译OpenCV以支持CUDA

一、环境要求 VS 2022社区版点击这里CMake(个人是GUI版本)点击这里OpenCV源码点击这里Opencv-contrib源码点击这里CUDA CUDNN参考这篇文章 个人的工具使用版本工具版本说明vs2019 社区版

第十五届蓝桥杯复盘python大学A组——试题C 数字诗意

思路 数字可以分为 有诗意的数字可以写成 (ij)(j-i1)/2 &#xff08; i、j都是正整数 &#xff09; ij 、j-i1 的奇偶性不同&#xff08;因为i、j都是正整数&#xff09; 因此&#xff0c; 如果一个数是奇数就一定有诗意 eg.312 ,523,734,945… 原因&#xff1a;根据上述分…

114 接口中幂等性的保证

前言 同样是 面试问题 如何确保接口的 幂等性 幂等是一个 较为抽象的概念, 多次重复访问, 不会导致业务逻辑的异常 这里从增删改查, 几个方面列一下 一般来说, 我们核心需要关注的就是 新增 和 更新 对于 增加元素, 首先针对唯一约束进行校验, 然后再处理新增的相关业…

Day09 React———— 第九天

ReactRoter 一个路径 path 对应一个组件 component 当我们在浏览器中访问一个 path 的时候&#xff0c;path 对应的组件会在页面中进行渲染 基础用法 import { createBrowserRouter, RouterProvider } from "react-router-dom"; const router createBrowserRoute…

基于windowns下的TCP网络通信编程

Tcp通信的三次握手和四次挥手 TCP的三次握手和四次挥手是TCP连接的建立和断开过程&#xff0c;确保了可靠的数据传输和连接状态的正确管理。 TCP的三次握手&#xff08;TCP 链接建立&#xff09;&#xff1a; 1. 客户端发送 SYN &#xff1a; 客户端向服务器发送一个 SYN 报文…

AI讲师人工智能讲师大模型培训讲师叶梓:突破大型语言模型推理效率的创新方法

大型语言模型&#xff08;LLM&#xff09;在自然语言处理&#xff08;NLP&#xff09;任务中展现出了前所未有的能力&#xff0c;但它们对计算资源的巨大需求限制了其在资源受限环境中的应用。SparQ Attention算法提出了一种创新的方法&#xff0c;通过减少注意力机制中的内存带…

TCP为什么需要3次握手?

一、3次握手过程 客户端向服务端发送一个表示建立连接的SYN报文段&#xff0c;服务端从IP数据报中提取出TCP SYN报文段&#xff0c;为该TCP连接分配需要的缓存和变量&#xff0c;并向客户端发送表示允许连接的报文段ACK。客户端在收到ACK报文段之后&#xff0c;也要给该连接分配…

探索Java世界中的七大排序算法(上)

文章目录 排序的概念直接插入排序希尔排序( 缩小增量排序)选择排序堆排序冒泡排序 在计算机科学中&#xff0c;排序算法是一类重要的算法&#xff0c;它们用于将一组元素按照一定的顺序进行排列。在Java编程中&#xff0c;我们经常需要对数组或集合进行排序操作。本文将介绍Jav…

【docker 】docker-compose 部署mongoDB

在notepad中将格式改为UNIX &#xff08;编辑》文档格式转化》转为Unix&#xff09;&#xff0c;编码改为UTF-8 &#xff08; 编码》转为UTF-8&#xff09;&#xff0c;改好后如图 新建启动脚本 mongo.sh #!/bin/bash # 挂载路径 DATA_DIR/opt/docker-data/mongodb/data LOG_…

timesten 安装

1. 安装 从oracle的网站&#xff08;http://www.oracle.com/technology/global/cn/software/products/timesten/index.html&#xff09;下载&#xff0c;timesten的安装文件。 将下载文件解压后&#xff0c;出现linux86文件夹&#xff0c;执行setup.sh&#xff0c;步骤如下…

死磕GMSSL通信-java/Netty系列(三)

死磕GMSSL通信-java/Netty系列&#xff08;三&#xff09; 接着上次的博客继续完善&#xff0c;上次其实只是客户端的改造&#xff0c;这次把服务端的也补上&#xff0c;netty集成GMSSL实现GMServer 1、netty_tcnative c代码改造&#xff0c;这个是客户端和服务端都需要都该的…

数据挖掘与机器学习

一. 机器学习的种类 1. 有监督的机器学习 : 分类 : KNN 最近邻 逻辑回归 - 朴素贝叶斯估计 SVM 线性 或 非线性 优化模型 决策树模型 - 随机森林 - 其它集成模型 lightGBM - XGBOOST 回归: 线性 …

驱动云创建保存自己的环境

驱动云创建保存自己的环境 制作镜像方法一方法二报错 上一篇link介绍了如何在驱动云上部署llama2以及驱动云在训练大模型的方便之处。也说到了可以直接使用驱动云现有的环境&#xff0c;免得自己配置环境。 但是有的时候免不了自己想要安装一些包。 驱动云的环境是这样的&…

基于SpringBoot + Vue 的电影售票及影院管理系统(前后端分离)

后端&#xff1a;Spring Boot Mybatis 实现功能&#xff1a; 售票子系统&#xff1a;用户浏览电影信息&#xff0c;电影分类查看&#xff0c;搜索查看&#xff0c;购票操作&#xff08;未实现支付沙箱&#xff09;&#xff0c;超时取消订单等 管理子系统&#xff1a;管理员…