java关闭窗口函数_2016年将是Java终于拥有窗口函数的那一年!

java关闭窗口函数

你没听错。 到目前为止,出色的窗口功能是SQL独有的功能。 甚至复杂的函数式编程语言似乎仍然缺少这种漂亮的功能(如果我错了,请纠正我,Haskell伙计们)。

我们撰写了许多有关窗口函数的博客文章,并在诸如以下文章中向我们的受众宣讲:

  • 可能最酷SQL功能:窗口函数
  • 使用此整洁的窗口函数技巧来计算时间序列中的时差
  • 如何在SQL中查找最长的连续事件系列
  • 不要错过带有FIRST_VALUE(),LAST_VALUE(),LEAD()和LAG()的超凡SQL能力
  • ROW_NUMBER(),RANK()和DENSE_RANK()之间的区别

我最喜欢的窗口函数示例用例之一是运行总计 。 即从以下银行帐户交易表中获取:

| ID   | VALUE_DATE | AMOUNT |
|------|------------|--------|
| 9997 | 2014-03-18 |  99.17 |
| 9981 | 2014-03-16 |  71.44 |
| 9979 | 2014-03-16 | -94.60 |
| 9977 | 2014-03-16 |  -6.96 |
| 9971 | 2014-03-15 | -65.95 |

…到此,并计算出余额:

| ID   | VALUE_DATE | AMOUNT |  BALANCE |
|------|------------|--------|----------|
| 9997 | 2014-03-18 |  99.17 | 19985.81 |
| 9981 | 2014-03-16 |  71.44 | 19886.64 |
| 9979 | 2014-03-16 | -94.60 | 19815.20 |
| 9977 | 2014-03-16 |  -6.96 | 19909.80 |
| 9971 | 2014-03-15 | -65.95 | 19916.76 |

对于SQL,这是小菜一碟。 观察SUM(t.amount) OVER(...)的用法:

SELECTt.*,t.current_balance - NVL(SUM(t.amount) OVER (PARTITION BY t.account_idORDER BY     t.value_date DESC,t.id         DESCROWS BETWEEN UNBOUNDED PRECEDINGAND     1         PRECEDING),0) AS balance
FROM     v_transactions t
WHERE    t.account_id = 1
ORDER BY t.value_date DESC,t.id         DESC

窗口功能如何工作?

(别忘了预订我们SQL Masterclass来了解窗口函数 ,以及更多!)

尽管有时语法有些令人恐惧,但窗口函数确实非常易于理解。 Windows是您的FROM / WHERE / GROUP BY / HAVING子句中产生的数据的“视图”。 它们使您可以访问相对于当前行的所有其他行,同时在SELECT子句中(或很少在ORDER BY子句中)进行计算。 上面的声明实际上是这样做的:

| ID   | VALUE_DATE |  AMOUNT |  BALANCE |
|------|------------|---------|----------|
| 9997 | 2014-03-18 | -(99.17)|+19985.81 |
| 9981 | 2014-03-16 | -(71.44)| 19886.64 |
| 9979 | 2014-03-16 |-(-94.60)| 19815.20 |
| 9977 | 2014-03-16 |   -6.96 |=19909.80 |
| 9971 | 2014-03-15 |  -65.95 | 19916.76 |

也就是说,对于任何给定的余额,从当前余额中减去SUM()OVER() ”与当前行(同一银行帐户)在同一分区中的所有行的窗口,并且这些行严格位于“当前行。

或者,详细而言:

  • PARTITION BY指定“ OVER() ”,该字符将窗口范围排成一行
  • ORDER BY指定窗口的排序方式
  • ROWS指定应考虑的有序行索引

我们可以使用Java集合吗?

乔·布莱克 我们可以! 如果您使用的是jOOλ :我们设计了一个完全免费的开源Apache 2.0许可库,因为我们认为JDK 8 Stream和Collector API只是不这样做。

设计Java 8时,很多精力都放在了支持并行流上。 很好,但是当然不是唯一可以应用函数式编程的有用领域。 我们创建了jOOλ来填补这一空白-无需实现所有新的替代集合API,例如Javaslang或功能性Java have。

jOOλ已经提供:

  1. 元组类型
  2. 对于有序的,仅顺序的流更有用的东西

通过最近发布的jOOλ0.9.9,我们添加了两个主要新功能:

  1. 大量新收藏家
  2. 视窗功能

JDK中许多缺少的收集器

JDK附带了几个收集器,但是它们看起来确实笨拙且冗长,并且没有人真正喜欢编写像此Stack Overflow问题 (以及许多其他问题)中所介绍的收集器那样的收集器。

但是链接问题中公开的用例是非常有效的。 您要汇总人员列表中的几件事:

public class Person {private String firstName;private String lastName;private int age;private double height;private double weight;// getters / setters

假设您有以下列表:

List<Person> personsList = new ArrayList<Person>();personsList.add(new Person("John", "Doe", 25, 1.80, 80));
personsList.add(new Person("Jane", "Doe", 30, 1.69, 60));
personsList.add(new Person("John", "Smith", 35, 174, 70));

现在,您希望获得以下聚合:

  • 人数
  • 最高年龄
  • 最小高度
  • 平均重量

对于任何习惯编写SQL的人来说,这都是一个荒谬的问题:

SELECT count(*), max(age), min(height), avg(weight)
FROM person

做完了 Java有多难? 事实证明,许多原始代码需要使用香草JDK 8 API编写。 考虑给出的复杂答案

  • 由塔吉尔·瓦列夫(Tagir Valeev)
  • 通过TriCore

使用jOOλ0.9.9时,再次解决此问题变得非常可笑, 并且读取的内容几乎类似于SQL :

Tuple result =
Seq.seq(personsList).collect(count(),max(Person::getAge),min(Person::getHeight),avg(Person::getWeight));System.out.println(result);

结果如下:

(3, Optional[35], Optional[1.69], Optional[70.0])

请注意,这不是针对SQL数据库运行查询(这就是jOOQ的目的)。 我们正在针对内存中的Java集合运行此“查询”。

现在窗口功能如何?

是的,本文的标题并没有涉及琐碎的聚合工作。 它承诺了很棒的窗口功能。

但是,窗口函数不过是数据流子集上的聚合(或排名)而已。 您想要维护原始记录,而不是将所有流(或表)聚合到单个记录中,而是直接在每个单独的记录上提供聚合。

窗口函数的一个很好的入门示例是本文提供的示例,它解释了ROW_NUMBER(),RANK()和DENSE_RANK()之间的区别 。 考虑以下PostgreSQL查询:

SELECTv, ROW_NUMBER() OVER(w),RANK()       OVER(w),DENSE_RANK() OVER(w)
FROM (VALUES('a'),('a'),('a'),('b'),('c'),('c'),('d'),('e')
) t(v)
WINDOW w AS (ORDER BY v);

它产生:

| V | ROW_NUMBER | RANK | DENSE_RANK |
|---|------------|------|------------|
| a |          1 |    1 |          1 |
| a |          2 |    1 |          1 |
| a |          3 |    1 |          1 |
| b |          4 |    4 |          2 |
| c |          5 |    5 |          3 |
| c |          6 |    5 |          3 |
| d |          7 |    7 |          4 |
| e |          8 |    8 |          5 |

在Java 8中,可以使用jOOλ0.9.9进行相同的操作

System.out.println(Seq.of("a", "a", "a", "b", "c", "c", "d", "e").window(naturalOrder()).map(w -> tuple(w.value(),w.rowNumber(),w.rank(),w.denseRank())).format()
);

屈服…

+----+----+----+----+
| v0 | v1 | v2 | v3 |
+----+----+----+----+
| a  |  0 |  0 |  0 |
| a  |  1 |  0 |  0 |
| a  |  2 |  0 |  0 |
| b  |  3 |  3 |  1 |
| c  |  4 |  4 |  2 |
| c  |  5 |  4 |  2 |
| d  |  6 |  6 |  3 |
| e  |  7 |  7 |  4 |
+----+----+----+----+

同样,请注意,我们没有对数据库运行任何查询。 一切都在内存中完成。

注意两件事:

  • jOOλ的窗口函数返回0(基于Java API的期望值),而不是SQL(全为1)。
  • 在Java中,无法使用命名列构造临时记录。 不幸的是,我确实希望将来的Java将为此类语言功能提供支持。

让我们回顾一下代码中到底发生了什么:

System.out.println(// This is just enumerating our valuesSeq.of("a", "a", "a", "b", "c", "c", "d", "e")// Here, we specify a single window to be// ordered by the value T in the stream, in// natural order.window(naturalOrder())// The above window clause produces a Window<T>// object (the w here), which exposes....map(w -> tuple(// ... the current value itself, of type String...w.value(),// ... or various rankings or aggregations on// the above window.w.rowNumber(),w.rank(),w.denseRank()))// Just some nice formatting to produce the table.format()
);

而已! 很简单,不是吗?

我们可以做的更多! 看一下这个:

System.out.println(Seq.of("a", "a", "a", "b", "c", "c", "d", "e").window(naturalOrder()).map(w -> tuple(w.value(),   // v0 w.count(),   // v1w.median(),  // v2w.lead(),    // v3w.lag(),     // v4w.toString() // v5)).format()
);

以上产量是多少?

+----+----+----+---------+---------+----------+
| v0 | v1 | v2 | v3      | v4      | v5       |
+----+----+----+---------+---------+----------+
| a  |  1 | a  | a       | {empty} | a        |
| a  |  2 | a  | a       | a       | aa       |
| a  |  3 | a  | b       | a       | aaa      |
| b  |  4 | a  | c       | a       | aaab     |
| c  |  5 | a  | c       | b       | aaabc    |
| c  |  6 | a  | d       | c       | aaabcc   |
| d  |  7 | b  | e       | c       | aaabccd  |
| e  |  8 | b  | {empty} | d       | aaabccde |
+----+----+----+---------+---------+----------+

现在,您的分析心脏应该跳了起来。

43765651

等一会儿。 我们也可以像在SQL中那样做框架吗? 我们可以。 就像在SQL中一样,当我们省略窗口定义上的frame子句(但我们确实指定了ORDER BY子句)时,默认情况下将应用以下内容:

RANGE BETWEEN UNBOUNDED PRECEDINGAND CURRENT ROW

我们在前面的示例中已经做到了。 可以在第v5列中看到,在该列中我们从第一个值到当前值聚合字符串。 因此,让我们指定框架:

System.out.println(Seq.of("a", "a", "a", "b", "c", "c", "d", "e").window(naturalOrder(), -1, 1) // frame here.map(w -> tuple(w.value(),   // v0w.count(),   // v1w.median(),  // v2w.lead(),    // v3w.lag(),     // v4w.toString() // v5)).format()
);

结果很简单:

+----+----+----+---------+---------+-----+
| v0 | v1 | v2 | v3      | v4      | v5  |
+----+----+----+---------+---------+-----+
| a  |  2 | a  | a       | {empty} | aa  |
| a  |  3 | a  | a       | a       | aaa |
| a  |  3 | a  | b       | a       | aab |
| b  |  3 | b  | c       | a       | abc |
| c  |  3 | c  | c       | b       | bcc |
| c  |  3 | c  | d       | c       | ccd |
| d  |  3 | d  | e       | c       | cde |
| e  |  2 | d  | {empty} | d       | de  |
+----+----+----+---------+---------+-----+

如预期的那样, lead()lag()不受影响,这与count()median()toString()相反

现在,让我们回顾一下运行总计。

通常,您不会根据流本身的标量值来计算窗口函数,因为该值通常不是标量值,而是元组(或Java语言中的POJO)。 取而代之的是,您从元组(或POJO)中提取值并对其进行汇总。 因此,再次,在计算BALANCE ,我们需要首先提取AMOUNT

| ID   | VALUE_DATE |  AMOUNT |  BALANCE |
|------|------------|---------|----------|
| 9997 | 2014-03-18 | -(99.17)|+19985.81 |
| 9981 | 2014-03-16 | -(71.44)| 19886.64 |
| 9979 | 2014-03-16 |-(-94.60)| 19815.20 |
| 9977 | 2014-03-16 |   -6.96 |=19909.80 |
| 9971 | 2014-03-15 |  -65.95 | 19916.76 |

这是使用Java 8和jOOλ0.9.9编写运行总计的方法

BigDecimal currentBalance = new BigDecimal("19985.81");Seq.of(tuple(9997, "2014-03-18", new BigDecimal("99.17")),tuple(9981, "2014-03-16", new BigDecimal("71.44")),tuple(9979, "2014-03-16", new BigDecimal("-94.60")),tuple(9977, "2014-03-16", new BigDecimal("-6.96")),tuple(9971, "2014-03-15", new BigDecimal("-65.95")))
.window(Comparator.comparing((Tuple3<Integer, String, BigDecimal> t) -> t.v1, reverseOrder()).thenComparing(t -> t.v2), Long.MIN_VALUE, -1)
.map(w -> w.value().concat(currentBalance.subtract(w.sum(t -> t.v3).orElse(BigDecimal.ZERO))
));

屈服

+------+------------+--------+----------+
|   v0 | v1         |     v2 |       v3 |
+------+------------+--------+----------+
| 9997 | 2014-03-18 |  99.17 | 19985.81 |
| 9981 | 2014-03-16 |  71.44 | 19886.64 |
| 9979 | 2014-03-16 | -94.60 | 19815.20 |
| 9977 | 2014-03-16 |  -6.96 | 19909.80 |
| 9971 | 2014-03-15 | -65.95 | 19916.76 |
+------+------------+--------+----------+

这里有几件事发生了变化:

  • 比较器现在考虑两个比较。 不幸的是JEP-101并没有完全实现 ,这就是为什么我们需要在此处帮助类型编译器的原因。
  • Window.value()现在是一个元组,而不是单个值。 因此,我们需要从中提取有趣的列AMOUNT (通过t -> t.v3 )。 另一方面,我们可以简单地将附加值concat()给元组

但是已经足够了。 除了比较器的详细信息(我们一定会在将来的jOOλ版本中解决)之外,编写窗口函数也是小菜一碟。

我们还能做什么?

本文不是对新API可以做的所有事情的完整描述。 我们将很快写一个后续博客文章,并提供其他示例。 例如:

  • 未描述partition by子句,但也可用
  • 您可以指定比此处公开的单个窗口更多的窗口,每个窗口都具有单独的PARTITION BYORDER BY和框架规范

另外,当前的实现还很规范,即它尚未(尚未)缓存聚合:

  • 对于无序/无框窗口(所有分区的值相同)
  • 严格升序的窗口(聚合可以基于先前的值,例如SUM()toString()关联收集器)

就我们而言就是这样。 下载jOOλ,试用它,并享受一个事实,那就是所有Java 8开发人员现在都可以使用最强大SQL功能!

  • https://github.com/jOOQ/jOOL

翻译自: https://www.javacodegeeks.com/2016/01/2016-will-year-remembered-java-finally-window-functions.html

java关闭窗口函数

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/336569.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jvm gc阻塞时长 占比_jvm进行转义分析需要多长时间? 可能比您想象的要长。

jvm gc阻塞时长 占比这篇文章着眼于转义分析&#xff0c;特别是jvm在运行的程序中执行转义分析需要多长时间。 我做了一些观察&#xff0c;但目前还没有全部解释。 作为介绍&#xff0c;让我们绕道看看jvm -Xcomp中一个鲜为人知且使用更少的标志&#xff08;我们将看到这是一件…

jquery mysql php_jQuery+PHP+Mysql在线拍照和在线浏览照片

本文示例建立在本站helloweba.net两篇文章之上&#xff0c;一篇是用于在线拍照的&#xff1a;JavascriptPHP实现在线拍照功能&#xff0c;另一篇是用于浏览照片的&#xff1a;Fancybox丰富的弹出层效果。如果您对在线拍照和Fancybox不大了解&#xff0c;可以先参照以上两篇文章…

设计散列表实现通讯录查找系统_[源码和文档分享]利用哈希表实现电话号码查询系统...

第一章 需求分析1.1 问题描述设计一个电话号码查询系统&#xff0c;为来访的客⼈提供各种信息查询服务。1.2 基本要求设计每个记录有下列数据项&#xff1a;电话号码、用户名、地址从键盘输入个记录&#xff0c;分别以电话号码和用户名为关键字建立不同散列表存储采用一定的方法…

C++基础(2)

【1】静态全局变量 1.通常情况下&#xff0c;静态全局变量的声明和定义放在源文件中&#xff0c;并且不能使用extern关键字将全局静态变量导出&#xff0c;作用域仅限于定义静态全局变量的文件内部。 2.如果头文件中声明静态全局变量&#xff0c;在声明的同时会被初始化&…

drill apache_使用Apache Drill REST API通过Node构建ASCII仪表盘

drill apacheApache Drill有一个隐藏的瑰宝&#xff1a;易于使用的REST接口。 该API可用于查询&#xff0c;分析和配置Drill引擎。 在此博客文章中&#xff0c;我将解释如何使用Brilled Contrib使用Drill REST API创建ascii仪表板。 ASCII仪表盘如下所示&#xff1a; 先决条…

mysql 8.0用doc修改密码_MYSQL8.0修改密码流程

MYSQL8.0修改密码流程1.以管理员身份打开cmd2.找到mysql 的安装路径bin文件的路径&#xff0c;3.输入net start mysql4.输入mysql -u root -p5.找到my.ini文件6.在my.ini里面的[mysqld]这一行后面添加 skip -grant-tables,保存文件&#xff0c;注意不是[mysql]7.输入mysqld --s…

颜色空间缩减color space reduction

颜色空间缩减公式 //---------------------------------【头文件、命名空间包含部分】-------------------------- // 描述&#xff1a;包含程序所使用的头文件和命名空间 //---------------------------------------------------------------------------------------…

运动基元_发现大量Java基元集合处理

运动基元在阅读博客文章5减少Java垃圾收集开销的技巧时 &#xff0c;我想起了一个名为Trove的小型Java收集库&#xff0c;该库“为Java提供了高速的常规和原始收集”。 我对将Trove应用到允许原语的集合而不是要求集合中的元素成为完整的引用对象的能力特别感兴趣。 我在这篇文…

python判断奇偶数字符串的拼接_Python字符串拼接方法总结

这篇文章主要介绍了Python字符串拼接的几种方法整理的相关资料,这里提供了五种方法及实现&#xff0c;需要的朋友可以参考下Python字符串拼接的几种方法整理第一种 通过加号()的形式print(第一种方式通过加号形式连接 &#xff1a; lovePython \n)第二种 通过逗号(,)的形式pr…

Split分离通道

#include <iostream> #include <opencv2/core/core.hpp> #include <opencv2/highgui/highgui.hpp> #include <opencv2\opencv.hpp> using namespace cv; using namespace std;int main() {vector<Mat>cha;Mat b, g, r,dst;//1.加载两幅图片…

上下文异常中的上下文属性_在没有适当上下文的情况下引发异常是一种不良习惯...

上下文异常中的上下文属性Allison Anders等人的《四个房间》&#xff08;1995&#xff09;。 我不断重复同样的错误。 因此&#xff0c;该停止并制定规则以防止这种情况了。 错误不是致命的&#xff0c;但很烦人。 当查看生产日志时&#xff0c;经常会看到类似"File does…

最大公约数简便算法_求最大公约数的4种算法

for(z0; z<10000000; z) 循环只是为了增加程序的运行时间&#xff0c;让我们体会算法的时间复杂度。算法一&#xff1a;短除法想法&#xff0c;采用短除法找出2个数的所有公约数&#xff0c;将这些公因子相乘&#xff0c;结果就是2个数的最大公约数。【找公因子&#xff0c;…

java 编写代码_如果您在2015年编写过Java代码-这是您不容错过的趋势

java 编写代码去年我们有机会遇到的最有趣趋势的实用概述 在这篇文章中&#xff0c;我们回顾了构成我们2015年对话的5个主题和新发展。与其他许多年终总结保持较高水平的不同&#xff0c;我们将做一个更实际的操作不用流行语 。 好吧&#xff0c;没有太多*流行语。 与往常一样…

java自动生成合同_Java 7和Java 8之间的细微自动关闭合同更改

java自动生成合同Java 7的try-with-resources语句和与该语句一起使用的AutoCloseable类型的一个不错的功能是&#xff0c;静态代码分析工具可以检测到资源泄漏。 例如&#xff0c;Eclipse&#xff1a; 当您具有上述配置并尝试运行以下程序时&#xff0c;您将收到三个警告&…

Python学习(1)

1.str字符串操作 len(str) 计算字符串长度 str.replace(xxx,xxxx) 替换指定字符 str.upper()字符串转大写 str.lower()字符串转小写 str.strip()删除左右多余的空格 str.lstrip()删除左边多余的空格 str.rstrip()删除右边的空格 format(a,b,c) 传参显示 2.索引 out hello wo…

opencv求两张图像光流_光流(optical flow)和openCV中实现

转载请注明出处&#xff01;&#xff01;&#xff01;光流(optical flow)和openCV中实现光流的概念&#xff1a;是Gibson在1950年首先提出来的。它是空间运动物体在观察成像平面上的像素运动的瞬时速度。是利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一…

storm apache_Apache Storm的实时情绪分析示例

storm apache实时情感分析是指处理自然语言文本&#xff08;或语音&#xff09;流以提取主观信息。 琐碎的用例用于构建推荐引擎或查找社交媒体趋势。 我选择了Apache Storm作为实时处理引擎。 Storm非常强大&#xff08;我们正在生产中使用它&#xff09;&#xff0c;并且非常…

怎么用python画圆的公式_怎么用python画圆

python中内置了许多第三方库&#xff0c;来帮助它完成各种功能。Turtle库就是Python语言中一个很流行的绘制图像的函数库(推荐学习&#xff1a;Python视频教程)Turtl库用于绘制线、圆、其他形状或者文本这个库被介绍为一个最常用的用来给孩子们介绍编程知识的方法库&#xff0c…

嵌入式java基准测试_Java正则表达式库基准测试– 2015年

嵌入式java基准测试在尝试使Java在计算机语言基准游戏的regexdna挑战中排名第一时&#xff0c;我正在研究Java正则表达式库的性能。 我可以找到的最新网站是2010年的tusker.org 。因此&#xff0c;我决定使用Java Microbenchmarking Harness重做测试并发布结果&#xff08;破坏…

libgdx和unity_libgdx和Kotlin –类[2D平台原型]

libgdx和unity这篇文章是libgdx和Kotlin文章的后续文章。 我已经决定开发一个简单的2D平台程序的原型&#xff08;沿着我的早期文章中的Star Assault进行介绍&#xff09;&#xff0c;但是我一直在使用和学习Kotlin&#xff0c;而不是Java。 对于本教程&#xff0c;该项目应处…