Java8————Stream API

引言

Java8 加入了java.util.stream包,这个包中的相关API将极大的增强容器对象对元素的操作能力。

它专注于对集合对象进行各种便利、高效的聚合操作,或大批量数据处理。

Stream API借助于同样新出现的Lambda表达式,极大的提高了编程效率和程序信噪比。

它提供了串行和并行两种模式进行汇聚操作。并行模式底层采用 Fork / Join 框架来拆分任务和加速处理过程。

什么是流?

一、流的概念

1、流不是数据结构

它没有内部存储,它只是用操作管道从source(数据结构、数组、IO channel)抓取数据。

2、不修改源数据

例如Stream 的 filter操作会产生一个不包含被过滤元素的新的Stream,而不是从source中删除那些元素。

3、流的操作参数

所有的Stream操作必须以Lambda表达式作为参数。

4、不支持索引访问

Stream操作实际上是 增强For循环 的函数编程变式,它没有元素下标的访问方式。

5、流可以转换成数组或者List

6、惰性化

Intermediate操作永远是惰性化的

7、并行能力

当一个集合不要求元素的顺序时,我们可以通过Stream的并行化特性来充分利用多核资源,不需要再写多线程代码,所有对它的操作会自动并行进行。

8、可以是无限的

集合有固定大小,Stream则不必,limit(n)、findFirst()这类short-circuiting操作可以对无限的Stream进行运算并很快完成。

二、流的操作分类

流的操作类型被分为三种:Intermediate、Terminal、short-circuiting

Intermediate :代表流的中间操作,这种操作的目的主要是打开流,做出某种程度的映射或过滤,然后返回一个新的流,交给下一个操作使用。这类操作是惰性的,也就是说,仅仅调用到这类方法,并没有真正开始流的遍历。

Terminal :一个流只能有一个Terminal操作。所以这必定是流的最后一个操作。而Terminal操作的执行,才会真正开始流的遍历,并且会生成一个结果,或者一个副作用。

short-circuiting :对于Intermediate 操作,如果接收的是一个无限大的Stream,则返回一个有限的新Stream;对于Terminal 操作,如果它接收的是一个无限大的Stream,但能在有限的时间计算出结果。

三、惰性化(lazy)

我们说Intermediate操作都是惰性化的,这如何理解?在对于一个Stream进行多次转换操作(Intermediate操作),每次操作都对Stream中的每个元素进行转换,而且是执行多次,这样时间复杂度就是 N(转换次数)个for循环里所有操作都执行完的总和吗?其实不是这样的!

我们说转换操作是Lazy的,多个转换操作只会在Terminal 操作的时候融合进来,一次循环完成。

我们可以这样简单的类比,在Java 8 未引进Stream API的时候,使用命令式进行for循环,并对每个元素进行诸如 if-else 、赋值、计算、获取、添加等操作,而这些操作你可以理解为Stream中的Intermediate操作,只有在for循环真正执行的时候才会执行它们,这就是惰性化的语义,即提前安排好筛选、计算等Intermediate操作,当循环时再执行它们

常见用法归纳

一、创建流

我们可以通过一个“集合”对象来创建流,这个集合对象并不限于Collection接口,还包含那些能容纳多个对象的容器。

创建流的方式大致可以分为三种:Arrays.stream()、Stream.of()、集合.stream(),下面举例来说明:

1、数组生成流

// 基本类型数组
int[] numx = new int[] { 1, 2, 2, 3, 5 };
// 方法一:
IntStream stream1 = Arrays.stream(numx);// 方法二:
IntStream stream2 = IntStream.of(numx);// 引用类型数组
Integer[] nums = new Integer[] { 1, 2, 2, 3, 5 };// 方法一:
Stream<Integer> stream3 = Arrays.stream(nums);// 方法二:
Stream<Integer> stream4 = Stream.of(nums);

需要注意的是,对于基本数值型,目前有三种对应的包装类型 Stream:

IntStream、LongStream、DoubleStream。当然我们也可以用 Stream<Integer>、Stream<Long> >、Stream<Double>,但是 boxing 和 unboxing 会很耗时,所以特别为这三种基本数值型提供了对应的 Stream。 Java 8 中还没有提供其它数值型 Stream,因为这将导致扩增的内容较多。而常规的数值型聚合运算可以通过上面三种 Stream 进行。

 2、集合生成流

List<Integer> numsList = Arrays.asList( 1, 2, 2, 3, 5 );
// 使用parallelStream会将List进行分段并行处理,因此处理的顺序是不固定的。
Stream<Integer> parallelStream = numsList.parallelStream();

二、流转化为容器(Terminal)

Stream<String> names = Arrays.asList("Tom", "Jerry", "Tim", "Morty").stream();

1、Stream转Array

String[] namesArr = names.toArray(String[]::new);

2、 Stream转Collection

List<String> list1 = names.collect(Collectors.toList());
// 或
List<String> list2 = names.collect(Collectors.toCollection(ArrayList::new));
Set<String> set = names.collect(Collectors.toSet());
Stack<String> stack = names.collect(Collectors.toCollection(Stack::new));

3、Stream转String

String str = names.collect(Collectors.joining());// joining()有重载

 三、映射操作(Intermediate)

map将input stream中的每一个元素,映射成output  stream中的另外一个元素(一对一映射)

List<String> output = names.map(String::toUpperCase).collect(Collectors.toList());

四、多集合映射操作(Intermediate)

flatMap(功能和map相同,只不过映射是一对多),flatMap 把 input Stream 中的层级结构扁平化,就是将最底层元素抽出来放到一起。

List<String> names1 = Arrays.asList("Tom", "Jerry", "Tim", "Morty");
List<String> names2 = Arrays.asList("Tony", "Jack", "Tina", "Marry");
List<String> collect = Stream.of(names1, names2).flatMap(ns -> ns.stream().map(String::toLowerCase)).collect(Collectors.toList());

五、筛选操作(Intermediate)

filter对原始 Stream 进行某项测试,符合条件表达式的元素被留下来生成一个新 Stream 或集合。

Integer[] sixNums = { 1, 2, 3, 4, 5, 6 };
Integer[] evens = Stream.of(sixNums).filter(n -> n % 2 == 0).toArray(Integer[]::new);

六、循环操作(Terminal)

forEach() 方法接收一个 Lambda 表达式,然后在 Stream 的每一个元素上执行该表达式。

但一般认为,forEach 和常规 for 循环的差异不涉及到性能,它们仅仅是函数式风格与传统 Java 风格的差别.

注意:forEach 不能修改自己包含的本地变量值,也不能用 break/return 之类的关键字提前结束循环。

当需要为多核系统优化时,可以 parallelStream().forEach()。另外一点需要注意,forEach 是 terminal 操作。具有相似功能的 intermediate 操作 peek 可以达到上述目的。

Stream.of("one", "two", "three", "four").filter(e -> e.length() > 3).peek(e -> System.out.println("Filtered value: " + e)).map(String::toUpperCase).peek(e -> System.out.println("Mapped value: " + e)).collect(Collectors.toList());

七、第一个元素(Terminal)

findFirst是一个 termimal 兼 short-circuiting 操作,它总是返回 Stream 的第一个元素,或者空。

注意,它的返回值类型:Optional。使用Optional的目的是尽可能避免 NullPointerException。它提供的是编译时检查,能极大的降低 NPE 这种 Runtime Exception 对程序的影响。

Optional<String> firstName = names2.stream().findFirst();

八、聚合操作(Terminal)

reduce方法的主要作用是把 Stream 元素组合起来。它提供一个起始值(种子),然后依照运算规则(BinaryOperator),和前面 Stream 的第一个、第二个、第 n 个元素组合。从这个意义上说,字符串拼接、数值的 sum、min、max、average 都是特殊的 reduce。

下面代码例如第一个示例的 reduce(),第一个参数(空白字符)即为起始值,第二个参数(String::concat)为 BinaryOperator。这类有起始值的 reduce() 都返回具体的对象。而对于第四个示例没有起始值的 reduce(),由于可能没有足够的元素,返回的是 Optional,请留意这个区别。

// 字符串连接,concat = "ABCD"
String concat = Stream.of("A", "B", "C", "D").reduce("", String::concat); 
// 求最小值,minValue = -3.0
double minValue = Stream.of(-1.5, 1.0, -3.0, -2.0).reduce(Double.MAX_VALUE, Double::min);
// 求和,sumValue = 10, 有起始值
int sumValue = Stream.of(1, 2, 3, 4).reduce(0, Integer::sum);
// 求和,sumValue = 10, 无起始值
sumValue = Stream.of(1, 2, 3, 4).reduce(Integer::sum).get();
// 过滤,字符串连接,concat = "ace"
String s = Stream.of("a", "B", "c", "D", "e", "F").filter(x -> x.compareTo("Z") > 0).reduce("", String::concat);

九、limit/skip (Short-circuiting)

limit 返回 Stream 的前面 n 个元素;skip 则是扔掉前 n 个元素(它是由一个叫 subStream 的方法改名而来)。

List<String> persons = new ArrayList<>();
for (int i = 1; i <= 10000; i++) {persons.add(new String("name" + i));
}
List<String> personNameList = persons.stream().map(String::toUpperCase).limit(10).skip(3).collect(Collectors.toList());

 上述代码是一个有 10000 个元素的 Stream,但在 short-circuiting 操作 limit 和 skip 的作用下,管道中 map 操作指定的toUpperCase()方法的执行次数为 limit 所限定的 10 次,而最终返回结果再跳过前 3 个元素后只有后面 7 个返回。

执行结果:

注意,有一种情况 limit/skip 无法达到 short-circuiting 目的,就是把它们放在 Stream 的排序操作后,原因跟 sorted这个 intermediate 操作有关:此时系统并不知道 Stream 排序后的次序如何,所以 sorted 中的操作看上去就像完全没有被 limit 或者 skip 一样。

经典案例:内存全量数据实现分页返回:

如下代码所示,page 从 1 开始,分别翻页查询,可以得到完美的分页输出结果。

其中skip代表一个偏移量,limit代表输出限制,由此方式达到了 SQL 语句中 limit x, y 的效果。

public class TestMemoryPage {public static final List<String> totalNameList = new ArrayList<>();static {for (int i = 1; i <= 100; i++) {totalNameList.add("name"+ i);}}public static void main(String[] args) {// 可自由调整分页大小int pageSize = 9;int total = totalNameList.size();int totalPage = (total + pageSize - 1) / pageSize;System.out.println(totalNameList);System.out.println("pageSize = "+pageSize+", total = "+total+", totalPage = "+totalPage);// 分页开始for (int page = 1; page <= totalPage; page++) {List<String> pageList = totalNameList.stream().skip((page - 1) * pageSize).limit(pageSize).collect(Collectors.toList());System.out.println("第"+page+"页,数量:"+pageList.size()+" 数据:" + pageList);}}
}

十、排序操作(Intermediate)

对 Stream 的排序通过 sorted 进行,它比数组的排序更强之处在于你可以首先对 Stream 进行各类 map、filter、limit、skip 甚至 distinct 来减少元素数量后,再排序,这能帮助程序明显缩短执行时间。

List<String> pList = persons.stream().limit(2).sorted((p1, p2) -> p1.toString().compareTo(p2.toString())).collect(Collectors.toList());

 十一、最大/最小值、去重操作(Intermediate)

min 和 max 的功能也可以通过对 Stream 元素先排序,再 findFirst 来实现,但前者的性能会更好,为 O(n),而 sorted 的成本是 O(n log n)。同时它们作为特殊的 reduce 方法被独立出来也是因为求最大最小值是很常见的操作。

BufferedReader br = new BufferedReader(new FileReader("c:\\noThisFile.txt"));
int longest = br.lines().mapToInt(String::length).max().getAsInt();br.close();
System.out.println(longest);

十二、匹配操作(Terminal)

Stream 有三个 match 方法,从语义上说:

allMatch:Stream 中全部元素符合传入的 predicate,返回 true 

anyMatch:Stream中只要有一个元素符合传入的 predicate,返回 true

noneMatch:Stream 中没有一个元素符合传入的predicate,返回 true

它们都不是要遍历全部元素才能返回结果。例如 allMatch 只要一个元素不满足条件,就 skip 剩下的所有元素,返回 false。

List<Person> persons = new ArrayList();
persons.add(new Person(1, "name" + 1, 10));
persons.add(new Person(2, "name" + 2, 21));
persons.add(new Person(3, "name" + 3, 34));
persons.add(new Person(4, "name" + 4, 6));
persons.add(new Person(5, "name" + 5, 55));
boolean isAllAdult = persons.stream().allMatch(p -> p.getAge() > 18);
System.out.println("All are adult? " + isAllAdult);
boolean isThereAnyChild = persons.stream().anyMatch(p -> p.getAge() < 12);
System.out.println("Any child? " + isThereAnyChild);

十三、常用聚合函数案例

数据准备,声明一个User对象,然后初始化一个user 列表:

@Data
@AllArgsConstructor
public static class User implements Jsonable {private Long id;private String name;private Integer age;private String address;private String group;@Overridepublic String toString() {return this.toJsonStr();}
}public static final List<User> users = new ArrayList<>();static {User morty = new User(1L, "morty", 28, "昌平区天通中苑", "研发组");User tom = new User(2L, "tom", 24, "朝阳区将台街道", "研发组");User lucy = new User(3L, "lucy", 22, "朝阳区美景东方小区", "测试组");users.add(morty);users.add(tom);users.add(lucy);
}

13.1 提取某一列

List<String> names = users.stream().map(User::getName).collect(Collectors.toList());
System.out.println("names = " + names);// names = [morty, tom, lucy]

13.2 连接某一列

String joiningNames = users.stream().map(User::getName).collect(Collectors.joining("_"));
System.out.println("joiningNames = " + joiningNames);// joiningNames = morty_tom_lucy

13.3 映射表

Map<Long, User> userMapping = users.stream().collect(Collectors.toMap(User::getId, o -> o));
System.out.println("userMapping = " + userMapping);// userMapping = {1={"address":"昌平区天通中苑","name":"morty","id":1,"age":28,"group":"研发组"}, 2={"address":"朝阳区将台街道","name":"tom","id":2,"age":24,"group":"研发组"}, 3={"address":"朝阳区美景东方小区","name":"lucy","id":3,"age":22,"group":"测试组"}}

13.4 按某列分组

Map<String, List<User>> userGroups = users.stream().collect(Collectors.groupingBy(User::getGroup));
System.out.println("userGroups = " + userGroups);// userGroups = {测试组=[{"address":"朝阳区美景东方小区","name":"lucy","id":3,"age":22,"group":"测试组"}], 研发组=[{"address":"昌平区天通中苑","name":"morty","id":1,"age":28,"group":"研发组"}, {"address":"朝阳区将台街道","name":"tom","id":2,"age":24,"group":"研发组"}]}

鸣谢

《Java 8 中的 Streams API 详解》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/558935.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL数据库知识点总结

数据库&#xff1a; 数据库索引的好处&#xff1a;索引是对数据库表中的一个或多个列的值进行排序的结构&#xff0c;这样检索或者查询某条记录的时候就不在是顺序查找&#xff0c;而是使用特定的查找方式进行查找&#xff0c;如通过二分查找或者是hash值来查找&#xff0c;提高…

Java8 函数式对齐约定————Eclipse自定义代码风格

引言 Java8 的函数式代码风格在Stream的使用上尤为突出。尽管我们可以通过连续调用函数完成一系列操作&#xff0c;但是其可读性并不能保证&#xff0c;还需要有与之相辅的Code Style。例如&#xff0c;请尝试阅读下面两段完全相同的代码&#xff1a; 未遵守约定格式&#xf…

Java核心篇之JVM--day3

Java核心篇之JVM--day3 Java JVM详解--通俗易懂教程 JVM&#xff1a;Java虚拟机的简称。 谈到JVM&#xff0c;通常会聊到三个问题&#xff1a; 1. 什么时候触发Java GC&#xff1f; 2. 对什么东西进行Java GC&#xff1f; 3. 如何进行Java GC&#xff1f; 首先解决第…

使用springboot来实现WebLog

使用websocket技术实时输出系统日志到浏览器端&#xff0c;实现WebLog boot-websocket-log&#xff1a; spring boot系统中使用websocket技术实时输出系统日志到浏览器端&#xff0c;因为是实时输出&#xff0c;所有第一时间就想到了使用webSocket,而且在spring boot中&#…

设计模式---观察者模式介绍与理解

设计模式---观察者模式介绍与理解&#xff1a; 观察者模式原理&#xff1a;类似于定牛奶业务 1. 奶站&#xff0c;subject&#xff1a;登记注册&#xff0c;移除&#xff0c;通知&#xff08;register&#xff0c;remove&#xff0c;notify&#xff09; 2. 用户&#xff0c;…

CRS-4995: The command ‘start resource’ is invalid in crsctl.

ntp时间调整后&#xff0c;节点1&#xff0c;advm 和acfs offline 处理办法&#xff1a; /u01/app/12.2.0.1/grid/bin/crsctl stop crs /u01/app/12.2.0.1/grid/bin/crsctl start crs 曾经尝试如下命令不起作用 /u01/app/12.2.0.1/grid/bin/acfsload start /u01/app/12.2…

抽象工厂模式升级版————泛型化实现

引言 今天回看之前总结的抽象工厂模式的实现《Java常用设计模式————抽象工厂模式》&#xff0c;聚焦于抽象工厂模式的缺点&#xff0c;试着改进了一下。 回顾一下抽象工厂模式的缺点&#xff1a; 在添加新的产品类型时&#xff0c;难以扩展抽象工厂来生产新种类的产品。…

发生在“注解”@的那些事儿

注解&#xff1a; 自定义注解&#xff1a; 注解和类&#xff0c;接口一样&#xff0c;属于一种数据类型 注解可以放在类&#xff0c;方法&#xff0c;属性上面 注解可以有属性&#xff0c;也可以没有属性 注解有作用范围 &#xff08; 源码期间&#xff08;String&#…

Java常用设计模式————建造者模式

引言 建造者模式&#xff08;Builder Pattern&#xff09;使用多个简单对象一步一步构建成一个复杂的对象。这种类型的设计模式属于建造型模式&#xff0c;它提供了一种创建对象的最佳方式。 一个Builder会一步步构建最终的对象。该Builder类是独立于其他对象的。 实现概要 …

使用动态代理解决网站字符集编码问题:(之前通过拦截器)

使用动态代理解决网站字符集编码问题&#xff1a;&#xff08;之前通过拦截器&#xff09; 设计模式&#xff1a; 在软件开发的过程中&#xff0c;遇到相识的问题&#xff0c;将问题的解决方式抽象为模型&#xff08;套路&#xff09; 单例模式&#xff08;静态代码只会执行一…

设计模式---简单工厂设计模式

先定义一个抽象类Animal&#xff1a; 定义两个动物类继承这个类&#xff1a; 定义一个专门生产动物的工程类&#xff1a; 最后定义一个测试类&#xff1a; 按照这个动物工厂类&#xff0c;你会发现&#xff0c;如果动物一多的话&#xff0c;就需要写很多重复的方法&#xff0c;…

Java 多线程 —— ThreadLocal

一、引言 ThreadLocal是Java帮助实现线程封闭性的典型手段。 作用&#xff1a;提供线程内的局部变量&#xff0c;这种变量在线程的生命周期内起作用&#xff0c;减少同一个线程内多个函数或组件之间一些公共变量的传递复杂度。同时也用来维护线程中的变量不被其他线程干扰。 …

设计模式---适配器设计模式

设计模式---适配器设计模式 什么事适配器&#xff1a; 1. 在使用监听的时候&#xff0c;需要定义一个类事件监听器接口 2. 通常接口中有多个方法&#xff0c;而程序中不一定所有的方法都用到&#xff0c;但又必须重写&#xff0c;很繁琐 3. 适配器简化了这些操作&#xff0c…

Java并发编程实战————售票问题

引言 现有一个需求如下&#xff1a; 有10000张火车票&#xff0c;每张票都有一个编号&#xff0c;同时有10个窗口对外售票&#xff0c;如何确保车票的正常售卖&#xff1f; 程序一&#xff1a;使用List 问题的解决办法都是从我们最最熟悉的角度思考。程序一&#xff0c;我们…

多线程相关知识

多线程相关知识 两个线程进行通信&#xff1a;通过等待&#xff08;wait&#xff09;唤醒&#xff08;notify&#xff09;机制 三个或三个以上线程进行通信&#xff1a;通过notifyAll&#xff08;&#xff09;方法 /* * 1. 在同步代码块中&#xff0c;用哪个对象锁&#xff0c…

Eclipse集成PyDev5.2.0开发插件

引言 在进行Python学习的时候&#xff0c;希望不使用IDLE进行开发&#xff0c;但是其他的IDE如PyCharm可能需要一段短暂时间的上手&#xff0c;因为开发过Java&#xff0c;所以使用能够集成到Eclipse上的PyDev插件进行开发应该会好一些。 但是在安装PyDev的时候发生了一些问题…

PostMan 四种常见的 POST 提交数据方式

HTTP/1.1 协议规定的 HTTP 请求方法有 OPTIONS、GET、HEAD、POST、PUT、DELETE、TRACE、CONNECT 这几种。其中 POST 一般用来向服务端提交数据&#xff0c;本文主要讨论 POST 提交数据的几种方式。 协议规定 POST 提交的数据必须放在消息主体&#xff08;entity-body&#xff0…

史上最真实行业鄙视链

本文转载自菜鸟教程的微信公众号&#xff0c;原文链接&#xff1a;https://mp.weixin.qq.com/s/d9cdtq8y4Msq-_ZNof-iuw 引言 作为程序员的一份子&#xff0c;掌握好各个生态系统中的鄙视链&#xff0c;可以写出更加符合改变世界要求的代码。掌握了鄙视链&#xff0c;就掌握了…

权限验证框架Shiro

权限验证框架Shiro&#xff1a; Shiro简介 什么是Shiro&#xff1a; shiro是一个强大易用的Java安全框架&#xff0c;提供了认证&#xff0c;授权&#xff0c;加密&#xff0c;回话管理等功能&#xff1b; 认证&#xff08;Authentication&#xff09;&#xff1a;用户身份识别…

Mybatis从入门到精通上篇

Mybatis从入门到精通上篇&#xff1a; 学习过的持久层框架&#xff1a;DBUtils , Hibernate Mybatis就是类似于hibernate的orm持久层框架。 Mybatis介绍&#xff1a; Mybatis是面向sql的持久层框架&#xff0c;他封装了jdbc访问数据库的过程&#xff0c;我们开发&#xff0c;只…