java8 lambda maplist排序_「java8系列」流式编程Stream

前言

「Java8系列」神秘的Lambda
「Java8系列」神奇的函数式接口
继上两篇之后,本文已经java8系列的第三篇了。本篇文章比较长,但我希望大家都能认真读完。读不完可以先收藏,在找时间读。没看过前两篇的可以点上边的链接看看,前两篇文章算是对是用Stream铺垫的一点基础吧,不过不看也可以学会使用Stream,但看了会有助于更好的理解和使用。在没有深入了解之前,我以为Stream也是数据的载体,但后来发现并不是。那么它到底是什么?听我慢慢道来。

什么是Stream?

Stream它并不是一个容器,它只是对容器的功能进行了增强,添加了很多便利的操作,例如查找、过滤、分组、排序等一系列的操作。并且有串行、并行两种执行模式,并行模式充分的利用了多核处理器的优势,使用fork/join框架进行了任务拆分,同时提高了执行速度。简而言之,Stream就是提供了一种高效且易于使用的处理数据的方式。

  • 特点:
  1. Stream自己不会存储元素。
  1. Stream的操作不会改变源对象。相反,他们会返回一个持有结果的新Stream。
  1. Stream 操作是延迟执行的。它会等到需要结果的时候才执行。也就是执行终端操作的时候。
  • 图解:

cfe4d4747a1f6f0029a668ec7920549c.png


一个Stream的操作就如上图,在一个管道内,分为三个步骤,第一步是创建Stream,从集合、数组中获取一个流,第二步是中间操作链,对数据进行处理。第三步是终端操作,用来执行中间操作链,返回结果。

怎么创建Stream?

  • 由集合创建:
    Java8 中的 Collection 接口被扩展,提供了两个获取流的方法,这两个方法是default方法,也就是说所有实现Collection接口的接口都不需要实现就可以直接使用:
  1. default Stream
    stream() : 返回一个顺序流。
  1. default Stream
    parallelStream() : 返回一个并行流。
    例如:List<Integer> integerList = new ArrayList<>();integerList.add(1);integerList.add(2);Stream<Integer> stream = integerList.stream();Stream<Integer> stream1 = integerList.parallelStream();
  • 由数组创建:
    Java8 中的 Arrays 的静态方法 stream() 可以获取数组流:
  1. static
    Stream
    stream(T[] array): 返回一个流
  1. 重载形式,能够处理对应基本类型的数组:
    public static IntStream stream(int[] array)
    public static LongStream stream(long[] array)
    public static DoubleStream stream(double[] array)
    例如:int[] intArray = {1,2,3};IntStream stream = Arrays.stream(intArray);
  • 由值创建:
    可以使用静态方法 Stream.of(), 通过显示值 创建一个流。它可以接收任意数量的参数。
  1. public static
    Stream
    of(T... values) : 返回一个流。
    例如:Stream<Integer> integerStream = Stream.of(1, 2, 3, 4, 5, 6, 7, 8);
  • 由函数创建:创建无限流
    可以使用静态方法 Stream.iterate() 和 Stream.generate()创建无限流。
  1. 迭代
    public static
    Stream
    iterate(final T seed, final UnaryOperator
    f)
  1. 生成
    public static
    Stream
    generate(Supplier
    s)
    例如:Stream.generate(Math::random).limit(5).forEach(System.out::print); List<Integer> collect = Stream.iterate(0,i -> i + 1).limit(5).collect(Collectors.toList());

注意:使用无限流一定要配合limit截断,不然会无限制创建下去。

Stream的中间操作

如果Stream只有中间操作是不会执行的,当执行终端操作的时候才会执行中间操作,这种方式称为延迟加载或惰性求值。多个中间操作组成一个中间操作链,只有当执行终端操作的时候才会执行一遍中间操作链,具体是因为什么我们在后面再说明。下面看下Stream有哪些中间操作。

  • Stream distinct():
    去重,通过流所生成元素的 hashCode() 和 equals() 去除重复元素。

004a4acc39b9b47f3f77a2ce9e03be74.png

afe3b5a213c75e680eead62318f3d2ee.png
  • Stream filter(Predicate
    predicate):
    Predicate函数在上一篇当中我们已经讲过,它是断言型接口,所以filter方法中是接收一个和Predicate函数对应Lambda表达式,返回一个布尔值,从流中过滤某些元素。

f7872ba2f50085f4359e70aee4be1ed9.png

28128c969373752c86ee8b770b273ab6.png
  • Stream sorted(Comparator
    comparator):
    指定比较规则进行排序。

47f4f6662f33e504bee099fb4f0ddc6d.png
  • Stream limit(long maxSize):
    截断流,使其元素不超过给定数量。如果元素的个数小于maxSize,那就获取所有元素。

1f97803c3603baeda22bb4a2397e3227.png

606dcb083d7169072d3412e90ddde784.png
  • Stream skip(long n):
    跳过元素,返回一个扔掉了前 n 个元素的流。若流中元素不足 n 个,则返回一个空流。与 limit(n) 互补。

69e89bf6a520ee6d8b338e2c6f320218.png

20c0a29cfd6d6577450383fe5a666369.png
  • Stream map(Function
    mapper):
    接收一个Function函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素。也就是转换操作,map还有三个应用于具体类型方法,分别是:mapToInt,mapToLong和mapToDouble。这三个方法也比较好理解,比如mapToInt就是把原始Stream转换成一个新的Stream,这个新生成的Stream中的元素都是int类型。这三个方法可以免除自动装箱/拆箱的额外消耗。

692106440edf8caa00b92fe04b4d7f09.bmp

f4e8bf9af048aed9219639fb0639035c.png
  • Stream flatMap(Function
    > mapper):
    接收一个Function函数作为参数,将流中的每个值都转换成另一个流,然后把所有流连接成一个流。flatMap也有三个应用于具体类型的方法,分别是:flatMapToInt、flatMapToLong、flatMapToDouble,其作用于map的三个衍生方法相同。

9f7c59787cc1732ab5495eddb92226a9.png

38e7a05c4bf31ad345c3128efb906311.png

Stream的终端操作

终端操作执行中间操作链,并返回结果。终端操作我们就不一一介绍了,只介绍一下常用的操作。详细可看java.util.stream.Stream接口中的方法。

  • void forEach(Consumer
    action):
    内部迭代(需要用户去做迭代,称为外部迭代。相反,Stream API使用内部迭代帮你把迭代做了)
 users.stream().forEach(user -> System.out.println(user.getName()));

  • R collect(Collector
    collector):
    收集、将流转换为其他形式,比如转换成List、Set、Map。collect方法是用Collector作为参数,Collector接口中方法的实现决定了如何对流执行收集操作(如收集到 List、Set、Map)。但是 Collectors 实用类提供了很多静态方法,可以方便地创建常见收集器实例。例举一些常用的:
 List<User> users = Lists.newArrayList();users.add(new User(15, "A", ImmutableList.of("1元", "5元")));users.add(new User(25, "B", ImmutableList.of("10元", "50元")));users.add(new User(21, "C", ImmutableList.of("100元")));//收集名称到ListList<String> nameList = users.stream().map(User::getName).collect(Collectors.toList());//收集名称到ListSet<String> nameSet = users.stream().map(User::getName).collect(Collectors.toSet());//收集到map,名字作为key,user对象作为valueMap<String, User> userMap = users.stream().collect(Collectors.toMap(User::getName, Function.identity(), (k1, k2) -> k2));
  • 其他终端操作:
  1. boolean allMatch(Predicate
    predicate); 检查是否匹配所有元素。
    1. boolean anyMatch(Predicate
      predicate); 检查是否至少匹配一个元素。
    1. boolean noneMatch(Predicate
      predicate); 检查是否没有匹配所有元素。
    1. Optional findFirst(); 返回当前流中的第一个元素。
    1. Optional findAny(); 返回当前流中的任意元素。
    1. long count(); 返回流中元素总数。
    1. Optional max(Comparator
      comparator); 返回流中最大值。
    1. Optional min(Comparator
      comparator); 返回流中最小值。
    1. T reduce(T identity, BinaryOperator accumulator); 可以将流中元素反复结合起来,得到一个值。 返回 T。这是一个归约操作。

Fork/Join框架

上面我们提到过,说Stream的并行模式使用了Fork/Join框架,这里简单说下Fork/Join框架是什么?Fork/Join框架是java7中加入的一个并行任务框架,可以将任务拆分为多个小任务,每个小任务执行完的结果在合并成为一个结果。在任务的执行过程中使用工作窃取(work-stealing)算法,减少线程之间的竞争。

  • Fork/Join图解

f3889863e4f6b6ae20368ea403684759.png
  • 工作窃取图解

bdacf3612a220d747bec9db727f56a6f.png

Stream是怎么实现的

先看下整体类图:蓝色箭头代表继承,绿色箭头代表实现,红色箭头代表内部类。

5dba170475af8440506a8542fb93b9fd.png

实际上Stream只有两种操作,中间操作、终端操作,中间操作只是一种标记,只有终端操作才会实际触发执行。所以Stream流水线式的操作大致应该是用某种方式记录中间操作,只有调用终端操作才会将所有的中间操作叠加在一起在一次迭代中全部执行。这里只做简单的介绍,想详细了解的可以参考下面的参考资料中的链接。

  • 操作怎么记录?
    Stream的操作记录是通过ReferencePipeline记录的,ReferencePipeline有三个内部类Head、StatelessOp、StatefulOp,Stream中使用Stage的概念来描述一个完整的操作,并用某种实例化后的ReferencePipeline来代表Stage,Head用于表示第一个Stage,即调用诸如Collection.stream()方法产生的Stage,很显然这个Stage里不包含任何操作,StatelessOp和StatefulOp分别表示无状态和有状态的Stage,对应于无状态和有状态的中间操作。

861038783b47a23d5754a7cc1793896e.png
  • 操作怎么叠加?
    操作是记录完了,但是前面的Stage并不知道后面Stage到底执行了哪种操作,以及回调函数是哪种形式。这就需要有某种协议来协调相邻Stage之间的调用关系。
    这种协议由Sink接口完成,Sink接口包含的方法如下表所示:
  1. void begin(long size),开始遍历元素之前调用该方法,通知Sink做好准备。
  1. void end(),所有元素遍历完成之后调用,通知Sink没有更多的元素了。
  1. boolean cancellationRequested(),是否可以结束操作,可以让短路操作尽早结束。
  1. void accept(T t),遍历元素时调用,接受一个待处理元素,并对元素进行处理。Stage把自己包含的操作和回调方法封装到该方法里,前一个Stage只需要调用当前Stage.accept(T t)方法就行了。

每个Stage都会将自己的操作封装到一个Sink里,前一个Stage只需调用后一个Stage的accept()方法即可,并不需要知道其内部是如何处理的。有了Sink对操作的包装,Stage之间的调用问题就解决了,执行时只需要从流水线的head开始对数据源依次调用每个Stage对应的Sink.{begin(), accept(), cancellationRequested(), end()}方法就可以了。

  • 操作怎么执行?

b85795df0f5a85ad7ff692dcdcaf21a5.png


Sink完美封装了Stream每一步操作,并给出了[处理->转发]的模式来叠加操作。这一连串的齿轮已经咬合,就差最后一步拨动齿轮启动执行。是什么启动这一连串的操作呢?也许你已经想到了启动的原始动力就是结束操作(Terminal Operation),一旦调用某个结束操作,就会触发整个流水线的执行。

参考资料

https://ifeve.com/streamhttps://www.ibm.com/developerworks/cn/java/j-lo-java8streamapi/

https://segmentfault.com/a/1190000016781127

https://github.com/CarpenterLee/JavaLambdaInternals/blob/master/6-Stream%20Pipelines.md

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/521142.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Centos7 下载、安装、配置、启动部署

文章目录1. 下载tomcat2. 解压tomcat3. 重命名tomcat4. 配置tomcat环境变量5. 刷新配置文件6. 启动tomcat1. 下载tomcat wget http://mirror.bit.edu.cn/apache/tomcat/tomcat-9/v9.0.31/bin/apache-tomcat-9.0.31.tar.gz2. 解压tomcat [rootly-01 ~]# tar -zxf apache-tomca…

世界杯千万级直播高稳定的挑战和实践

今年夏天&#xff0c;俄罗斯世界杯召开。在刚刚落幕的重庆云栖飞天技术汇专场中&#xff0c;阿里视频云技术专家裘良科&#xff0c;就世界杯这个话题&#xff0c;跟参会嘉宾一起探讨了千万级直播高稳定的挑战和相关实践&#xff0c;本文为演讲全文。 2018年俄罗斯世界杯从6月14…

会议邀请 | 10月25日北京,首期D2iQ云原生主题论坛正式启动

在开始今天的内容之前&#xff0c;先问大家一个问题&#xff1a;云原生究竟是什么&#xff1f; 一般来说&#xff0c;“云原生”是一种构建和运行应用程序的方法&#xff0c;它利用了云计算交付模型的优势。CNCF&#xff08;云原生计算基金会&#xff09;将“云原生”定义为使…

Flutter快速上车之Widget

Flutter作为一种全新的响应式&#xff0c;跨平台&#xff0c;高性能的移动开发框架。从开源以来&#xff0c;已经得到越来越多开发者的喜爱。闲鱼是最早一批与谷歌展开合作&#xff0c;并在重要的商品详情页中使用上线的公司。一路走来&#xff0c;积累了大量的开发经验。虽然越…

Linux Shell脚本专栏_自动发布Java项目(tomcat)_10

文章目录一、需求背景及实现流程1. 需求背景2. 实现流程二、软件准备2.1. 公共工具包yum下载2.2. tomcat安装及配置2.3. maven安装及配置2.4. 安装mysql2.5. order项目配置2.6. 脚本制作2.7. 运行脚本一、需求背景及实现流程 1. 需求背景 order项目代码已经到版本仓库中&…

[Phoenix] 十、全局索引设计实践

概述 全局索引是Phoenix的重要特性&#xff0c;合理的使用二级索引能降低查询延时&#xff0c;让集群资源得以充分利用。 本文将讲述如何高效的设计和使用索引。 全局索引说明 全局索引的根本是通过单独的HBase表来存储数据表的索引数据。我们通过如下示例看索引数据和主表数…

云原生数据库崛起,阿里云POLARDB当选世界互联网领先科技成果

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 晶少责编 | 阿秃10月20日&#xff0c;在第六届世界互联网大会上&#xff0c;阿里云自研数据库POLARDB当选世界互联网领先科技成果&#xff0c;POLARDB解决了企业在云时代的数据库难题&#xff0c;帮助企业在数小时内完成上云…

gitee提交代码_git 版本控制,github和gitee

3.4 git 版本控制# 查看本地状态git status # 修改README.txt &#xff0c;添加一行,保存&#xff0c;添加到暂存区git add README.txt # 查看当前仓库某一个文件的版本git diff README.txt# 提交到本地仓库git commit README.txt -m second Commit# 查看当前仓库某一个文件版本…

IT 拉呱室 | 论我遇到的最刺激的bug【长期福利站】

戳蓝字“CSDN云计算”关注我们哦&#xff01;套路的最高境界是没有套路&#xff1a;这是一个只送福利的长期互动栏目【如果你们让我尴尬&#xff0c;我就哭给你们看】。书籍、键盘、鼠标、鼠标垫、CSDN 20周年纪念T恤、技术沙龙门票、线上公开课名额……你敢一直在&#xff0c;…

“百变”Redis带你见识不同场景下的产品技术架构

2018飞天技术汇24期-云数据库Redis产品发布会&#xff0c;由阿里云数据库技术组技术专家王欢、怀听、梁盼分别带来以“Redis全球多活产品”、“Redis混合存储产品”、“Redis多线程性能增强版”为题的演讲。本文对Redis进行了简单的介绍&#xff0c;进而针对不同的应用场景研制…

阿里云PyODPS 0.7.18发布,针对聚合函数进行优化同时新增对Python 3.7支持

近日&#xff0c;阿里云发布PyODPS 0.7.18&#xff0c;主要是针对聚合函数进行优化同时新增对Python 3.7支持。 PyODPS是MaxCompute的Python版本的SDK&#xff0c;SDK的意思非常广泛&#xff0c;辅助开发某一类软件的相关文档、范例和工具的集合都可以叫做“SDK”。 PyODPS在这…

centos安装rabbitmq_【SpringBoot MQ系列教程】RabbitMq 初体验

SpringBoot 系列教程之 RabbitMq 初体验​mp.weixin.qq.commq 在异步解耦削峰的优势非常突出&#xff0c;现在很多的项目都会用到&#xff0c;掌握 mq 的知识点&#xff0c;了解如何顺畅的使用 mq&#xff0c;可以说是一个必备的职业技能点了接下来我们进入 rabbitmq 的学习过程…

java rpc与webservice_RPC体系,RPC和WebService的区别详解

RPC和WebService的关系RPC(Remote Procedure Call)— 远程过程调用&#xff0c;是一个很大的概念, 它是一种通过网络从远程计算机程序上跨语言跨平台的请求服务&#xff0c;rpc能省略部分接口代码的开发&#xff0c;可以跨机器之间访问对象(java rmi)&#xff0c;可以有更方便的…

免费公测中-GPU数据库SQream DB正式上线云市场

业内领先的GPU 数据库服务SQream DB在阿里云云市场正式开启免费公测&#xff01;SQream DB是一款由阿里战略投资的以色列SQream公司提供&#xff0c;能够支撑海量数据高速分析的业内领先的GPU数据库。通过将计算密集型操作卸载到GPU上&#xff0c;与业界的解决方案相比&#xf…

唏嘘!2019榜单出炉:铁打的Python连续3年第一,它居然跌出前十?

IEEE Spectrum2019年度编程语言排行榜最近刚刚出炉&#xff0c;Python不出意外的又拿了个第一&#xff0c;但是意料之外的是&#xff0c;曾经大火的PHP&#xff0c;居然跌出了前十&#xff01;PHP曾被大家称为“世界上最好的编程语言”&#xff0c;去年排名第六&#xff0c;前年…

阿里云ECS家族再添新成员,推出密集计算型实例规格族ic5

去年&#xff0c;阿里云正式发布云服务器ECS企业级产品家族&#xff0c;推出面向173种企业应用场景的19款实例。适合在复杂的企业计算环境下&#xff0c;满足对于高性能、高可靠的计算需求。 时隔近一年&#xff0c;回看ECS企业级产品家族已经发展到30款实例&#xff0c;近日再…

findbugs插件_Intellij静态代码扫描插件SpotBugs

最近要做Java静态扫描的部分工作&#xff0c;之前是在Jenkins上使用findbugs插件完成的&#xff0c;但是由于现在Jenkins权限收回和Java代码权限的放开(我也搞不懂这两者的关联性)&#xff0c;目前打算在本地完成静态代码扫描工作。选来选取还是选择在Intellij中用插件来完成&a…

一张图看懂智联车管理云平台

智联车管理云平台&#xff08;IoV Command Center&#xff0c;简称IoV CC&#xff09;是阿里云面向智联车领域&#xff0c;专门推出的车辆全生命周期云端管理平台&#xff0c;旨在赋能车厂转型出行服务商&#xff0c;提高运营效率、降低自建成本。 传统模式下&#xff0c;车辆…

刨根问底 | 红遍全网的SD-WAN,到底是个啥?

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 小枣君责编 | 阿秃作为一个热门概念&#xff0c;SD-WAN近年以来频繁地出现在我们的视野当中。很多人说&#xff0c;它是未来最具发展潜力的通信技术之一&#xff0c;极具商业价值。行业里的老牌通信设备商和运营商对它一致看…

centos7安装rabbitmq简单方式

安装rabbitmq前要准备的基础环境 yum install build-essential openssl openssl-devel unixODBC unixODBC-devel make gcc gcc-c kernel-devel m4 ncurses-devel tk tc xz tcp_wrappers需下载的安装文件如下 ## erlang wget www.rabbitmq.com/releases/erlang/erlang-18.3-1.…