system流怎么判断为空_并行流ParallelStream中隐藏的陷阱

cd94f101d176c67eae8196b6ed469974.png

点击上方蓝字 ↑↑ Throwable文摘

关注公众号设置星标,不定时推送高质量原创文章

关注

前提

这篇文章介绍一下日常开发中并行流ParallelStream中隐藏的陷阱,这个问题其实离我们很近,特别是喜欢使用JDK1.8+的流式编程的伙伴,应该会深有感触。

一个故意而为的例子

下面举一个故意而为的例子,实际上应该不会有类似的业务代码:

public class ParallelStreamMain {

    public static void main(String[] args) throws Exception {
        List> array = new ArrayList<>();
        List item1 = new ArrayList<>();
        List item2 = new ArrayList<>();
        List target = new ArrayList<>(100);
        array.add(item1);
        array.add(item2);
        array.parallelStream().forEach(x -> {for (int i = 0; i 100000; i++) {
                target.add(i);
            }
        });
        System.out.println(target.size());
    }
}

某一次执行结果为:163913。如果不停地执行这个main方法,最终都会得到一个非200000的结果,这里的问题就在于使用了并行流parallelStream()方法。ParallelStream底层使用了Fork/Join框架实现,也就是应用了线程池ForkJoinPool把并行流中的节点抽象为ForkJoinTask进行计算,背后用到的"任务窃取"等原理这里就不进行展开,只需要明确:

  • ForkJoinPool一般使用Runtime.getRuntime().availableProcessors()(此值一般认为是物理机器的逻辑核心数量)作为并行度(parallelism),简单认为是可并发执行的任务数,并不是工作线程数。
  • 多核机器中,使用ParallelStream在流的节点中的所有操作都相当于在「一个多线程环境中」进行操作,里面的所有操作都会产生不可预期的结果,例如可能会数组越界、添加元素丢失、部分下标index的引用为NULL等等。

一个仿真例子

写这篇文章不是有意为之,其实很早之前笔者曾经遇到一个比较隐蔽的生产故障,其中有一段访问量比较低的代码大致如下:

@Data
private static class OrderDTO {

    private String orderId;
    private OrderStatus orderStatus;
    private BigDecimal amount;
    private Long customerId;
}

@Data
private static class Order {

    private Long id;
    private String orderId;
    private Integer orderStatus;
    private BigDecimal amount;
    private Long customerId;
    private OffsetDateTime createTime;
    private OffsetDateTime editTime;
}

public void groupByOrderStatus(Long customerId) {
    List orders = orderDao.selectByCustomerId(customerId);
    List orderDTOList = new ArrayList<>();
    orders.parallelStream().forEach(order -> {
        OrderDTO dto = new OrderDTO();
        ......
        orderDTOList.add(dto);
    });
    Map> collect 
            = orderDTOList.stream().collect(Collectors.groupingBy(item -> item.getOrderStatus().getCode()));
    ......
}

该方法的功能是通过客户ID查询订单列表,然后把订单列表转化为OrderDTO列表,然后再按照订单状态字段进行分组。通过生产日志和测试回归发现,上面的代码段中groupByOrderStatus()方法会偶发空指针异常。

初次出现问题的时候,由于开发者通过Lambda表达式把多处代码压缩为1行,所以从异常栈比较难排查具体发生问题的代码,后面把Lambda表达式以句点起点拆分为多行上线后观察一段时间,最终定位到发生空指针异常的代码段为Collectors.groupingBy(item -> item.getOrderStatus().getCode()),也就是OrderDTO实例中的orderStatus为空对象。这里显然,groupByOrderStatus()方法其实是被封闭在线程栈中调用,本不应该有多个线程去并发修改其中的内容,这里只剩下一个疑点:使用了parallelStream()。后来直接把parallelStream()修改为stream()重新上线,该空指针问题不再复现。

Lambda/Stream其实并不是天然线程安全的,线程安全的前提是它们本身被线程封闭调用,并且不引入多线程环境,像使用了并行流,本质就是引入了多线程环境。所以,在开发功能的时候,需要仔细思考一下:

  1. 是否真的有必要使用Lambda和流式编程?
  2. 是否真的有必要用到并行流?如果使用了并行流,是否需要考虑引入额外的同步机制,例如锁?
  3. 其实并发并不能提高性能,只能提高吞吐量,应该着重去发现和优化性能瓶颈,而不是拼命地把上游改造成并发调用。

笔者有代码洁癖,当时还发现了上面的代码存在映射操作,正确来说应该使用map()函数,而不是forEach()去遍历元素重新装进去另一个列表,方法中的逻辑体现了原开发者其实对Lambda一知半解。

小结

回到最初那个问题,其实使用并行流也可以保证执行结果和预期一致,不过一定需要引入额外的同步机制,例如这里使用「监视器」进行同步:

public class ParallelStreamMain {

    public static void main(String[] args) throws Exception {
        List> array = new ArrayList<>();
        List item1 = new ArrayList<>();
        List item2 = new ArrayList<>();
        List target = new ArrayList<>(100);
        array.add(item1);
        array.add(item2);final Object monitor = new Object();
        array.parallelStream().forEach(x -> {synchronized (monitor) {for (int i = 0; i 100000; i++) {
                    target.add(i);
                }
            }
        });
        System.out.println(target.size());
    }
}

上面的方法无论执行多少次,最终都只会输出:200000

(本文完 c-1-d e-a-20200710)

e7cad5cb92473aa51a0ab7f65c8f2097.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/505775.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python脚本怎么打印日志_python 接口测试1 --如何创建和打印日志文件

python自带的logging实在是不好用&#xff0c;推荐使用logbook思路如下&#xff1a;1.创建path.py文件&#xff0c;获取工程根路径2.创建log.py文件&#xff0c;在工程根路径下创建日志文件(文件名称按日期命名)&#xff0c;并设置log输出等级3.执行测试用例&#xff0c;调用lo…

吸血鬼 java_吸血鬼数

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼代码:/** * 功能:找出四位数中由二位数相乘得出的吸血鬼数 * author wiley */public class Vampire { public static void main(String[] arg){ String[] ar_str1,ar_str2; int sum0; //双重循环穷举 for(int i10;i<100;i){ //j…

vfp操作excel排序_中招计算机信息技术考试训练|Excel操作题一|排序和筛选

Excel操作题&#xff08;一&#xff09;&#xff1a;进入本题工作目录&#xff0c;请完成以下操作。1、将单元格区域A1:F1合并后居中&#xff0c;字体格式设置为黑体、16号。2、将单元格区域A2:F2填充颜色改为橙色&#xff0c;A3:A7填充颜色改为黄色。3、用函数计算5个储蓄所的…

java 反射机制 视频_【视频笔记】Java反射机制笔记

Java 语言的反射机制在Java运行时环境中&#xff0c;对于任意一个类&#xff0c;可以知道这个类有哪些属性和方法。对于任意一个对象&#xff0c;可以调用它的任意一个方法。这种动态获取类的信息以及动态调用对象的方法的功能来自于Java 语言的反射(Reflection)机制。Java 反射…

算术溢出使用4字节值上的运算符_c语言程序设计的数据类型、运算符和表达式介绍...

数据类型 为什么在用计算机运算时,要指定数据的类型呢?在数学中,数值是不分类型的,数值的运算是绝对准确的,例如:1/3的值是0.333333(循环小数)。 而在计算机中,数据是存放在存储单元中的,它是具体存在的。而且,存储单元是由有限的字节构成的,每一个存储单元中存放数据…

java windows 下载_Windows环境下JDK的下载与安装

1.首先检查一下本机是否有安装java。按winR&#xff0c;在弹出窗口中输入cmd&#xff0c;按回车打开控制台在控制台中输入 java 并按回车&#xff0c;如果显示“java 不是内部或外部命令&#xff0c;也不是可运行的程序或批处理文件“&#xff0c;则说明这台电脑还没安装java可…

net应用程序中发生了未经处理的异常怎么办_介绍一些在.NET Core 3.0中引入的诊断改进工具...

编者按&#xff1a;即使.NET Core3.1.5已经发布&#xff0c;在进行.NET Core的性能诊断时&#xff0c;我们有时依然不知该从何处下手&#xff0c;那这篇介绍.NET Core3.0中引入的诊断工具&#xff0c;或许能为我们提供参考。在.NET Core 3.0中&#xff0c;我们引入了一套工具&a…

python pptp链接_pptp-client连接设置

一、安装软件包yum -y install pptpyum -y install pptp-setup二、使用pptpsetup命令直接拨号&#xff0c;可直接生成配置文件。pptpsetup --create NAME --server ADDRESS --username DOMAIN\\USER --password PWD --encrypt –start#--encrypt&#xff1a;支持加密&#xff0…

python选择框格式_PyQt组合框选择性文本格式

圣诞快乐伙计们&#xff01;在我不熟悉PyQt4编程&#xff0c;并且在大多数UI开发中使用Qt设计器。不过&#xff0c;我有一个特定的需求&#xff0c;需要通过Python代码填充QComboBox。另外&#xff0c;我想更改一些条目的文本格式(粗体&#xff0c;红色背景色)。在基本上&#…

python 整数输出 d f_pythn print格式化输出---------%s 和 % d 都是什么意思?

pythn print格式化输出。%r 用来做 debug 比较好&#xff0c;因为它会显示变量的原始数据(raw data)&#xff0c;而其它的符号则是用来向用户显示输出的。1. 打印字符串print ("His name is %s"%("Aviad"))效果&#xff1a;2.打印整数print ("He is %…

c语言memcopy_用C语言模拟实现memcpy函数,memmove函数和memset函数

模拟实现memcpy函数&#xff1a;函数原型&#xff1a;void *memcpy (void *p,void *m, size_t num);memcpy与strcpy相比&#xff0c;memcpy函数用来做内存拷贝&#xff0c;可以用它拷贝任何数据类型的对象&#xff0c;并且可以指定拷贝的数据长度。stycpy函数也是用来做内存拷贝…

python中oxf2是什么_0x02-StartingPoint-Oopsie

Help Desk经过第一篇文章&#xff0c;我思考了一下&#xff0c;已经存在太多的 walkthrough&#xff0c;不应该再去写一样的文章&#xff0c;而是应该着重写思路。接下来的文章&#xff0c;会着重写在什么情况下&#xff0c;应该做些什么&#xff0c;应该注意哪些信息&#xff…

java jlist checkbox_JCheckBox检查Java中的JList中的切换逻辑时遇到问题

如果我理解这个问题......import java.awt.*;import java.awt.event.*;import javax.swing.*;public class JListToggleLogicTest {private final ClearSelectionListener listener new ClearSelectionListener();public JComponent makeUI() {JList list new JList(makeMode…

java yaml dump方法_yamlyaml.load与yaml.dump方法

yaml.load与yaml.dump方法该模块提供了一些方法&#xff0c;不过常用的方法只有两个yaml.load和yaml.dump &#xff0c;以下是一个版本相关的yaml 格式文件[root361way yaml]# cat tree.yamltreeroot:branch1:name: Node 1branch1-1:name: Node 1-1branch2:name: Node 2branch2…

vba中有多线程吗_VBA会被Python代替吗?

先说答案&#xff1a;不会被替代这里引用轮子哥的话说&#xff1a;微软只会开发更多的增强型插件来慢慢淡化VBA&#xff0c;但是不会用其他语言取代VBA。早在17年底&#xff0c;就有风声说Python要取代VBA&#xff0c;成为Excel官方脚本语言。我认真翻看了下好多篇文章&#xf…

java 编码实现内存拷贝_java提高篇(六)-----使用序列化实现对象的拷贝

我们知道在Java中存在这个接口Cloneable&#xff0c;实现该接口的类都会具备被拷贝的能力&#xff0c;同时拷贝是在内存中进行&#xff0c;在性能方面比我们直接通过new生成对象来的快&#xff0c;特别是在大对象的生成上&#xff0c;使得性能的提升非常明显。然而我们知道拷贝…

统计一个整数的所有因子的个数_【题解循环嵌套】1095:数1的个数

1095&#xff1a;数1的个数时间限制: 1000 ms 内存限制: 65536 KB【题目描述】给定一个十进制正整数n(1≤n≤10000)&#xff0c;写下从1到n的所有整数&#xff0c;然后数一下其中出现的数字“1”的个数。例如当n2时&#xff0c;写下1,2。这样只出现了1个“1”&#xff1b;当…

运行java是提示 选择未包含 main 类型 如何解决_RuoYi 若依 代码生成器使用教程...

你好&#xff01; 若是你想学习如何使用RuoYi 若依 代码生成器, 能够仔细阅读这篇文章&#xff0c;了解一下RuoYi 若依 代码生成器的基本知识。java新建数据表(注意字段必定要写注释)USE ry;web/*Table structure for table sys_zyq */sqlDROP TABLE IF EXISTS sys_zyq;数据库C…

vb.net 功能f8键事件_憋了三年,史上最全的 F1~F12 键用法整理出来了!

F1~F12 键在Excel表格中的用法&#xff0c;小编很早就想写篇教程整理一下。可三年过去了还没整理出来&#xff0c;原因有很多&#xff0c;总结成一个字&#xff1a;懒&#xff01;这么&#xff0c;终于整理出来了&#xff01;提示&#xff1a;有的电脑启用了FN键&#xff0c;如…

java递归分苹果_递归较难题——分苹果问题

第四届程序设计大赛 苹果Time Limit:1000MS Memory Limit:65536KTotal Submit:90 Accepted:48Description把M个同样的苹果放在N个同样的盘子里&#xff0c;允许有的盘子空着不放&#xff0c;问共有多少种不同的分法&#xff1f;(用K表示)5&#xff0c;1&#xff0c;1和1&#…