如何使用 arrayList.removeAll(Collection<?> c)?

引言

对于 Collection 集合及其实现类都有 removeAll(Collection<?> c)

对于ArrayList 的实例对象,在数据比较多的情况下,方法 removeAll() 的传参 c 的类型是 HashSet会比是 ArrayList 的情况快的多。

原因

我们来细看一下ArrayList类的removeAll()方法实现的伪代码。

如:arrayList.removeAll(subList);// 遍历底层数组,将不需要删除的元素放在数组前面,后面的全部置为 null
// w 为要删除和不删除的分界线
int w = 0;
for(var value in 该 arrayList 的底层数组){if(!subList.contains(value)){该 arrayList 的底层数组 [w] = value;w++;}
}

这里影响速率关键的一步是:subList.contains(value)

这是因为contains()方法在不同类中的实现是存在差异的。

对于 ArrayList.contains(),它的实现是调用 indexOf(),一个一个地遍历查找。最坏时间复杂度为O(总数据量)。

而对于 HashSet.contains(),由于 HashSet 的底层是 HashMap,因此实际调用的是 HashMapcontainsKey()方法,该方法是通过哈希计算的方式去查询的,因此速度十分快。最坏的时间复杂度约为O(最长链表长度),而链表长度一般不会过大。

使用方法

在数据量比较大的的情况下,使用arrayList.removeAll(subList)时,可以将subList封装为HashSet

arrayList.removeAll(new HashSet(subList));

速度实测:

数据量ArrayListHashSetLinkedList
10 万1094 毫秒6 毫秒1133 毫秒
20 万4140毫秒8 毫秒4241 毫秒
50 万51431毫秒30 毫秒34380 毫秒
100 万140444 毫秒36 毫秒179465 毫秒
500 万9130706 毫秒79 毫秒10549229 毫秒

测试用的代码:

public class RemoveAllTest {public static void main(String[] args) {ArrayList<Integer> arrayList = new ArrayList<>();for (int i = 0; i < 5000000; i++) {arrayList.add(i);}ArrayList<Integer> subList = new ArrayList<>();for (int i = 0; i < 5000000; i++) {subList.add(i);i += 2;}// 测试入参为 ArrayList 类型时 removeAll() 的性能long startTime = System.currentTimeMillis();arrayList.removeAll(subList);long endTime = System.currentTimeMillis();System.out.println("ArrayList 耗时:" + (endTime - startTime));// 测试入参为 HashSet 类型时 removeAll() 的性能ArrayList<Integer> arrayList2 = new ArrayList<>();for (int i = 0; i < 5000000; i++) {arrayList2.add(i);}startTime = System.currentTimeMillis();arrayList2.removeAll(new HashSet<>(subList));endTime = System.currentTimeMillis();System.out.println("HashSet 耗时:" + (endTime - startTime));// 测试将 ArrayList 类型转成 LinkedList 类型ArrayList<Integer> arrayList3 = new ArrayList<>();for (int i = 0; i < 5000000; i++) {arrayList3.add(i);}startTime = System.currentTimeMillis();new LinkedList(arrayList3).removeAll(subList);endTime = System.currentTimeMillis();System.out.println("LinkedList 耗时:" + (endTime - startTime));}
}

HashSet 、LinkedList 中 removeAll() 方法的区别

在这里插入图片描述

不同类的 removeAll() 方法实现不同,可以看到对于 HashSetLinkedList,他们的 removeAll() 方法是通过父类或超父类的迭代器进行实现的,而 ArrayList 是自己通过 for 循环进行了实现。

HashSet 内部实现

依托于 AbstractSet 类的 removeAll(Collection<?> c) 方法,实现的逻辑是:

先调原集合对象 HashSetremoveAll(Collection<?> c) 方法中传入的参数 c 的 size() 方法,用来判断谁包含的元素更多。

  • 如果原集合对象的元素数量 > c 中元素数量,那么调用 c 的代器去遍历 c ,查看元素是否包含在原集合中,并使用原集合的 remove() 方法去删除元素。时间复杂度为 O(n)。

  • 如果原集合对象的元素数量 < c 中元素数量,那么调用原集合对象的迭代器去遍历原集合,检查元素是否包含在 c 中,并调用原集合迭代器的 remove() 方法去删除元素。这里的时间复杂度与集合 c 的 contains() 方法的实现有关:

    • 如果 c 是一个 ArrayListcontains() 方法的时间复杂度是 O( m )。因此,从集合 HashSet 中删除 ArrayList 中存在的所有元素的总体时间复杂度为 O( n * m )。

    • 如果 c 再次是 HashSet,则 contains() 方法的时间复杂度为 O(1)。因此,从集合 HashSet 中删除 HashSet 中存在的所有元素的总体时间复杂度为 O( n )。

public boolean removeAll(Collection<?> c) {Objects.requireNonNull(c);boolean modified = false;if (size() > c.size()) {for (Iterator<?> i = c.iterator(); i.hasNext(); )modified |= remove(i.next());} else {for (Iterator<?> i = iterator(); i.hasNext(); ) {if (c.contains(i.next())) {i.remove();modified = true;}}}return modified;
}

LinkedList 内部实现

public boolean removeAll(Collection<?> c) {Objects.requireNonNull(c);boolean modified = false;Iterator<?> it = iterator();while (it.hasNext()) {if (c.contains(it.next())) {it.remove();modified = true;}}return modified;
}

通过 contains() 方法来判断是否存在相同的元素,效率与 c 的类型有关。

参考

  • 为什么arrayList.removeAll(set)的速度远高于arrayList.removeAll(list)?

  • Java 中 HashSet 的 removeAll 性能分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/106629.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++桶排序算法的应用:存在重复元素 III

题目 给你一个整数数组 nums 和两个整数 indexDiff 和 valueDiff 。 找出满足下述条件的下标对 (i, j)&#xff1a; i ! j, abs(i - j) < indexDiff abs(nums[i] - nums[j]) < valueDiff 如果存在&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 示例…

城市广告牌安全传感器特点有哪些?

城市广告牌安全传感器特点有哪些&#xff1f; 在现代快节奏的都市生活中&#xff0c;城市的广告牌成为不可或缺的一部分&#xff0c;以各种形式和大小存在于城市的街头巷尾&#xff0c;商业中心和交通要道。广告牌是城市生命线组成的一部分。但是由于天气因素、材料老化、不当维…

MySQL [基础]] 学习笔记

MySQL 学习 文章目录 MySQL 学习1. 数据库三层结构2. 数据在数据库中的存储方式3. SQL 语句分类3.1 备份恢复数据库的表 4. Mysql 常用数据类型(列类型)4.1 数值型(整数)的基本使用4.2 数值型(bit)的使用4.3 数值型(小数)的基本使用4.4 字符串的基本使用(面试题)4.5 字符串使用…

【JUC】JMM

文章目录 1. 概述2. 三大特性2.1 可见性2.2 原子性2.3 有序性 3. 多线程对变量的读写过程4. 先行发生原则(happens-before) 1. 概述 CPU的运行并不是直接操作内存而是先把内存里边的数据读到缓存&#xff0c;而内存的读和写操作的时候就会造成不一致的问题 JVM规范中试图定义…

【软件测试】Requests库中处理cookie的几种方式

前言 发送请求时经常需要利用请求头中的cookie字段来做用户访问状态的保持&#xff0c;关于的cookie的处理常见有下面一些处理方式&#xff0c;这里做个小小的总结 1.直接在请求中传递cookies参数 import requestshost http://119.91.144.93:82 api r/ecshop/user.php url…

机器人命令表设计

演算命令 CLEAR 将数据 1 上被指定的编号以后的变数的内容&#xff0c;以及数据 2 上仅被指定的个数都清除至 0。 INC 在被指定的变数内容上加上 1。 DEC 在被指定的变数内容上减掉 1。 SET 在数据 1 上设定数据 2。 ADD 将数据 1 和数据 2 相加&#xff0c;得出的结果保存在数…

DataPath实现渐变效果

Android的vector矢量图很好用&#xff0c;可以画出保证清晰度的任意图形。但是Android Nougat之前的VectorDrawable不支持渐变色&#xff0c;如果要使用渐变色就要使用png图片或者自定义GradientDrawable。这么明显的不足&#xff0c;肯定是要修补上呀&#xff0c;API 24中的Ve…

五、RocketMQ发送顺序消息

顺序消息的应用场景 在有序事件处理、撮合交易、数据实时增量同步等场景下&#xff0c;异构系统间需要维持强一致的状态同步&#xff0c;上游的事件变更需要按照顺序传递到下游进行处理。 例如需要保证一个订单的生成、付款和发货&#xff0c;这三件事情是被顺序执行的。 如…

软件工程第六周

软件体系结构概述 体系结构&#xff1a;一种思想&#xff0c;而框架就是思想的实现&#xff0c;设计模式就是根据某一特殊问题实现的框架。 体系结构&#xff1a;体系结构是软件系统的高级结构。它定义了系统的主要组成部分&#xff0c;以及这些部分之间的关系和交互方式。 框…

springboot自动配置原理面试题(自用)

springboot自动装配主要是基于注解编程和约定大于配置的思想设计 核心步骤&#xff1a; 1 组件必须包含configuration并声明为bean注解返回注入到IOC容器中 2 第三方jar包&#xff0c;根据/meta-inf/目录下增加spring.factories文件加载配置文件中的内容 3 springboot获取到…

NSSCTF做题(9)

[GDOUCTF 2023]<ez_ze> 看见输入框而且有提示说是ssti注入 输入{{7*7}} 试试&#xff0c;发现报错 输入{%%}发现了是jinja2模板 找到关键函数 Python SSTI利用jinja过滤器进行Bypass ph0ebuss Blog 原理见这篇文章&#xff0c;这里直接给出payload {%set ninedict(aaa…

3.1 SQL概述

思维导图&#xff1a; 前言&#xff1a; 前言笔记&#xff1a;第3章 关系数据库标准语言SQL - **SQL的定义**&#xff1a; - 关系数据库的标准和通用语言。 - 功能强大&#xff0c;不仅限于查询。 - 功能覆盖&#xff1a;数据库模式创建、数据插入/修改、数据库安全性与…

LeetCode 1095. 山脉数组中查找目标值【数组,二分】1827

本文属于「征服LeetCode」系列文章之一&#xff0c;这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁&#xff0c;本系列将至少持续到刷完所有无锁题之日为止&#xff1b;由于LeetCode还在不断地创建新题&#xff0c;本系列的终止日期可能是永远。在这一系列刷题文章…

OOA/D 时统一过程(UP)中的 迭代、 进化 和 敏捷

一、迭代和进化式开发的优势 相对于顺序或“瀑布”软件开发模型&#xff0c;迭代和进化式开发&#xff08;iterative and evolutionary development &#xff09;对部分系统及早地引入了编程和测试&#xff0c;并重复这一循环。这种方式通常会还没有详细定义所有需求的情况下假…

如何使用前端构建工具(如Webpack、Parcel)?

聚沙成塔每天进步一点点 ⭐ 专栏简介 前端入门之旅&#xff1a;探索Web开发的奇妙世界 欢迎来到前端入门之旅&#xff01;感兴趣的可以订阅本专栏哦&#xff01;这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发…

C++指针解读(6)-- 指针和字符串

1、字符串的基本概念 &#xff08;1&#xff09;字符串的存储 字符串是存放在字符数组中的。比如字符串“hello”&#xff0c;在内存中是这么存放的&#xff1a; 这里要注意&#xff0c;在字符串的最后会加上一个\0&#xff0c;也被称为NUL字符&#xff0c;表示字符串的结束位…

Liunx中系统安全及文件系统(极其粗糙版)

系统安全&#xff1a; 系统安全和数据防护&#xff0c;数据备份的资质 比如三台服务器&#xff1a; 500万 工信部是有要求的&#xff0c;组织必须保证处理的个人数据的安全性 品牌形象如何维护呢 基于liunx的安全加固措施&#xff1a; 权限进行控制 账号安全&#xff1a;…

09_Webpack打包工具

1 初识Webpack 1.1 什么是Webpack Webpack打包工具对项目中的复杂文件进行打包处理&#xff0c;可以实现项目的自动化构建&#xff0c;并且给前端开发人员带来了极大的便利。 目前&#xff0c;企业中的绝大多数前端项目是基于Webpack打包工具来进行开发的。 1.2 Webpack的安…

C++学习——引用详解

以下内容源于C语言中文网的学习与整理&#xff0c;非原创&#xff0c;如有侵权请告知删除。 一、引用的语法 1、引用的含义 引用&#xff08;Reference&#xff09;是 C 相对于C语言的又一个扩充。 引用可以看做是数据的一个别名&#xff0c;通过这个别名和原来的名字都能够…

可观测 AIOps 的智能监控和诊断实践丨QCon 全球软件开发大会总结

作者&#xff1a;董善东&#xff08;梵登&#xff09; 本文是作者于 9 月 5 日在 QCon 北京 2023&#xff08;全球软件开发大会&#xff09;上做的《阿里云可观测 AIOps 的智能监控和诊断实践》专题演讲文字版。 大家上午好&#xff0c;很高兴可以在 QCon 稳定性和可观测的场…