List 集合去重的 3 种方法

问题由来

在实际开发的时候,我们经常会碰到这么一个困难:一个集合容器里面有很多重复的对象,里面的对象没有主键,但是根据业务的需求,实际上我们需要根据条件筛选出没有重复的对象

比较暴力的方法,就是根据业务需求,通过两层循环来进行判断,没有重复的元素就加入到新集合中,新集合中已经有的元素就跳过。

操作例子如下,创建一个实体对象PenBean,代码如下:

/*** 笔实体*/
public class PenBean {/**类型*/private String type;/**颜色*/private String color;//... 省略 setter 和 getterpublic PenBean(String type, String color) {this.type = type;this.color = color;}@Overridepublic String toString() {return "PenBean{" +"type='" + type + '\'' +", color='" + color + '\'' +'}';}
}

测试 demo,如下:

public static void main(String[] args) {//添加信息,PenBean中没有主键List<PenBean> penBeanList = new ArrayList<PenBean>();penBeanList.add(new PenBean("铅笔","black"));penBeanList.add(new PenBean("铅笔","white"));penBeanList.add(new PenBean("铅笔","black"));penBeanList.add(new PenBean("中性笔","white"));penBeanList.add(new PenBean("中性笔","white"));//新数据List<PenBean> newPenBeanList = new ArrayList<PenBean>();//传统重复判断for (PenBean penBean : penBeanList) {if(newPenBeanList.isEmpty()){newPenBeanList.add(penBean);}else{boolean isSame = false;for (PenBean newPenBean : newPenBeanList) {//依靠type、color来判断,是否有重复元素//如果新集合包含元素,直接跳过if(penBean.getType().equals(newPenBean.getType()) && penBean.getColor().equals(newPenBean.getColor())){isSame = true;break;}}if(!isSame){newPenBeanList.add(penBean);}}}//输出结果System.out.println("=========新数据======");for (PenBean penBean : newPenBeanList) {System.out.println(penBean.toString());}
}

输出结果:

=========新数据======
PenBean{type='铅笔', color='black'}
PenBean{type='铅笔', color='white'}
PenBean{type='中性笔', color='white'}

一般处理数组类型的对象时,可以通过这种方法来对数组元素进行去重操作,以筛选出没有包含重复元素的数组。

那有没有更加简洁的写法呢?

答案肯定是有的,List中的contains()方法就是!

1、利用list中contains方法去重

在使用contains()之前,必须要对PenBean类重写equals()方法,为什么要这么做?等会会详细解释!

我们先在PenBean类中重写equals()方法,内容如下:

@Override
public boolean equals(Object o) {if (this == o) return true;if (o == null || getClass() != o.getClass()) return false;PenBean penBean = (PenBean) o;//当type、color 内容都相等的时候,才返回truereturn Objects.equals(type, penBean.type) &&Objects.equals(color, penBean.color);
}

修改测试 demo,如下:

public static void main(String[] args) {//添加信息List<PenBean> penBeanList = new ArrayList<PenBean>();penBeanList.add(new PenBean("铅笔","black"));penBeanList.add(new PenBean("铅笔","white"));penBeanList.add(new PenBean("铅笔","black"));penBeanList.add(new PenBean("中性笔","white"));penBeanList.add(new PenBean("中性笔","white"));//新数据List<PenBean> newPenBeanList = new ArrayList<PenBean>();//使用contain判断,是否有相同的元素for (PenBean penBean : penBeanList) {if(!newPenBeanList.contains(penBean)){newPenBeanList.add(penBean);}}//输出结果System.out.println("=========新数据======");for (PenBean penBean : newPenBeanList) {System.out.println(penBean.toString());}
}

输出结果如下:

=========新数据======
PenBean{type='铅笔', color='black'}
PenBean{type='铅笔', color='white'}
PenBean{type='中性笔', color='white'}

如果PenBean对象不重写equals()contains()方法的都是false!新数据与源数据是一样的,并不能达到我们想要除去重复元素的目的

那么contains()是怎么做到,判断一个集合里面有相同的元素呢?

我们打开ArrayListcontains()方法,源码如下:

public boolean contains(Object o) {return indexOf(o) >= 0;
}

找到indexOf(o)方法,继续往下看,源码如下:

public int indexOf(Object o) {if (o == null) {for (int i = 0; i < size; i++)if (elementData[i]==null)return i;} else {for (int i = 0; i < size; i++)//对象通过 equals 方法,判断是否相同if (o.equals(elementData[i]))return i;}return -1;
}

此时,非常清晰了,如果传入的对象是null,for循环判断数组中的元素是否有null,如果有就返回下标;如果传入的对象不是null,通过对象的equals()方法,for循环判断是否有相同的元素,如果有就返回下标!

如果是数组返回的下标,肯定是大于0,否则返回-1!

这就是为什么在List中使用contains()方法,对象需要重写equals()方法的原因!

2、java 8中去重操作

当然,有些朋友可能会想到 JDK1.8 中的流式写法,例如 jdk1.8 中的集合元素去重写法如下:

public static void main(String[] args) {//添加信息List<PenBean> penBeanList = new ArrayList<PenBean>();penBeanList.add(new PenBean("铅笔","black"));penBeanList.add(new PenBean("铅笔","white"));penBeanList.add(new PenBean("铅笔","black"));penBeanList.add(new PenBean("中性笔","white"));penBeanList.add(new PenBean("中性笔","white"));//使用java8新特性stream进行List去重List<PenBean> newPenBeanList = penBeanList.stream().distinct().collect(Collectors.toList());//输出结果System.out.println("=========新数据======");for (PenBean penBean : newPenBeanList) {System.out.println(penBean.toString());}
}

利用 jdk1.8 中提供的Stream.distinct()列表去重,Stream.distinct()使用hashCode()equals()方法来获取不同的元素,因此使用这种写法,对象需要重写hashCode()equals()方法!

PenBean对象重写hashCode()方法,代码如下:

@Override
public int hashCode() {return Objects.hash(type, color);
}

在运行测试demo,结果如下:

=========新数据======
PenBean{type='铅笔', color='black'}
PenBean{type='铅笔', color='white'}
PenBean{type='中性笔', color='white'}

即可实现集合元素的去重操作!

那为什么当我们使用String类型的对象作为集合元素时,没有重写呢?

因为 java 中String原生类,已经重写好了,源码如下:

public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {@Overridepublic boolean equals(Object anObject) {if (this == anObject) {return true;}if (anObject instanceof String) {String anotherString = (String)anObject;int n = value.length;if (n == anotherString.value.length) {char v1[] = value;char v2[] = anotherString.value;int i = 0;while (n-- != 0) {if (v1[i] != v2[i])return false;i++;}return true;}}return false;}@Overridepublic int hashCode() {int h = hash;if (h == 0 && value.length > 0) {char val[] = value;for (int i = 0; i < value.length; i++) {h = 31 * h + val[i];}hash = h;}return h;
}
}

3、HashSet去重操作

在上面的分享中,我们介绍了 List 的集合去重操作!其中网友还提到了HashSet可以实现元素的去重!

的确,HashSet集合天然支持元素不重复!

实践代码如下!

还是先创建一个对象PenBean,同时重写Object中的equals()hashCode()方法,如下:

/*** 笔实体*/
public class PenBean {/**类型*/private String type;/**颜色*/private String color;//... 省略 setter 和 getterpublic PenBean(String type, String color) {this.type = type;this.color = color;}@Overridepublic String toString() {return "PenBean{" +"type='" + type + '\'' +", color='" + color + '\'' +'}';}@Overridepublic boolean equals(Object o) {if (this == o) return true;if (o == null || getClass() != o.getClass()) return false;PenBean penBean = (PenBean) o;//当type、color 内容都相等的时候,才返回truereturn Objects.equals(type, penBean.type) &&Objects.equals(color, penBean.color);}@Overridepublic int hashCode() {return Objects.hash(type, color);}}

创建测试 demo,如下:

public static void main(String[] args) {//添加信息List<PenBean> penBeanList = new ArrayList<PenBean>();penBeanList.add(new PenBean("铅笔","black"));penBeanList.add(new PenBean("铅笔","white"));penBeanList.add(new PenBean("铅笔","black"));penBeanList.add(new PenBean("中性笔","white"));penBeanList.add(new PenBean("中性笔","white"));//新数据List<PenBean> newPenBeanList = new ArrayList<PenBean>();//set去重HashSet<PenBean> set = new HashSet<>(penBeanList);newPenBeanList.addAll(set);//输出结果System.out.println("=========新数据======");for (PenBean penBean : newPenBeanList) {System.out.println(penBean.toString());}
}

输出结果如下:

=========新数据======
PenBean{type='铅笔', color='white'}
PenBean{type='铅笔', color='black'}
PenBean{type='中性笔', color='white'}

很明细,返回的新集合没有重复元素!

HashSet是怎么做的的呢?

打开HashSet的源码,查看我们传入的构造方法如下:

public HashSet(Collection<? extends E> c) {map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));addAll(c);
}

很显然,首先创建了一个HashMap对象,然后调用addAll()方法,继续往下看这个方法!

public boolean addAll(Collection<? extends E> c) {boolean modified = false;for (E e : c)if (add(e))modified = true;return modified;
}

首先遍历List中的元素,然后调用add()方法,这个方法,源码如下:

public boolean add(E e) {return map.put(e, PRESENT)==null;
}

其实,就是向HashMap对象中插入元素,其中PRESENT是一个new Object()常量!

private static final Object PRESENT = new Object();

到这里就基本很清楚了,向HashSet中添加元素,其实等同于

Map<Object,Object> map = new HashMap<Object,Object>();
map.put(e,new Object);//e表示要插入的元素

其中插入的元素e,就是HashMap中的key

我们知道HashMap,是通过equals()hashCode()来判断插入的key是否为同一个key,因此,当我们对PenBean对象进行重写equals()hashCode()时,保证判断是同一个key时,就可以达到元素去重的目的!

最后,对已经去重的集合HashSet,再通过ArrayList中的addAll()方法进行包装,即可得到我们想要的不包含重复元素的数据

最后

你还知道哪些集合去重的方法,欢迎评论区留言补充~

往期推荐

阿里《Java开发手册》最新嵩山版发布!


最简单的6种防止数据重复提交的方法!(干货)

关注下方二维码,每一天都有干货!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/545947.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c printf 段错误_错误:预期声明在C中的printf之前指定

c printf 段错误The main cause of this error is - missing opening curly brace ({), before the printf() function. 导致此错误的主要原因是-在printf()函数之前缺少打开的花括号( { )。 Example: 例&#xff1a; #include <stdio.h>int main(void)printf("He…

常用的60招电脑操作

1、如果同时有多个窗口打开&#xff0c;想要关闭的话&#xff0c;可以按住shift不放然后点击窗口右上角的关闭图标。2、在保存网页前&#xff0c;可以按一下"ESC"键(或脱机工作)再保存&#xff0c;这样保存很快 3、用电脑听CD可以不用任何的播放软件&#xff0c;把音…

C语言入门——排序

排序的方法有很多种比较常见的便为&#xff1a;冒泡排序、选择排序、插入排序、快速排序。 今天我们就围绕着四种排序来说&#xff0c;如果有兴趣的话可以去查找一下其他排序。 在排序这方面我们主要讨论&#xff1a; 稳定&#xff1a;如果a原本在b前面&#xff0c;而ab&…

【转】eclipse技巧1

2019独角兽企业重金招聘Python工程师标准>>> 俗话说的好啊&#xff0c;“工于利启事&#xff0c;必先善其器”&#xff0c;如果说你的编程功底是一个枪法的话&#xff0c;那么强大的eclipse就是android战士们最好的武器。 这里&#xff0c;我们来总结eclipse的使用技…

Java LinkedList公共int indexOf(Object o)方法(带示例)

LinkedList公共int indexOf(Object o)方法 (LinkedList public int indexOf(Object o) method) This method is available in package java.util.LinkedList.indexOf(Object o). 软件包java.util.LinkedList.indexOf(Object o)中提供了此方法。 This method is used to return …

定时任务最简单的3种实现方法(超好用)

这是我的第 86 篇原创文章作者 | 王磊来源 | Java中文社群&#xff08;ID&#xff1a;javacn666&#xff09;转载请联系授权&#xff08;微信ID&#xff1a;GG_Stone&#xff09;定时任务在实际的开发中特别常见&#xff0c;比如电商平台 30 分钟后自动取消未支付的订单&#x…

C语言入门基础——Brute-Force算法

Brute-Force算法的基本思想是&#xff1a; 1) 从目标串s 的第一个字符起和模式串t的第一个字符进行比较&#xff0c;若相等&#xff0c;则继续逐个比较后续字符&#xff0c;否则从串s 的第二个字符起再重新和串t进行比较。 2) 依此类推&#xff0c;直至串t 中的每个字符依次和…

MFC:2个重载中没有一个可以转换所有参数类型

MFC:2个重载中没有一个可以转换所有参数类型用VS2008&#xff0c;在使用AfxMessageBox函数的时候出现以上错误&#xff0c;代码如下&#xff1a;AfxMessageBox("Here is the information!",MB_ICONINFORMATION);解决办法一&#xff1a;一、 AfxMessageBox(_T("H…

SQL随机生成6位数字

SELECT RIGHT(100000000 CONVERT(bigint, ABS(CHECKSUM(NEWID()))), 6)

为什么劝你放弃Maven?看看Gradle的这些优点就知道了

相信使用Java的同学都用过Maven&#xff0c;这是一个非常经典好用的项目构建工具。但是如果你经常使用Maven&#xff0c;可能会发现Maven有一些地方用的让人不太舒服&#xff1a;Maven的配置文件是XML格式的&#xff0c;假如你的项目依赖的包比较多&#xff0c;那么XML文件就会…

解决问题手册(QT+C++ )

目录前言QTQT介绍QMutexLockerQTimer与事件循环C介绍工作日记介绍2022前言 刚刚参加工作&#xff0c;感觉自己不懂的地方很多。所以我希望做一篇长时间的文章分享&#xff0c;把我工作中遇到的问题还有解决问题的思路都记下来。时间长了它是不是就变成了一本解决问题手册&…

css中的换行符_如何使用CSS防止项目列表中的换行符?

css中的换行符Introduction: 介绍&#xff1a; Dealing with various items in CSS sometimes pose very different problems. The problem could be anything, it could be related to positioning, arrangement, and whatnot, therefore all such kinds of problems require…

Java中的一些坑,汇总篇(2万字)

Photo Drew Farwell 文 | 常意1.前言

VB.NET判断一个路径的文件是否存在

使用文件系统操控文件和路径的能力是任何程序的一个重要功能。在本文所介绍的技巧中&#xff0c;我们将检测VB.NET 如何与文件系统进行作用。通过现有类、方法和属性示例给出简便方法完成必须的功能。为了能够操作文件系统&#xff0c;我们需要用到System.IO命名空间。因此&…

6款html5模板下载

http://www.100sucai.com/code/1316.htmlhttp://www.100sucai.com/code/1318.htmlhttp://www.100sucai.com/code/1310.htmlhttp://www.100sucai.com/code/1309.htmlhttp://www.100sucai.com/code/1303.htmlhttp://www.100sucai.com/code/1301.html转载于:https://blog.51cto.co…

QMutexLocker用法

QMutexLocker 详细描述:QMutexLocker类是一个方便的类&#xff0c;它简化了锁定和解锁互斥锁。在复杂函数和语句或异常处理代码中对QMutex进行锁定和解锁是容易出错的&#xff0c;很难调试。在这种情况下可以使用QMutexLocker来确保互斥锁的状态总是定义良好的。应该在需要锁定…

软件工程生命周期模型_软件生命周期模型比较| 软件工程

软件工程生命周期模型软件生命周期模型 (Software Lifecycle Models) There are five software lifecycle models that are commonly used while developing any software. These are as follows: 开发任何软件时&#xff0c;通常使用五个软件生命周期模型。 这些如下&#xff…

VB 日期时间函数

1.date(日期表达式)将日期表达式转换成日期类型的数据。日期表达式是任何可以解释成日期的表达式&#xff0c;包含日期文字&#xff0c;可以看作日期的字符串以及从函数返回的日期。比如&#xff1a;myDate CDate("99-5-20") &#xff0c;这样的日期表达式必须加双引…

高并发系统 3 大利器之缓存

引言随着互联网的高速发展&#xff0c;市面上也出现了越来越多的网站和app。我们判断一个软件是否好用&#xff0c;用户体验就是一个重要的衡量标准。比如说我们经常用的微信&#xff0c;打开一个页面要十几秒&#xff0c;发个语音要几分钟对方才能收到。相信这样的软件大家肯定…

QTimer与事件循环理解

问题分析 最近在使用QT的时候发现了某些问题&#xff0c;查阅资料最后总结一下。我起初是想用QT在界面还在加载时加载一副动画&#xff0c;然后动画下面有加载的滚动条代表时间&#xff0c;由于测试所以界面加载没写很多东西很快就加载完成了。我就想让他加载慢点我看看效果。…