HashSet 是 Java 中的一个集合类,它实现了 Set 接口。Set 是一种不允许包含重复元素的集合,而 HashSet 则是 Set 接口的一个具体实现。因此,HashSet 用于存储一组唯一的元素,不允许重复。
HashSet 的一些特点:
- 不允许重复元素:如果试图向 HashSet 中添加重复的元素,重复元素将被忽略。
- 无序性:HashSet 不保证元素的顺序,元素在 HashSet 中是无序的。
- 允许 null 元素:HashSet 可以包含一个 null 元素。
基本操作
创建和初始化HashSet
Set<String> fruits = new HashSet<>();
Set<String> set = new HashSet<>(List.of("a","b","c","a"))
添加元素
Set<String> fruits = new HashSet<>();
fruits.add("苹果");
fruits.add("香蕉");
fruits.add("梨子");
删除元素
fruits.remove("苹果");
判断元素是否存在
fruits.contains("苹果");
获取集合大小
fruits.size();
遍历HashSet
// 迭代器遍历
Iterator<String> iterator = fruits.iterator();
while (iterator.hasNext()){System.out.println(iterator.next());
}// 增强for遍历
for (String fruit : fruits){System.out.println(fruit);
}// lambda 遍历
fruits.forEach(f->System.out.println(f));
求交集差集
HashSet<Integer> set1 = new HashSet<>(Arrays.asList(1,2,3,4,5,6));
HashSet<Integer> set2 = new HashSet<>(Arrays.asList(4,5,6,7,8,9));// 求交集
boolean b = set1.retainAll(set2);// 求差集
boolean b1 = set1.removeAll(set2);
转换为数组
String[] fruitsArray = fruits.toArray(new String[0]);
转换为其他集合类型
// 转换为其他集合类型
Set<String> set3 = new HashSet<>(List.of("a","b","c","a"));
ArrayList<String> arrayList = new ArrayList<>(set3);
LinkedList<String> linkedList = new LinkedList<>(set3);
比较两个HashSet
Set<String> set4 = new HashSet<>(Arrays.asList("a","b","c","d"));
Set<String> set5 = new HashSet<>(Arrays.asList("a","b","c","d"));
boolean isEquals = set4.equals(set5);
将自定义对象作为HashSet的元素,重写HashCode和equals
比如,有一个People类,将多个People对象传入到Set中,然后希望的结果是,只要idCard身份证号不同,就表示people不同,即名字相同并不是重复的元素。
People 类 (没有重写hashCode和equals方法):
package com.robin._collections;public class People {private String name;private String sex;private String idCard;public String getName() {return name;}public void setName(String name) {this.name = name;}public String getSex() {return sex;}public void setSex(String sex) {this.sex = sex;}public String getIdCard() {return idCard;}public void setIdCard(String idCard) {this.idCard = idCard;}public People(String name, String sex, String idCard) {this.name = name;this.sex = sex;this.idCard = idCard;}public People() {}@Overridepublic String toString() {return "People{" +"name='" + name + '\'' +", sex='" + sex + '\'' +", idCard='" + idCard + '\'' +'}';}
}
下面的代码中,HashSet并未对我们自定义的People类按照预期的方式去重,原因就是每个People对象的哈希值不同,所以HashSet认为每个对象都是不同的,但是实际情况并不是这样,这时候就需要我们重写hashCode和equals方法了。
Set<People> peopleSet = new HashSet<>();
People p1 = new People("张三","男","2001000");
People p2 = new People("王五","男","2001001");
People p3 = new People("李四","男","2001013");
People p4 = new People("李四","男","2001013");
People p5 = new People("李四","男","2001016");
peopleSet.add(p1);
peopleSet.add(p2);
peopleSet.add(p3);
peopleSet.add(p4);
peopleSet.add(p5);peopleSet.forEach(people -> System.out.println(people));
重写hashCode和equals方法,我们只需要比较idCard这个字段即可,将下面的代码添加到People类中,然后再次测试HashSet的结果
@Override
public boolean equals(Object o) {if (this == o) return true;if (o == null || getClass() != o.getClass()) return false;People people = (People) o;return Objects.equals(idCard, people.idCard);
}@Override
public int hashCode() {return Objects.hash(idCard);
}
此时HashSet已经能够按照我们的想法去对自定义类型进行去重了。
小结
HashSet 的性能通常是很高的,它提供了快速的插入、删除和查询操作。
添加元素的性能:HashSet 的添加元素操作通常是很快的,但性能可能会随着负载因子的增加而下降。负载因子是一个衡量哈希表填充程度的参数,默认值是 0.75。当负载因子超过一定阈值时,HashSet 会进行扩容操作,这可能会导致性能下降。
查询元素的性能:HashSet 提供了快速的查询操作,因为它使用哈希表来存储元素,可以快速定位元素位置。
删除元素的性能:删除元素的性能通常也很高,与查询操作类似,可以快速定位要删除的元素。
HashSet 不允许添加重复元素,自动去重。
HashSet 不保证元素的顺序,元素在HashSet中是无序的。
当将自定义对象作为HashSet对象时,需要重写hashCode() 和 equals()方法,以保证对象在集合中的唯一性和正确性。