第2节 集合(下)
一、Set接口
java.util.Set
接口和 java.util.List
接口一样,同样继承自 Collection
接口,它与Collection
接口中的方法基本一致,并没有对 Collection
接口进行功能上的扩充,只是比Collection
接口更加严格了。
与 List
接口不同的是, Set
接口中元素无序 ,并且都会以某种规则保证存入的元素不出现重复 。
Set
接口有很多子类:
比较常用的有HashSet
、LinkedHashSet
、TreeSet
三个,后面分别介绍。
二、HashSet类
2.1 概述与使用
java.util.HashSet
是 Set
接口的一个实现类,它所存储的元素是不可重复的,并且元素都是无序的(即存取顺序不一致)。 java.util.HashSet
底层的实现其实是一个java.util.HashMap
支持,即将数据存在HashMap
的键的位置,值的位置全部存放空对象。
HashSet
是根据对象的哈希值来确定元素在集合中的存储位置,因此具有良好的存取和查找性能。保证元素唯一性的方式依赖于: hashCode
与 equals
方法。hashCode
就是一个生成哈希值(int型)的函数。
先来看一个使用HashSet
存储的例子:
public class HashSetDemo {public static void main(String[] args) {//创建 Set集合HashSet<String> set = new HashSet<String>();//添加元素set.add(new String("123"));set.add("123");set.add("123");set.add("321");//遍历for (String name : set) {System.out.println(name);}}
} 结果如下:
123
321
说明Set集合中不能存储重复元素
2.2 构造方法与方法
其中涉及到散列因子,后续介绍,**这里注意最后一种构造方法,可以将其他类型的Collection实现转为HashSet类,其他的一些类也有类似的操作** 。
方法也不多,增加删除遍历获取元素数比较常用。
2.3 哈希表
因为HashSet
是由HashMap
实现的,而HashMap
又是由哈希表这种数据结构实现的,所以有必要介绍一下java中哈希表是什么。
在JDK1.8之前,哈希表底层采用数组+链表 实现,即使用链表处理冲突,同一hash值的链表都存储在一个链表里。但是当位于一个桶中的元素较多,即hash值相等的元素较多时,通过key值依次查找的效率较低。而JDK1.8中,哈希表存储采用数组+链表+红黑树 实现,当链表长度超过阈值(8)时,将链表转换为红黑树,这样大大减少了查找时间 。
当红黑树中数据个数减少到6时,从红黑树变回为链表 。这里要注意,如果本身就是链表,那么降到6也不会发生这种转变。
它存入数据时的完整过程如下图所示:
总而言之,JDK1.8引入红黑树大程度优化了HashMap
的性能,那么对于我们来讲保证HashSet
集合元素的唯一,其实就是根据对象的hashCode
和equals
方法来决定的。如果我们往集合中存放自定义的对象,那么保证其唯一,就必须复写hashCode
和equals
方法建立属于当前对象的比较方式。
2.4 LinkedHashSet类
此实现使客户免于HashSet
提供的未指定的,通常是混乱的排序,而不会产生与TreeSet
相关的增加的成本。无论原始集合的实现如何,它都可用于生成与原始集合具有相同顺序的集合的副本 。
三、TreeSet类与Comparable接口
3.1 TreeSet类概述
它与HashSet
相比,最大的区别在于TreeSet
是有序存储的。先来看一下它的构造方法和方法:
看一个例子:
package com.kaikeba.coreclasslibrary.set;import java.util.TreeSet;public class treeset {//TreeSet:public static void main(String[] args) {TreeSet<String> data = new TreeSet<>();data.add("B");data.add("C");data.add("A");data.add("D");for(String s:data) {System.out.println(s);}}
}结果如下:
A
B
C
D
它有一个问题,当存入的数据是自定义的对象时, TreeSet
通过什么来比较大小,或者再一般一些,传入上述字符串对象时,TreeSet是通过说明比较顺序的?
它本身是不知道的,所以必须实现Comparable
接口。
3.2 Comparable接口
此接口对实现它的每个类的对象强加一个总排序。 这种排序被称为类的自然顺序 ,类的compareTo
方法被称为其自然比较方法 。
它只有一个抽象方法:compareTo
,它将传入的对象与此对象进行比较以获得顺序。返回负整数,零,正整数,表示此对象小于,等于或大于指定对象。
看一个例子:
package com.kaikeba.coreclasslibrary.set;import java.util.Objects;
import java.util.TreeSet;public class treeset2 {//TreeSet:public static void main(String[] args) {TreeSet<Person> data = new TreeSet<>();Person p1 = new Person("张三", 20);Person p2 = new Person("李四", 19);Person p3 = new Person("麻子", 19);data.add(p1);data.add(p2);data.add(p3); //不能存一样大的值for(Person p:data) {System.out.println(p);}}static class Person implements Comparable<Person>{private String name;private int age;@Overridepublic int compareTo(Person o) {//this 与 o 比较//返回的数据是:负数this小、零一样大、整数this大if(this.age > o.age) {return 1;}else if(this.age == o.age) {return 0;}return -1;}public Person() {}public Person(String name, int age) {this.name = name;this.age = age;}public String getName() {return name;}public void setName(String name) {this.name = name;}public int getAge() {return age;}public void setAge(int age) {this.age = age;}@Overridepublic boolean equals(Object o) {if (this == o) return true;if (o == null || getClass() != o.getClass()) return false;Person person = (Person) o;return age == person.age && Objects.equals(name, person.name);}@Overridepublic int hashCode() {return Objects.hash(name, age);}@Overridepublic String toString() {return "Person{" +"name='" + name + '\'' +", age=" + age +'}';}}
}
结果如下:
Person{name='李四', age=19}
Person{name='张三', age=20}
Person
类实现了Comparable
接口,实现了compareTo
方法,这里对年龄进行了排序,而且也可以发现,当两者一样大时,不会存入数据。
那是不是String
也做了同样的事才可以使得它能排序呢?看一下String
源码:
它也是做了相同的事,才可以比较大小进行排序的。
四、Collections类和Comparator接口
4.1 Collections类
是一个集合工具类,用来对集合进行操作,部分方法如下:
-
public static <T> boolean addAll(Collection<T> c, T... elements)
:往集合中添加一些元素。 -
public static void shuffle(List<?> list)
: 打乱集合顺序。 -
public static <T> void sort(List<T> list)
:将集合中元素按照默认规则排序。 -
public static <T> void sort(List<T> list,Comparator<? super T> )
:将集合中元素按照指定规则排序。
举个例子:
public class CollectionsDemo {public static void main(String[] args) {ArrayList<Integer> list = new ArrayList<Integer>();//原来写法//list.add(12);//list.add(14);//list.add(15);//list.add(1000);//采用工具类 完成 往集合中添加元素Collections.addAll(list, 5, 222, 1,2);System.out.println(list);//排序方法Collections.sort(list);System.out.println(list);}
}
结果:
[5, 222, 1, 2]
[1, 2, 5, 222]
这里的排序是采用的默认顺序,如果想要自定义顺序怎么操作?
4.2 Comparator接口
排序的规则是怎么定义出来的呢?说到排序,简单说就是两个对象之间比较大小,那么在Java中提供了两种比较实现的方式:
-
一种是比较死板的采用
java.lang.Comparable
接口去实现; -
一种是灵活的当我需要做排序的时候再去选择
java.util.Comparator
接口完成。
Comparable
接口中的实现,把比较规则写死了,比如想要字符串按照字符降序排序,那么就要修改String
的源代码,这是不可能的,所以这个时候可以使用Comparator
接口灵活的完成。
Comparator
接口中主要需要重写的方法是compare
方法:
public int compare(String o1, String o2): //比较其两个参数的顺序。
两个对象比较的结果有三种:大于,等于,小于。
如果要按照升序排序,
则o1 小于o2,返回(负数),相等返回0,01大于02返回(正数)
如果要按照降序排序
则o1 小于o2,返回(正数),相等返回0,01大于02返回(负数)
操作如下:
public class CollectionsDemo3 {public static void main(String[] args) {ArrayList<String> list = new ArrayList<String>();list.add("cba");list.add("aba");list.add("sba");list.add("nba");//排序方法 按照第一个单词的降序Collections.sort(list, new Comparator<String>() {@Overridepublic int compare(String o1, String o2) {return o2.charAt(0) - o1.charAt(0);}});System.out.println(list);}
}结果如下:
[sba, nba, cba, aba]
4.3 Comparable和Comparator接口的区别
Comparable
:强行对实现它的每个类的对象进行整体排序。这种排序被称为类的自然排序,类的compareTo
方法被称为它的自然比较方法。只能在类中实现compareTo()
一次,不能经常修改类的代码实现自己想要的排序。实现此接口的对象列表(和数组)可以通过Collections.sort
(和Arrays.sort
)进行自动排序,对象可以用作有序映射中的键或有序集合中的元素,无需指定比较器。
Comparator
:强行对某个对象进行整体排序。可以将Comparator
传递给sort
方法(如Collections.sort
或 Arrays.sort
),从而允许在排序顺序上实现精确控制。还可以使用Comparator
来控制某些数据结构(如有序set或有序map)的顺序,或者为那些没有自然顺序的对象collection
提供排序。
练习:
创建一个学生类,存储到ArrayList
集合中完成指定排序操作。
Student 初始类:
public class Student{private String name;private int age;public Student() {} public Student(String name, int age) {this.name = name;this.age = age;} public String getName() {return name;} public void setName(String name) {this.name = name;} public int getAge() {return age;} public void setAge(int age) {this.age = age;} @Overridepublic String toString() {return "Student{" +"name='" + name + '\'' +", age=" + age +'}';}
}
测试类:
public class Demo {public static void main(String[] args) {// 创建四个学生对象 存储到集合中ArrayList<Student> list = new ArrayList<Student>();list.add(new Student("rose",18));list.add(new Student("jack",16));list.add(new Student("abc",16));list.add(new Student("ace",17));list.add(new Student("mark",16));/*让学生 按照年龄排序 升序*/// Collections.sort(list);//要求 该list中元素类型 必须实现比较器Comparable接口for (Student student : list) {System.out.println(student);}}
}
发现,当我们调用Collections.sort()方法的时候 程序报错了。
原因:如果想要集合中的元素完成排序,那么必须要实现比较器Comparable
接口。
于是我们就完成了Student
类的一个实现,如下:
public class Student implements Comparable<Student>{....@Overridepublic int compareTo(Student o) {return this.age-o.age;//升序}
}
再次测试,代码就OK 了效果如下:
Student{name='jack', age=16}
Student{name='abc', age=16}
Student{name='mark', age=16}
Student{name='ace', age=17}
Student{name='rose', age=18}
补充:
如果想要规则更多一些,可以参考下面代码:
Collections.sort(list, new Comparator<Student>() {@Overridepublic int compare(Student o1, Student o2) {// 年龄降序int result = o2.getAge()-o1.getAge()//第一个规则判断完了 下一个规则 姓名的首字母 升序if(result==0){result = o1.getName().charAt(0)-o2.getName().charAt(0);} return result;}
});
效果如下:
Student{name='rose', age=18}
Student{name='ace', age=17}
Student{name='abc', age=16}
Student{name='jack', age=16}
Student{name='mark', age=16}
五、Map接口
5.1 概述
以上的Collection
中,每次操作的都是一个单独对象,而Map接口,可以实现键值对的存储 ,如下所示:
-
张三 123456
-
李四 234567
Map中不能包含重复的键,即键必须唯一,而且每个键最多可以映射一个值 。
Map
接口与Collection
接口没有任何的关系,是第二大集合操作接口。
注意:如果将可变对象用作键,则必须非常小心,因为一旦中途更改对象的属性,根据hashCode
和equals
方法的定义,将无法找到原来存在以该对象为键的值,即发生了哈希值错乱,后面再结合源码和例子详细解释。
5.2 方法介绍
介绍一下常用法方法:
1、删除所有映射
2、是否包含指定的键、值
3、返回Map.Entry
或Set
视图
4、equals
5、根据键获取值
6、返回哈希码值
7、判断是否不包含映射关系
8、将键作为Set集合返回,遍历常用
9、返回包含若干个映射的不可修改Map,静态方法
10、存入指定的键值对
11、删除某映射对
12、替换某映射对
13、返回此Map
中的键值对数量
14、返回此Map
中所有值的Collection
集合
Map
本身是一个接口,所以一般会使用以下的几个子类:HashMap
、TreeMap
、Hashtable
。
六、HashMap、Hashtable、ConcurrentHashMap类
6.1 HashMap类
6.1.1 概述
基于哈希表的Map
接口的实现。 此实现提供了所有可选的映射操作,并允许null
值和null
键。 ( HashMap
类大致相当于Hashtable
,除了它是不同步的并且允许空值。)此类不保证顺序。
此类定义如下:
public class HashMap<K,V> extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable
它继承了AbstractMap
类,同时可以被克隆,可以被序列化。
看一个例子:
package com.kaikeba.coreclasslibrary.set;import java.util.Collection;
import java.util.HashMap;
import java.util.Set;public class map {//Map//HashMap/Hashtable/ConcurrentHashMap//TreeMap//LinkedHashMappublic static void main(String[] args) {HashMap<String, String> data = new HashMap<>();data.put("key1", "锄禾日当午");data.put("key2", "汗滴禾下土");data.put("key2", "勇敢牛牛"); //新的内容将替换旧的内容//根据键来遍历键值对Set<String> set = data.keySet();for(String key:set) {System.out.println(key+"->"+data.get(key));}//遍历值Collection<String> values = data.values();for(String value:values) {System.out.println(value);}}
}结果如下所示:
key1->锄禾日当午
key2->勇敢牛牛
锄禾日当午
勇敢牛牛
6.1.2 可变对象作为键
前面也提到了,可变对象作为键会出现哈希值错乱的问题,先来看一个例子:
package com.kaikeba.coreclasslibrary.set;import java.util.HashMap;
import java.util.Objects;public class Demo {public static void main(String[] args) {//为防止键改变导致哈希值错乱的问题,尽量不要使用对象来作为键,如果要做,不要修改对象的属性HashMap<Book, String> data = new HashMap<>();Book book1 = new Book("三体", "科幻小说");data.put(book1, "第一本书");Book book2 = new Book("平凡的世界", "纪实小说");data.put(book2, "第二本书");book1.setName("四体");//哈希值通过对象属性计算,哈希值计算的与原来不一样,是找不到值的System.out.println(data.get(book1));//哈希值虽然计算一样,但是equals不相等,传入的“三体”与键对象的“四体不相等,也找不到”Book book3 = new Book("三体", "科幻小说");System.out.println(data.get(book3));}static class Book {private String name;private String info;public Book() {}public Book(String name, String info) {this.name = name;this.info = info;}@Overridepublic boolean equals(Object o) {if (this == o) return true;if (o == null || getClass() != o.getClass()) return false;Book book = (Book) o;return Objects.equals(name, book.name) && Objects.equals(info, book.info);}@Overridepublic int hashCode() {return Objects.hash(name, info);}@Overridepublic String toString() {return "Book{" +"name='" + name + '\'' +", info='" + info + '\'' +'}';}public String getName() {return name;}public void setName(String name) {this.name = name;}public String getInfo() {return info;}public void setInfo(String info) {this.info = info;}}
}结果如下:
null
null
因为中途将作为键的可变对象的属性改变,导致后续找不到该键对应的值了,上述涉及到了两种情况:
-
直接通过改变后的对象去get,发现找不到;
-
新new一个与原来对象的属性完全一样的新对象去get,也找不到。
为了解释上述的现象,需要看get方法的源码:
public V get(Object key) {Node<K,V> e;return (e = getNode(hash(key), key)) == null ? null : e.value;
}
调用getNode
方法,根据哈希值
和key
来获取值,首先来看一下哈希值是如何来的:
static final int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
其实就是根据键来获取哈希值,若键为null
,哈希值为0,若不为空,调用hashCode
方法生成,而hashCode
在创建类的时候已经生成:
@Override
public int hashCode() {return Objects.hash(name, info);
}
就是根据键的属性计算的一个int值,到这里就解释了第一个问题,因为存入的时候是new Book("三体", "科幻小说");
,而修改了属性后键变为new Book("四体", "科幻小说");
两者属性不一样,根据哈希值计算方法来看,计算得到的哈希值是不一样的,而getNode
中哈希值就是寻找位置的关键,哈希值不一样肯定找不到。
最后再看一下getNode
方法内部:
注意这里:
还有这里:
以及若在红黑树中getTreeNode
方法里也有一样的判断条件,要想返回值,必须先满足这个,这里的意思就是除了哈希值要一样,键也要保持一样,但是修改之后的键是"四体", "科幻小说"
,而book3是"三体", "科幻小说"
,它们哈希值虽然一样了,但是key不一样了,这就是问题2的原因。
综上,为防止键改变导致哈希值错乱的问题,尽量不要使用可变对象来作为键,如果对象必须可变,那就不要拿它作为键使用 。
6.2 Hashtable类
Hashtable
是一个最早的键值对操作类,本身是在JDK1.0的时候推出的,其基本操作与HashMap
是类似的。
import java.util.Hashtable;
import java.util.Map;
public class HashtableDemo01 {public static void main(String[] args) {Map<String, Integer> numbers = new Hashtable<String, Integer>();numbers.put("one", 1);numbers.put("two", 2);numbers.put("three", 3);Integer n = numbers.get("two");if (n != null) {System.out.println("two = " + n);}}
}
操作的时候, 可以发现与 HashMap
基本上没有什么区别, 而且本身都是以 Map
为操作标准的, 所以操作的结果形式都一样。 但是 Hashtable
中是不能向集合中插入 null
值的。
6.3 HashMap与Hashtable的区别
在整个集合中除了ArrayList
和Vector
的区别之外,另外一个最重要的区别就是HashMap
与Hashtable
的区别:
6.4 ConcurrentHashMap类
HashMap
是异步处理,线程不安全,但是性能较高;Hashtable
是同步处理,线程安全,但是性能较低;而ConcurrentHashMap
是对这两类的一个优化,采用了分段锁机制,在保证线程安全的同时,效率也比较高。
分段锁机制 就是每个哈希桶内部需要同步保证线程安全,但是桶与桶之间是异步的,提高性能。
6.5 哈希表的散列操作
注意一下这三类的构造方法,以HashMap
为例:
涉及到两个参数:初始容量 和加载因子 。无参的默认初始容量为16,所有的默认加载因子为0.75。
-
初始容量 :哈希表中哈希桶的数量;
-
加载因子 :哈希表中有多少百分比的哈希桶中有数据,就需要进行扩容,一般是扩容为2倍,0.75就是75%。0.75是在时间和空间成本之间进行的良好的折中。较高的值会减少空间开销,但是会增加查找的成本。
为了尽量减少重新哈希(扩容)的操作,事先选择好初始容量和加载因子是很关键的(加载因子一般就选0.75)。
七、TreeMap类
TreeMap
子类是允许 key 进行排序的操作子类, 其本身在操作的时候将按照 key 进行排序, 另外, key 中的内容可以为任意的对象, 但是要求对象所在的类必须实现 Comparable
接口。这一点和TreeSet
是类似的,毕竟,TreeSet
就是TreeMap
实现的。
import java.util.Iterator;
import java.util.Map;
import java.util.Set;
import java.util.TreeMap;
public class TreeMapDemo01 {public static void main(String[] args) {Map<String, String> map = new TreeMap<String, String>();map.put("ZS", "张三");map.put("LS", "李四");map.put("WW", "王五");map.put("ZL", "赵六");map.put("SQ", "孙七");Set<String> set = map.keySet(); // 得到全部的keyIterator<String> iter = set.iterator();while (iter.hasNext()) {String i = iter.next(); // 得到keySystem.out.println(i + " --:> " + map.get(i));}}
}结果如下:
LS --:> 李四
SQ --:> 孙七
WW --:> 王五
ZL --:> 赵六
ZS --:> 张三
此时的结果已经排序成功了, 但是从一般的开发角度来看, 在使用 Map 接口的时候并不关心其是否排序, 所以此类只需要知道其特点即可。
八、关于Map集合的输出
8.1 使用Map.Entry接口
在Collection
接口中,可以使用 iterator()
方法为Iterator
接口实例化,并进行输出操作,但是在 Map
接口中并没有此方法的定义, 所以 Map
接口本身是不能直接使用 Iterator
进行输出的。
因为 Map
接口中存放的每一个内容都是一对值, 而使用 Iterator
接口输出的时候, 每次取出的都实际上是一个完整的对象。 如果此时非要使用Iterator
进行输出的话, 则可以按照如下的步骤进行:
-
使用
Map
接口中的entrySet()
方法将Map
接口的全部内容变为Set
集合; -
可以使用
Set
接口中定义的iterator()
方法为Iterator
接口进行实例化; -
之后使用
Iterator
接口进行迭代输出,每一次的迭代都可以取得一个Map.Entry
的实例; -
通过
Map.Entry
进行key
和value
的分离。
那么, 到底什么是 Map.Entry
呢?
Map.Entry
本身是一个接口。此接口是定义在 Map
接口内部的,是 Map
的内部接口。此内部接口使用 static
进行定义,所以此接口将成为外部接口。
实际上来讲,对于每一个存放到 Map
集合中的 key
和 value
都是将其变为了Map.Entry
并且将Map.Entry
保存在了Map
集合之中。
在Map.Entry
接口有如下的方法:
在Map.Entry
接口中以下的方法最为常用:
看一个例子:
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
import java.util.Set;
public class MapOutDemo01 {public static void main(String[] args) {Map<String, String> map = new HashMap<String, String>();map.put("ZS", "张三");map.put("LS", "李四");map.put("WW", "王五");map.put("ZL", "赵六");map.put("SQ", "孙七");// 变为Set实例Set<Map.Entry<String, String>> set = map.entrySet();Iterator<Map.Entry<String, String>> iter = set.iterator();while (iter.hasNext()) {Map.Entry<String, String> me = iter.next();System.out.println(me.getKey() + " --> " + me.getValue());}}
}结果如下:
WW --> 王五
ZL --> 赵六
LS --> 李四
ZS --> 张三
SQ --> 孙七
以上的代码一定要记住,Map
集合中每一个元素都是 Map.Entry
的实例, 只有通过Map.Entry
才能进行 key
和 value
的分离操作。
8.2 foreach遍历
在 JDK 1.5 之后也可以使用 foreach 完成同样的输出, 只是这样的操作基本上不使用。
import java.util.HashMap;
import java.util.Map;
public class MapOutDemo02 {public static void main(String[] args) {Map<String, String> map = new HashMap<String, String>();map.put("ZS", "张三");map.put("LS", "李四");map.put("WW", "王五");map.put("ZL", "赵六");map.put("SQ", "孙七");for (Map.Entry<String, String> me : map.entrySet()) {System.out.println(me.getKey() + " --> " + me.getValue());}}
}结果如下:
WW --> 王五
ZL --> 赵六
LS --> 李四
ZS --> 张三
SQ --> 孙七
九、类集总结
-
类集就是一个动态的对象数组,可以向集合中加入任意多的内容;
-
List
接口中是允许有重复元素的,Set
接口中是不允许有重复元素; -
所有的重复元素依靠
hashCode()
和equals
进行区分; -
List
接口常用子类:ArrayList
、Vector
; -
Set
接口常用子类:HashSet
、TreeSet
; -
TreeSet
是可以排序的,一个类的对象依靠Comparable
接口排序; -
Map
接口中允许存放一对内容,key→value; -
Map
接口的常用子类:HashMap
、Hashtable
、TreeMap
; -
Map
使用Iterator
输出的详细步骤(Map.Entry
)