通过Java指南我们知道Java集合框架(Collection Framework)如何为并发服务,我们应该如何在单线程和多线程中使用集合(Collection)。
话题有点高端,我们不是很好理解。所以,我会尽可能的描述的简单点。通过这篇指南,你将会对Java集合由更深入的了解,而且我敢保证,这会对你的日常编码非常有用。
1. 为什么大多数的集合类不是线程安全的?
你注意到了吗?为什么多数基本集合实现类都不是线程安全的?比如:ArrayList, LinkedList, HashMap, HashSet, TreeMap, TreeSet等等。事实上,所有的集合类(除了Vector和HashTable以外)在java.util包中都不是线程安全的,只遗留了两个实现类(Vector和HashTable)是线程安全的为什么?
原因是:线程安全消耗十分昂贵!
你应该知道,Vector和HashTable在Java历史中,很早就出现了,最初的时候他们是为线程安全设计的。(如果你看了源码,你会发现这些实现类的方法都被synchronized修饰)而且很快的他们在多线程中性能表现的非常差。如你所知的,同步就需要锁,有锁就需要时间来监控,所以就降低了性能。
这就是为什么新的集合类没有提供并发控制,为了保证在单线程中提供最大的性能。
下面测试的程序验证了Vector和ArrayList的性能,两个相似的集合类(Vector是线程安全,ArrayList非线程安全)
import java.util.*;/** * This test program compares performance of Vector versus ArrayList * @author www.codejava.net * */public class CollectionsThreadSafeTest { public void testVector() { long startTime = System.currentTimeMillis(); Vector vector = new Vector<>(); for (int i = 0; i < 10_000_000; i++) { vector.addElement(i); } long endTime = System.currentTimeMillis(); long totalTime = endTime - startTime; System.out.println("Test Vector: " + totalTime + " ms"); } public void testArrayList() { long startTime = System.currentTimeMillis(); List list = new ArrayList<>(); for (int i = 0; i < 10_000_000; i++) { list.add(i); } long endTime = System.currentTimeMillis(); long totalTime = endTime - startTime; System.out.println("Test ArrayList: " + totalTime + " ms"); } public static void main(String[] args) { CollectionsThreadSafeTest tester = new CollectionsThreadSafeTest(); tester.testVector(); tester.testArrayList(); }}
通过为每个集合添加1000万个元素来测试性能,结果如下:
Test Vector: 9266 msTest ArrayList: 4588 ms
如你所看到的,在相当大的数据操作下,ArrayList速度差不多是Vector的2倍。你也拷贝上述代码自己感受下。
2.快速失败迭代器(Fail-Fast Iterators)
在使用集合的时候,你也要了解到迭代器的并发策略:Fail-Fast Iterators
看下以后代码片段,遍历一个String类型的集合:
List listNames = Arrays.asList("Tom