java arraylist底层实现原理_ArrayList和LinkedList底层原理

ArrayList和LinkedList都是List的实现类，是在日常开发中经常被使用到的两个集合，我们来结合源码看下两个集合的不同之处。

先来看下ArrayList的源码：

// 默认的初始化大小private static final int DEFAULT_CAPACITY = 10;

ArrayList的底层数数组结构，我们创建ArrayList的时候，可以使用指定数组大小的构造函数或者直接是默认的构造函数。当使用默认构造函数的时候，数组的初始化大小是0，当第一次调用add()方法的时候，会变成默认的初始化大小10。

使用ArrayList的最多的就是add()方法了，我们直接来看add()方法的源码：

public boolean add(E e) {//调用ensureCapacityInternal()看是否需要初始化以及扩容ensureCapacityInternal(size + 1); // Increments modCount!!//将数据添加到数组中elementData[size++] = e;return true;}

来看ensureCapacityInternal()方法：

private void ensureCapacityInternal(int minCapacity) {// 如果elementData为空，也就是第一次add的话，则返回默认容量和minCapacity中的最大值if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);}// ensureExplicitCapacity()方法则进一步判断是否需要扩容ensureExplicitCapacity(minCapacity);}private void ensureExplicitCapacity(int minCapacity) {modCount++;// 如果添加后的容量大于原来的容量，则调用扩容方法if (minCapacity - elementData.length > 0)grow(minCapacity);}private void grow(int minCapacity) {// 原来的容量int oldCapacity = elementData.length;//将原来的容量右移一位，相当于是*2^-1，总容量为原来的1.5倍int newCapacity = oldCapacity + (oldCapacity >> 1);if (newCapacity - minCapacity < 0)newCapacity = minCapacity;if (newCapacity - MAX_ARRAY_SIZE > 0)newCapacity = hugeCapacity(minCapacity);// 将旧数据拷贝到新数组中elementData = Arrays.copyOf(elementData, newCapacity);}

ArrayList的add方法逻辑很清晰，也没有过多的方法嵌套，就是添加数据到数组中，判断一下是否需要扩容，需要的话就进行扩容操作。

山东掌趣网络科技

get方法：

public E get(int index) {rangeCheck(index);checkForComodification();return ArrayList.this.elementData(offset + index);}

get()就是直接获取该索引处的元素。

接下来我们就来分析下remove()方法：

remove(int index)方法：

public E remove(int index) {// 越界检查rangeCheck(index);modCount++;E oldValue = elementData(index);// 判断是否是最后一个元素int numMoved = size - index - 1;// 如果不是，则需要将index之后的元素往前移动一位if (numMoved > 0)System.arraycopy(elementData, index+1, elementData, index,numMoved);// 将最后一个元素删除，帮助GCelementData[--size] = null; // clear to let GC do its workreturn oldValue;}

remove(Object o)方法：

public boolean remove(Object o) {if (o == null) {for (int index = 0; index < size; index++)if (elementData[index] == null) {fastRemove(index);return true;}} else {for (int index = 0; index < size; index++)if (o.equals(elementData[index])) {fastRemove(index);return true;}}return false;}

remove逻辑比较简单，直接来看fastRemove()方法：

private void fastRemove(int index) {// modCount，继承于AbstractList。记录着集合的修改次数modCount++;int numMoved = size - index - 1;// 判断是否是最后一个元素，这里的操作和remove(index)一样if (numMoved > 0)System.arraycopy(elementData, index+1, elementData, index,numMoved);elementData[--size] = null; // clear to let GC do its work}

接下来我们来看下删除的例子：

山东掌趣网络科技

public class ArrayListDemo {public static void main(String[] args) {List list=new ArrayList();list.add("jack");list.add("tom");list.add("tom");list.add("mary");list.add("danel");System.out.println("删除之前的集合--:"+list);// for循环删除字符串为tom的元素for(int i=0;i

我们看到，集合中元素为“tom”的并未完全删除掉，结合上面remove(int index)的源码，List调用remove(index)方法后，会移除index位置上的元素，index之后的元素就全部依次往前移，当删除掉一个元素后，size的值就变成了4，此时tom的索引位置为1，由于之前遍历的时候，i已经是1了，再次遍历的时候，i是从2开始，所以tom这个元素边不会再被遍历到，所以会存在漏删的情况。

山东掌趣网络科技

再来看一个例子，使用foreach来遍历删除:

for(String name : list){if("tom".equals(name)){list.remove(name);}}Exception in thread "main" java.util.ConcurrentModificationExceptionat java.util.ArrayList$Itr.checkForComodification(ArrayList.java:901)at java.util.ArrayList$Itr.next(ArrayList.java:851)at ArrayListDemo.main(ArrayListDemo.java:14)

代码报了ConcurrentModificationException异常，为什么会出现这个异常呢，还记得上面源码分析的时候提到过一个成员变量modCount吗，modCount继承于AbstractList，记录着集合的修改次数，也就是每次add或者remove的话modCount值都会被修改，根据报错的地方，跟踪到它的源码：

final void checkForComodification() {if (modCount != expectedModCount)throw new ConcurrentModificationException();}

expectedModCount表示对ArrayList修改次数的期望值，我们来看下expectedModCount的源码位置，是内部类Itr的成员变量：

private class Itr implements Iterator {int cursor; // index of next element to returnint lastRet = -1; // index of last element returned; -1 if no suchint expectedModCount = modCount;public boolean hasNext() {return cursor != size;}、、、、

foreach之所以能工作，是因为这些集合类都实现了Iterable接口，该接口中定义了Iterator迭代器的产生方法，并且foreach就是通过Iterable接口在序列中进行移动，foreach语法最终被编译器转为了对Iterator.next()的调用，

每次foreach迭代的时候都有会有两步操作：

第一步：iterator.hasNext() //判断是否有下个元素

public boolean hasNext() {return cursor != size;}

第二步：下个元素是什么

public E next() {checkForComodification();int i = cursor;if (i >= size)throw new NoSuchElementException();Object[] elementData = ArrayList.this.elementData;if (i >= elementData.length)throw new ConcurrentModificationException();cursor = i + 1;return (E) elementData[lastRet = i];}

我们打印的异常也说明了这一点，Iterator初始化的时候将modCount 的值赋给了expectedModCount，此时这是一个固定值，而当调用remove方法的时候，会修改modCount ，当modCount 值与expectedModCount值不相等的时候，就会报ConcurrentModificationException异常。

那需要怎样删除ArrayList的数据呢？我们再看Iterator的源码，里面有一个删除的方法：

public void remove() {if (lastRet < 0)throw new IllegalStateException();checkForComodification();try {ArrayList.this.remove(lastRet);cursor = lastRet;lastRet = -1;expectedModCount = modCount;} catch (IndexOutOfBoundsException ex) {throw new ConcurrentModificationException();}}

这个remove方法的源码将修改后的modCount的值又重新复制给了expectedModCount ，所以不会再报ConcurrentModificationException异常，正确的删除是获取list集合的迭代器，然后通过迭代器调用它的remove方法。

Iterator iterator = list.iterator();while (iterator.hasNext()){String name = (String)iterator.next();if("tom".equals(name)){iterator.remove();}}

LinkedList源码分析：

相比于ArrayList，它额外实现了双端队列接口Deque，这个接口主要是声明了队头，队尾的一系列方法。LinkedList是一个双向链表结构，这里定义了链表的头结点和尾结点：

// 链表的头元素transient Node first;// 链表的尾元素transient Node last;

LinkedList的内部类，用以表示一个链表节点，一个节点除了保持自身的数据外，还持有前，后两个节点的引用。所以就数据存储上来说，它相比使用数组作为底层数据结构的ArrayList来说，会更加耗费空间。但也正因为这个特性，它删除，插入节点很快

private static class Node {E item;Node next;Node prev;Node(Node prev, E element, Node next) {this.item = element;this.next = next;this.prev = prev;}}

每一个元素在LinkedList中都是在Node中存储，每个Node中同时还存储了当前元素的前节点和后节点。

我们再来看LikedList的add方法：

public boolean add(E e) {linkLast(e);return true;}

add方法没做什么事情，只调用了linkLast()方法，真正做事的是linkLast(E e)，来看下这个方法：

void linkLast(E e) {// 将原尾结点赋值给lfinal Node l = last;// 新节点的头节点是原集合的尾结点，它自己的尾节点为空final Node newNode = new Node<>(l, e, null);// 将新节点赋值给尾节点last = newNode;// 如果原集合的尾结点是null的话，说明原集合没有值，它的头结点就是现在的新增的数据if (l == null)first = newNode;else //否则的话将原尾结点的下一个节点指向当前新增的数据l.next = newNode;size++; // 集合数量+1modCount++; //修改次数+1}

add()方法是将数据插入到链表的尾部，通过add(int index, E element)方法可以在指定位置插入指定元素。

public void add(int index, E element) {// 检查指针是否越界checkPositionIndex(index);// 如果指定位置是最后一个的话，则直接在尾部插入if (index == size)linkLast(element);elselinkBefore(element, node(index));}

看下linkBefore(E e, Node succ)的源码:

void linkBefore(E e, Node succ) {// assert succ != null;final Node pred = succ.prev;// 新节点的前驱节点是原索引处节点的前驱节点，next节点是原索引处节点final Node newNode = new Node<>(pred, e, succ);// 将原索引处的节点的前驱节点修改为新的节点succ.prev = newNode;if (pred == null)first = newNode;else//将原前驱节点的next节点修改为新的节点pred.next = newNode;size++;modCount++;}

get方法源码：

Node node(int index) {// assert isElementIndex(index);// 首先判断该索引时位于前半段还是后半段if (index < (size >> 1)) {Node x = first;for (int i = 0; i < index; i++)x = x.next;return x;} else {Node x = last;for (int i = size - 1; i > index; i--)x = x.prev;return x;}}

LinkedList的get首先判断需要获取的数据在该链表的前半段还是后半段，这样可以减少需要遍历的数据，由于需要遍历数据，所以获取数据的速度会比ArrayList慢。

再来看下删除的方法

public E remove(int index) {// 检查下标是否越界checkElementIndex(index);return unlink(node(index));}E unlink(Node x) {// 得到要删除的元素final E element = x.item;// 获得删除元素的前驱和后置节点final Node next = x.next;final Node prev = x.prev;// 前驱节点为null的话说明要删除的节点是第一个节点if (prev == null) {first = next;} else {// 修改前驱节点的next节点指向被删除节点的next节点prev.next = next;x.prev = null;}// 后置节点为null的话说明要删除的节点是最后一个节点if (next == null) {last = prev;} else {// 修改next节点的前驱节点指向被删除节点的前驱节点next.prev = prev;x.next = null;}x.item = null;size--;modCount++;return element;}

remove(Object o)和remove(int index)稍有差别，但是基本都是调用unlink(Node x)方法。

在使用for循环或者是foreach迭代的时候，和ArrayList一样，也会有漏删或者报错，因此仍然建议使用迭代器中的remove方法进行迭代删除。

值得一提的是LinkedList还实现Dequeue接口，接口定义了队列数据结构，元素是有序的(按插入顺序)，先进先出

可以利用LinkedList实现一个队列。LinkedList中的方法：

// 将指定的元素插入此队列public boolean offer(E e) {return add(e);}// 获取但不移除此队列的头；如果此队列为空，则返回 null。public E peek() {final Node f = first;return (f == null) ? null : f.item;}// 获取并移除此队列的头，如果此队列为空，则返回 null。public E poll() {final Node f = first;return (f == null) ? null : unlinkFirst(f);}// 获取并移除此队列的头public E remove() {return removeFirst();}、、、

例如简单的队列：

public class DequeDemo {public static void main(String[] args) {Queue queue = new LinkedList();queue.offer("tom");queue.offer("jack");queue.offer("mike");while (queue.peek()!=null){System.out.println(queue.poll());}}}

作为双端队列的一些方法，如： addFirst(Object ob):在队首增加元素addLast(Object obj):在队尾增加；peekFirst():查看队首；peekLast:查看队尾；pollFirst:移除队首；pollLast:移除队尾例如：

public class DequeDemo {public static void main(String[] args) {Deque queue = new LinkedList();queue.offer("tom");queue.offer("jack");queue.offer("mike");queue.addFirst("dannel");queue.addLast("mary");while (queue.peek()!=null){System.out.println(queue.poll());}}}danneltomjackmikemary

由于LinkedList底层是用双向链表实现的，没有初始化大小，也没有扩容的机制。

总结

ArrayList和LinkedList都实现了List的接口，但是LinkedList还实现了Deque队列接口，因此还可以当做队列使用，

ArrayList的底层结构是数组，获取元素的速度快，但是插入速度相对LinkedList较慢，LinkedList的底层是双向链表结构，插入和删除比较快，但是查找的速度相对ArrayList较慢。另外ArrayList和LinkedList在并发情况下没有对数据进行同步，是线程不安全的。

山东掌趣网络科技