1.背景
Java语言相比于C和C++,一个最大的特点就是不需要程序员自己手动去申请和释放内存,这一切交由JVM来完成。在Java中,运行时的数据区域分为程序计数器、Java虚拟机栈、本地方法栈、方法区和堆。其中,程序计数器、虚拟机栈和本地方法栈是线程私有的,线程销毁后自动释放。垃圾回收的行为发生在堆和方法区,主要是堆,而堆中存储的主要是对象。那么自然而然地就会有这么几个问题,哪些对象可以被回收?通过什么方式回收?本文主要探讨第一个问题,以及JVM对Java中几种引用的回收策略。
2.如何判断一个对象是否可以被回收 2.1 引用计数法
主要思想是:给对象添加一个引用计数器,这个对象被引用一次,计数器就加1;不再引用了,计数器就减1。如果一个对象的引用计数器为0,说明没有人使用这个对象,那么这个对象就可以被回收了。这种方法实现起来比较简单,效率也比较高,大多数情况下都是有效的。但是,这种方法有一个漏洞。比如A.property = B,B.property = A,A和B两个对象互相引用,并且没有其他对象引用A和B。按照引用计数法的思想,A和B对象的引用计数器都不为0,都不能被释放,但实际情况是A和B已经没人使用他们了,这就造成了内存泄漏。所以,引用计数法虽然实现简单,但并不是一个完美的解决方案,实际中的Java也没有采用它。
2.2 可达性分析算法
主要思想是:首先确定确定一系列肯定不能被回收的对象,即GC Roots。然后,从这些GC Roots出发,向下搜索,去寻找它直接和间接引用的对象。最后,如果一个对象没有被GC Roots直接或间接地引用,那么这个对象就可以被回收了。这种方法可以有效解决循环引用的问题,实际中Java也是采用这种判断方法。那么问题来了,哪些对象可以作为GC Roots呢?这里可以使用MAT工具进行观察。运行下面的demo:
import java.util.concurrent.TimeUnit; public class GCRootsTest { public static void main(String[] args) throws InterruptedException { Object o = new Object(); TimeUnit.SECONDS.sleep(100); }}
主线程sleep的时候,在terminal窗口执行jmap -dump:format=b,live,file=heapdump.bin 2872命令,生成堆转储快照dump文件,其中2872是进程id,可以使用jps命令查看。然后使用MAT工具打开dump文件,可以很明显地看到一共有四类对象可以作为GC Roots,下面详细介绍下。
第一类,系统类对象(System Class)。比如,java.lang.String的Class对象,这个也很好理解,如果这些核心的系统类对象被回收了,程序就没办法运行了。
第二类,native方法引用的对象。
第三类,活动线程中正在引用的对象。可以看出,代码中变量o指向的Object对象可以被当作GC Roots。
第四类,正在加锁的对象。
3.Java中的几种引用
在可达性分析算法中,判断一个对象是不是可以被回收,主要看从GC Roots出发是否可以找到一个引用指向该对象。java中的引用一共有四种,按照引用的强弱依次为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)。这样就可以对不同引用指向的对象采取不同的回收策略。比如一个强引用指向一个对象,那么这个对象肯定不会被回收,哪怕发生OOM。而对于弱引用指向的对象,只要发生垃圾回收,该对象就会被回收。下面详细介绍下不同引用的用法。
3.1强引用
所谓强引用,就是平时使用最多的,类似于Object obj = new Object()的引用。垃圾回收器永远不会回收被强引用指向的对象。
3.2软引用
软引用,在Java中使用SoftReference类来实现软引用。在下面的代码中,softReference作为软用指向一个Object对象,而otherObject变量可以通过软引用的get方法间接引用到Object对象。
public static void main(String[] args) { // 软引用 SoftReference