一、垃圾回收器类型
如果说垃圾收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体 实现。下图展示了7种作用于不同分代的收集器,其中用于回收新生代的收集器 包括Serial、PraNew、Parallel Scavenge,回收老年代的收集器包括Serial Old、Parallel Old、CMS,还有用于回收整个Java堆的G1收集器。不同收集器 之间的连线表示它们可以搭配使用。
1. Serial收集器(复制算法):
新生代单线程收集器,标记和清理都是单线程,优点是简单高效;
2. ParNew收集器 (复制算法):
新生代并行收集器,实际上是Serial收集器的多线程 版本,在多核CPU环境下有着比Serial更好的表现;
3. Parallel Scavenge收集器 (复制算法):
新生代并行收集器,追求高吞吐量,高效利用 CPU。吞吐量 = 用户线程时间/(用户线程时间+GC线程时间),高吞吐量可以高效率的利用CPU时间,尽快完成程序的运算任务,适合后台应用等对交互相应要求不高的场景;
4. Serial Old收集器 (标记-整理算法):
老年代单线程收集器,Serial收集器的老年代版本;
5. Parallel Old收集器 (标记-整理算法):
老年代并行收集器,吞吐量优先, Parallel Scavenge收集器的老年代版本;
6. CMS(Concurrent Mark Sweep)收集器(标记-清除算法):
老年代并行收集器,以获取最短回收停顿时间为目标的收集器,具有高并发、低停顿的特点,追求最短GC回收停顿时间。
CMS回收过程:
a. 初始标记:仅标记GC Roots 能直接关联的对象,这个阶段会导致 STW(stop the world)。用户无法操作。
b. 并发标记:从 GC Roots 直接关联的对象进行遍历,不需要STW,可以与GC线程一起并发执行。
c. 重新标记:重新标记期间,因用户程序继续运行而导致的标记产生变动的那一部分对象的标记记录,比初始标记时间长,但远比并发标记时间短,也会导致 STW。
d. 并发清除:清除标记为死亡的对象,释放内存空间,可以与用户线程并发执行。
7. G1(Garbage First)收集器 (标记-整理算法):
Java堆并行收集器,G1收集器是 JDK1.7提供的一个新收集器,G1收集器基于“标记-整理”算法实现,也就是说不会产生内存碎片。此外,G1收集器不同于之前的收集器的一个重要特点是:G1回收的范围是整个Java堆(包括新生代,老年代),而前六种收集器回收的范围仅限于新生代或老年代。
G1收集器可以精确控制停顿时间,让使用者明确一个指定长度为M毫秒的时间片段内,消耗在垃圾收集器上的时间不超过N毫秒,几乎是实时java的垃圾回收器的特征了。
收集过程:避免全区域收集,将堆空间分成若干区域,这个区域逻辑上包含的新生代、老年代,并且不要求整个Eden、年轻代、老年代都是连续的。跟踪这些区域垃圾堆积程度,维护一张优先级列表,每次根据允许的收集时间,优先回收垃圾最多的区域,从而获取更高的效率。
二、分代垃圾回收器工作流程
分代垃圾回收是一种内存管理策略,是内存管理策略层面的概念,不是具体的实现。上面介绍的7中垃圾回收器是具体的实现。例如:Serial Old收集器可以是分代垃圾回收策略中老年代回收的一个组成部分,是策略与实现的关系。
分代回收器有两个分区:老生代和新生代,新生代默认的空间占比总空间的 1/3,老生代的默认占比是 2/3。 新生代使用的是复制算法,新生代里有 3 个分区:Eden、To Survivor、From Survivor,它们的默认占比是 8:1:1,它的执行流程如下:
1. 把 Eden + From Survivor 存活的对象放入 To Survivor 区;
2. 清空 Eden 和 From Survivor 分区;
3. From Survivor 和 To Survivor 分区交换,From Survivor 变 To Survivor,To Survivor 变 From Survivor。
每次在 From Survivor 到 To Survivor 移动时都存活的对象,年龄就 +1,当年龄到达 15(默认配置是 15)时,升级为老生代。大对象也会直接进入老生代。 老生代当空间占用到达某个值之后就会触发全局垃圾收回,一般使用标记整理的执行算法。以上这些循环往复就构成了整个分代垃圾回收的整体执行流程。
三、java内存分配与回收策率
对象的内存分配通常是在 Java 堆上分配(随着虚拟机优化技术的诞生,某些场景下也会在栈上分配),对象主要分配在新生代的 Eden 区, 如果启动了本地线程缓冲,将按照线程优先在 TLAB 上分配。少数情况下也会直接在老年代上分配。总的来说分配规则不是百分百固定的,其细节取决于哪一种垃圾收集器组合以及虚拟机相关参数有关,但是虚拟机对于内存的分配还是会遵循以下几种「普世」规则:
1. 对象优先在 Eden 区分配
多数情况,对象都在新生代 Eden 区分配。当 Eden 区分配没有足够的空间进行分配时,虚拟机将会发起一次 Minor GC。如果本次 GC 后还是没有足够的空 间,则将启用分配担保机制在老年代中分配内存。 Minor GC 是指发生在新生代的 GC,因为 Java 对象大多都是朝生夕死,所有 Minor GC 非常频繁,一般回收速度也非常快; Major GC/Full GC 是指发生在老年代的 GC,出现了 Major GC 通常会伴随至少一次 Minor GC。Major GC 的速度通常会比 Minor GC 慢 10 倍以上。
2. 大对象直接进入老年代
所谓大对象是指需要大量连续内存空间的对象,频繁出现大对象是致命的,会导致在内存还有不少空间的情况下提前触发 GC 以获取足够的连续空间来安置新对 象。 前面我们介绍过新生代使用的是标记-清除算法来处理垃圾回收的,如果大对象直接在新生代分配就会导致 Eden 区和两个 Survivor 区之间发生大量的内存复制。因此对于大对象都会直接在老年代进行分配。
3. 长期存活对象将进入老年代
虚拟机采用分代收集的思想来管理内存,那么内存回收时就必须判断哪些对象应该放在新生代,哪些对象应该放在老年代。因此虚拟机给每个对象定义了一个对象年龄的计数器,如果对象在 Eden 区出生,并且能够被 Survivor 容纳,将被移动到 Survivor 空间中,这时设置对象年龄为 1。对象在 Survivor 区中每「熬 过」一次 Minor GC 年龄就加 1,当年龄达到一定程度(默认 15) 就会被晋升到老年代。