垃圾回收算法
Java是如何实现垃圾回收的呢?简单来说,垃圾回收要做的有两件事:
1、找到内存中存活的对象
2、释放不再存活对象的内存,使得程序能再次利用这部分空间
[本质上后续所有的垃圾回收算法,都是在前两种算法的基础上优化而来。]
垃圾回收算法的评价标准
-
吞吐量、最大暂停时间、堆使用效率
Java垃圾回收过程会通过单独的GC线程来完成,但是不管使用哪一种GC算法,都会有部分阶段需要停止所有的用户线程。这个过程被称之为Stop The World简称STW,如果STW时间过长则会影响用户的使用。【无法处理用户请求】
用户代码执行和垃圾回收执行让用户线程停止执行(STW)是交替执行的。
所以判断GC算法是否优秀,可以从三个方面来考虑:
1.吞吐量
吞吐量指的是 CPU 用于执行用户代码的时间与 CPU 总执行时间的比值,即吞吐量 = 执行用户代码时间 /(执行用户代码时间 + GC时间)。吞吐量数值越高,垃圾回收的效率就越高。
2.最大暂停时间
最大暂停时间指的是所有在垃圾回收过程中的STW时间最大值。最大暂停时间越短,用户使用系统时受到的影响就越短。
3.堆使用效率
不同垃圾回收算法,对堆内存的使用方式是不同的。比如标记清除算法,可以使用完整的堆内存。而复制算法会将堆内存一分为二,每次只能使用一半内存。从堆使用效率上来说,标记清除算法要优于复制算法。
上述三种评价标准:堆使用效率、吞吐量,以及最大暂停时间不可兼得。
-
堆内存越大,最大暂停时间就越长。
-
想要减少最大暂停时间【将长的拆分成多个小的,准备工作会重复执行】,就会降低吞吐量。
没有一个垃圾回收算法能兼顾上述三点评价标准,所以不同的垃圾回收算法它的侧重点是不同的,适用于不同的应用场景。
比如购物商品,最大暂停时间越短越好
程序在后台处理数据,最大暂停时间就无关紧要了。吞吐量很低的话执行效率肯定收到影响
标记清除算法(Mark-and-Sweep)
标记清除算法的核心思想分为两个阶段:
1.标记阶段,将所有存活的对象进行标记。Java中使用可达性分析算法,从GC Root开始通过引用链遍历出所有存活对象。
2.清除阶段,从内存中删除没有被标记也就是非存活对象。
优点:实现简单,只需要在第一阶段给每个对象维护标志位,第二阶段删除对象即可。
缺点:
1.碎片化问题
由于内存是连续的,所以在对象被删除之后,内存中会出现很多细小的可用内存单元。如果我们需要的是一个比较大的空间,很有可能这些内存单元的大小过小无法进行分配。【外部碎片】
2.分配速度慢。O(n)
由于内存碎片的存在,需要维护一个空闲链表,极有可能发生每次需要遍历到链表的最后才能获得合适的内存空间。 如果链表很长,遍历也会花费较长的时间。
复制算法
-
复制性能效率低,不适合老年代【说内存不想一分为二】
复制算法的核心思想是:【新Form放存活对象,旧Form垃圾回收,To是中介,后面换名】
1.准备两块空间From空间和To空间,每次在对象分配阶段,只能使用其中一块空间(From空间)。
(对象A首先分配在From空间。)
2.在垃圾回收GC阶段,将From中存活对象复制到To空间。
(在垃圾回收阶段,如果对象A存活,就将其复制到To空间。然后将From空间直接清空。)
3.将两块空间的From和To名字互换。
(接下来将两块空间的名称互换,下次依然在From空间上创建对象。)
完整的复制算法的例子:
1.将堆内存分割成两块From空间 To空间,对象分配阶段,创建对象。
2.GC阶段开始,将GC Root搬运到To空间
3.将GC Root关联的对象,搬运到To空间
4.清理From空间,并把名称互换
优点:
-
吞吐量高,复制算法只需要遍历一次存活对象复制到To空间即可。
-
比标记-整理算法少了一次遍历的过程,因而性能较好
-
但是不如标记-清除算法,因为标记清除算法不需要进行对象的移动
-
-
不会发生碎片化,复制算法在复制之后就会将对象按顺序放入To空间中,所以对象以外的区域都是可用空间,不存在碎片化内存空间。
缺点:
-
内存使用效率低,每次只能让一半的内存空间来为创建对象使用。
-
不适合老年代:如果存活对象数量比较大,复制性能会变得很差【老年代存活的多,把那么多复制很费事,所以适合新生代】
标记整理算法
【比复制算法多一次遍历】
标记整理算法也叫标记压缩算法,是对标记清理算法中容易产生内存碎片问题的一种解决方案。+ 提高内存使用率
核心思想分为两个阶段:
1.标记阶段,将所有存活的对象进行标记。Java中使用可达性分析算法,从GC Root开始通过引用链遍历出所有存活对象。
2.整理阶段,将存活对象移动到堆的一端。清理掉存活对象的内存空间。
优点:
-
内存使用效率高,整个堆内存都可以使用,不会像复制算法只能使用半个堆内存
-
不会发生碎片化,在整理阶段可以将对象往内存的一侧进行移动,剩下的空间都是可以分配对象的有效空间
缺点:
整理阶段的效率不高,整理算法有很多种,比如Lisp2整理算法需要对整个堆中的对象搜索3次,整体性能不佳。可以通过Two-Finger、表格算法、ImmixGC等高效的整理算法优化此阶段的性能。
-
由于多了整理这一步,因此效率也不高,适合老年代这种垃圾回收频率不是很高的场景。
分代GC垃圾回收算法
【目前都在使用的算法】
分代GC算法将堆分成年轻代和老年代主要原因有:【降低垃圾回收对系统的影响】
1、可以通过调整年轻代和老年代的比例来适应不同类型的应用程序,提高内存的利用率和性能。
2、新生代和老年代使用不同的垃圾回收算法,新生代一般选择复制算法【不会有内存碎片,吞吐量比标记算法高】,老年代可以选择标记-清除和标记-整理算法,由程序员来选择灵活度较高。
3、分代的设计中允许只回收新生代(minor gc),如果能满足对象分配的要求就不需要对整个堆进行回收(full gc),STW时间就会减少。【吞吐量增大。因为FullGC耗时长】避免FullGC
比如在新生代中,每次收集都会有大量对象死去,所以可以选择”标记-复制“算法,只需要付出少量对象的复制成本就可以完成每次垃圾收集。
而老年代的对象存活几率是比较高的(需要回收的少),而且没有额外的空间对它进行分配担保,所以我们必须选择“标记-清除”或“标记-整理”算法进行垃圾收集。
现代优秀的垃圾回收算法,会将上述描述的垃圾回收算法组合进行使用,其中应用最广的就是分代垃圾回收算法(Generational GC)。
分代垃圾回收将整个内存区域划分为年轻代和老年代:【这种设计的本质原因:灵活调整、适应不同场景】
-
伊甸园:上帝创造亚当和夏娃的地方,代表对象刚创建会放到到这里边
-
幸存区:实现复制算法的
我们通过arthas来验证下内存划分的情况:
在JDK8中,添加-XX:+UseSerialGC
参数使用分代回收的垃圾回收器,运行程序。
在arthas中使用memory
命令查看内存,显示出三个区域的内存情况。
Eden + survivor 这两块区域组成了年轻代。
tenured_gen指的是晋升区域,其实就是老年代。
还可以选择的虚拟机参数如下。注意加上-XX:+UseSerialGC
【因为每种垃圾回收算法都有独特的设计】
垃圾回收过程
【From存什么?】
1、分代回收时,创建出来的对象,首先会被放入Eden伊甸园区。
2、随着对象在Eden区越来越多,如果Eden区满,新创建的对象已经无法放入,就会触发年轻代的GC,称为Minor GC或者Young GC。
Minor GC会把eden中和From需要回收的对象回收,把没有回收的对象放入To区。
3、接下来,S0会变成To区,S1变成From区。当eden区满时再往里放入对象,依然会发生Minor GC。【复制算法】
此时会回收eden区和S1(from)中的对象,并把eden和from区中剩余的对象放入S0。【此时s0放不下的话应该会直接放到老年代区,不管年龄】
注意:每次Minor GC中都会为对象记录他的年龄,初始值为0,每次GC完加1。
4、如果Minor GC后对象的年龄达到阈值(最大15,默认值和垃圾回收器有关),对象就会被晋升至老年代。【代表存活时间长】
当老年代中空间不足,无法放入新的对象时,先尝试minor gc如果还是不足【是看平均晋升大小有没有超出老年代剩余空间 】,就会触发Full GC,Full GC会对整个堆进行垃圾回收。
Full GC之前并不一定会再次进行一次Minor GC。因为FullGC会回收整个堆
因为被放入老年代·的未必是达到15这个年龄,有可能年轻代满了之后minorGC还是回收不了,就只能放老年代了
伊甸园满了--》回收---》to区放不下--》放入老年代
如果Full GC依然无法回收掉老年代的对象,那么当对象继续放入老年代时,就会抛出Out Of Memory异常。
Full GC无法回收掉老年代的对象,那么当对象继续放入老年代时,就会抛出Out Of Memory异常。
空间分配担保
JDK 6 Update 24 之前,在发生 Minor GC 之前,虚拟机必须先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那这一次 Minor GC 可以确保是安全的。如果不成立,则虚拟机会先查看
-XX:HandlePromotionFailure
参数的设置值是否允许担保失败(Handle Promotion Failure);如果允许,那会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试进行一次 Minor GC,尽管这次 Minor GC 是有风险的;如果小于,或者-XX: HandlePromotionFailure
设置不允许冒险,那这时就要改为进行一次 Full GC。JDK 6 Update 24 之后的规则变为只要老年代的连续空间大于新生代对象总大小或者历次晋升的平均大小,就会进行 Minor GC,否则将进行 Full GC。