JVM系列 | 垃圾收集算法

JVM系列 | 垃圾收集算法

文章目录

  • 前言
  • 如何判断对象已"死"?
    • 引用计数法
    • 可达性分析算法
    • 可达性分析2.0版 | 引用的增强
    • 对象的消亡过程
    • 回收方法区
      • 主要回收目标:
      • 回收操作
  • 垃圾收集算法
    • 分代收集理论 与 跨代引用假说
      • 分代收集理论
      • 跨带引用假说
    • 垃圾收集算法 | 标记清除算法
    • 垃圾收集算法 | 标记复制算法
      • 传统标记复制算法
      • 优化标记复制算法
      • 逃生门 | 提前养老
    • 垃圾收集算法 | 标记整理算法

前言

在上一篇文章《【JVM】对象的生命周期一 | 对象的创建与存储》中,我们已经介绍了对象的完整创建过程,既然有出生,那么必然有死亡。本文将会详细介绍对象的消亡-JVM的垃圾回收机制。

这两篇文章详细介绍了对象的生命周期,推荐联合观看。


如何判断对象已"死"?


引用计数法

JVM 并不是使用引用计数器来判断对象是否存活的,这是由于引用计数器有着非常大的缺点。

引用计数法非常的简单:在对象中添加一个引用计数器,每当有一个地方引用它,计数器的值就+1,当引用失效时,计数器-1。当计数器为0时,就代表没有地方引用它,它就可以被垃圾回收器清除掉。

想法很完美,但是,如果两个对象互相引用,那么即使这两个对象已经不存在其它的调用关系,也不会被垃圾收集算法清理掉,请看以下代码:

class Node {Node next;
}public class ReferenceCountingExample {public static void main(String[] args) {Node node1 = new Node();Node node2 = new Node();// 互相引用node1.next = node2;node2.next = node1;// 取消外部引用node1 = null;node2 = null;// 在引用计数垃圾回收器中,node1 和 node2 由于互相引用,// 引用计数永远不会变为0,它们不会被回收。}
}

以上代码中:

  1. 创建两个node对象,每个node对象的引用计数器为1
  2. 让他们的nextNode指向对方,现在互相引用,每个node的引用计数器是2
  3. 清除外部引用,也就是让node1/node2变为null,此时每个node的引用计数器是1
  4. 没有地方再引用node1/2了,但是node1/2还是无法正常退出

可达性分析算法

可达性分析算法从根对象(GC Roots)出发(注意根对象可以不止有一个,下面会有介绍),一级一级向下扫描,能被根对象直接或间接引用的对象就是存活对象(从根对象可达),与根对象没有任何关系的对象则为消亡的对象(根对象不可达)。

在这里插入图片描述

上图中:

  1. O2/O3/O4与根对象O1(间接)可达,那么在本次扫描中,该三个对象全部为存活
  2. O6与O7对象虽然与O5对象关联,但是O5对象并没有与根节点关联,因此O5/O6/O7对象全部消亡
  3. O8/O9对象虽然互相引用,但是也不例外,消亡

可达性分析2.0版 | 引用的增强

在Java 1.2之前,引用只有传统的实现方式:可达即存活、不可达即消亡。

但是在一些场景下,有一些对象存在能创造一定的价值,但是消亡了意义也不大,典型的例子就是缓存。缓存中存在的内容可能是一些大的对象,我们通过缓存可以加快程序的运行速度。但是如果缓存的内容太多,那么会严重影响JVM的运行速度,此时Java都跑不动了,还关心数据库读取什么的嘛?这个时候就可以释放掉这些引用内容。

为了解决这一问题,JDK引入了另外三种引用方式,分别如下:

  1. 强引用(经典引用 Strongly Reference)
  2. 软引用(Soft Reference)
  3. 弱引用(Weak Reference)
  4. 虚引用(Phantom Reference)
  • 强引用是最传统的“引用”的定义,是指在程序代码之中普遍存在的引用赋值,即类似“Object obj=new Object()”这种引用关系。无论任何情况下,只要强引用关系还存在,垃圾收集器就永远不会回收掉被引用的对象。

  • 软引用是用来描述一些还有用,但非必须的对象。只被软引用关联着的对象,在系统将要发生内存溢出异常前,会把这些对象列进回收范围之中进行第二次回收,如果这次回收还没有足够的内存,才会抛出内存溢出异常。在JDK 1.2版之后提供了SoftReference类来实现软引用。

  • 弱引用也是用来描述那些非必须对象,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生为止。当垃圾收集器开始工作,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK 1.2版之后提供了WeakReference类来实现弱引用。

  • 虚引用也称为“幽灵引用”或者“幻影引用”,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的只是为了能在这个对象被收集器回收时收到一个系统通知。在JDK 1.2版之后提供了PhantomReference类来实现虚引用。


对象的消亡过程

上文中我们已经确定了判断对象的消亡的方法,但是并不是一旦发现消亡对象之后就立刻进行清除,要清除一个对象至少要经过两次标记阶段。

阶段一:判定对象为不可达

阶段二:判断对象是否重写了finalize()方法(终结器方法),如有没有重写该方法,则直接进行垃圾回收/如果重写了该方法那么将会把该对象放在名为F-Queue队列中,并在稍后由虚拟机自动建立的、低调度优先级的Finalizer线程去执行它们的finalize()方法。这里所说的“执行”是指虚拟机会触发这个方法开始运行,但并不承诺一定会等待它运行结束(以防止执行缓慢或死循环等)。

阶段三:对F-Queue队列中的对象进行二次标记。此时会查看这些对象是否仍然不可达,如果不可达那么这些对象将会被垃圾回收器进行回收。

如过finalize方法中,有代码把该对象的引用重新赋值给某个静态变量或其他存活的对象(该对象又可达了),那么该对象将不会被垃圾回收掉。

可见,对象的消亡像是一个判刑的过程,如果对象一开始犯了错(不可达),那么就先要判断该对象有没有必要缓刑(重写finalize方法),然后JVM将不缓刑的对象直接死刑立即执行,将需要缓刑的对象关到一个单独的监牢里面,随后给缓刑的对象们一个"托关系"的机会,找到机会了就能活,没有机会就得消亡。


回收方法区

简单复习:方法区是用于存储已被虚拟机加载的类信息(类名、访问修饰符、父类、接口、字段、方法等)、常量、静态变量、即时编译器编译后的代码(字段的名称与描述符、方法的字节码、访问修饰符)等数据。方法区在JVM规范中是堆的一部分,但在实现上可以有不同的划分和管理方式。

对方法区的回收性价比很低,在Java堆中,对常规应用进行一次垃圾收集通常可以回收70%至99%的内存空间,方法区则远低于此。因此也有一些垃圾收集器没有实现对方法区的回收。


主要回收目标:

  1. 废弃的常量
  2. 不再使用的类型

回收操作

回收常量:比较简单,如果一个字符串"Jim.kk"进入到常量池但是又没有任何一个字符串对象值是它,那么他就可以被清理出去。

回收不再使用的类型:回收不再使用的类型比较麻烦,它要同时满足以下条件才能够允许被回收。而且并不一定会被回收,需要程序员使用参数控制。

  1. 该类所有的实例都已经被回收,也就是Java堆中不存在该类及其任何派生子类的实例。
  2. 加载该类的类加载器已经被回收,这个条件除非是经过精心设计的可替换类加载器的场景,如OSGi、JSP的重加载等,否则通常是很难达成的。
  3. 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。

启用条件:关于是否要对类型进行回收,HotSpot虚拟机提供了-Xnoclassgc参数进行控制,还可以使用-verbose:class以及-XX:+TraceClass-Loading、-XX:+TraceClassUnLoading查看类加载和卸载信息,其中-verbose:class和-XX:+TraceClassLoading可以在 Product版的虚拟机中使用,-XX:+TraceClassUnLoading参数需要FastDebug版[1]的虚拟机支持。

在大量使用反射、动态代理、CGLib等字节码框架,动态生成JSP以及OSGi这类频繁自定义类加载器的场景中,通常都需要Java虚拟机具备类型卸载的能力,以保证不会对方法区造成过大的内存压力。



垃圾收集算法


分代收集理论 与 跨代引用假说

分代收集理论

当我们使用引用可达算法扫描堆内存的时候,会发现大部分的对象都是朝生夕死的,存活时间可能根本不会超过一次垃圾收集。还有一些对象是长命百岁的,能一直活,很能活。

对于这种情况,垃圾收集器提出了新生代与老年代的概念:所有新创建的对象放在新生代中并定时进行扫描与垃圾回收,能挺过多次垃圾回收的对象将被放入老年代中,并在老年代中以更低的频率来回收该区域。这就同事兼顾了垃圾收集的时间开销和内存的空间利用。


跨带引用假说

对象与对象之间可能存在跨代引用,比如老年代引用新生代的对象,但是新生代的大部分都是朝生夕死的,所以跨代引用必定是小数(如果广泛存在的话则大部分新生代对象肯定都能存活很久),没有必要为了这一小部分跨带引用去扫描整个老年代,因此JVM建立了一个称为"记忆集"的数据结构(存储在新生代中),用来记录老年代的哪一块老年代的内存存在跨带引用,这样的话在扫描新生代时,只需要扫描一下这些被记录的老年代即可。

上图中,在第二个与第五个老年代的分片上存在跨代引用(分别是o7引用Y11/o20引用Y25),将这两个区域记录在记忆集中,随后在对新生代进行垃圾收集的时候,从记忆集中拿到两个老年代的内存区域并进行扫描,所以最终扫描对象除了所有新生代的对象以外,还包含(o5、o6、o7、o8、o17、o18、o19、o20)。

事实上并不只是跨老年代与新生代之间才存在跨代引用与记忆集,许多的分代或者分区的垃圾收集器中都存在跨代引用,比如近些年很火的G1收集器,没有明确的新生代与老年代,整个堆内存就是无数的小分区。


垃圾收集算法 | 标记清除算法

标记清除算法是最早出现的算法,在1960年有Lisp之父John McCarthy提出(当时还没有Java语言,不止是只有Java才有虚拟机与垃圾回收)。

标记清除算法分为两个步骤:1. 标记 2. 清除。可以对所有需要回收的对象做标记,随后统一清除掉;也可以对不需要回收的对象做标记,随后统一清除掉没有标记的对象。

标记回收算法有两个缺点:

  1. 是执行效率不稳定,如果Java堆中包含大量对象,而且其中大部分是需要被回收的,这时必须进行大量标记和清除的动作,导致标记和清除两个过程的执行效率都随对象数量增长而降低;
  2. 内存空间的碎片化问题,标记、清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致当以后在程序运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

在之前一篇文章《【JVM】对象的生命周期一 | 对象的创建与存储》中提到过使用空闲列表来记录堆内存中的空闲内存,随后在空闲内存中插入新对象的方式。这种方式就适用于标记清除算法,在一段时间使用后堆内存中会存在大量的空隙,造成很严重的内存浪费。


垃圾收集算法 | 标记复制算法

传统标记复制算法

标记复制算法又称为标记移动算法,它解决了标志清除算法中大量内存空间碎片的问题。

简单来说,标记复制算法就是将需要进行垃圾回收的区域分为两个部分(可以是新生代也可以是老年代),在创建新的对象的时候只使用其中的一半,在需要进行垃圾回收的时候,先对对象进行标记,然后将能存活的对象复制到另一半,当前区域的对象全部消亡(注意当前区域与目标区域不是新生代与老年代的区别)。

标记复制算法也有一个非常大的缺点:内存空间浪费,标记复制算法总有一半的内存空间是未被使用的。


优化标记复制算法

为了解决标记复制算法带来的巨大空间浪费问题,Andrew Appel针对具备“朝生夕灭”特点的对象,提出了一种更优化的半区复制分代策略,现在称为“Appel式回收”。

Appel(不是Apple哦)式回收采用一个大的Eden空间两个小的Survivor空间(Eden:Survivor通常为8:1),新建对象时将对象存放至Eden空间,进行垃圾回收时,扫描Eden空间与其中一块Survivor空间,并将存活的对象全部移动至另一块Survivor空间。

上一次垃圾回收存活的对象放在Survivor1中,本次垃圾回收扫描Eden空间与Survivor1空间,并将所有存活对象放入另一个Survivor2空间中,以此循环。


逃生门 | 提前养老

虽然朝生夕死大部分情况下可以消灭98%的对象,但是毕竟也会有特殊情况,万一那10%的Survivor无法存储本次GC可以存活下来的对象怎么办呢?Appel式垃圾回收提出了逃生门机制:

在通常情况下,对象进入老年代存在一个阈值,比如一个对象连续存活超过20次可以进入老年代。但是当触发逃生门机制的时候(Survivor无法存放全部存活对象),就会让一部分存活了一段时间但是还未达到阈值的对象提前进入老年代,这样可以保证Survivor空间的正常。

垃圾收集算法 | 标记整理算法

标记整理算法在需要GC时,会先标记所有对象,然后将不需要存活的对象从内容空间中剔除,给存活的对象整齐的复制到内存的开端。

标记整理算法相比于标记移动算法,节省了内存空间,但是移动所有的存活对象并更新所有引用是一件及其负重的操作,而且在这一阶段之内用户线程无法继续执行(否则可能会造成空引用等问题),因此这样的停顿被最初的虚拟机设计者描述为“Stop The World”(有点类似于时停的意思)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/45715.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《GroupViT: Semantic Segmentation Emerges from Text Supervision》论文解读

会议:CVPR 年份:2022 代码:https://github.com/NVlabs/GroupViT 研究背景与动机: 传统深度学习系统中,图像区域的Grouping通常是隐式通过像素级识别标签的自上而下监督来实现的。作者提出将Grouping机制重新引入深…

LeetCode热题100刷题12:20. 有效的括号、394. 字符串解码、739. 每日温度、155. 最小栈、139. 单词拆分

20. 有效的括号 class Solution { public:bool isValid(string s) {if(s.size()%2 !0)return false;stack<char> st;for(int i0;i<s.size();i) {if(s[i]( || s[i]{ || s[i][)st.push(s[i]);else if(st.empty() && (s[i]} || s[i]] || s[i])))return false;els…

MySQL 数据库(基础)- 约束

MySQL 数据库&#xff08;基础&#xff09;- 约束 概念&#xff1a;约束是作用于表中字段上的规则&#xff0c;用于限制存储在表中的数据。目的&#xff1a;保证数据库中数据的正确&#xff0c;有效性和完成性。分类&#xff1a; 注意&#xff1a;约束是作用在表中字段上的&am…

yoloV8导出engine模型

yoloV8导出engine模型 引言&#xff1a; 目的是TensorRT加速YOLO实例分割模型。 本博客记录达成此目的所需的步骤&#xff0c;及步骤中可能遇到的问题。 as follow&#xff1a; 1. 首先导出onnx模型的脚本命令&#xff1a; yolo export modelbest.pt formatonnx opset12 simpl…

[misc]-流量包-find the pass

提示&#xff1a;黑客抓到一段流量&#xff0c;找找管理员的密码是多少 直接追踪流发现pass flag ffb7567a1d4f4abdffdb54e022f8facd

【RNN练习】天气预测

&#x1f368; 本文为&#x1f517;365天深度学习训练营 中的学习记录博客&#x1f356; 原作者&#xff1a;K同学啊 一、环境及数据准备 1. 我的环境 语言环境&#xff1a;Python3.11.9编译器&#xff1a;Jupyter notebook深度学习框架&#xff1a;TensorFlow 2.15.0 2. 导…

2024的开放式耳机排行榜,看这六个耳机选购的小Tips

在选择适合散步聊天和听歌的耳机时&#xff0c;开放式耳机是一个很好的选择。相对于传统的入耳式耳机&#xff0c;开放式耳机不会过度隔离你与周围环境&#xff0c;这意味着你可以更自然地与朋友交流&#xff0c;并且更加安全地行走在路上。市面上有许多开放式耳机可供选择&…

01. Hibernate 教程简介

1. 前言 大家好&#xff01;本节课将和大家一起学习鼎鼎有名的 Hibernate 框架。 本节课程将向大家介绍&#xff1a; Hibernate 的功能 、特点&#xff1b;Hibernate 产生的背景&#xff1b;并初步探讨编写 Jdbc 框架的基础构建思路。 2. Hibernate 是什么&#xff1f; 简而…

尚硅谷js

原型模式 原型对象就是相当于java的static,所有实例对象可以直接用静态的属性或者方法 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title><script type"text/javascript&q…

3D工艺大师快速生成装配动画,驱动汽车工业装配流程革新

在现代制造业的一般生产流程中&#xff0c;车间装配环节是产品由蓝图迈向市场前至关重要的一道工序。随着产品结构的日益复杂化和个性化需求的不断增长&#xff0c;车间装配工作面临着前所未有的挑战。高精密度的装配要求、错综复杂的组件关系以及频繁变更的生产计划&#xff0…

Java单边表的局部翻转

反转链表 II 这是上一个翻转全部链表的进阶版&#xff0c;大家可以先去看我的上一篇博客 Java算法之单链表的全部翻转-CSDN博客 题目描述 给你单链表的头指针 head 和两个整数 left 和 right &#xff0c;其中 left < right 。请你反转从位置 left 到位置 right 的链表节…

在VSCode上创建Vue项目详细教程

1.前期环境准备 搭建Vue项目使用的是Vue-cli 脚手架。前期环境需要准备Node.js环境&#xff0c;就像Java开发要依赖JDK环境一样。 1.1 Node.js环境配置 1&#xff09;具体安装步骤操作即可&#xff1a; npm 安装教程_如何安装npm-CSDN博客文章浏览阅读836次。本文主要在Win…

使用 lmdeploy 部署 internlm/internlm2_5-7b-chat

使用 lmdeploy 部署 internlm/internlm2_5-7b-chat 0. 引言1. lmdeploy 性能2. lmdeploy 支持的模型3. 快速开始 0. 引言 LMDeploy 由 MMDeploy 和 MMRazor 团队联合开发&#xff0c;是涵盖了 LLM 任务的全套轻量化、部署和服务解决方案。 这个强大的工具箱提供以下核心功能&a…

webRtc架构与目录结构

整体架构 目录结构 webrtc Modules目录

Redis实践经验

优雅的Key结构 Key实践约定&#xff1a; 遵循基本格式&#xff1a;[业务名称]:[数据名]:id例&#xff1a;login:user:10长度步超过44字节&#xff08;版本不同&#xff0c;上限不同&#xff09;不包含特殊字符 优点&#xff1a; 可读性强避免key冲突方便管理节省内存&#x…

使用 Unstructured.io 和 Elasticsearch 向量数据库搜索复杂文档

作者&#xff1a;来自 Elastic Amy Ghate, Rishikesh Radhakrishnan, Hemant Malik 使用非结构化和 Elasticsearch 向量数据库为 RAG 应用程序提取和搜索复杂的专有文档 在使信息可搜索之前解析文档是构建实际 RAG 应用程序的重要步骤。Unstructured.io 和 Elasticsearch 在此…

mybatis动态传入参数 pgsql 日期 Interval ,day,minute

mybatis动态传入参数 pgsql 日期 Interval 在navicat中&#xff0c;标准写法 SELECT * FROM test WHERE time > (NOW() - INTERVAL 5 day)在mybatis中&#xff0c;错误写法 SELECT * FROM test WHERE time > (NOW() - INTERVAL#{numbers,jdbcTypeINTEGER} day)报错内…

CSS【详解】层叠 z-index (含 z-index 的层叠规则,不同样式的层叠效果)

仅对已定位的元素&#xff08; position:relative&#xff0c;position:absolute&#xff0c;position:fixed &#xff09;有效&#xff0c;默认值为0&#xff0c;可以为负值。 z-index 的层叠规则 z-index 值从小到大层叠 兄弟元素 z-index 值相同时&#xff0c;后面的元素在…

python | setup.py里有什么?

setup.py里有什么&#xff1f; 文章目录 setup.py里有什么&#xff1f;C/C扩展总结gcc/g的编译参数&#xff1a;Windows Visual StudioCmakesetup.py C/C扩展模块 为什么需要分发打包&#xff1f;Distutils一个简单的例子通用的 Python 术语 使用 Setuptools 构建和分发软件包源…

Android Gantt View 安卓实现项目甘特图

需要做一个项目管理工具&#xff0c;其中使用到了甘特图。发现全网甘特图解决方案比较少&#xff0c;于是自动动手丰衣足食。 前面我用 Python和 Node.js 前端都做过&#xff0c;这次仅仅是移植到 Android上面。 其实甘特图非常简单&#xff0c;开发也不难&#xff0c;如果我…