一、什么是 JVM?
JVM 是 Java Virtual Machine 的简称,意为 Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统。可以认为 JVM 是一台被定制过的现实当中不存在的计算机,Java程序最终是在JVM(Java虚拟机)中运行的。
二、JVM 的执行流程
三、JVM 运行时数据区
堆(Heap):是Java程序中最大的一块内存区域,用于存储使用
new
关键字创建的对象实例和数组对象。栈(Stack):为每个线程分配单独的栈空间,主要用于存储方法调用时的栈帧、局部变量等。
方法区(Method Area):主要用于存储类的结构信息(类对象)、方法元信息、常量池、静态变量等。
程序计数器(Program Counter Register):每个线程都有一个独立的程序计数器,用于存储当前线程正在执行的指令地址或下一条即将执行的指令地址。
四、JVM 类加载机制
1、类加载过程
程序要想运行,就要把依赖的“指令和数据”加载到内存中,这里主要体现为将 .class
文件加载到内存中的过程。总结为5个词就是:
- 加载:它通过类加载器(ClassLoader)查找并读取类的字节码文件,将其加载到内存中。加载过程中会生成一个代表该类的Class对象,用于后续操作。
- 验证:
.class
文件具有明确的数据格式 - 准备:正式为类中定义的变量(即静态变量,被static修饰的变量)分配内存并设置类变量初始值的阶段。
- 解析:是 Java 虚拟机将常量池内的符号引用替换为直接引用的过程,也就是初始化常量的过程。
- 初始化:主要初始化静态成员、执行静态代码块、加载父类(如果存在父类)等过程。
2、双亲委派模型
在 “加载” 这个过程中涉及到类加载器的概念,JVM 中内置了三个类加载器,构成“双亲委派模型:
BootStrap ClassLoader
:负责加载 Java 标准库中的类Extension ClassLoader
:负责加载 Sun、Oracle拓展库的类Application ClassLoader
:负责加载项目中自定义类以及第三方库中的类
如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最 终都应该传送到最顶层的类加载器中,只有当父加载器反馈自己无 法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去完成加载。直到在某一层加载完成进入下一环节,如果始终没有找到,则抛出异常:ClassNotFoundException
五、JVM 垃圾回收策略
JVM垃圾回收(Garbage Collection)主要用于回收不再被程序引用的内存对象。而对象又是存储在堆内存上的,因此CG的主要目标就是 堆
,并且 CG 是以 对象
为单位进行释放的。至于其他内存区域:
栈:方法调用完毕,方法的栈帧、局部变量就随着出栈操作销毁了。整个栈也是随着线程一起销毁。
方法区:主要存储类对象,很少涉及“卸载”操作。
程序计数器:只是是一个单纯的地址整数,随着线程一起销毁。
1、死亡对象的判断算法
Java堆中存放着所有的对象实例,垃圾回收器在对堆进行垃圾回收前,首先要判断这些对象哪些还存活,哪些已经"死去"。判断对象是否已"死"有主要有如下 2 种算法:
(1)引用计数算法
给对象增加一个引用计数器,每当有一个地方引用它时,计数器就+1;当引用失效时,计数器就-1;任何时刻计数器为0的对象就是不能再被使用的,即对象已"死"。
使用引用计数法判断对象存活的思想很简单,一般情况下判定效率也比较高,但是 引用计数法无法解决对象的循环引用问题。
(2)可达性分析法(Java 采取的方案)
把对象中的引用关系理解为一个树形结构,通过一系列称为"GC Roots"的对象作为起始点,从这些节点开始向下搜索,只要能遍历到的对象都是可达的,否则证明此对象是不可用的。
这里的GC Roots包含以下几种:
- 栈上引用的对象
- 方法区中常量池中引用的对象
- 方法区中静态成员引用的对象
虽然可达性分析解决了引用计数法中的 循环引用 问题,但是搜索的过程可能会消耗更多的时间,并且为了防止在搜索的过程中引用关系发生变化,会让一些业务线程暂停工作,也就是产生STW(Stop-The-World)问题。
2、垃圾回收算法
(1)标记清除
"标记-清除"算法是最基础的垃圾回收算法。算法分为"标记"和"清除"两个阶段 : 首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
标记清除算法最大的问题是会产生 内存碎片。一般在申请内存时,往往是申请整块连续的空间,而内存碎片会导致空间利用率大打折扣。
(2)复制算法
它将
整个可用内存
按容量划分为大小相等的两块,每次只使用其中的一块。当这块内存需要进行垃圾回收时,会将此区域还存活着的对象复制到另一块上面,然后再把已经使用过的内存区域一次清理掉。这样做的好处是每次都是对整个半区进行内存回收,内存分配时也就不需要考虑内存碎片等复杂情况。
这种算法的缺陷是内存空间的利用率比较低,将最大可用空间减为原来的一般。并且如果可用内存中垃圾很少,需要保留的对象很多,此时复制成本就比较高,效率就会变低。
(3)标记整理
标记整理也可以解决内存碎片的问题,总体思路类似于顺序表删除中间元素,每次将存活对象都向一端移动,然后直接清理掉端边界以外的内存。
标记整理算法,由于每次需要挪动,因此导致效率降低。
(4)分代回收(JVM 采用)
分代算法是通过区域划分,实现不同区域(阶段)采用不同的垃圾回收策略。大量的经验表明,Java对象大多都具备朝 生夕灭的特性,一般经过一轮扫描就有大量新生代对象死去,如果一个对象存活的时间很长了,那么经验表明他将会持续存活更长的时间。
- 新建的对象,会放到伊甸区。当垃圾回收扫描到伊甸区后,绝大部分对象会在第一轮 GC 中被干掉。
- 如果伊甸区的对象熬过第一轮 GC,会通过复制算法,将存活的对象拷贝到生存区。
- 生存区分为两部分,大小相等,一次使用一半,垃圾回收扫描到生存区,发现垃圾,就使用复制算法,将仍然存活的对象复制到生存区的另一半。
- 当生存区的对象熬过若干轮 GC 后,认为年龄增长到一定程度,则进入老年区,会通过复制算法将其拷贝到老年代。
- 进入老年代的对象,一般都是存活时间较长的对象,死亡的概率就比新生代中小了很多,因此针对老年代的 GC 频率就会降低很多。如果某次扫描发现老年代中某个对象是垃圾,则直接使用标记整理的方式删除。
- 特殊情况:如果某个对象非常大,则直接进入老年代。因为大对象进行复制算法成本比较高,并且大对象不会有很多。
六、Java 虚拟机中的垃圾收集器(了解)
Java虚拟机中的三个垃圾收集器是基于以上算法的具体实现,通常会基于以上做出一些改进和优化。这里主要列举了两个:
- CMS(Concurrent Mark-Sweep)垃圾收集器:CMS是一种旨在减少应用程序停顿时间的垃圾收集器。它采用并发标记-清除算法,允许在大部分清除过程中应用程序继续运行。
- G1(Garbage-First)垃圾收集器:G1是一种面向服务端应用程序的垃圾收集器,旨在提供可控制的停顿时间和高吞吐量。它使用分代、区域化的垃圾回收策略,可以更精确地控制停顿时间。