文章目录
- 一、JVM 运行流程
- 二、虚拟机栈(线程私有)
- 三、本地方法栈 (线程私有)
- 四、方法区(元数据区)
- 五、堆(线程共享)
- 六、程序计数器(线程私有)
一、JVM 运行流程
JVM 是 Java 程序的运行基础和运行环境,同时也是 Java 实现 "一次编译,到处运行"
的关键所在。因此,深入了解 JVM 对于学习和理解 Java 编程语言是至关重要的,那么JVM 到底是如何运行的呢?
下面这张图片展示了 JVM 的基本运行过程:
JVM的执行过程涉及以下主要组成部分::
-
Java 代码转换为字节码(
.class
文件):编写完成后的 Java 源代码需要通过 Java 编译器编译为字节码,生成.class
文件,这些文件包含了 Java 程序的中间代码。 -
类加载器(ClassLoader):JVM 的类加载器负责将
.class
字节码文件加载到内存中的运行时数据区
。类加载器根据类的全限定名(Fully Qualified Name)查找并加载对应的字节码文件,并根据文件内容创建 Class 对象来代表这个类,以供后续的执行引擎调用。 -
运行内存管理:JVM负责管理程序运行时的内存区域,主要包括以下几个区域:
- 虚拟机栈(Java Virtual Machine Stacks):用于存储方法调用的栈帧,包含局部变量、操作数栈等。
- 本地方法栈(Native Method Stacks):用于执行本地方法的栈。
- 方法区(Method Area):存储类的结构信息、常量池、静态变量等。
- 堆(Heap):存储对象实例和数组的内存区域。
- 程序计数器(Program Counter):记录当前线程执行的字节码指令的地址或索引。
-
执行引擎(Execution Engine):执行引擎是 JVM 的核心组件之一,负责执行加载到内存中的字节码文件。执行引擎有两种方式执行字节码:
- 解释执行:逐条解释字节码指令并执行相应的操作。解释执行效率较低,但跨平台性好,适用于刚开始执行的代码段或是执行次数较少的代码段。
- 编译执行:将字节码编译成特定平台的本地代码,然后交由CPU执行。编译执行效率高,但需要额外的编译时间,适用于执行次数频繁的代码段。
-
本地方法库(Native Libraries):JVM 中的 Java 代码无法直接访问底层操作系统,因为字节码只是一套跨平台的指令集规范。当 Java 代码需要执行底层操作系统或与本地代码(如C、C++)进行交互的时候。就需要通过本地方法库来实现这些功能。本地方法库允许 Java 程序调用与操作系统相关的本地代码,从而实现整个程序的功能。
以上就是 JVM 的主要运行过程以及运行时涉及的组成部分,下文是对其中的运行时数据区的详细介绍。
二、虚拟机栈(线程私有)
虚拟机栈是 Java 线程私有的内存区域,用于存储线程的方法调用和局部变量等信息。虚拟机栈的生命周期和线程相同,虚拟机栈描述的是 Java 方法执行的内存模型:
- 每个方法在执行的时候都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。
- 当方法结束的时候,响应的栈帧也会因为出栈而销毁。
虚拟机栈主要包含四个部分:
- 局部变量表:用于存储方法的局部变量。在Java方法执行时,它会分配一块内存区域,用于存储方法参数和方法内部定义的局部变量。局部变量表的大小在编译期间就被确定,存储的数据类型包括基本数据类型和对象引用。
- 操作栈:用于执行方法时的计算操作。Java虚拟机的字节码指令通常都是基于操作数栈进行运算的。当一个方法被调用时,会将参数值和返回值等压入操作数栈,在方法执行时,字节码指令会从操作数栈中取值进行计算。
- 动态链接:用于指向运行时常量池中该栈帧所属方法的引用。在Java虚拟机的运行时常量池中,存放着每个类的方法的符号引用,动态链接将这些符号引用与实际内存地址进行关联。
- 方法返回地址:用于指示方法的返回地址。当方法执行完成后,需要知道从哪里继续执行,方法返回地址就是用来记录返回的目标地址。
什么是线程私有:
- 线程私有是指在多线程环境下,每个线程都拥有自己独立的内存区域,其他线程无法直接访问或修改该区域。线程私有内存中的数据对于每个线程都是独立的,互不影响。这种设计使得多线程程序可以同时执行,每个线程都能够独立地运行和维护自己的数据。
- 在JVM中,
虚拟机栈
、本地方法栈
和程序计数器
是线程私有的内存区域。每个线程都有自己的虚拟机栈和本地方法栈,用于支持方法调用和执行,并且这些栈的数据对其他线程是不可见的。程序计数器也是线程私有的,每个线程都有自己的程序计数器,用于指示当前线程执行的字节码指令的地址或索引。线程的切换时,会保存和恢复程序计数器的值,以保证线程切换后能正确继续执行。- 其他共享内存区域如
堆
和方法区(元空间)
是线程共享的。堆用于存储Java对象实例和数组,方法区用于存储类的结构信息、常量池、静态变量等。多个线程可以共同访问堆和方法区的数据,因此在多线程环境下,需要通过同步机制来保护共享数据的一致性和正确性。- 内存区域按线程私有和共享的划分:
三、本地方法栈 (线程私有)
本地方法栈与虚拟机栈类似,也是 Java 线程私有的内存区域。它用于支持 Java 程序调用和执行本地方法(Native Method)。本地方法是使用其他语言(如C、C++)编写的方法,通过本地方法接口(JNI,Java Native Interface)与 Java 代码进行交互。本地方法栈和虚拟机栈在功能上也是类似的,但它们分别用于 Java 方法和本地方法的调用。
四、方法区(元数据区)
方法区是 Java 线程共享的内存区域,用于存储类的结构信息、常量池、静态变量、即时编译器编译后的代码等。在 JDK 8 及以前版本,方法区是永久代(Permanent Generation)
;而在 JDK 8 及以后版本,方法区被替换为元空间(Metaspace)
。方法区的大小可以通过启动JVM 时的参数来设置。
在《Java虚拟机规范中》把此区域称之为 “方法区”,而在 HotSpot 虚拟机的实现中,在 JDK 7 时此区域叫做永久代(Permanent Generation),JDK 8 中叫做元空间(Metaspace)。
JDK 1.8 元空间的变化:
- 对于 HotSpot 来说,JDK 8 元空间的内存属于本地内存,这样元空间的大小就不在受 JVM 最大内存的参数影响了,而是与本地内存的大小有关。
- JDK 8 中将字符串常量池移动到了堆中。
运行时常量池:
运行时常量池(Runtime Constant Pool)是方法区的一部分,用于存放在编译期间生成的各种字面量和符号引用。它是在类加载过程中,由虚拟机根据字节码文件中的常量池表构建而成。
在运行时常量池中,主要包含两种类型的数据:
-
字面量:
- 字符串字面量:即Java程序中直接写的字符串值,例如:“Hello, Java”。在JDK 8中,字符串字面量被移动到堆中,这样它们也可以被垃圾收集器回收,避免了一些内存问题。
final
常量:在编译期间可以确定的final
常量,例如:final int MAX_VALUE = 100;
。- 基本数据类型的值:例如:整数、浮点数、字符等基本数据类型的字面量。
-
符号引用:
符号引用是一种在编译期间产生的、但在类加载阶段需要用到的一种数据结构,它用于描述被引用的目标。符号引用包括:- 类和接口的完全限定名:例如:
java.lang.String
。 - 字段的名称和描述符:用于描述字段的名称和数据类型,例如:
int count
。 - 方法的名称和描述符:用于描述方法的名称和参数列表以及返回值类型,例如:
void print(String message)
。
- 类和接口的完全限定名:例如:
运行时常量池在类加载后,会存放在方法区中,并且在整个类的生命周期中存在,与类本身一起被回收。它在程序运行时提供了常量池解析、动态链接、方法调用等功能,为 Java 程序的执行提供了必要的支持。
五、堆(线程共享)
堆(Heap)是 Java 虚拟机中的一个运行时数据区域,用于存储Java对象实例和数组。堆是JVM中最大的一块内存区域,也是唯一被所有线程共享的内存区域。
在Java程序运行过程中,当使用new
关键字创建对象时,对象实例会被分配在堆中。同时,数组也是对象,因此数组的元素也会存储在堆中。堆的大小可以在启动 JVM 时通过参数来指定,也可以动态调整(如果未指定大小,则JVM会根据系统内存自动设置初始大小)。
堆的主要特点包括:
-
线程共享:堆是所有线程共享的内存区域。所有线程都可以访问堆中的对象实例,这使得多个线程可以共同操作和共享对象。
-
动态分配和回收:堆的大小在程序运行时是可以动态调整的。当创建对象时,JVM会自动分配堆中的内存空间。当对象不再被引用时,垃圾收集器会自动回收堆中不再使用的对象的内存。
-
垃圾回收:堆中的内存由垃圾收集器负责管理。垃圾收集器会周期性地检查堆中的对象,将不再被引用的对象标记为垃圾,然后回收这些垃圾对象的内存,释放给堆供其他对象使用。
-
自动内存管理:Java 中的堆内存由 JVM 自动进行内存管理,程序员不需要手动释放内存。JVM 会自动进行垃圾回收,释放不再使用的内存,避免了内存泄漏等问题。
另外,在Java虚拟机的堆内存中,通常被划分为两个主要区域:新生代(Young Generation)
和老生代(Old Generation)
。
-
新生代(Young Generation):
新生代是存放新创建的对象的区域。在新生代中,通常会将堆内存划分为一个Eden空间和两个Survivor空间(通常称为S0和S1)。新创建的对象首先会被分配到Eden空间。当Eden空间满时,会触发Minor GC(Young GC),垃圾回收器会将Eden空间和其中还存活的对象复制到一个未使用的Survivor空间中。然后,垃圾回收器会清除Eden空间和正在使用的Survivor空间,将其中的垃圾对象回收。幸存下来的对象会被晋升到老生代。 -
老生代(Old Generation):
老生代是存放长时间存活的对象的区域。老生代中存放的对象通常是在新生代经过一定次数的Minor GC后仍然存活的对象,或者是大对象等。当老生代空间满时,会触发Major GC(Full GC),垃圾回收器会对整个堆进行回收,包括新生代和老生代的所有对象。
通过将堆内存分为新生代和老生代,并采用不同的垃圾回收策略,可以提高垃圾回收的效率。新生代中的Minor GC频繁进行,回收生命周期短的对象,尽可能快速地释放内存;而老生代中的Major GC则相对较少进行,回收生命周期长的对象,保证了老生代的稳定性和可靠性。
六、程序计数器(线程私有)
程序计数器也是 Java 线程私有的内存区域。它是一种指示器,用于指示当前线程执行的字节码指令的地址或索引
。在Java线程切换时,程序计数器的值会被保存和恢复,以保证线程切换后能正确继续执行。