什么是JVM?
JVM 本质上是一个运行在计算机上的程序,他的职责是运行Java字节码文件。
JVM的功能
1.解释和运行:对字节码文件中的指令实时的解释成机器码让计算机执行。
2.内存管理:自动为对象、方法等分配内存,自动的垃圾回收机制。
3.即时编译:对热点代码进行优化,提升执行效率,回收不再使用的对象。
常见的JVM
Hotspot(OracleJDK版):闭源、使用最广泛,稳定可靠,社区活跃JIT支持OracleJDK默认虚拟机。
HotSpot(OpenJDK版):同上,开源,OpenJDK默认虚拟机,适用于对JDK有二次开发需求。
GraalVM:多语言支持高性能、JIT、AOT支持,适用于微服务、云原生架构需要多语言混合编程。
DragonwellJDK(龙井):基于OpenJDK的增强高性能、bug修复、安全性提升JWarmup、ElasticHeap、Wisp特性支持,适用于电商、物流、金融领域对性能要求比较高。
Eclipse Openj9(原IBMJ9):高性能、可扩展JIT、AOT特性支持,适用于微服务、云原生架构。
虚拟机的组成
类加载器(ClassLoader):加载class字节码文件中的内容到内存中。
运行时的数据域(JVM管理的内存):负责管理JVM使用到的内存,比如创建对象和销毁对象。
执行引擎(即时编译器,解释器,垃圾回收器等):将字节码文件中的指令解释成机器码,同时使用即时编译器优化性能。
本地接口:调用本地已经编译的方法,比如虚拟机中提供的c/c++的方法。jdk中用native修饰的方法。
字节码文件的组成
基础信息
Magic魔数⚫ 文件是 无法通过文件扩展名 来确定文件类型的,文件扩展名可以随意修改,不影响文件的内容。⚫ 软件使用文件的头几个字节(文件头)去校验文件的类型,如果软件不支持该种类型就会出错。⚫ Java字节码文件中,将文件头称为 magic魔数主副版本号⚫ 主副版本号指的是编译字节码文件的 JDK 版本号, 主版本号用来标识大版本号,JDK1.0-1.1使用了 45.0-45.3,JDK1.2是46之后每升级一个大版本就加1;副版本号是当主版本号相同时作为区分不同版本的标识,一般只需要关心主版本号。⚫ 版本号的作用主要是判断当前字节码的版本和运行时的 JDK 是否兼容。访问标识标识是类还是接口、注解、枚举、模块标识public final abstract类、父类、接口索引通过这些索引可以找到类、父类、接口的信息
常量池
⚫ 字节码文件中常量池的作用:避免相同的内容重复定义,节省空间。⚫ 常量池中的数据都有一个编号,编号从1开始。在字段或者字节码指令中通过编号可以快速的找到对应的数据。⚫ 字节码指令中通过编号引用到常量池的过程称之为 符号引用 。
字段
⚫当前类或接口声明的字段信息
方法
当前类或接口声明的方法信息 、字节码指令
⚫ 字节码中的方法区域是存放字节码指令的核心位置,字节码指令的内容存放在方法的Code属性中。
属性
⚫类的属性,比如源码的文件名 、内部类的列表等
字节码常用工具
javap -v命令
⚫ javap是JDK自带的反编译工具,可以通过控制台查看字节码文件的内容。 适合在服务器上查看字节码文件内容。⚫ 直接输入javap查看所有参数。⚫ 输入 javap -v 字节码文件名称 查看具体的字节码信息。(如果jar包需要先使用 jar –xvf 命令解压)
jclasslib插件
安装插件之后,选中需要查看的类,点击Show Bytecode With JclassLib就可以查看字节码文件。
阿里arthas
⚫ Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,大大提升线上问题排查效率。⚫ dump 类的全限定名:dump已加载类的字节码文件到特定目录。⚫ jad 类的全限定名: 反编译已加载类的源码
类的生命周期
加载
⚫加载(Loading)阶段第一步是 类加载器 根据类的全限定名通过不同的渠道以二进制流的方式获取字节码信息。 程序员可以使用Java代码拓展的不同的渠道。⚫ 2、类加载器在加载完类之后,Java虚拟机会将字节码中的信息保存到方法区中。⚫ 3、类加载器在加载完类之后,Java虚拟机会将字节码中的信息保存到内存的方法区中。生成一个InstanceKlass对象,保存类的所有信息,里边还包含实现特定功能比如多态的信息。⚫ 4、同时,Java虚拟机还会在堆中生成一份与方法区中数据类似的java.lang.Class对象。作用是在Java代码中去获取类的信息以及存储静态字段的数据(JDK8及之后)。⚫ 对于开发者来说,只需要访问堆中的Class对象而不需要访问方法区中所有信息。这样Java虚拟机就能很好地控制开发者访问数据的范围。
⚫ 推荐使用 JDK自带的hsdb 工具查看Java虚拟机内存信息。工具位于JDK安装目录下lib文件夹中的sa-jdi.jar中。⚫ 启动命令:java -cp sa-jdi.jar sun.jvm.hotspot.HSDB添加一个进程,获取内存中的对象
连接
验证:检验内容是否满足《Java虚拟机规范》⚫ 连接(Linking)阶段的第一个环节是验证,验证的主要目的是检测Java字节码文件是否遵守了《Java虚拟机规范》中的约束。 这个阶段一般不需要程序员参与。⚫ 主要包含如下四部分,具体详见《Java虚拟机规范》:1.文件格式验证,比如文件是否以0xCAFEBABE开头,主次版本号是否满足当前Java虚拟机版本要求。2.元信息验证,例如类必须有父类(super不能为空)。3.验证程序执行指令的语义,比如方法内的指令执行到一半强行跳转到其他方法中去。4.符号引用验证,例如是否访问了其他类中private的方法等准备:给静态变量赋初值⚫ 准备阶段为静态变量(static)分配内存并设置初始值⚫ 准备阶段只会给静态变量赋初始值,而每一种基本数据类型和引用数据类型都有其初始值。⚫ final修饰的基本数据类型的静态变量,准备阶段直接会将代码中的值进行赋值。解析:将常量池中的符号引用换成指向内存的直接引用⚫ 解析阶段主要是将常量池中的符号引用替换为直接引用。⚫ 符号引用就是在字节码文件中使用编号来访问常量池中的内容。⚫ 直接引用不再使用编号,而是使用内存中地址进行访问具体的数据。
初始化
⚫ 初始化阶段会执行 静态代码块中的代码 ,并 为静态变量赋值 。⚫ 初始化阶段会执行字节码文件中 clinit 部分的字节码指令。⚫ 以下几种方式会导致类的初始化:1.访问一个类的静态变量或者静态方法,注意变量是final修饰的并且等号右边是常量不会触发初始化。2.调用Class.forName(String className)。3.new一个该类的对象时。4.执行Main方法的当前类。⚫ clinit指令在特定情况下不会出现,比如:如下几种情况是不会进行初始化指令执行的。1.无静态代码块且无静态变量赋值语句。2.有静态变量的声明,但是没有赋值语句。3.静态变量的定义使用final关键字,这类变量会在准备阶段直接进行初始化。⚫ 直接访问父类的静态变量,不会触发子类的初始化。⚫ 子类的初始化clinit调用之前,会先调用父类的clinit初始化方法。注:数组的创建不会导致数组中元素的类进行初始化final修饰的变量如果赋值的内容需要执行指令才能得出结果,会执行clinit方法进行初始化。
使用(见后文)
卸载(见后文)
一些字节码指令
iconst_0 将操作数0放入操作数栈
istore_1 从操作数栈去除放入局部变量表1号位置
iload_1 将局部变量量表1中的数放入操作数栈
iadd 将操作数栈顶部的两个 数据进行累加,结果放入栈中
iinc 1 by 1 在局部变量表1号位置 增加1putstatic #2 <init/Demo.value : I> 从操作数栈中获取值 设置到静态变量中
一些代码的字节码
注:clinit方法中的执行顺序与Java中编写的顺序是一致的。
代码1
int i = 0;
i = i++;
System.out.println(i);
字节码1
代码2
int i = 0;
i = ++i;
System.out.println(i);
字节码2
代码3
int i = 0;
i = i + 1;
System.out.println(i);
字节码3
代码4
public static int value = 1;
static{value = 2;
}
字节码4
代码5
static{value = 2;
}
public static int value = 1;
字节码5