深入JVM:详解JIT即时编译器

文章目录

  • 深入JVM:详解JIT即时编译器
    • 一、序言
    • 二、基础概念
      • 1、何为JIT即时编译
      • 2、热点代码
    • 三、HotSpot内置的即时编译器
      • 1、C1编译器
      • 2、C2编译器
      • 3、分层编译
        • 3.1 协作流程
    • 四、常见JIT优化技术
      • 1、方法内联
      • 2、逃逸分析
        • (1)同步锁消除
        • (2)栈上分配
        • (3)标量替换
    • 五、后记


深入JVM:详解JIT即时编译器

一、序言

对于Java工程师而言,深入理解JVM(Java虚拟机)不仅是掌握Java程序运行机制的基础,也是提升系统性能、优化应用和解决复杂问题能力的重要一步,更是Java进阶之路的重中之重。

本文小豪将带大家认识JIT即时编译器,介绍主流HotSpot虚拟机内置的几款即时编译器,同时结合代码实例,着重讲解JIT优化手段,话不多说,我们直接进入正题。

二、基础概念

在之前,网上可能经常说Java语言的运行速度不如C或C++,Java运行速度慢主要是因为它是解释执行的,而C或C++是编译执行的,解释执行需要通过JVM虚拟机将字节码实时翻译成机器码(边翻译边执行),才能运行在操作系统上,这个过程会比编译执行慢。

但现在再说这个结论就不太对了,随着JIT即时编译技术的发展,性能差距正在逐步缩小,甚至在某些情况下,执行速度是优于C或C++的。

1、何为JIT即时编译

在Java程序执行过程中,主要依靠字节码指令来进行。这些字节码指令按照顺序逐行被实时翻译成机器码,以便于在操作系统上运行。当某些方法或代码块(它们都对应特定的字节码)被频繁调用时,这部分代码就被视为热点代码

JVM虚拟机会针对性的对这部分热点代码进行优化编译,将它们从字节码转换为本地机器码,然后将优化后的本地机器码缓存起来,后续再执行时可以直接从缓存中获取并运行,无需再次编译。

完成这个过程的编译器,就称为JIT即时编译器(Just In Time Compiler)。JIT即时编译器显著提升了Java的性能,缩小了与其它编译型语言运行速度的差距。

在这里插入图片描述

2、热点代码

热点代码是指在运行过程中被频繁执行的代码,被即时编译的热点代码有两种,分别是:

  • 被多次调用的方法
  • 被多次执行的循环体

而热点代码由热点探测进行发现,热点探测基于计数器,JVM虚拟机会为每个方法建立对应的计数器,统计方法的执行次数、方法内的循环次数等,如果计数器超过指定阈值,则标识其为热点代码。

方法调用计数器:统计方法被调用的次数

回边计数器:统计方法内循环体代码执行的次数

三、HotSpot内置的即时编译器

主流的HotSpot虚拟机内置了两个JIT编译器:C1(Client Compiler)编译器C2(Server Compiler)编译器,在常用的JDK 8版本中,C1和C2是相互协同工作的。

1、C1编译器

C1编译器注重启动时间和编译时间,编译速度较快,但优化程度相对较低。

C1的优化策略相对简单,也比较轻量级,比如方法内联、公共子表达式消除,C1编译器编译的代码的执行速度通常比C2编译器慢。

2、C2编译器

C2编译器侧重于深度优化,与C1正好相反,C2编译器的编译时间较长,但优化的程度较高。

C2的优化策略比较深度,会进行更高级的优化,比如逃逸分析等,C2编译器编译的代码的执行速度通常比C1编译器快。

C2编译器由于深度优化代码过于复杂,已经很难维护了,从JDK 10开始,Graal编译器已经代替了C2编译器,与C1编译器协同工作

3、分层编译

由于C1和C2编译器在优化方面有不同的侧重点:C1侧重编译速度,C2侧重深度优化。

从JDK 7开始,采用分层编译的方式,C1和C2相互协同,共同发挥作用,HotSpot虚拟机根据代码的运行性能动态的选择具体采用哪个编译器完成优化。

在分层编译中,整个优化过程分为五个层次,对应着不同的优化策略:

  • 第0层:解释器执行,开启Profiling性能监控功能
  • 第1层:C1编译器执行,不开启Profiling,执行不带Profiling功能的C1编译代码
  • 第2层:C1编译器执行,开启Profiling,仅执行带部分Profiling功能的C1编译代码(方法调用次数和循环次数)
  • 第3层:C1编译器执行,开启Profiling,执行带全部Profiling功能的C1编译代码
  • 第4层:C2编译器执行,执行C2编译代码

Profiling性能监控是指在程序执行过程中,收集程序执行的各项数据,包括方法调用次数、循环次数、类型转换等等,收集的数据越多,额外的性能开销越大。

第1层到第3层都是由C1编译器执行的,显然,第1层由于不开启Profiling,执行性能会高于第2层,同时第2层只收集少量数据,第2层的执行性能也会高于第3层(总体性能:第4层 > 第1层 > 第2层 > 第3层 > 第0层)

3.1 协作流程

在分层编译中,C1和C2编译器是相互协作的,它们都由各自独立的线程来处理编译任务,线程内部维护着任务队列,用来存放待编译的热点代码,具体协作流程如下:

  1. 默认情况下,热点方法首先会被第3层的C1编译器执行,当Profiling性能监控收集到的数值达到阈值,JVM会评估C1和C2的优化性能(字节码数较少等)
    • 若判定C1和C2的执行效率相当:交由第1层的C1编译器进行优化,停止Profiling监控,不再收集运行信息
    • 若判定C2执行效率相当优于C1:交由第4层的C2编译器进行深度优化
  2. C1线程忙碌时,会直接交由第4层的C2编译器进行深度优化
  3. C2线程忙碌时,会先交由第2层的C1编译器执行优化,进行信息的初步收集,待C2线程空闲时,再交由第3层的C1编译器执行

在这里插入图片描述

四、常见JIT优化技术

JIT即使编译器主要是通过方法内联逃逸分析两种技术来实现代码的优化。

1、方法内联

方法内联其实就是将被调用方法的字节码直接插入到调用该方法的地方,调用时减少了栈帧的创建销毁开销。

举个例子:

实际上JIT修改的是字节码指令,为便于理解,本文使用代码举例

// 方法内联
public double methodInlining() {double num1 = Math.random();double num2 = Math.random();// 等价于 -> double sum = num1 + num2double sum = add(num1, num2);return sum;
}public double add(double num1, double num2) {return num1 + num1;
}

在代码中,方法内联会将其中的add(num1, num2)方法转换为实际的num1 + num1,直接进行计算操作,避免了方法调用。

这里我们简单测试一下:

public static void main(String[] args) {long startTime = System.currentTimeMillis();JitTest demo = new JitTest();for (int i = 0; i < 1000000; i++) {demo.methodInlining();}long endTime = System.currentTimeMillis();System.out.println("执行耗时:" + (endTime - startTime));
}

测试代码也比较简单,循环调用百万次,统计总耗时。

首先我们测试不启用JIT优化下这段代码的执行耗时,禁用JIT优化只需要添加JVM参数-Xint即可,禁用后,控制台输出:

执行耗时:881

取消掉禁用参数-Xint,启用JIT优化,重新执行这段测试代码:

执行耗时:47

我们进一步验证一下add方法是否进行了方法内联优化,添加三个JVM参数-XX:+PrintCompilation -XX:+UnlockDiagnosticVMOptions -XX:+PrintInlining,打印JVM优化内容:

  • -XX:+PrintCompilation:输出被JIT编译的方法信息
  • -XX:+UnlockDiagnosticVMOptions:解锁用于诊断JVM的选项,默认关闭
  • -XX:+PrintInlining:打印内联方法

在这里插入图片描述

如图,大量方法都被内联,其中也包括我们自己写的methodInliningadd方法,并且同时打印出了方法对应的字节大小,我们发现这些被内联的方法字节数都比较小。

其实这是由于方法内联也有一点的限制,即字节数过大的方法体不会进行内联,具体限制如下:

  • 非热点代码:默认限制字节数小于35,可通过参数调整限制

    // 非热点代码的内联字节大小最大阈值
    -XX:MaxInlineSize=n
    
  • 热点代码:默认限制字节数小于325,可通过参数调整限制

    // 热点代码的内联字节大小最大阈值
    -XX:FreqInlineSize=n
    
  • 接口实现限制:若接口的实现方法数量超过3个,则不会被内联

2、逃逸分析

逃逸分析核心思想是判断方法内创建的对象是否会被外部所引用,当JIT编译器判断到对象在方法外部不会被引用,即该对象的生命周期被限定在当前方法执行期间,编译器就能采取多种优化措施,比如锁消除、标量替换和栈上分配。

(1)同步锁消除

同步锁消除旨在消除代码中的同步操作,若某个对象不会逃逸出当前方法,只在方法内部使用,则不存在线程安全问题,因为每个方法的栈都是私有的,JIT编译器就会消除该同步锁操作,提高程序的执行效率。

举个例子:

public void syncLockEliminate() {// 等价于 -> 不执行该同步锁synchronized (JitTest.class) {// 业务代码逻辑}
}public static void main(String[] args) {long startTime = System.currentTimeMillis();JitTest demo = new JitTest();for (int i = 0; i < 1000000; i++) {demo.syncLockEliminate();}long endTime = System.currentTimeMillis();System.out.println("执行耗时:" + (endTime - startTime));
}

这里启用和禁用JIT锁消除(禁用锁消除参数:-XX:-EliminateLocks)对应控制台输出的执行耗时分别为:

// 启用锁消除
执行耗时:143// 禁用锁消除
执行耗时:203
(2)栈上分配

栈上分配是将被创建的对象内存分配在栈上,而不是堆上,降低GC垃圾回收的频率。

举个例子:

static class UserInfo {// 姓名private String name;// 年龄private int age;public UserInfo() {}public UserInfo(String name, int age) {this.name = name;this.age = age;}
}// 栈上分配,不赋值对象属性
public static void createUser() {UserInfo user = new UserInfo();
}public static void main(String[] args) throws Exception {long startTime = System.currentTimeMillis();for (int i = 0; i < 1000000; i++) {createUser();}long endTime = System.currentTimeMillis();System.out.println("执行耗时:" + (endTime - startTime));
}

这里我们验证一下这个结论,我们在JVM参数上添加-XX:+PrintGC,输出GC日志信息,同时将堆内存空间设小一些:

-Xms10m -Xmn10m -XX:+PrintGC

首先默认启用JIT逃逸分析优化,控制台输出:

执行耗时:72

接着禁用逃逸分析优化,添加参数-XX:-DoEscapeAnalysis关闭逃逸分析,控制台输出:

[GC (Allocation Failure)  7679K->1041K(9216K), 0.0010975 secs]
[GC (Allocation Failure)  8721K->904K(9216K), 0.0006550 secs]
[GC (Allocation Failure)  8584K->840K(9216K), 0.0007822 secs]
执行耗时:103

关闭逃逸分析优化后,JVM执行了几次的GC垃圾回收。

(3)标量替换

标量替换是将需要被创建的对象拆解成独立的标量(对象内部的基本数据类型),方法执行时不创建该对象实例,而是直接创建它的成员变量代替它,这些成员变量作为该方法的局部变量被分配在栈上。

标量替换是针对栈上分配更进一步的优化技术,栈上分配只是将对象从堆上分配到栈上,而标量替换是将对象进行拆解,作为方法的局部变量被分配在栈上。

举个例子:

// 标量替换,赋值对象属性
public static void createUser() {// 等价于 -> String name = user.name = xiaohao;//          int age = user.name = 24UserInfo user = new UserInfo("xiaohao", 24);String userInfo = user.name + ":" + user.age;
}public static void main(String[] args) throws Exception {long startTime = System.currentTimeMillis();for (int i = 0; i < 1000000; i++) {createUser();}long endTime = System.currentTimeMillis();System.out.println("执行耗时:" + (endTime - startTime));
}

若JIT判断到UserInfo对象不会逃逸出当前方法,则会将UserInfo对象的nameage属性替换为两个局部变量,不进行创建UserInfo对象,避免在堆上分配对象实例。

控制台输出的执行耗时分别为:

// 启用逃逸分析
执行耗时:162// 禁用逃逸分析
执行耗时:203

五、后记

本文从JIT即时编译器基础概念开始介绍,着重讲解了常见的JIT优化技术,包括方法内联与逃逸分析,额外拓展了HotSpot虚拟机内置的C1、C2编译器及分层编译协作流程。

JIT即时编译器在运行时对Java字节码进行优化,极大地提升了Java程序的执行效率。不过也要求我们日常编写代码要注意一定的规范,让JIT发挥最大效果。比如控制方法的代码行数,避免写过长的代码方法,可以将复杂的逻辑拆分成多个小方法,提升方法内联的生效几率;另外也可以控制接口的实现数量,尽量不超过两个,降低方法内联的复杂度;以及注意在方法内创建对象时,尽量不让对象逃逸。

如果大家觉得内容有价值,不妨考虑点点赞,关注关注小豪,后续小豪将会继续更新其它Java相关文章,大家共同进步~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/860454.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构:栈和队列详解

栈 栈的概念 栈&#xff1a;一种特殊的线性表&#xff0c;其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端称为栈顶&#xff0c;另一端称为栈底。栈中的数据元素遵守先进后出LIFO&#xff08;Last In First Out&#xff09;的原则。大家可以理解为…

Day60 代码随想录打卡|回溯算法篇---组合

题目&#xff08;leecode T77&#xff09;&#xff1a; 给定两个整数 n 和 k&#xff0c;返回范围 [1, n] 中所有可能的 k 个数的组合。 你可以按 任何顺序 返回答案。 方法&#xff1a;本题最直观的解法是使用暴力for循环遍历法&#xff0c;根据k的大小定for循环的嵌套次数&…

Posix消息队列使用总结

Posix在线文档&#xff1a; The Single UNIX Specification, Version 2 (opengroup.org) Linux系统中提供了两种不同接口的消息队列&#xff1a; POSIX消息队列。POSIX为可移植的操作系统接口。System V消息队列。System V 是 AT&T 的第一个商业UNIX版本(UNIX System III)的…

[Python人工智能] 四十六.PyTorch入门 (1)环境搭建、神经网络普及和Torch基础知识

从本专栏开始,作者正式研究Python深度学习、神经网络及人工智能相关知识。前文讲解合如何利用keras和tensorflow构建基于注意力机制的CNN-BiLSTM-ATT-CRF模型,并实现中文实体识别研究。这篇文章将介绍PyTorch入门知识。前面我们的Python人工智能主要以TensorFlow和Keras为主,…

【Linux】进程间通信_4

文章目录 七、进程间通信1. 进程间通信分类systeam V共享内存消息队列信号量 未完待续 七、进程间通信 1. 进程间通信分类 systeam V共享内存 进程间通信的本质就是让不同进程看到同一份资源。而systeam V是通过让不同的进程经过页表映射到同一块内存空间&#xff08;操作系…

LED显示屏中什么是静态驱动?什么是扫描驱动?两者的区别是什么?

随着科技的飞速发展&#xff0c;LED显示屏作为现代信息显示技术的重要组成部分&#xff0c;正以其独特的优势引领着显示行业的革新。近日&#xff0c;LED显示屏市场呈现出蓬勃的发展态势&#xff0c;技术创新不断推动行业向前发展&#xff0c;让LED显示屏无论是在商场的广告牌、…

苏东坡传-读书笔记一

太守的官衙位于杭州中心&#xff0c;但是苏东坡却喜欢在较为富有诗意的地方办公。他往往在葛岭下面有十三间房子的寿星院办公&#xff0c;因为那里风光如画。看公文不在寒碧轩&#xff0c;就在雨奇堂。我们记得雨奇堂是从苏东坡西湖诗“山色空濛雨亦奇”而得名的。在这里&#…

04-Shell编程之正则表达式与文本处理器

4.1 正则表达式 4.1.1正则表达式概述 1.正则表达式的定义 正则表达式又称正规表达式&#xff0c;常规表达式。在代码中常简写为regex&#xff0c;regexp&#xff0c;或RE。正则表达式是使用一个字符来描述&#xff0c;匹配一系列符合某个句法规则的字符串&#xff0c;简单的…

【现代操作系统】什么是操作系统

1.前言 现代计算机系统由一个或多个处理器、主存、磁盘、打印机、键盘、鼠标、显示器、网络接口以及各种其他输入/输出设备组成。一般而言&#xff0c;现代计算机系统是一个复杂的系统。如果每位应用程序员都不得不掌握系统的所有细节&#xff0c;那就不可能再编写代码了。而且…

音视频入门基础:H.264专题(5)——FFmpeg源码中 解析NALU Header的函数分析

音视频入门基础&#xff1a;H.264专题系列文章&#xff1a; 音视频入门基础&#xff1a;H.264专题&#xff08;1&#xff09;——H.264官方文档下载 音视频入门基础&#xff1a;H.264专题&#xff08;2&#xff09;——使用FFmpeg命令生成H.264裸流文件 音视频入门基础&…

SpringBoot-在配置文件中使用Profile

Profile&#xff0c;译为“配置文件” 在这里的Spring Boot也是一样&#xff0c;我们可以配置很多个Profile&#xff0c;每个Profile都对应一整个完整的全局配置&#xff0c;激活哪个&#xff0c;那个对应的全局配置就生效&#xff0c;具体的配置&#xff1a; 1、properties格…

漏洞挖掘 | 记一次edusrc--轻松拿下中危信息泄露

1.前言 也是一次漏洞挖掘的思路分享 上次我们讲过了关于小程序方面的一些小思路&#xff0c;即关于抓包更改id号造成的一个信息泄露&#xff0c;但是在小程序上的信息泄露很难涉及到公民三要素这是一个痛点&#xff0c;今天就来分享一下一次edu挖掘时挖到的一个涉及公民三要素…

【讲师招募】PowerData 2024数字经济开源行

【讲师招募】PowerData 2024数字经济开源行 活动信息讲师招募往期活动回顾 活动信息 2023&#xff0c;社区经过一年的发展&#xff0c;凝聚起了一批热爱数据、热爱开源的伙伴。 2024&#xff0c;社区计划在全国十个城市举办"数字经济-城市开源行"活动&#xff0c;连…

2024年最新中级会计职称考试题库。

46.甲将一汇票背书转让给乙&#xff0c;但该汇票上未记载乙的名称。其后&#xff0c;乙在该汇票被背书人栏内记载了自己的名称。根据《票据法》的规定&#xff0c;下列有关该汇票背书与记载效力的表述中&#xff0c;正确的是&#xff08;&#xff09;。 A.甲的背书无效&#x…

Qt案例-ApplicationExamples-Calqlatr

项目 一个Qt Quick应用程序设计的横向和纵向设备&#xff0c;使用自定义组件&#xff0c;响应式布局和JavaScript的应用程序逻辑。 项目路径&#xff1a; Qt\Examples\Qt-6.7.1\demos 环境&#xff1a;Qt6.7.1 MSVC 2019 64位 项目目录&#xff1a; calqlatr--CMakeList.txt…

三、用户中心项目笔记----后端多环境实战+原始部署

后端多环境主要是修改&#xff1a; 依赖的环境地址 数据库地址 缓存地址 消息队列地址 项目端口号 服务器配置 后端怎么去区分不同的环境&#xff1f; 我们后端的SpringBoot项目&#xff0c;通过application.yml添加不同后缀来区分配置文件 application.yml就是公共的配置&a…

Sam Altman:从少儿奇才到OpenAI掌舵人

自2022年底发布了ChatGPT以来&#xff0c;OpenAI及其首席执行官Sam Altman迅速成为科技界的焦点人物。Altman的崛起并非偶然&#xff0c;而是长期以来不断追求权力和创新的结果。本文将回顾Altman的成长历程&#xff0c;探索他如何一步步走向OpenAI的顶峰。 童年与教育背景 S…

乌班图Ubuntu 24.04初始化MySQL报错error while loading shared libraries: libaio.so.1

由于乌班图24.04 LTS已经发布了&#xff0c;因此准备新业务逐步往这上面迁移&#xff0c;毕竟支持有效期比22.04更长 准备在24.04上进行MySQL的初始化&#xff0c;因为习惯自定义安装存储目录&#xff0c;所以使用mysql-8.0.37-linux-glibc2.28-x86_64.tar.xz这个最新的二进制版…

7款三维地球软件/框架:Google Earth SkylineGlobe,Cesium等

可视化大屏已经不满足于2D和3D展示了&#xff0c;开始向着星辰大海迈进了&#xff0c;本文介绍7款三维地球软件/开发框架&#xff0c;带各位老铁入个门。 1. Google Earth: 大名鼎鼎&#xff0c;Google Earth 是由 Google 开发的一款免费的虚拟地球软件。它提供了全球范围内的…

【自然语言处理系列】手动安装和测试Spacy中en_core_web_sm模型的详细教程

摘要&#xff1a;本教程旨在为自然语言处理&#xff08;NLP&#xff09;初学者提供一个详细的指南&#xff0c;用于手动安装流行的NLP库Spacy及其英语模型en_core_web_sm。文章将逐步指导您如何安装Spacy库、查看其版本&#xff0c;确定并下载适合的en_core_web_sm模型版本&…