文章目录
- JVM简介和体系结构
- JVM的位置
- JVM的体系结构
- 类加载器
- 双亲委派机制
- 沙箱安全机制(了解即可)
- Native
- PC寄存器
- 方法区
- 栈
- 三种JVM
- 堆
- 新生区
- 永久区
- 堆内存调优
- Jprofiler的使用
- GC(垃圾回收)
- 引用计数法
- 复制算法
- 标记清除法
- 标记压缩法
- GC算法总结
面试常见:
- 请你谈谈你对JVM的理解?
- java8虚拟机和之前的变化更新?
- 什么是OOM,什么是栈溢出StackOverFlowError? 怎么分析?
- JVM的常用调优参数有哪些?
- 内存快照如何抓取,怎么分析Dump文件?
- 谈谈JVM中,类加载器你的认识
JVM简介和体系结构
JVM的位置
JVM上层就是一个个程序
JRE:Java运行环境,包含了JVM
操作系统、JRE、JVM本质上还是软件
JVM的体系结构
Java栈、本地方法栈、程序计数器不会有垃圾产生,自然不存在垃圾回收。因为栈里的东西一用就出栈,不会有垃圾产生。
垃圾在堆中产生(方法区是特殊的堆),绝大部分的JVM调优都是对于堆而言的。
类加载器
作用:加载Class文件
类是模板,是抽象的,类实例化得到的对象是具体的。所有的对象反射回去得到的是同一个类模板。
代码演示:
public class Car {public static void main(String[] args) {Car car1 = new Car();Car car2 = new Car();Car car3 = new Car();System.out.println(car1.hashCode());// 1735600054System.out.println(car2.hashCode());// 21685669System.out.println(car3.hashCode());// 2133927002Class<? extends Car> aClass1 = car1.getClass();Class<? extends Car> aClass2 = car2.getClass();Class<? extends Car> aClass3 = car3.getClass();System.out.println(aClass1.hashCode());// 356573597System.out.println(aClass2.hashCode());// 356573597System.out.println(aClass3.hashCode());// 356573597}
}
由此可知,由类加载器加载出来的Car Class是全局唯一的,这个Car Class所new出来的具体的Car对象各不相同,但是各种不相同的对象通过getClass获得的.Class都是同一个Car Class
再看一段代码:
public class Car {public static void main(String[] args) {Car car1 = new Car();Class<? extends Car> aClass1 = car1.getClass();ClassLoader classLoader = aClass1.getClassLoader();System.out.println(classLoader);//输出:sun.misc.Launcher$AppClassLoader@18b4aac2System.out.println(classLoader.getParent());//输出:sun.misc.Launcher$ExtClassLoader@677327b6System.out.println(classLoader.getParent().getParent());//输出:null 当输出为null:1.不存在 2.java程序获取不到}
}
可见,这里的classLoader是AppClassLoader,它的父加载器是ExtClassLoader,而ExtClassLoader的父加载器并不是没有才null,而是因为根加载器是C写的,Java无法获取。
需要了解的是:
Java程序在JRE中运行,分析jre文件下的包
- BootstrapClassLoader:加载jre/lib下的rt.jar包
- ExtClassLoader扩展类加载器:加载/jre/lib/ext下的所有包
- AppClassLoader应用(系统)类加载器:加载CLASSPATH路径下的包
类在经过Class Loader之后的变化:
- 虚拟机自带的加载器
- 启动类(根)加载器 BootstrapClassLoader
- 扩展类加载器 ExtClassLoader
- 应用程序加载器 AppClassLoader
双亲委派机制
代码演示:
自定义创建包java.lang,然后在包里创建String.java,然后写toString方法,返回类型为自定义的String类
package java.lang;public class String {public String toString(){ // 返回的为自定义的String类return "Hello";}public static void main(String[] args) {String s = new String();// s属于自定义的String类System.out.println(s.toString());}
}
输出:
错误: 在类 java.lang.String 中找不到 main 方法, 请将 main 方法定义为:
public static void main(String[] args)
否则 JavaFX 应用程序类必须扩展javafx.application.Application
分析:
App—>Ext—>Bootstrap (底——>顶层)
(双亲委派机制是为了保证安全)
双亲委派机制会从AppClassLoader开始检查String类有没有被加载,发现AppClassLoader有加载,但并不就此停止检查,继续自底向上到BootstrapClassLoader根加载器检查,发现根加载器也加载了这个类,然后自顶向下加载类,最终执行了BootstrapClassLoader的String类。所以自定义String类报错无法运行。
1、AppClassLoader收到类加载的请求;
2、将这个请求向上委托给父类加载器去完成,一 直向上委托,直到启动BootstrapClassLoader;
3、启动加载器检查是否能够加载当前这个类,能加载就结束, 使用当前的加载器。否则, 抛出异常,通知子加载器进行加载;
4、重复步骤3。
Class Not Found异常就是这么来的
Null:Java调用不到。 Java = C++去掉繁琐的东西:指针,内存管理(Java交给JVM去做)~
- Java语言保留了C的接口,这些方法就是用native(本地)修饰的,Java通过native方法调用操作系统的方法。比如Thread的start方法,它是由C/C++语言实现的
沙箱安全机制(了解即可)
Java安全模型的核心就是Java沙箱(sandbox)。沙箱是一个限制程序运行的环境。沙箱机制就是将Java代码限定在虚拟机 (JVM) 特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么? CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱机制。如下图所示JDK1.0安全模型
但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的Java1.1版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图所示JDK1.1安全模型
在Java1.2版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示
当前最新的安全机制实现,则引入了域(Domain)的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域,对应不一样的权限。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示最新的安全模型(jdk 1.6)
组成沙箱的基本组件
- 字节码校验器(bytecode
verifier):确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。 - 类裝载器(class loader) :其中类装载器在3个方面对Java沙箱起作用
它防止恶意代码去干涉善意的代码;
它守护了被信任的类库边界;
它将代码归入保护域,确定了代码可以进行哪些操作。
虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成, 每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。
类装载器采用的机制是双亲委派模式。
-
从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用
-
由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
-
存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。
-
安全管理器(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。
-
安全软件包(security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:安全提供者、消息摘要、数字签名、加密、鉴别
Native
-
凡是带了native关键字的,说明java的作用范围达不到了,会去调用底层c语言的库
会进入本地方法栈,调用本地方法本地接口 JNI (Java Native Interface) -
JNI作用:开拓Java的使用,融合不同的编程语言为Java所用,最初: C、C++
-
Java诞生的时候C、C++横行,想要立足,必须要有调用C、C++的程序
-
它在内存区域中专门开辟了一块标记区域: Native Method Stack,登记native方法
-
在最终执行的时候,加载本地方法库中的方法通过JNI
例如:Java程序驱动打印机,管理计算机系统,掌握即可,在企业级应用比较少
目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机或者Java系统管理设备,在企业级应用中已经比较少见。因为现在的异构领域间通信很发达,比如可以使用Socket通信,也可以使用Web Service等等,不多做介绍
Native Method Stack
它的具体做法是Native Method Stack 中登记native方法,在 ( Execution Engine ) 执行引擎 执行的时候加载Native Libraies。【本地库】
PC寄存器
程序计数器:Program Counter Register
每个线程都有一个程序计数器,是线程私有的,就是一个指针, 指向方法区中的方法字节码(用来存储指向像一条指令的地址, 也即将要执行的指令代码),在执行引擎读取下一条指令, 是一个非常小的内存空间,几乎可以忽略不计
方法区
方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间;
静态变量、常量、类信息(构造方法、接口定义)、运行时的常量池存在方法区中,但是实例变量存在堆内存中,和方法区无关。
栈
栈:数据结构
程序 = 数据结构+算法︰持续学习~
程序 = 框架+业务逻辑︰吃饭~
栈:先进后出、后进先出,桶
队列:先进先出(FIFO)
栈:栈内存
主管程序的运行,生命周期和线程同步;线程结束,栈内存也就释放,对于栈来说,不存在垃圾回收的问题。
一旦线程结束,栈就Over
栈存放的内容:8大基本类型+对象引用+实例的方法
栈运行原理:栈帧
栈帧:局部变量表+操作数栈
每执行一个方法,就会产生一个栈帧。程序正在运行的方法永远都会在栈的顶部
栈满了,栈溢出错误: StackOverflowError
栈+堆+方法区:交互关系
三种JVM
Sun公司HotSpot java Hotspot™64-Bit server vw (build 25.181-b13,mixed mode)
BEA JRockit
IBM 39 VM
我们学习都是:Hotspot
堆
堆(Heap),一个JVM只有一个堆内存,堆内存的大小是可以调节的。
类加载器读取了类文件后,一般会把什么东西放到堆中?
类,方法,常量,变量~,保存我们所有引用类型的真实对象;
堆内存中还要细分为三个区域:
- 新生区(伊甸园区) Young/New
- 老年区 Old
- 永久区 Perm
GC:Garbage recycling
轻GC:轻量级垃圾回收,主要是在新生区
重GC(Full GC):重量级垃圾回收,主要是养老区,重GC就说明内存都要爆了
GC垃圾回收,主要是在伊甸园区和养老区~
假设内存满了,OOM(Out Of memory),堆内存不够!java.lang.OutOfMemoryError: Java heap space
在JDK8以后,永久存储区改了个名字(元空间)
经过研究,99%的对象都是临时对象
新生区
- 类:诞生和成长的地方,甚至死亡
- 伊甸区:所有的对象都是在伊甸区new出来的
- 幸存者区(0区和1区)
例图,假如Eden区域可以放10个对象,当Eden区域满的时候,进行一次轻GC,此时假设有一个对象到了service 0区域。如果service 0 区域也满了,那么就会调用一次重GC,将对象放入老年代中。
但是,如果新生代与老年代区域都满了,那么就会报OOM错误
永久区
这个区域常驻内存的。用来存放JDK自身携带的Class对象。Interface元数据,存储的是Java运行时的一些环境或类信息~
这个区域不存在垃圾回收!
关闭虚拟机就会释放这个区域的内存~
一个启动类,加载了大量的第三方jar包。Tomcat部署了太多的应用,大量动态生成的反射类。不断地被加载。直到内存满,就会出现OOM
jdk1.6之前︰永久代,常量池是在方法区;
jdk1.7:永久代,但是慢慢的退化了,去永久代,常量池在堆中
jdk1.8之后:无永久代,常量池在元空间
方法区中那个小框是:常量池
(方法区和堆内存物理上连续,逻辑上分开,方法区是共享的,所以有人认为它不属于堆)
元空间又被称为非堆,但它也是堆,也有人认为右侧区域是堆空间,只是个人理解不同。
元空间:逻辑上存在,物理上不存在 (因为存储在本地磁盘内) 而并不算在JVM虚拟机内存中,也就是并没有占堆内存。
堆内存调优
在默认情况下:分配给JVM试图使用的最大总内存是电脑内存的 1/4,而JVM初始化的总内存是电脑内存的 1/64
可以通过调整这个参数(Edit Configuration—>VM options)控制Java虚拟机初始内存和分配的总内存的大小。
测试:
// 在VM options里面设置如下参数
//-Xms8m -Xmx8m -XX:+PrintGCDetails
public class Hello{public static void main( String[ ] args) istring str = "kuangshensayjava";while (true){str += str + new Random( ) .nextInt( bound: 888888888)+new Random( ) .nextInt( bound: 99999999);}
}
可见新生代、老年代、元空间都满了,然后报OOM错误
尝试应对OOM错误:
1、尝试扩大堆内存
2、分析内存和代码,看看哪个地方出现问题使用Debug或专业工具(如内存快照分析工具:MAT,Jprofiler)
MAT,Jprofiler作用
- 分析Dump内存文件,快速定位内存泄露
- 获得堆中的数据
- 获得大的对象
- ……
MAT最早集成于Eclipse中,IDEA中可以使用Jprofiles插件,在Settings—>Plugins中搜索Jprofiler,安装改插件即可使用
Jprofiler的使用
1、在idea中下载 jprofile 插件
2、百度搜索官网下载 jprofile 客户端 ,安装路径要求:没有中文没有空格
3、安装破解完之后,在IDEA的Settings—>Tools下找到 jprofiles,然后绑定安装目录bin下的.exe文件
4、在idea中VM参数中写参数 -Xms1m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError (假如堆内存heap出现了OOM则dump出这个异常)
5、运行程序后在jprofile客户端中打开(dump出的文件应该在src目录下)找到错误 告诉哪个位置报错
命令参数详解
- -Xms(设置初始化内存分配大小,默认计算机内存的1/64)
- -Xmx(设置最大分配内存,默以计算机内存的1/4)
- -XX: +PrintGCDetails (打印GC垃圾回收信息)
- -XX: +HeapDumpOnOutOfMemoryError (OOM DUMP)
GC(垃圾回收)
JVM在进行GC时,并不是对这三个区域统一回收。大部分时候,回收都是新生代~
- 新生代
- 幸存区(form , to)
- 老年区
GC两种类:轻GC(普通的GC),重GC(全局GC)
幸存0区和幸存1区两者是会交替的,from和to的关系会交替变化。
建议参考:为什么JVM新生代需要两个Survivor区
题目:
JVM的内存模型和分区,详细到每个区放什么?
堆里面的分区有哪些? Eden,from,to,老年区,
说说这些分区的特点。
GC的算法有哪些? 标记清除法,标记压缩(标记整理)法,复制算法,引用计数法
这些GC算法怎么用的?
轻GC和重GC分别在什么时候发生?
引用计数法
复制算法
漫画演示复制算法:
第一次GC后,Eden区和to区空了,经过15次垃圾回收后依然存活下来的对象就会去养老区
- 好处:没有内存的碎片
- 坏处:浪费了内存空间(一个幸存区的空间永远是空:to)。假设对象100%存活(极端情况)
复制算法最佳使用场景:对象存活度较低的时候;新生区~
标记清除法
- 优点:不需要额外的空间
- 缺点:两次扫描,严重浪费时间,会产生内存碎片
标记压缩法
优化标记清除法:先标记清除几次之后,再压缩1次。
GC算法总结
- 内存效率:复制算法>标记清除算法>标记压缩算法(时间复杂度)
- 内存整齐度:复制算法=标记压缩算法>标记清除算法
- 内存利用率:标记压缩算法=标记清除算法>复制算法
思考一个问题:难道没有最优算法吗?
答案:没有,没有最好的算法,只有最合适的算法 —> GC:分代收集算法
新生代:
- 存活率低
- 复制算法
老年代:
- 区域大:存活率
- 标记清除 (内存碎片不是太多) + 标记压缩混合实现
一天时间学JVM,不现实,要深究,必须要下去花时间,和多看面试题,以及《深入理解JVM》
但是,我们可以掌握一个学习JVM的方法~