JVM知识总结

1.概述

JVM指的是Java虚拟机，本质上是一个运行在计算机上的程序，他的职责是运行Java字节码文件，作用是为了支持跨平台特性。

功能：

装载字节码，解释/编译为机器码
管理数据存储和垃圾回收
优化热点代码提升效率

2.构成

类加载子系统：从硬盘上加载字节码文件到JVM
运行时方法区：按照不同的数据分区存储（方法区，栈，堆，本地方法栈，程序计数器）
执行引擎：将字节码再次编译/解释为机器码
本地库接口：负责调用本地方法

3.类加载子系统

3.1加载

通过类的全限类名获得此类的二进制字节流
将静态存储转化为运行时存储（方法区）
在内存中生成该类的class对象

3.2链接

验证：检验被加载的字节码是否正确

1.文件格式验证，比如文件是否以0xCAFEBABE开头，主次版本号是否满足当前Java虚拟机版本要求。 2.元信息验证，例如类必须有父类（super不能为空）。 3.验证程序执行指令的语义，比如方法内的指令执行到一半强行跳转到其他方法中去。 4.符号引用验证，例如是否访问了其他类中private的方法等。

准备：为该类的静态属性分配内存，并设置默认值（不包括被final修饰,此时会直接赋值，因为在编译时就被加载）

解析：将常量池中二进制的符号引用替换成直接引用，符号引用就是在字节码文件中使用编号来访问常量池中的内容。直接引用不在使用编号，而是使用内存中地址进行访问具体的数据。

3.3初始化

为类的静态变量赋初值，执行字节码文件中clint部分的字节码指令

3.4类初始化时机

使用类中的静态变量，静态方法
创建对象
运行main方法
反射
初始化子类

4.运行时数据区

4.1程序计数器

记录程序执行的位置，不会出现内存溢出的情况，内存小，速度快，是线程私有的，不会进行垃圾回收

4.2虚拟机栈

一个方法入栈后，可以看作是一个栈帧

局部变量表：存放方法的参数和局部变量
操作数栈：在执行指令时用来存放临时数据的一块区域
返回地址：当一个方法执行完毕之后，要返回之前调用它的地方，因此在栈帧中必须保存一个方法返回地址。

4.3本地方法栈

存放本地方法，线程私有，会造成内存溢出，不会进行垃圾回收.

本地方法：被native修饰的方法，没有方法体，例如

native hashCode() 内存地址 native getClass(); native Object clone() native void notify(); native void notifyAll(); native void wait(long timeout) FileInputStream native int read0() Thread native void start0();

4.4堆

存放程序中的对象实例，共享线程，会内存溢出，会进行垃圾回收，是JVM管理最大的一块内存空间

分区

为什么分区？

根据存活时间的长短进行划分，生命较长的对象放在老年代减少垃圾回收次数和扫描频率

对象分区流程

新创建的对象存放在伊甸园区
当垃圾回收时,将伊甸园存活的对象移入到幸存者0区
再次创建的新对象还是在伊甸园区
下一次垃圾回收到来时会将伊甸园区存货的对象和幸存者0存活的对象转至幸存者1区，始终保持幸存者区有一个是空的
当一个对象经过15次垃圾回收后仍然存活，该对象被移入老年区
当老年代中空间不足，无法放入新的对象时，先尝试major gc如果还是不足，就会触发Full GC，Full GC会对整个堆进行垃圾回收。

4.5方法区

在不同的hotspot版本中会使用永久代和元空间来实现主要包括：

每一个加载的类的基本信息
运行时常量池，保存了字节码文件中的常量池信息

大小可调节并且线程是共享的，但会造成内存溢出

5.本地方法接口

底层由非Java代码实现，并不提供方法体，由于高级语言无法直接访问底层的硬件，所以需要调用操作系统提供的接口进行访问。

6.执行引擎

将装载到虚拟机的字节码编译为机器码

前端编译：.java---->.class
后端编译：.class---->机器码

6.1解释执行

用一个解释器对代码逐行进行解释，一般用于脚本语言（效率低，但省去了编译时间）

6.2编译执行

一次性的对代码进行整体编译（编译费时，但执行效率高）

6.3解释器和JIT编译器

解释器：当 Java 虚拟机启动时会根据预定义的规范对字节码采用逐行解释的方式执行，将每条字节码文件中的内容“翻译”为对应平台的本地机器指令执行。
JIT（Just In Time Compiler）编译器：就是虚拟机将源代码一次性直接编译成和本地机器平台相关的机器语言，但并不是马上执行。

在Java中采用半解释半编译的方式将字节码转化为机器码，程序刚开始执行时解释器就会立即执行，但在运行过程中，会将热点代码编译并缓存，二者结合达到一个平衡点

7.JDK6-8内存区域的区别

7.1方法区的实现

使用元空间替换永久代的原因： 1、提高内存上限：元空间使用的是操作系统内存，而不是JVM内存。如果不设置上限，只要不超过操作系统内存上限，就可以持续分配。而永久代在堆中，可使用的内存上限是有限的。所以使用元空间可以有效减少OOM情况的出现。 2、优化垃圾回收的策略：永久代在堆上，垃圾回收机制一般使用老年代的垃圾回收方式，不够灵活。使用元空间之后单独设计了一套适合方法区的垃圾回收机制

7.2字符串常量池的位置

字符串常量池从方法区移动到堆的原因： 1、垃圾回收优化：字符串常量池的回收逻辑和对象的回收逻辑类似，内存不足的情况下，如果字符串常量池中的常量不被使用就可以被回收；方法区中的类的元信息回收逻辑更复杂一些。移动到堆之后，就可以利用对象的垃圾回收器，对字符串常量池进行回收。 2、让方法区大小更可控：一般在项目中，类的元信息不会占用特别大的空间，所以会给方法区设置一个比较小的上限。如果字符串常量池在方法区中，会让方法区的空间大小变得不可控。 3、intern方法的优化：JDK6版本中intern () 方法会把第一次遇到的字符串实例复制到永久代的字符串常量池中。JDK7及之后版本中由于字符串常量池在堆上，就可以进行优化：字符串保存在堆上，把字符串的引用放入字符串常量池，减少了复制的操作

8.类加载器

类加载器负责在类的加载过程中将字节码信息以流的方式获取并加载到内存中

1.启动类加载器

JDK9之前由C++编写，JDK9之后由Java编写

2.拓展类加载器

JDK提供的，使用Java编写的加载器，派生于 ClassLoader 类.

3.应用类加载器

加载我们自己定义的类,用于加载用户类路径(classpath)上所有的类

4.自定义加载器

我们自己写一个类继承ClassLoder再例如tomcat这种容器,都会有自己加载类的加载器，重写findClass方法。

9.双亲委派机制

双亲委派机制指的是：当一个类加载器接收到加载类的任务时，会向上查找是否加载过，再由顶向下进行加载。如果上级找不到,就逐级向下委托,使用子级类加载器加载的类,如果都找不到,就报异常了。

作用：

保证类加载的正确性避免恶意代码来替代系统类库中的类，比如java.lang.String
避免同一个类被重复加载

9.1如何打破

实现自定义类加载器重写findClass()方法，将其中双亲委派机制的代码删除

10.垃圾回收

没有任何引用指向的对象，一直占用内存空间知道程序结束，被保留的空间的无法对其他对象使用，严重的会导致内存溢出。早期的垃圾回收：c/c++程序员手动在程序中对不使用的对象进行删除，如果忘记回收会造成内存泄漏

10.1内存溢出和内存泄漏

内存溢出：垃圾回收速度跟不上内存占用的速度
内存泄漏：对于对象不被使用，但GC无法回收的对象，导致OOM，是内存溢出的原因之一

例如：数据库连接 dataSourse.getConnection()，网络连接 socket 和 io 连接必须手动 close，否则是不能被回收的。

10.2STW

Stop-the-World，简称 STW，指的是 GC 事件发生过程中，会产生应用程序的停顿。当进行垃圾回收时，会导致其他用户线程暂停。可达性分析算法中枚举根节点（GC Roots）会导致所有 Java 执行线程停顿，为什么需要停顿所有 Java 执行线程？

分析工作必须在一个能确保一致性的快照中进行
一致性指整个分析期间整个执行系统看起来像被冻结在某个时间点上
如果出现分析过程中对象引用关系还在不断变化，则分析结果的准确性无法保证,会出现漏标,错标问题

10.3标记阶段

主要是为了判断对象是否为垃圾对象

算法：

引用计数算法：被引用时+1。缺点：单独维护一个计数器，增加了内存空间占用，会造成循环引用
可达性分析算法：以根（GCRoots）为起点搜索被跟所连接的对象是否可达

10.3.1哪些对象被称之为GC Root对象

线程Thread对象，引用线程栈帧中的方法参数、局部变量等。
系统类加载器加载的java.lang.Class对象，引用类中的静态变量。
监视器对象，用来保存同步锁synchronized关键字持有的对象。
本地方法调用时使用的全局对象

10.3.2finalize方法

回收前调用，且只会调用一次，在被回收前此方法会执行一些需要的逻辑。由于 finalize()方法的存在，虚拟机中的对象一般处于三种可能的状态.

可触及的：从根节点开始，可以到达这个对象。可复活的：对象的所有引用都被释放，但是对象有可能在 finalize()中复活。不可触及的：对象的 finalize()被调用，并且没有复活，那么就会进入不可触及状态。

以上 3 种状态中，是由于 finalize()方法的存在，进行的区分。只有在对象不可触及时才可以被回收

10.4回收阶段

标记-清除算法

概述：1.标记阶段：将存活对象进行标记，使用可达性分析算法寻找所有的存活对象

2.清除：删除没有别标记的对象

优点：操作简单，只需要维护标志位即可，无需进行对象的移动

缺点：会造成内存碎片化，很有可能这些内存单元的大小过小无法进行分配。由于内存碎片的存在，需要维护一个空闲链表，极有可能发生每次需要遍历到链表的最后才能获得合适的内存空间。

标记-复制算法

概述：准备两块空间，From和To，在对象分配期间只使用其中一块空间，GC阶段将From存活的对象复制到To中，再将两块空间名字互换

优点：不会造成内碎片，只需遍历一次，性能较好

缺点：会进行对象的移动，只有一半的空间来创建对象使用

标记-压缩算法

概述：1.标记阶段：将所有的存活对象的进行标记，使用可达性分析算法寻找所有的存活对象

2.整理阶段：将存活的对象移动到堆的一端

优点：内存利用率高，不会出现碎片化

缺点：造成对象移动，要选择合适的压缩算法

分区收集

分代回收时，创建出来的对象，首先会被放入Eden伊甸园区。
随着对象在Eden区越来越多，如果Eden区满，新创建的对象已经无法放入，就会触发年轻代的GC，称为Minor GC或者Young GC。Minor GC会把需要eden中和From需要回收的对象回收，把没有回收的对象放入To区
如果Minor GC后对象的年龄达到阈值（最大15，默认值和垃圾回收器有关），对象就会被晋升至老年代。当老年代中空间不足，无法放入新的对象时，先尝试minor gc如果还是不足，就会触发Full GC，Full GC会对整个堆进行垃圾回收。
如果Full GC依然无法回收掉老年代的对象，那么当对象继续放入老年代时，就会抛出Out Of Memory异常。