【Java EE初阶三十】JVM的简单学习

1. JVM 内存区域划分

        
        一个运行起来的 Java 进程,就是一个 JVM 虚拟机,需要从操作系统申请一大块内存,就会把这个内存,划分成不同的区域,每个区域都有不同的作用.
        JVM 申请了一大块内存之后,也会划分成不同的内存区域,下面来详细讲解一下各个区域:

1、方法区

        (jdk1.7 及其之前)/ 元数据区 (jdk1.8 开始)
        这里存储的内容,就是类对象。.class 文件加载到内存之后,就成了类对象。

2、堆
        这里存储的内容,就是代码中 new 的对象(该区域是占据空间最大的区域)

3、栈
        这里存储的内容,就是代码执行过程中,方法之间的调用关系,如下图所示:

        4. 程序计数器
        是一个比较小的空间,主要就是存放一个"地址",表示下一条要执行的指令在内存中的哪个地方(方法区里每个方法里面的指令, 都是以二进制的形式保存到对应的类对象中的),刚开始调用方法,程序计数器记录的就是方法的入口的地址,随着一条一条的执行指令,每执行一条,程序计数器的值都会自动更新,即去指向下一条指令;

        如果是一个顺序执行的代码,下一条指令就是把指令地址进行递增;

        如果是条件/循环代码,下一条指令就可能会跳转到一个比较远的地址;

        下面进行举例:

主要知识点如下图所示:

        本地方法:指的是使用 native 关键字修饰的方法.这个方法不是使用 java 实现,而是在jvm 内部通过 C++ 代码实现的,JVM 内部的 C++ 代码调用关系;

        虚拟机栈,以及程序计数器都是每个线程都有一份,JVM 进程中有 10 个线程就会有 10 个虚拟机栈,也会有 10 个程序计数器(每个线程各自有一个)

        堆区和元数据区,这俩东西在 JvM 进程中是只有一份的

        下面给你一个代码,问你某个变量是处于内存中的哪个区域中?

        一个变量处于哪个区域,和变量的形态密切相关,局部变量处于栈上。成员变量在堆上,静态变量在与数据区内;同时我们要知道变量处于哪个空间上,和变量是不是引用类型,是不是基本类型是没有关系的

        new 出来的对象在堆上,于此同时又创建了一个局部变量 Test t引用类型的变量,就把对象地址存储到t里面了,t里面存储的不是对象本身;

        一个 JvM 进程里,可能有多个线程.每个线程,有自己的程序计数器和栈空间,这些线程共用同一份堆和方法区;

2. jvm中类加载的过程

        java 代码会被编译成.class 文件(包含了一些字节码),java 程序要想运行起来,就需要让 jvm读取到这些.class 文件,并且把里面的内容,构造成类对象并保存到内存的方法区中.(所谓的"执行代码”,就是调用方法.就需要先知道每个方法编译后生成的指令都是啥)

        一般来说将整个类加载的过程分为5个部分:

2.1 加载

        找到 .class 文件,打开文件,读取文件内容;

        往往代码中,会给定某个类的,"全限定类名“,例如java.lang.String,java.util.ArrayList,jvm 就会根据这个类名,在一些指定的目录范围内查找.

2.2 .验证

        .class 文件是一个二进制的格式,(每一个字节,都是有某些特定含义的)就需要验证你当前读到的这个格式是否符合要求.

        下图就是.class文件需要遵循的格式:

2.3 准备 

        给类对象分配内存空间 (最终的目标就是要构造出 类对象)

        我们这一步只是分配内存空间,还没有初始化呢.此时这个空间上的内存的数值,就是全0 ,(此时如果尝试打印类的 static 成员,结果就是全0的);

2.4 解析

         针对类对象中包含的字符串常量进行处理, 进行一些初始化操作,java 代码中用到的字符串常量在编译之后,也会进入到 .class 文件中;下面通过对字符串s的解析进行进一步说明:

        于此同时,.class 文件的二进制指令中,也会有一个s这样的引用被创建出来,由于引用里面本质上保存的是一个变量的地址,在 .class 文件中,这是文件不涉及到内存地址,因此住 .class 文件中,s 的初始化语句,即先会被设置成一个“文件偏移量”,通过偏移量,就能找到"test"这个字符串所在的位置;

        下面来简单说明一下文件偏移量:

        接下来,

这个过程,也叫做: 把"符号引用(文件偏移量)替换成“"直接引用)(内存地址)

2.5 初始化

        针对类对象进行初始化

        把类对象中需要的各个属性都设置好,同时还需要初始化好 static 成员变量,还需要执行静态代码块,以及还可能需要加载一下父类.

2.6 双亲委派模型

        双亲委派模型属于类加载中第一个步骤->"加载"过程中的一个环节,主要是根据负责根据全限定类名来找到 .class 文件.

        类加载器是 JVM 中的一个模块,JM 中中内置了下面如图所示的三个类加载器:

        如上图所示,这个父子关系并不是“继承"构成的,而是这几个 ClassLoader 里有一个 parent 这样的属性,指向了一个 父"类加载器";

        下面来详细描述一下类加载的过程(即找 .class 文件的过程):

1、给定一个类的全限定类名,形如 java.lang.String;

2、从 Application ClassLoader 作为入口,开始执行査找的逻辑

3、Application ClassLoader不会立即去扫描自己负责的目录(负责的是搜索项目当前目录和第三方库对应目录),而是把查找的任务,交给它的父亲,Extension ClassLoade

4、 Extension ClassLoader,也不会立即扫描自己负责的目录(负责的是 JDK 中一些扩展的库所对应的目录),而是把查找的任务交给它的父亲BootStrap ClassLoade;

5、Bootstrap ClassLoader,也不想立即扫描自己负责的目录(负责的是 标准库 的目录),也想把任务交给它的父亲,结果发现,自己没有父亲,因此 BootStrap ClassLoader 只能亲自负责扫描标准库的目录,如下所示:

        像java.lang.String.这种类,就能够在标准库中,找到对应的 .class 文件,就可以进行打开文件,读取文件......此时,查找 .class 文件的过程就结束了;但是,如果给定的类不是标准库的类,任务仍然会被交给孩子来执行;

6、没有扫描到就会回到 Extension ClassLoader.Extension ClassLoader 就会扫描负责的扩展库的目录.如果找到,就执行后续的类加载操作,此时查找过程结束还没有没找到,就会把任务交给他的孩子来执行.

7、没有扫描到, 就会回到 Application ClassLoade),Application ClassLoader 就会负责扫描当前项目和第三方库的目录.如果找到,就执行后续的类加载操作.如果没找到,就会抛出一个 ClassNotFoundException;

        综上所述,所谓的“双亲委派模型“,其实就是一个查找优先级的问题;简单的查找流程如下图所示:

        之所以搞这一套流程,主要的目的是为了确保标准库的类被加载的优先级最高,其次是扩展库,其次是自己写的类和第三方库;

3. GC 垃圾回收 

        C 语言中,像 malloc 这种, 就属于是"动态申请内存”(运行时),其实很多时候, 需要程序真正跑起来,才能确定内存的大小;

        在C 语言中, 使用 malloc 申请的内存,需要在用完之后, 通过 free 来释放。(此处如果不释放,就会产生"内存泄露”这样的问题)

        C++里,动态申请内存,变成 new,malloc 只是申请内存.new,能够申请内存,也能初始化(调用构造函数),在C++ 中,使用 new 申请的内存,用完之后, 通过 delete 来释放;

        在 Java 中, new 一个对象也就是"动态内存申请”;

        综上所述,相比之下, java 给出了一个方案,垃圾回收机制 (GC),让 JVM 自行判定,某个内存是否就不再使用了,如果这个内存后面确实不用了,JVM 就自动的把这个内存给回收掉,此时就不必让程序猿自己手动写代码回收;

        下面首先来了解一下GC机制的缺陷:

        1.系统开销,需要有一个或一些特定的线程,不停的扫描内存中的所有的对象, 看是否能够回收,此时是需要额外的内存和CPU 资源的.

        2.效率问题,这样的扫描线程,不一定能够及时的释放内存(扫描总是有一定周期的)一旦同一时刻,出现大量的对象都需要被回收,GC 产生的负担就会很大.甚至引起整个程序都卡顿.(STW 问题:即stop the world);

        GC 是垃圾回收,GC 回收的目标其实是内存中的对象,对于 Java 来说, 就是 new 出来的这些对象;栈里的局部变量,是跟随着栈帧的生命周期走的,(方法执行结束,栈帧销毁,该部分的内存自然释放);静态变量的生命周期就是整个程序,这个始终存在就意味着静态变量是无需释放的;因此真正需要 gc 释放的, 就是堆上的对象了.

        gc 可以理解成两个大的步骤:
1. 找到垃圾
2. 释放垃圾

3.1  找到垃圾

        在 GC 的领域中, 有两种主流的方案:

1)、引用计数 [Python, PHP]

        new 出来的对象,单独安排一块空间,来保存一个计数器,如下图所示:

        在Java 中,使用对象,必须要依靠引用,如果一个对象,没有引用指向了,就可以视为是垃圾了(引用计数就是0 )

        对于上述代码,出了 { }之后,t 和 t2 就都销毁了,即引用计数就要归0了,当对象的引用计数为 0,此时代码中就不可能访问到这个对象了,此时这个对象就可以视为是垃圾了;

        关于 java 不使用引用计数的分析,引用计数存在两个重要的问题:

        1、比较浪费内存.
        计数器最少需要2个字节,如果对象本身就很小,这个计数器占据的空间比例就很大;
比如对象本身就 2 个字节,计数器占据的空间就是 50%;如果对象本身 4个字节?计数器占据的空间就是 33% ;如果对象很少, 或者对象比较大, 都影响不大。但是如果对象小并且很多,计数器所占据的空间就十分巨大;

        2、引用计数机制,存在"循环引用”问题,如下面的一段代码所示:

 a,b及其引用的内存分布如下所示:

        此时,当前a和 b 两个引用已经销毁了,new 出来的这俩对象,已经无法被其他代码访问到了,但是他们的引用计数却是不为0的,所以这俩对象是不能被回收的;此时,第一个对象引用了第二个对象,第二个对象引用了第一个对象.

2)、可达性分析 【java】
        可达性分析本质上是时间换空间的手段;

        有一个/一组线程周期性的扫描我们代码中所有的对象,从一些特定的对象出发,尽可能的进行访问的遍历,把所有能够访问到的对象,都标记成“可达”,反之,经过扫描之后, 未被标记的对象,就是垃圾;

        不仅仅是所有的局部变量,还有常量池中引用的对象,还有方法区中的静态引用类型引用的变量,都统称为 GCRoots,当然,这里的遍历大概率是 N 叉树.主要就是看所访问的某个对象,里面有多少个引用类型的成员,并针对每个引用类型的成员都需要进一步的进行遍历;

        可达性分析都是周期性进行的,当前某个对象是否是垃圾,是随着代码的执行而发生改变,总之就是可达性分析比较消耗系统资源,开销比较大;

3.2 回收垃圾

3.2.1 标记清除

        该方式是比较简单粗暴的释放方式,下面黑色区域是被标记的要被清除的,

        把对应的对象,直接释放掉,就是标记清除的方案,但是这个方案其实非常不好,因为会产生很多的内存碎片,释放内存的主要目的是为了让别的代码能够申请到"连续”的内存空间,但是这样会导致我们能用的内存是断断续续的;随着时间的推移,内存碎片的情况就会越演越烈,如此就会导致后续内存申请举步维艰.

3.2.2 复制算法

        通过复制的方式,把有效的对象归类到一起.再统一释放剩下的空间;

        

        把内存分成两份,一次只用其中的一半,这个方案可以有效解决内存碎片的问题.但是缺点也很明显:
1、内存要浪费一半,利用率不高;
2、如果有效的对象非常多,拷贝开销就很大;

3.2.3 标记整理

        既能够解决内存碎片的问题,又能处理复制算法中利用率;

        类似于顺序表删除元素的搬运操作

3.2.4 分代回收

        实际上,JVM 采取的释放思路是上述基础思路结合体,分代回收,对象能活过的 GC 扫描轮次越多, 就是越老;

        伊甸区:

        刚 new 的新的对象放到伊甸区,从对象诞生,到第一轮可达性分析扫描,这个过程中
虽然时间不长(往往就是毫秒或秒)但是,在这个时间里,大部分的对象都会成为垃圾,

        释放过程如下所示:

1)、伊甸区 =>幸存区

         使用复制算法,每一轮 GC 扫描之后, 都把有效对象复制到幸存区中,伊甸区就可以整个释放了,由于经验规律,真正需要复制的对象不多,所以非常适合复制算法;

2)、GC 扫描线程也会扫描幸存区.
        就会把活过GC 扫描的对象(扫描过程中可达),拷贝到幸存区的另一个部分,幸存区之间的拷贝,每一轮会拷贝多个对象,每一轮也会淘汰掉一批对象(有些对象随着时间的推移,就成了垃圾)

3)、当这个对象已经在幸存区存活过很多轮 GC 扫描之后,JVM 就认为这个对象,短时间内应该是释放不掉了,就会把这个对象拷贝到老年代;

4)、进入老年代的对象, 虽然也会被 GC 扫描,但是老年代 GC 扫描的频率就会比新生代;

        分代回收,是 JVM 中主要的回收的思想方法.,但是在垃圾回收器具体实现的时候,可能还会有一些调整和优化.

ps:到这里java ee初阶的内容就结束了,感谢陪伴了很久的自己,尤其是在上完班后晚上敲写博客的自己,还是那句话,虽然多阻滞,花发再重荣!!!

        

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/728600.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flink实时数仓之用户埋点系统(一)

需求分析及框架选型 需求分析数据采集用户行为采集业务数据采集 行为日志分析用户行为日志页面日志启动日志APP在线日志 业务数据分析用户Insert数据用户Update数据 技术选型Nginx配置Flume配置MaxWellHadoopFlink架构图 需求分析 数据采集 用户行为采集 行为数据&#xff1…

人类与智能体

1、人类与智能体 人类与智能体之间的关系在当今科技发展中变得日益紧密。智能体,作为人工智能领域的一个核心概念,通常指的是一种能够感知环境、做出决策并采取行动以实现特定目标的实体,它可以是软件系统、机器人或其他类型的自动化装置。 …

最小二乘法(带你 原理 实践)

文章目录 引言一、最小二乘法的基本原理二、最小二乘法的计算过程建立模型确定目标函数求解模型参数模型检验 三、最小二乘法的优缺点优点原理简单易懂统计特性优良适用范围广泛 缺点对异常值敏感假设条件较多 四、最小二乘法在实际应用中的案例五、如何克服最小二乘法的局限性…

vue-cli项目因为webpack版本不兼容运行后报错

vue-cli项目运行后报错: Error: Rule can only have one resource source (provided resource and test include exclude) in {"exclude": [null],"use": [{"loader": "G:\\CustomerDay\\customerday\\node_modules\\cache-l…

大语言模型的知识融合(ICLR2024)

一、写作动机: 虽然从头开始训练大型语言模型(LLMs)可以生成具有独特功能和优势的模型,但这种方法成本高昂,而且可能导致功能冗余。 二、主要贡献: 入了 LLMs 知识融合的概念,旨在结合现有 LL…

LiveNVR监控流媒体Onvif/RTSP功能-支持云端录像监控视频集中存储录像回看录像计划配置NVR硬件设备录像回看

LiveNVR支持云端录像监控视频集中存储录像回看录像计划配置NVR硬件设备录像回看 1、流媒体服务软件2、录像回看3、查看录像3.1、时间轴视图3.2、列表视图 4、如何分享时间轴录像回看?5、iframe集成示例7、录像计划7、相关问题7.1、录像存储位置如何配置?…

selenium也能过某数、5s盾..

文章转载于:selenium也能过某数、5s盾… 直接安装: pip install undetected_chromedriver运行代码: import undetected_chromedriver as uc import timedriver uc.Chrome(executable_pathrC:\Users\chromedriver.exe,version_main111) driver.get(网…

K线形态分析宝典:10种K线形态特征与应用场景详解,助您投资更有底气

在金融市场中,K线图是投资者们最常用的技术分析工具之一,通过观察K线形态可以揭示市场的走势和情绪。以下是10种常见的K线形态,包括详细的形态特征、作用以及应用场景,帮助您更好地理解市场走势,制定更精准的投资策略。…

JS实现chatgpt数据流式回复效果

最近高了一个简单chatgpt对话功功能,回复时希望流式回复,而不是直接显示结果,其实很简单,前端流式读取即可,后端SSE实现流式传输 前端用到fetch获取数据,然后利用reader读取 let requestId parseInt(Ma…

【Python】成功解决TypeError: ‘tuple‘ object does not support item assignment

【Python】成功解决TypeError: ‘tuple’ object does not support item assignment 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程&am…

算法归纳【数组篇】

目录 二分查找1. 前提条件:2. 二分查找边界 2.移除元素有序数组的平方长度最小的子数组59.螺旋矩阵II54. 螺旋矩阵 二分查找 参考链接 https://programmercarl.com/0704.%E4%BA%8C%E5%88%86%E6%9F%A5%E6%89%BE.html#%E6%80%9D%E8%B7%AF 1. 前提条件: 数…

阿里云ECS磁盘扩容操作手册

云原生专栏大纲 文章目录 ESC磁盘扩容步骤前提条件云盘备份云盘扩容扩容分区和文件系统前提条件操作视频操作步骤准备工作:获取目标云盘信息步骤1:扩容分区步骤2:扩容文件系统 ESC磁盘扩容步骤 扩容已有云盘的操作步骤和注意事项_云服务器 …

影响哈默纳科Harmonic减速机使用寿命的5大因素

哈默纳科HarmonicDrive减速机以其轻量、小型、传动效率高、减速范围广、精度高等特点,被广泛应用于各种传动系统中。然而,尽管哈默纳科Harmonic减速机具有诸多优势,但其使用寿命仍可能受到多种因素的影响。 首先,环境因素对哈默纳…

ThreadLocal, InheritableThreadLocal和TransmittableThreadLocal

ThreadLocal, InheritableThreadLocal和TransmittableThreadLocal ThreadLocal(TL) 后续部分地方会使用ThraedLocal简称为TL 什么是TL? ThreadLocal是Java中的一个类, 也称为线程本地变量, 它提供了线程局部变量的功能。每个ThreadLocal对象都可以存储一个线程本地的变量副…

Service Mesh:如何为您的微服务架构带来可靠性和灵活性

在云原生架构中,Service Mesh 技术成为了微服务架构中不可或缺的一环。本文灸哥将和你一起探讨 Service Mesh 技术的原理、功能和实践,帮助架构师和开发人员更好地理解和应用这一关键技术。 1、Service Mesh 技术概述 Service Mesh 又称为服务网格&…

世界的本质是旋转(5)-在复平面上驱动软件无线电SDR发射BPSK波形

在上一篇文章中,我们介绍了复平面、拍照采样的一些思维实验。从本节开始,转入现实应用,通过控制复平面向量的位置,实现一个完整的BPSK全双工通信通道。 发射方:通过控制复平面向量在各个时刻的位置来携带信息的技术&a…

Axure RP 10:让原型设计更快、更直观、更智能 mac版

Axure RP 10是一款强大的原型设计工具,它能够帮助设计师快速创建高保真、交互式的原型,从而更好地展示和测试设计方案。这款软件凭借其直观易用的界面和丰富的功能,已经成为了许多设计师的首 选工具。 Axure RP 10 for Mac版软件获取 首先&a…

AI论文速读 | 【综述】城市计算中跨域数据融合的深度学习:分类、进展和展望

题目:Deep Learning for Cross-Domain Data Fusion in Urban Computing: Taxonomy, Advances, and Outlook 作者:Xingchen Zou, Yibo Yan, Xixuan Hao, Yuehong Hu, Haomin Wen(温皓珉), Erdong Liu, Junbo Zhang(张钧…

进程之舞:操作系统中的启动、状态转换与唤醒艺术

✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨ 🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua,在这里我会分享我的知识和经验。&#x…