Java高阶私房菜:JVM垃圾回收机制及算法原理探究

目录

垃圾回收机制

什么是垃圾回收机制

JVM的自动垃圾回收机制

垃圾回收机制的关键知识点

初步了解判断方法-引用计数法

GCRoot和可达性分析算法

什么是可达性分析算法

什么是GC Root

对象回收的关键知识点

标记对象可回收就一定会被回收吗?

可达性分析算法为什么可以解决循环引用造成的内存泄漏问题?

​编辑

垃圾回收算法

标记-清除算法原理

标记-复制算法原理

标记-整理-压缩算法原理

几种算法对比


        本文主要讲解了什么是垃圾回收机制,进而了解它的底层架构原理,到核心的几种垃圾回收算法,逐步延申到它的应用场景和启发。

垃圾回收机制

什么是垃圾回收机制

        垃圾回收机制(Garbage Collection, 简称GC) 指自动管理动态分配的内存空间的机制,自动回收不再使用的内存,以避免内存泄漏和内存溢出的问题。

        最早是在1960年代提出的,程序员需要手动管理内存的分配和释放,这往往会导致内存泄漏和内存溢出等问题,同时也增加了程序员的工作量,特别是C++/C语言开发的时候,Java语言是最早实现垃圾回收机制的语言之一,其他编程语言,如C#、Python和Ruby等,也都提供了垃圾回收机制。

JVM的自动垃圾回收机制

        指Java虚拟机在运行Java程序时,自动回收不再使用的对象所占用的内存空间的过程。Java程序中的对象,一旦不再被引用会被标记为垃圾对象,JVM会在适当的时候自动回收这些垃圾对象所占用的内存空间。

其优点在于

  • 减少了开发人员的工作量,不需要手动管理内存;

  • 动态地管理内存,根据应用程序的需要进行分配和回收,提高了内存利用率;

  • 避免内存泄漏和野指针等问题,增加程序的稳定性和可靠;

缺点在于

  • 垃圾回收会占用一定的系统资源,可能会影响程序的性能;

  • 垃圾回收过程中会停止程序的执行,可能会导致程序出现卡顿等问题;

  • 不一定能够完全解决内存泄漏等问题,需要在编写代码时注意内存管理和编码规范;

垃圾回收机制的关键知识点

        垃圾回收机制需要判断哪些对象需要回收?即如何判读判断对象存活。其方法包括了有引用计数法可达性分析算法(JVM采用)。

        如何针对性进行回收?其收集死亡对象方法主要有三种,有标记-清除算法、标记-复制算法和标记-整理算法。每个中算法所针对的场景都不一样,没有最优解,只有最合适。

        了解垃圾回收算法和垃圾收集器的关系?两者没有可比性,是承先启后的关系,垃圾回收算法是垃圾回收的方法论,而垃圾收集器是算法的落地实现

初步了解判断方法-引用计数法

        简而言之就是跟踪每个对象被引用的次数,当引用次数为0时,就可以将该对象回收。在JVM中,每个对象都有一个引用计数器,当对象被引用时,引用计数器+1,当对象被取消引用时,引用计数器-1,当引用计数器为0时,该对象就可以被回收。

        其优点在于实现简单,回收垃圾的效率高。但缺点也显而易见循环引用无法回收。如果两个对象互相引用,它们的引用计数器永远不会为0,因此无法真正被回收,而且引用计数器开销大,每个对象都需要一个引用计数器,如果对象很多,开销就会很大。

什么是循环引用

public class Main {public static void main(String[] args) {A a = new A();B b = new B();a.setB(b);b.setA(a);a = null;b = null;System.gc();}
}class A {private B b;public void setB(B b) {this.b = b;}
}class B {private A a;public void setA(A a) {this.a = a;}
}

        类A和类B相互引用,每个对象都持有对方的引用,形成了一个循环引用的环,当Main方法执行完毕后,a和b对象都置为null。由于它们相互引用,它们的引用计数器都不为0,无法被垃圾回收器回收,导致内存泄漏,但是上面代码却不会发生内存泄漏,因为多数jvm没有采用这个引用计数器方案,而是采用可达性分析算法

GCRoot和可达性分析算法

什么是可达性分析算法

        简而言之就是从一些“GC Roots”对象开始,通过搜索引用链的方式,找到所有可达对象。如果一个对象没有任何引用链与GC Roots相连,那么它就被判定为不可用的,是可以被回收的垃圾对象。

什么是GC Root

        指一些被JVM认为是存活的对象,它们是垃圾回收算法的起点,可以理解为由堆外指向堆内的引用, 本身是没有存储位置,都是字节码加载运行过程中加入 JVM 中的一些普通引用。通俗的例子可以是一个树形结构,树的根节点就是GC Roots,是垃圾回收器的起点,如果一个节点没有任何子节点与根节点相连,那这个节点就被认为是不可达的,可以被回收器回收。

        举个例子,将GC Roots比喻成一座城市,城市中有很多建筑物,这些建筑物就是内存中的对象,GC Roots就像城市的卫生局、消防局等,它们直接或间接地与城市中的建筑物相连,从这些机构出发,通过道路、桥梁等连接,最终能够到达所有的建筑物,如果一个建筑物没有与这些机构相连,那么它就被认为是废弃的,可以被清理掉。

JVM中的GC Roots对象包括以下几种:

        1)虚拟机栈(栈帧中的本地变量表)中引用的对象。

        2)方法区中类静态属性引用的对象。JDK 1.7 开始静态变量的存储从方法区移动到堆中,比如你定义了一个static 的集合对象,那里面添加的对象就是可以被GC Root可达的

        3)方法区中常量引用的对象。字符串常量池从 JDK 1.7 开始由方法区移动到堆中,本地方法栈中JNI(即一般说的Native方法)引用的对象。

小技巧:由于GC Roots采用栈方式存放变量和指针,如果一个指针它保存了堆内存里面的对象,但是自己又不能存放在堆内存里面,那么它就是一个GC Roots。

代码举例

// product 是栈帧中的本地变量,指向了 title = CSDN 这个 Product 对象
// 此时 当product 充当了 GC Root 的作用
// 当product = null; ,那么product 与原来指向product 对象断开了连接
// 所以这个 new Product("CSDN") 对象会被回收public class GCTest {public static void main(String[] args) {Product product = new Product("CSDN");product = null;}
}

对象回收的关键知识点

标记对象可回收就一定会被回收吗?

        不一定会回收,对象的finalize方法给了对象一次最后一次存活的机会。当对象不可达(可回收)并发生 GC 时,会先判断对象是否执行了 finalize 方法,如果未执行则会先执行 finalize 方法。前对象与 GC Roots 关联,执行 finalize 方法之后,GC 会再次判断对象是否可达,如果不可达,则会被回收,如果可达,则不回收!需要注意的是 finalize 方法只会被执行一次,如果第一次执行 finalize 方法,对象变成了可达,则不会回收,但如果对象再次被 GC,则会忽略 finalize 方法,对象会被直接回收掉!

可达性分析算法为什么可以解决循环引用造成的内存泄漏问题?

        当两个或多个对象相互引用时,它们的引用链会形成一个环,但是由于这个环中的对象与GC Roots没有任何引用链相连,所以JVM会将这些对象判定为不可用的,从而回收它们。如下图所示。

垃圾回收算法

标记-清除算法原理

         是一种常见的垃圾回收算法,它的基本思路是分为两个阶段:标记阶段和清除阶段

        在标记阶段,垃圾回收器会从一些GC Roots对象开始,遍历整个对象图,标记所有被引用的对象。被标记的对象会被打上标记,表示这些对象是“活”的对象,需要保留下来,未被标记的对象就是垃圾对象,可以被回收。

        在清除阶段,垃圾回收器会对所有未被标记的对象进行回收。        

        其优点在于可以回收不连续的内存空间。其缺点显而易见,标记和清除两个步骤,都需要垃圾回收器遍历整个对象图,耗费时间较长,并且会产生内存碎片,当频繁进行垃圾回收时,内存碎片会越来越多导致可用内存空间不足,一次次不连续的内存使用,会影响程序的性能和稳定性。

        该算法应用场景应用在实际应用中,标记清除法一般用于不需要频繁进行垃圾回收的场景,比如在Java堆中大对象的分配和回收。其实后续的收集算法大多都是以标记-清除算法为基础,对其缺点进行改进。

标记-复制算法原理

        是一种常见的垃圾回收算法,它的基本思路是将Java堆分为两个区域:一个活动区域和一个空闲区域。在垃圾回收过程中,首先标记所有被引用的对象,然后将所有被标记的对象复制到空闲区域中,最后交换两个区域的角色,完成垃圾回收

        从下图可以看出复制到空闲区域后的内存对象是连续的,以及未使用的内存空间也被重新分配。

为更深入了解该算法,我们详细看看它的实现步骤:

        1)在初始化环境下会将Java堆分为两个区域:一个活动区域一个空闲区域。初始时,所有对象都分配在活动区域中

        2)从GC Roots对象开始,遍历整个对象图,标记所有被引用的对象;

        3)对所有被标记存活的对象进行遍历,将它们复制到空闲区域中,并更新所有指向它们的引用,使它们指向新的地址

        4)对所有未被标记的对象进行回收,将它们所占用的内存空间释放;

        5)交换活动区域和空闲区域的角色,空闲区域变为新的活动区域,原来的活动区域变为空闲区域;

        6)当空闲区域的内存空间不足时,进行一次垃圾回收,重复以上步骤

        这样的方式其优点在于,如果内存中的垃圾对象较多,需要复制的对象就较少,则效率高,清理后,内存碎片少。其缺点也不少,虽然标记复制算法的效率较高,但是预留一半的内存区域用来存放存活的对象,占用额外的内存空间。如果出现存活对象数量比较多的时候,需要复制较多的对象效率低,假如是在老年代区域,99%的对象都是存活的,则性能低,所以老年代不适合这个算法。

        该算法应用场景应用在新生代的垃圾回收,因此需要对新生代的对象进行分代管理,虚拟机多数采用这个算法,对新生代进行内存管理,因为多数这个新生代区域的存活对象数量少。国外有公司统计过多数业务,98%撑不过一次GC,所以不用1:1比例分配新生代的空间

        这么分配的原因在于,当发生GC时, 将Eden和Survivor中存活对象一次性复制到另外一块Survivor空间上, 然后清理掉Eden和已用过的那块Survivor空间,每次新生代中可用内存空间为整个新生代容量的90% (Eden的80% + Survivor的 10%) ,只有一个Survivor空间, 即10%的新生代是会被浪费而已。

标记-整理-压缩算法原理

        从根节点开始对所有可达对象做一次标记,但之后并不简单地清理未标记的对象,而是将所有的存活对象压缩到内存的一端,然后清理边界外的垃圾,避免了碎片的产生,也不需要两块相同的内存空间,因此性价比比较高。

        其优点在于,解决了标记清除算法的碎片化的问题。和对比标记-复制算法来看,该算法不用浪费额外的空间,因为前者算法需要预留一部分空闲区域用于复制。和对比标记-清除算法来看,前者是一种非移动式的回收算法,而该算法是移动式的回收,且解决了内存碎片化的问题。

        其缺点就是效率相比于标记复制算法和标记清除算法低一些,在整理存活对象时,因对象位置的变动,需要调整该虚拟机栈中的引用地址。

         该算法应用场景应用在老年代的内存回收,它在标记-清除算法的基础上做了部分优化。 

几种算法对比

        标记-复制算法适合在存活对象少、垃圾对象多的场景,即新生代空间,朝生夕灭的场景

        标记-整理-压缩算法适合在存活对象多、垃圾对象少的场景,即老年代空间,都是历经多次GC,依旧存活的对象。

        标记-清除算法作为基础算法,其实也适合于在老年代空间,但不同的是在处理后会有碎片化空间,使用标记-整理-压缩算法效果会更佳。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/4425.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【免费源码下载】完美运营版商城 虚拟商品全功能商城 全能商城小程序 智慧商城系统 全品类百货商城php+uniapp

简介 完美运营版商城/拼团/团购/秒杀/积分/砍价/实物商品/虚拟商品等全功能商城 干干净净 没有一丝多余收据 还没过手其他站 还没乱七八走的广告和后门 后台可以自由拖曳修改前端UI页面 还支持虚拟商品自动发货等功能 挺不错的一套源码 前端UNIAPP 后端PHP 一键部署版本&am…

52832 不使用micro_lib ,同时使用AC6编译器且使用printf问题

1. 因为我的工程用AC6是因为要跑自己的C 和 TensorFlow lite micro. 所以是C,C混合的工程,但是一直没法打印,所以写一个总结。 基本说明: micro_lib这种情况不要选,因为存在C文件 第一个坑: 第二个坑&…

windows 避免电脑强制息屏

许多打工人的电脑被公司设置了隔一段时间没有操作,就会自动息屏,如何避免这种事发生呢 方案一 自动操作鼠标的软件 如果能自由安装软件,可以下载自动移动鼠标的软件,设置鼠标每隔多长时间做一次什么操作,防止锁屏 方…

LIUNX:系统编程动态库加载(1)

目录 操作系统角度理解 如何加载 怎么管理库 编址 操作系统角度理解 如何加载 首先main想要运行,首先要为main创建task_struct和mm_struct,然后将main的代码和数据加载到内存,将main的代码通过页表映射到mm_struct的正文代码段&#xff0…

leetcode-比较版本号-88

题目要求 思路 1.因为字符串比较大小不方便,并且因为需要去掉前导的0,这个0我们并不知道有几个,将字符串转换为数字刚好能避免。 2.当判断到符号位的时候加加,跳过符号位。 3.判断数字大小,来决定版本号大小 4.核心代…

Unity | 优化专项-包体 | 字体

1. 字体包体占用 常用汉字字体文件大小通常在 10M~12M 左右,大概包含常见汉字 3.5w 个。我国汉字有大约将近十万个,全字库的大小对于游戏包体是灾难性的 在小游戏中,即使是常见汉字,大小也足以影响小游戏总包体,进而…

qmt教程2----订阅单股行情,提供源代码

链接 qmt教程2----订阅单股行情,提供源代码 (qq.com) qmt教程1---qmt安装,提供下载链接 今天我重新封装了全部qmt的内容,包括数据,交易 qmt交易 我本来打算全部上次git的,但是考虑到毕竟是实盘的内容,就放…

决策树学习笔记

一、衡量标准——熵 随机变量不确定性的度量 信息增益:表示特征X使得类Y的不确定性减少的程度。 二、数据集 14天的打球情况 特征:4种环境变化(天气、温度等等) 在上述数据种,14天中打球的天数为9天;不…

如何通过4G DTU实现现场仪表的分布式采集并发布到MQTT服务器

提供一份资料文档以一个具体的工程案例来讲解,如何通过4G DTU实现现场仪表的分布式采集并发布到MQTT服务器。采用的数据采集模块是有人物联的边缘采集4G DTU,采集多个多功能电表和远传水表的数据,通过MQTT通讯的型式传送给MQTT服务器&#xf…

【Vue3+Tres 三维开发】01-HelloWord

预览 什么是TRESJS 简单的说,就是基于THREEJS封装的能在vue3中使用的一个组件,可以像使用组件的方式去创建场景和模型。优势就是可以快速创建场景和要素的添加,并且能很明确知道创景中的要素构成和结构。 项目创建 npx create-vite@latest # 选择 vue typescript安装依赖…

【物联网】手把手完整实现STM32+ESP8266+MQTT+阿里云+APP应用——第1节-阿里云配置+MQTT.fx模拟与使用AT命令发布订阅消息

本节目标:通过MQTT.fx模拟连接或通过串口连接ESP8266发送AT命令,实现阿里云物联网平台发送数据同时接收数据,IOT studio界面显示数据。具体来说:使用ESP8266 ESP-01来连接网络,获取设备数据发送到阿里云物联网平台并显…

ElasticSearch批处理

在刚才的新增当中,我们是一次新增一条数据。那么如果你将来的数据库里有数千上万的数据,你一次新增一个,那得多麻烦。所以我们还要学习一下批量导入功能。 也就是说批量的把数据库的数据写入索引库。那这里的需求是,首先利用mybat…

哈密顿函数和正则方程

9-2 哈密顿函数和正则方程_哔哩哔哩_bilibili 拉格朗日函数是广义坐标和广义速度的函数 哈密顿函数是广义坐标和广义动量的函数 拉格朗日函数经过勒让德变换得到哈密顿函数

【python技术】akshare爬取A股最新业绩预告保存进excel的简单示例

最近A股上市公司陆续在出年报和一季度报了, 心里寻思着要不用python把这些数据爬取下来分析下,说干就干。 数据来源网站东方财富:https://data.eastmoney.com/bbsj/ 我这个人比较懒,直接用akshare封装的方法来搞定 之前用aksha…

通过阿里云OOS实现定时备份redis实例转储到OSS

功能背景 随着企业业务数据的快速增长,Redis 作为高性能的内存数据存储方案,在多种应用场景下承担着重要的角色。为确保数据安全,定时备份成为了不可或缺的一环。Redis 实例定时备份是关键数据库管理任务的一个重要组成部分,它主…

JAVA面试八股文之JVM

JVM JVM由那些部分组成,运行流程是什么?你能详细说一下 JVM 运行时数据区吗?详细介绍一下程序计数器的作用?你能给我详细的介绍Java堆吗?什么是虚拟机栈?栈内存溢出情况?堆栈的区别是什么吗?解…

.NET 检测地址/主机/域名是否正常

&#x1f331;PING 地址/主机名/域名 /// <summary>/// PING/// </summary>/// <param name"ip">ip</param>/// <returns></returns>public static bool PingIp(string ip){System.Net.NetworkInformation.Ping p new System.N…

Quarto Dashboards 教程 1:Overview

「写在前面」 学习一个软件最好的方法就是啃它的官方文档。本着自己学习、分享他人的态度&#xff0c;分享官方文档的中文教程。软件可能随时更新&#xff0c;建议配合官方文档一起阅读。推荐先按顺序阅读往期内容&#xff1a; 1.quarto 教程 1&#xff1a;Hello, Quarto 2.qu…

游戏新手村21:再谈游戏广告页面设计

前文我们说到了网页游戏的LandingPage页面设计中需要遵循的一些规范和注意事项&#xff0c;本章我们重点谈下网络游戏的广告页面设计。 之前在金山的时候&#xff0c;大家习惯或者喜欢称LandingPage为分流页&#xff0c;这个页面需要加入哪些游戏信息才能在短时间内俘获玩家的…

深入解析Floyd Warshall算法:原理、Java实现与优缺点

Floyd Warshall算法的简介 在我们的日常生活中&#xff0c;常常会遇到需要找出两点之间最短路径的问题。比如&#xff0c;从家到公司的最短路线&#xff0c;或者在旅行时&#xff0c;从一个景点到另一个景点的最快路线。 为了解决这类问题&#xff0c;科学家们设计出了许多算法…