JVM运行时数据区——对象的实例化内存布局与访问定位

文章目录

  • 1、对象的实例化
    • 1.1、创建对象的方式
    • 1.2、创建对象的步骤
  • 2、对象的内存布局
  • 3、对象的访问定位
    • 3.1、对象访问的定位方式
    • 3.2、使用句柄访问
    • 3.3、使用指针访问
  • 4、小结

平时大家经常使用new关键字来创建对象,那么我们创建对象的时候,怎么去和运行时数据区关联起来呢?本贴将会带着这样的问题来重点讲解对象实例化的过程和方式,包括对象在内存中是怎样布局的,以及对象的访问定位方式,带领大家更加深入地学习对象的实例化布局。

1、对象的实例化

对象的实例化将分成两部分讲解,第一部分为创建对象的方式,第二部分为创建对象的步骤。如下图所示,是对象实例化的整体结构图:
在这里插入图片描述

1.1、创建对象的方式

创建对象的方式有多种,例如使用new关键字、Class的newInstance()方法、Constructor类的newInstance()方法、clone()方法、反序列化、第三方库Objenesis等,如下图所示:
在这里插入图片描述
每种创建对象方式的实际操作如下:

  • 使用new关键字——调用无参或有参构造器创建。
  • 使用Class的newInstance()方法——调用无参构造器创建,且需要是public的构造器。
  • 使用Constructor类的newInstance()方法——调用无参或有参、不同权限修饰构造器创建,实用性更广。
  • 使用clone()方法——不调用任何构造器,且对象需要实现Cloneable接口并实现其定义的clone()方法,且默认为浅复制。
  • 使用反序列化——从指定的文件或网络中,获取二进制流,反序列化为内存中的对象。
  • 第三方库Objenesis——利用了asm字节码技术,动态生成Constructor对象。

Java是面向对象的静态强类型语言,声明并创建对象的代码很常见,根据某个类声明一个引用变量指向被创建的对象,并使用此引用变量操作该对象。在实例化对象的过程中,JVM中发生了什么变化呢?

下面从最简单的Object ref = new Object();代码进行分析,利用javap -verbose -p命令查看对象创建的字节码,如下图所示:
在这里插入图片描述
各个指令的含义如下:

  • new:首先检查该类是否被加载。如果没有加载,则进行类的加载过程;如果已经加载,则在堆中分配内存。对象所需的内存的大小在类加载完成后便可以完全确定,为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。这个指令完毕后,将指向实例对象的引用变量压入虚拟机栈栈顶。
  • dup:在栈顶复制该引用变量,这时的栈顶有两个指向堆内实例对象的引用变量。
  • invokespecial:调用对象实例方法,通过栈顶的引用变量调用方法。是对象初始化时执行的方法,而是类初始化时执行的方法。

从上面的四个步骤中可以看出,需要从栈顶弹出两个实例对象的引用。这就是为什么会在new指令下面有一个dup指令。其实对于每一个new指令来说,一般编译器都会在其下面生成一个dup指令,这是因为实例的初始化方法(方法)肯定需要用到一次,然后第二个留给业务程序使用,例如给变量赋值、抛出异常等。如果我们不用,那编译器也会生成dup指令,在初始化方法调用完成后再从栈顶pop出来。

1.2、创建对象的步骤

前面所述是从字节码角度看待对象的创建过程,现在从执行步骤的角度来分析,如下图所示:
在这里插入图片描述

创建对象的步骤如下:

  • 1、判断对象对应的类是否加载、链接、初始化:虚拟机遇到一条new指令,首先去检查这个指令的参数能否在Metaspace的常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载、解析和初始化(即判断类元信息是否存在)。如果没有,那么在双亲委派模式下,使用当前类加载器以“ClassLoader+包名+类名”为Key查找对应的“.class”文件。如果没有找到文件,则抛出ClassNotFoundException异常。如果找到,则进行类加载,并生成对应的Class类对象。
  • 2、为对象分配内存:首先计算对象占用空间大小,接着在堆中划分一块内存给新对象。如果实例成员变量是引用变量,仅分配引用变量空间即可,即4字节大小。如果内存规整,使用指针碰撞。如果内存是规整的,那么虚拟机将采用指针碰撞法(Bump The Pointer)来为对象分配内存。意思是所有用过的内存在一边,空闲的内存在另外一边,中间放着一个指针作为分界点的指示器,分配内存就仅仅是把指针向空闲那边挪动一段与对象大小相等的距离罢了。一般使用带有compact(整理)过程的收集器时,使用指针碰撞,例如Serial Old、Parallel Old等垃圾收集器。如果内存不规整,虚拟机需要维护一个列表,使用空闲列表(Free List)分配。如果内存不是规整的,已使用的内存和未使用的内存相互交错,那么虚拟机将采用空闲列表法来为对象分配内存。意思是虚拟机维护了一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的内容。这种分配方式称为空闲列表。选择哪种分配方式由Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。
  • 3、处理并发安全问题:创建对象是非常频繁的操作,在分配内存空间时,另外一个问题是保证new对象的线程安全性。虚拟机采用了两种方式解决并发问题。CAS(Compare And Swap):是一种用于在多线程环境下实现同步功能的机制。CAS操作包含三个操作数,内存位置、预期数值和新值。CAS的实现逻辑是将内存位置处的数值与预期数值相比较,若相等,则将内存位置处的值替换为新值;若不相等,则不做任何操作。TLAB:把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存。
  • 4、初始化分配到的空间:内存分配结束,虚拟机将分配到的内存空间都初始化为零值(不包括对象头)。这一步保证了对象的实例字段在Java代码中可以不用赋初始值就可以直接使用,程序能访问到这些字段的数据类型所对应的零值。
  • 5、设置对象的对象头:将对象的所属类(即类的元数据信息)、对象的HashCode、对象的GC信息、锁信息等数据存储在对象头中。这个过程的具体设置方式取决于JVM实现。
  • 6、执行init()方法进行初始化:从Java程序的视角看来,初始化才正式开始。初始化成员变量,执行实例化代码块,调用类的构造方法,并把堆内对象的首地址赋值给引用变量。因此一般来说(由字节码中是否跟随由invokespecial指令所决定),new指令之后接着就是执行方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全创建出来。

2、对象的内存布局

对象的内存布局如下图所示:
在这里插入图片描述
在HotSpot虚拟机中,对象在内存中的布局可以分成对象头(Header)、实例数据(Instance Data)、对齐填充(Padding)三部分。

  • 对象头:主要包括对象自身的运行时元数据,比如哈希值、GC分代年龄、锁状态标志等,同时还包含一个类型指针,指向类元数据,表明该对象所属的类型。此外,如果对象是一个数组,对象头中还必须有一块用于记录数组的长度的数据。因为正常通过对象元数据就知道对象的确切大小。所以数组必须得知道长度。
  • 实例数据:它是对象真正存储的有效信息,包括程序代码中定义的各种类型的字段(包括从父类继承下来的和本身拥有的字段)。
  • 对齐填充:由于HotSpot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是任何对象的大小都必须是8字节的整数倍。对象头部分已经被精心设计成正好是8字节的倍数(1倍或者2倍),因此,如果对象实例数据部分没有对齐的话,就需要通过对齐填充来补全。它不是必要存在的,仅仅起着占位符的作用。

对象的内存布局示例如下图所示:
在这里插入图片描述
下面我们用代码来讲述实例在内存中的布局,如下代码清单所示:
在这里插入图片描述
把CustomerTest中main()方法看作是主线程,主线程虚拟机栈中放了main()方法的栈帧,其中栈帧里包含了局部变量表、操作数栈、动态链接、方法返回地址、附加信息等结构。局部变量表对于main()方法来讲第一个位置放的是args,第二个位置放的是cust,cust指向堆空间中new Customer()实体。Customer对象实体整体来看分为对象头、实例数据、对齐填充。对象头中主要有运行时元数据和元数据指针,元数据指针也可称为类型指针,运行时元数据包含哈希值、GC分代年龄、锁状态标志等信息;类型指针指向当前对象所属类的信息,也就是方法区的Customer类的Klass类元信息,Klass类元信息包括对象的类型信息;在实例数据中包含父类的实例数据,对于当前对象来讲它有id、name、acct三个变量,name的字符串常量放在堆空间的字符串常量池中,成员变量acct指向new Account()对象实例在堆中的内存地址,new Account()对象实例的对象头中也维护了一个类型指针指向方法区的Account的Klass类元信息。整体布局如下图所示:
在这里插入图片描述

3、对象的访问定位

3.1、对象访问的定位方式

前面讲解了创建对象的方式以及对象的内存结构。创建好对象之后,接下来就是去访问对象,那么JVM是如何通过栈帧中的对象引用访问到其内部对象实例的呢?如下图所示:
在这里插入图片描述
通常来讲,栈帧存储指向堆区中的对象地址,对象中含有该类对象的类型指针,也就是我们说的元数据指针,如果访问对象,只需要访问栈帧中的地址即可。

《Java虚拟机规范》没有对访问对象做具体的说明和要求,所以对象访问方式由虚拟机实现而定。主流有两种方式,分别是使用句柄访问和使用直接指针访问。

3.2、使用句柄访问

堆需要划分出一块内存来做句柄池,reference中存储对象的句柄池地址,句柄中包含对象实例与类型数据各自具体的地址信息,如下图所示:
在这里插入图片描述
这样做的好处是reference中存储稳定句柄地址,对象被移动(垃圾收集时移动对象很普遍)时只会改变句柄中实例数据指针,reference本身不需要被修改。但是这样做会造成多开辟一块空间来存储句柄地址,相当于是间接访问对象。

3.3、使用指针访问

reference中存储的就是对象的地址,如果只是访问对象本身的话,就不需要多一次间接访问的开销。

这样做的好处是访问速度更快,Java中对象访问频繁,每次访问都节省了一次指针定位的时间开销。HotSpot虚拟机主要使用直接指针访问的方式,如下图所示:
在这里插入图片描述
JVM可以通过对象引用准确定位到Java堆区中的对象,这样便可成功访问到对象的实例数据。JVM通过存储在对象中的元数据指针定位到存储在方法区中的对象的类型信息,即可访问目标对象的具体类型。

4、小结

讲解了多种创建对象的方式,如使用new关键字、Class的newInstance()方法、Constructor类的newInstance()方法等。紧接着讲解了创建对象的步骤,总共分为6步:第1步是判断对象对应的类是否加载、链接、初始化;第2步是为对象分配内存;第3步是处理并发安全问题;第4步是初始化分配到的空间;第5步是设置对象的对象头;第6步是执行init方法进行初始化。接下来讲解了对象的内存布局,并且使用案例讲解了对象在内存布局中的内容。最后讲解了访问对象的两种主流方式,分别是使用句柄访问和使用指针访问,其中经常使用的HotSpot虚拟机主要使用指针访问。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/735122.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ABAP接口-RFC连接(ABAP TO ABAP)

目录 ABAP接口-RFC连接(ABAP TO ABAP)创建ABAP连接RFC函数的调用 ABAP接口-RFC连接(ABAP TO ABAP) 创建ABAP连接 事务代码:SM59 点击创建,填写目标名称,选择连接类型: 填写主机名…

pycharm查看Tensor的完整数据

通常debug时,Tensor的数据呈现如下图,只显示开头几个值和结尾几个值,中间被省略: 解决方法: 右击想查看的数据,选择Evaluate Expression 输入如下命令,就会出现View as Array提示,…

鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:LoadingProgress)

用于显示加载动效的组件。 说明: 该组件从API Version 8开始支持。后续版本如有新增内容,则采用上角标单独标记该内容的起始版本。 子组件 无 接口 LoadingProgress() 创建加载进展组件。 从API version 9开始,该接口支持在ArkTS卡片中使…

2024年k8s最新版本使用教程

2024年k8s最新版本使用教程 3. YAML语言入门3.1 基本语法规则3.2 支持的数据结构3.3 其他语法 4 资源管理4.1 k8s资源查询4.2 资源操作命令4.3 资源操作方式4.3.1 命令行方式4.3.2 YAML文件方式 5 Namespace5.1 查看命名空间5.2 创建命名空间5.3 删除命名空间5.4 命名空间资源限…

计算机组成原理之机器:输入输出系统

计算机组成原理之机器:输入输出系统 笔记来源:哈尔滨工业大学计算机组成原理(哈工大刘宏伟) Chater3:输入输出系统 3.1 输入输出系统的发展概况 早期阶段 外部设备与主机之间采用分散连接,即每一个设备都…

什么是微隔离技术?

微隔离产生的背景 首先来看下南北向流量以及东西向流量的含义 南北向流量 指通过网关进出数据中心的流量,在云计算数据中心,处于用户业务虚拟机(容器)跟外部网络之间的流量,一般来说防火墙等安全设备部署在数…

Python打印Linux系统中最常用的linux命令之示例

一、Linux中的~/.bash_history文件说明: 该文件保存了linux系统中运行过的命令的历史。使用该文件来获取命令的列表,并统计命令的执行次数。统计时,只统计命令的名称,以不同参数调用相同的命令也视为同一命令。 二、示例代码&am…

【C语言步行梯】分支语句if...else、switch详谈

🎯每日努力一点点,技术进步看得见 🏠专栏介绍:【C语言步行梯】专栏用于介绍C语言相关内容,每篇文章将通过图片代码片段网络相关题目的方式编写,欢迎订阅~~ 文章目录 什么是语句?引入分支语句&am…

Charles-抓包工具的使用

文章目录 Charles简介与安装Charles的简介Charles的安装Charles 安装证书 抓包在PC端抓取HTTPS请求在移动端进行抓包移动端配置Androd端配置iOS端配置 Charles使用小技巧: 模拟慢速网络 Charles简介与安装 Charles的简介 Charles 是在 PC 端常用的网络封包截取工具…

数字化转型导师坚鹏:科技金融政策、案例及营销创新

科技金融政策、案例及营销创新 课程背景: 很多银行存在以下问题: 不清楚科技金融有哪些利好的政策? 不知道科技金融有哪些成功的案例? 不知道科技金融如何进行营销创新? 课程特色: 以案例的方式解…

【重温设计模式】迭代器模式及其Java示例

迭代器模式的介绍 在编程领域,迭代器模式是一种常见的设计模式,它提供了一种方法,使得我们可以顺序访问一个集合对象中的各个元素,而又无需暴露该对象的内部表示。你可以把它想象成一本书,你不需要知道这本书是怎么印…

vue+nodejs超市购物商城在线选品系统wtk87

在此基础上,结合现有超市货品信息管理体系的特点,运用新技术,构建了以 vue为基础的超市货品信息管理信息化管理体系。首先,以需求为依据,根据需求分析结果进行了系统的设计,并将其划分为管理员和用户二种角…

章六、集合(1)—— Set 接口及实现类、集合迭代、Map 接口、Collections类

一、 Set 接口及实现类 Set接口不能存储重复元素 Set接口继承了Collection接口。Set中所存储的元素是不重复的,但是是无序的, Set中的元素是没有索引的 Set接口有两个实现类: ● HashSet :HashSet类中的元素不能重复 ● TreeSet :可以给Set集…

python(5)之处理数组

上次代码结果如下: 1、处理数组的缺失值 1、isnan()函数 isnan()函数是Numpy模块里的一个可以标记数组中缺失值的位置 代码示例如下: import numpy as np ac np.array([1,2,3,2,3,4,5,9,np.nan,1]) p…

系统分析与设计(一)

我们有这么多各式各样的工具,互联网给我们带来了这么多用户和数据,这是好事也有副作用。 世界上能访问用户数据,并根据数据做分析和改进的公司,大概Google是其中翘楚,这种 data-centric 的做法做过了头,也有悲剧发生: Douglas Bowman 曾经是Google 的视觉设计主管,2009年的一天…

设计模式:观察者模式 ⑧

一、思想 观察者模式是一种常见的设计模式,也称作发布-订阅模式。它主要解决了对象之间的通知依赖关系问题。在这种模式中,一个对象(称作Subject)维护着一个对象列表,这些对象(称作Observers)都…

Docker完整版(一)

Docker完整版(一) 一、Docker概述1.1、Docker简介1.2、Docker的用途1.3、容器与虚拟机的区别1.4、Docker系统架构1.5、Docker仓库 二、Docker引擎2.1、Docker引擎架构2.2、Docker引擎分类2.3、Docker引擎的安装2.4、Docker镜像加速器 三、Docker镜像3.1、…

线程-创建线程的方法、线程池

1.创建线程一共有哪几种方法? 继承Thread类创建线程 继承Thread类,重写run()方法,在main()函数中调用子类的strat()方法 实现Runnable接口创建线程 先创建实现Runnable接口的类,重写run()方法,创建类的实例对象&#…

kibana配置 dashbord,做可视化展示

一、环境介绍 这里我使用的kibana版本为7.17版本。 语言选择为中文。 需要已经有es,已经有kibana,并且都能正常访问。 二、背景介绍 kibana的可视化界面,可以配置很多监控统计界面。非常方便,做数据的可视化展示。 这篇文章&…

数据结构:顺序表的奥秘

🎉个人名片: 🐼作者简介:一名乐于分享在学习道路上收获的大二在校生🐻‍❄个人主页🎉:GOTXX 🐼个人WeChat:ILXOXVJE🐼本文由GOTXX原创,首发CSDN&a…