首页 > 基础资料 博客日记
HotSpot虚拟机对象探秘
2025-07-30 00:00:01基础资料围观125次
HotSpot虚拟机对象探秘
HotSpot虚拟机在Java堆中的对象分配、布局和访问。
对象的创建
如何划分可用空间。
并发下指针分配的安全问题。
普通Java对象、数组对象和Class对象。此处只讨论普通Java对象。
使用new关键字创建对象,在虚拟机中,这是怎样的一个过程?
当Java虚拟机遇到一条字节码new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用。并检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,则先执行相应的类加载过程。
类加载检查通过后,虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后便可完全确定。
为对象分配空间的任务实际上等同于把一块确定大小的内存块从Java堆中划分出来。
- 分配方式
- 指针碰撞
假设Java堆中的内存是绝对规整。
- 空闲列表
维护一个列表,记录哪些内存块是可用的。
选择哪种分配方式由Java堆是否规整决定。
Java堆是否规整由所采用的垃圾收集器是否带有空间压缩整理(Compact)的能力决定。
当使用Serial、ParNew等带压缩整理过程的收集器时,系统采用的分配算法是指针碰撞。
当使用CMS这种基于清除(Sweep)算法的收集器时,理论上就只能采用较为复杂的空闲列表来分配内存。
- 如何保障并发内存分配的线程安全
有两种可选方案:
- 对分配内存空间的动作进行同步处理。实际上虚拟机是采用CAS配上失败重试的方式保证更新操作的原子性。
- 把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer, TLAB),哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完了,分配新的缓存区时才需要同步锁定。
- 设置零值
内存分配完成之后,虚拟机将分配到的内存空间(不包括对象头)都初始化为零值。
如果使用了TLAB,这一项工作可以提前到TLAB分配时顺便进行。
这步操作保证了对象的实例字段在Java代码中,可以不赋初始值就直接使用,使程序能访问到这些字段的数据类型所对应的零值。
- 进行必要的设置
Java虚拟机对对象进行必要的设置
对象是哪个类的实例
如何找到类的元数据信息
对象的哈希码
对象的GC分代年龄信息
这些信息存放在对象的对象头(Object Header)之中。根据虚拟机当前运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。
上面的工作都完成之后,从虚拟机视角来看,一个新的对象已经产生了。
从Java程序的的视角看来,对象的创建才刚开始。new指令之后执行
对象的内存布局
在HotSpot虚拟机里,对象在堆内存中的存储布局可以划分为三个部分:
对象头(Header)
实例数据(Instance Data)
对齐填充(Padding)
对象头
包含两类信息:
第一类,用于存储对象自身的运行时数据。哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有锁、偏向线程ID、偏向时间戳等。这部分数据的长度在32位和64位的虚拟机(未开启压缩指针)中分别为32个比特和64个比特,官方称它为"Mark Word"。
Mark Work被设计为一个有着动态定义的数据结构,以便在极小的空间内存储尽量多的数据,根据对象的状态,复用自己的存储空间。
有如下五种状态:未锁定、轻量级锁定、重量级锁定、GC标记、可偏向。根据状态不同,用不同的比特位控制不同的存储内容。
第二类,类型指针。对象指向它的类型的元数据指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。
并不是所有虚拟机实现都必须在对象数据上保留类型指针,即查找对象的元数据信息,不一定要经过对象本身。
如果对象是一个数组,对象头中还必须有一块用于记录数组长度的数据。虚拟机可以通过普通Java对象的元数据信息确定Java对象的大小,如果数组的长度是不确定的,将无法通过元数据信息推断数组的大小。
实例数据
实例数据部分是对象真正存储的有效信息。
我们在程序代码里定义的各种类型的字段内容。无论是从父类继承的,还是子类中定义的字段,都必须记录起来。
这部分的存储顺序,会受到虚拟机分配策略参数(-XX: FieldAllocationStyle参数)和字段在Java源码中定义顺序的影响。
相同宽度的字段总是被分配到一起存放。
对齐填充
并非必然存在,仅起着占位符的作用。
HotSpot虚拟机的内存管理系统,要求对象的起始地址,必须是8字节的整数倍,即任何对象的大小都必须是8字节的整数倍。
对象头已经被精心设计成正好是8字节的倍数(1倍或者2倍)。
对象实例数据如果没有对齐的话,需要通过对齐填充补全。
对象的访问定位
Java程序会通过栈上的reference数据来操作堆上的具体对象。
访问方式有两种:
- 句柄
- 直接指针
句柄
使用句柄访问,Java堆中将划出一块内存来作为句柄池。reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息。
直接指针
使用直接指针访问,Java堆中对象的内存布局,必须考虑如何放置访问类型数据的相关信息,reference中存储的直接就是对象地址,如果只是访问对象本身,不需要多一次间接访问的开销。
优点:速度快,节省一次指针定位的时间开销。hotSpot主要采用该方式进行访问。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签: