深入理解java虚拟机(1) -- 理解HotSpot内存区域

本系列文章为笔者阅读周志明老师所著的《深入理解java虚拟机 第二版》的一些感悟及读书笔记,这本书在我2016年(大三)的时候读过第一次,但是到现在很多细节已经有所遗忘,所以再次重读本书的时候,通过博客的形式,总结一下阅读之后的一些感悟以及对一些知识点的记录,以便日后可以快速回忆书中的内容。

正文

JVM将内存划分为几个不同的数据区域,每个区域都有各自的用途,根据《Java虚拟机规范(Java SE 7版)》的规定,JVM所管理的内存包括以下几个运行时数据区域:

  • 程序计数器
  • 虚拟机栈
  • 本地方法栈
  • 方法区

对于以上几个数据区域,不同的虚拟机有不同的实现方式,而sun公司的虚拟机HotSpot将虚拟机栈和本地方法栈合二为一,其实虚拟机栈和本地方法栈差不多,只是虚拟机栈为java程序服务,而本地方法栈为虚拟机使用到的Native方法服务,我们主要学习HotSpot虚拟机,所以主要对HotSpot的实现方式展开讨论,以下将简要描述这几个区域:
(在介绍各个数据区域的用途前,现总结一下这几个区域:程序计数器、虚拟机栈、本地方法栈是线程隔离的数据区,即这三个区域随线程产生,每个线程都有自己的栈;而方法区和堆空间是属于线程共享的数据区,即所有线程共用一个方法区和堆)

  1. 程序计数器
    程序计数器是一块较小的内存空间,它可以看作当前线程所执行的字节码的行号指示器,字节解释器工作时就是通过改变这个程序计数器的值来选取下一条要执行的指令。

  2. 虚拟机栈&本地方法栈
    虚拟机栈和堆应该是大多数java程序员最关心的区域,首先虚拟机栈也是线程私有的,每个线程启动时都会创建一个私有的虚拟机栈,线程中的每个方法执行的同时都会创建一个栈帧,用于存放局部变量表、操作数栈、动态链接、方法出口等信息,而局部变量表包括各种基本数据类型和对象引用。每个方法从调用到执行完成返回的过程就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。


  3. 堆是虚拟机所管理的内存中最大的一块,java堆被所有线程共享,在虚拟机启动时创建,该区域的唯一目的就是存放对象的实例,所有对象实例以及数组都要在堆上分配,由于HotSpot的分代GC思想,java堆可以细分为:新生代和老年代,新生代则可以划分为一个Eden区和两个survivor区,其中Eden区和survivor区的比例默认是8:1:1,关于这部分内容,会在以后进行详细讲解。

  4. 方法区
    方法区是所有线程共享的内存区域,它用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码数据。在虚拟机规范中方法区为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的应该是与堆区分开来,在方法区除了存放类信息,还有一个区域是运行时常量池,该区域用于存放各种常量信息,在JDK1.8之前方法区被HotSpot用永久代来实现,jdk1.7将字符串常量池从方法区移到堆中,jdk1.8完全移除永久代,取而代之的是元空间。元空间不在虚拟机中分分配,而是直接在本地内存分配。元空间的存活时间和类加载器的时间一致,一旦类加载器被回收,那么相对应的元空间也会被回收。

TLAB(本地线程分配缓冲): Thread Local Allocation Buffer

由于在并发情况下,创建对象是线程不安全的,例如:可能出现正在给对象A分配内存,指针还没来得及修改,对象B又使用还没修改的旧的指针来分配内存的问题,实际上jvm采用CAS配上失败重试的方式来保证操作的原子性,但是有另一种思路是把内存分配的动作按照线程划分在不同的空间中进行,即每个线程在java堆中预先分配一小块内存,这块内存就叫TLAB,这样那个对象要new分配内存的时候就在自己线程的TLAB上分配,这样就不存在线程安全问题(虽然TLAB是在堆中划分,但是它是线程私有的),当线程的TLAB用完时,就同步上锁分配新的TLAB。虚拟机是否使用TLAB可以通过-XX:+/-UseTLAB参数来设定。

对象的内存布局:

我们都知道对象在堆中被创建,那么对象在堆中具体是怎样存在的呢?在HotSpot虚拟机中,对象在内存中存储的布局可以分为3块区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)

  • 对象头:
    对象头包含两部分信息,第一部分用于存储对象吱声的运行时数据,包括哈希吗(HashCode)、GC分代年龄(在后文中会说)、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等,这部分数据的长度在32为虚拟机和64位虚拟机中分别为32bit和64bit,对象头的另一部分是类型指针,该指针指向存在方法区的它的类元数据,虚拟机通过这个指针来判断这个对象是哪个类的实例。如果对象是数组,那在对象头中还必须有一块用于记录数组长度的数据。
  • 实例数据:
    实例数据就是对象真正存储的有效信息,这部分的内容相信大家都很清楚。
  • 对齐填充:
    该部分不是必然存在的,该部分的存在主要是起站位符的作用。因为HotSpot的自动内存管理系统要求对象起始地址必须是8字节的整数倍。

尾声

本篇主要了解了jvm的内存分配以及对象的创建过程,在下一篇文章中主要记录《深入理解java虚拟机》一书第三章的内容,即:垃圾收集策略与内存分配策略