jlearning.cn

《深入理解java虚拟机》读书笔记(二)——Java内存

Java内存

从观念上介绍Java内存的各个区域,讲解这些区域的作用、服务对象以及其中可能产生的问题。

运行时数据区域

运行时数据区

程序计数器

  • 当前线程所执行的字节码的行号指示器。
  • 每条线程需要一个独立的程序计数器,各条线程之间计数器互不影响,独立存储。所以,这类内存区域为“线程私有”的内存。
  • 此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。
  • 若执行Java方法,记录正在执行的虚拟机字节码指令的地址。
  • 若执行Native方法,计数器值为空(Undefined)。

Java虚拟机栈

  • 和程序计数器一样,也是线程私有的,生命周期和线程相同。
  • 虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。方法的调用到完成——栈帧在虚拟机栈中入栈到出栈。
  • 局部变量表:存放了编译期可知的各种基本数据类型(64位的long和double占据2个局部变量空间Slot)、对象引用(指向对象起始地址的引用指针,或者指向一个代表对象的句柄,或者其他与此对象相关的位置),和returnAddress类型(指向了一条字节码指令的地址)
  • 局部变量表所需要的内存在编译期间完成分配,运行期间不会改变局部变量表的大小。
  • 两种异常:
    • 线程请求栈的深度大于虚拟机允许:StackOverflowError
    • 如果虚拟机栈可以动态扩展,如果扩展式无法申请到足够的内存:OutOfMemoryError

本地方法栈

  • 与虚拟机栈类似,虚拟机栈为虚拟机执行Java方法(也就是字节码),本地方法栈为执行Native方法服务。
  • Native方法:一个Native Method就是一个java调用非java代码的接口。一个Native Method是这样一个java的方法:该方法的实现由非java语言实现,比如C。

Java堆

  • 是Java虚拟机所管理的内存中最大的一块,被所有线程共享的一块内存区域,在虚拟机启动时创建。
  • Java堆的唯一目的:存放对象实例。
  • 随着JIT编译器的发展和逃逸分析技术逐渐成熟,所有对象都都分配在堆上,已经不那么绝对了。
  • Java堆是垃圾收集器管理的主要区域,因此也被称作GC堆。(Garbage Collected)
  • 从内存回收的角度,由于基本采用分代收集算法
    • Java堆可分为:
      • 新生代
      • 老年代
    • 更细致一点:
      • Eden空间
      • From Survivor空间
      • To Survivor空间
  • 从内存分配的角度,可能划分出多个线程私有的分配缓冲区(TLAB)(Tread Local Allocation Buffer)
  • Java可以处于物理上不连续的内存空间中,只要逻辑上连续的即可。
  • 可以固定大小,也可以扩展(通过-Xmx和-Xms控制

方法区

  • 用于存储已被虚拟机加载的类信息常量静态变量即时编译器编译后的代码等。
  • 这区域的内存回收目标主要是针对常量池的回收对类型的卸载,也可以不实现垃圾收集。
运行时的常量池
  • Class文件中的常量池(Constant Pool Table),用于存放编译期生成的各种字面量符号引用。这些内容在类加载后进入方法区的运行时常量池。
  • 除了保存Class文件中描述的符号引用外,还会把翻译出来的直接引用也存储在运行时常量池。
  • 不一定编译的时候产生常量,运行期间也可能加入新的常量,比如说String.intern()
    • intern():当调用 intern 方法时,如果池已经包含一个等于此 String 对象的字符串(该对象由 equals(Object) 方法确定),则返回池中的字符串。否则,将此 String 对象添加到池中,并且返回此 String 对象的引用。

直接内存

  • JDK1.4新加入NIO类,引入基于通道(Channel)缓冲区(Buffer)的I/O方式,可以使用Native函数库直接分配堆外内存,然后通过Java堆中的DirectByteBuffer对象作为对这块内存的引用。避免了再Java堆和Native堆中来回复制数据。
  • 不能忽视直接内存,以免出现OutOfMemoryError异常。

HotSpot虚拟机对象探秘

对象的创建

  • 虚拟机遇到一条new指令,检查这个指令的参数是否能在常量池中定位到一个类的符号引用。并且检查这个符号引用代表的类是否被加载、解析、初始化过。如果没有,先执行相应的类加载过程。(可以确定类需要的内存大小)
  • 虚拟机为新生对象分配内存。
    • 如果Java堆中内存是绝对规整的,把作为分界点指示器的指针,向前挪动一段与对象大小相等的距离。——叫做指针碰撞(Bump the Pointer)。
    • 如果Java堆中内存不是规整的,虚拟机需要维护一个列表,记录那些内存块是可用的。——空闲列表(Free List)。
    • Java堆是否规整由所采用的垃圾收集器是否带有压缩整理功能决定的。
    • 保证修改指针的线程安全
      1. 采用CAS配上失败重试的方式保证更新操作的原子性。
      2. 另一种方法是把内存分配的动作按照线程划分在不同的空间进行。每个线程在Java堆中预先分配一小块内存,成为本地线程分配缓存(TLAB)
  • 内存分配完成后,虚拟机将分配到的内存空间都初始化为零值(不包括对象头)。保证对象的实例字段在Java代码中可以不赋初始值就直接使用。
  • 对对象进行必要的设置
    • 这个对象是哪个类的实例
    • 如何才能找到类的元数据信息
    • 对象的哈希码
    • 对象的GC分代年龄
  • 最后执行ini()方法。

对象的内存布局

  • 对象头(Header)
    • 用于存储对象自身的运行时数据。如哈希码,GC分代年龄,锁状态标志,线程持有的锁,偏向想成ID,偏向时间戳等。官方称为Mark Word。
    • 类型指针。即对象指向它的类元数据的指针。通过这个指针来确定这个对象是哪个类的实例。
  • 实例数据(Instance Data)
    • 在程序代码中所定义的各种类型的字段内容。
    • 存储顺序收到虚拟机分配策略参数(FieldsAllocationStyle)和字段在Java源码中定义顺序的影响。
      • 相同宽度的字段被分配在一起
      • 父类中定义的变量会出现在自雷之前。
  • 对齐填充(Padding)
    • 对象的大小必须是8字节的整数倍。

对象的访问定位

  • Java程序需要通过栈上的reference数据来操作堆上的具体对象。
  • 使用句柄的话,Java堆中会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址。据病种包含了对象实例数据类型数据各自的具体地址信息。
    • 优点:对象被移动时,只要改变据病种的实例数据指针,reference本身不需要改变。
  • 使用直接指针访问的话,Java堆对象的布局中就必须考虑放置访问类型数据相关信息。
    • 好处:速度更快,节省了一次指针定位的时间开销。

OOM异常实战

Java堆溢出

  • 通过内存映像分析工具对Dump出来的堆转储快照进行分析,确认内存中的对象是否是必要的,也就是分清楚是内存泄漏(Memory Leak)还是内存溢出(Memory Overflow)。
  • 内存泄漏(GC无法回收它们)
    • 通过工具查看泄漏对象是通过怎样的路径与GC Roots相关联,并导致垃圾回收器,无法自动回收它们的。
  • 内存溢出(对象都必须存活)
    • 检查堆参数(Xms和Xmx)与物理内存的比例看是否还可以增大。
    • 从代码上检查是否存在某些对象生命周期过长持有状态时间过长

虚拟机栈和本地方法栈溢出

  • 如果线程请求的栈深度大于虚拟机所允许的最大深度,StackOverflowError.
  • 如果虚拟机在扩展式无法申请到足够的内存空间,OutMemoryError.
  • 在单个线程下,虚拟机抛出都是StackOverflowError。

方法区和运行时常量池溢出

  • String.intern()

本机内存直接溢出

  • 特征是在Heap Dump文件中不会看见明显的异常,如果发现OOM之后Dump文件很小,程序又使用了NIO,可以考虑一下这个原因。