jvm 内存 概述

jvm 内存 概述

JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。

一、运行时数据区域

Java 虚拟机在执行 Java 程序的过程中会把它管理的内存划分成若干个不同的数据区域。

线程私有的:

  • 程序计数器
  • 虚拟机栈
  • 本地方法栈

线程共享的:

  • 方法区
  • 直接内存

1、程序计数器 Program Counter Register

Register 的命名源于CPU的寄存器,CPU只有把数据装载到寄存器才能够运行

寄存器存储指令相关的现场信息,由于CPU时间片轮限制,众多线程在并发执行过程中,任何一个确定的时刻,一个处理器或者多核处理器中的一个内核,只会执行某个线程中的一条指令。这样必然导致经常中断或恢复,如何保证分毫无差呢?

程序计数器是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。字节码解释器工作时通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等功能都需要依赖这个计数器来完。

另外,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各线程之间计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。

主要的两个作用

  • 字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制,如:顺序执行、选择、循环、异常处理。

  • 在多线程的情况下,程序计数器用于记录当前线程执行的位置,从而当线程被切换回来的时候能够知道该线程上次运行到哪儿了。

如果当前线程正在执行的是

  • Java方法

计数器记录的就是当前线程正在执行的字节码指令的地址

  • 本地方法

那么程序计数器值为undefined

注意:程序计数器是唯一不会出现 OutOfMemoryError 的内存区域,它的生命周期随着线程的创建而创建,随着线程的结束而死亡。

特点

  • 一块较小的内存空间
  • 线程私有。每条线程都有一个独立的程序计数器。
  • 是唯一一个不会出现OOM的内存区域。
  • 生命周期随着线程的创建而创建,随着线程的结束而死亡。

2、Java 虚拟机栈 VM Stack

相对于基于寄存器的运行环境来说,JVM是基于栈结构的运行环境

栈结构移植性更好,可控性更强

JVM中的虚拟机栈是描述Java方法执行的内存区域,它是线程私有的

栈中的元素用于支持虚拟机进行方法调用,每个方法从开始调用到执行完成的过程,就是栈帧从入栈到出栈的过程

在活动线程中,只有位于栈顶的帧才是有效的,称为当前栈帧

正在执行的方法称为当前方法

栈帧是方法运行的基本结构

在执行引擎运行时,所有指令都只能针对当前栈帧进行操作

StackOverflowError表示请求的栈溢出,导致内存耗尽,通常出现在递归方法中

JVM能够横扫千军,虚拟机栈就是它的心腹大将,当前方法的栈帧,都是正在战斗的战场,其中的操作栈是参与战斗的士兵

局部变量表

  • 存放方法参数和局部变量
  • 相对于类属性变量的准备阶段和初始化阶段来说,局部变量没有准备阶段,必须显式初始化
  • 如果是非静态方法,则在index[0]位置上存储的是方法所属对象的实例引用,随后存储的是参数和局部变量
  • 字节码指令中的STORE指令就是将操作栈中计算完成的局部变量写回局部变量表的存储空间内

操作栈

  • 操作栈是一个初始状态为空的桶式结构栈
  • 在方法执行过程中,会有各种指令往栈中写入和提取信息
  • JVM的执行引擎是基于栈的执行引擎,其中的栈指的就是操作栈
  • 字节码指令集的定义都是基于栈类型的,栈的深度在方法元信息的stack属性中

Java虚拟机栈是描述Java方法运行过程的内存模型

Java虚拟机栈会为每一个即将运行的Java方法创建“栈帧”

用于存储该方法在运行过程中所需要的一些信息

  • 局部变量表

    存放基本数据类型变量、引用类型的变量、returnAddress类型的变量

  • 操作数栈

  • 动态链接
  • 当前方法的常量池指针
  • 当前方法的返回地址
  • 方法出口等信息

每一个方法从被调用到执行完成的过程,都对应着一个个栈帧在JVM栈中的入栈和出栈过程

注意:人们常说,Java的内存空间分为“栈”和“堆”,栈中存放局部变量,堆中存放对象。
这句话不完全正确!这里的“堆”可以这么理解,但这里的“栈”就是现在讲的虚拟机栈,或者说Java虚拟机栈中的局部变量表部分.
真正的Java虚拟机栈是由一个个栈帧组成,而每个栈帧中都拥有:局部变量表、操作数栈、动态链接、方法出口信息.

特点

  • 局部变量表的创建是在方法被执行的时候,随着栈帧的创建而创建.
  • 而且表的大小在编译期就确定,在创建的时候只需分配事先规定好的大小即可.
  • 在方法运行过程中,表的大小不会改变

异常

Java 虚拟机栈会出现两种异常:StackOverFlowError 和 OutOfMemoryError。

  • StackOverFlowError: 若Java虚拟机栈的内存大小不允许动态扩展,那么当线程请求栈的深度超过当前Java虚拟机栈的最大深度的时候,就抛出StackOverFlowError异常。
  • OutOfMemoryError: 若 Java 虚拟机栈的内存大小允许动态扩展,且当线程请求栈时内存用完了,无法再动态扩展了,此时抛出OutOfMemoryError异常。

其他

Java 虚拟机栈也是线程私有的,每个线程都有各自的Java虚拟机栈,而且随着线程的创建而创建,随着线程的死亡而死亡。

虚拟机栈通过压/出栈的方式,对每个方法对应的活动栈帧进行运算处理,方法正常执行结束,肯定会跳转到另一个栈帧上
在执行的过程中,如果出现异常,会进行异常回溯,返回地址通过异常处理表确定
栈帧在整个JVM体系中的地位颇高,包括局部变量表、操作栈、动态连接、方法返回地址等

Java 内存可以粗糙的区分为堆内存(Heap)和栈内存(Stack)其中栈就是现在说的虚拟机栈,或者说是虚拟机栈中局部变量表部分。 (实际上,Java虚拟机栈是由一个个栈帧组成,而每个栈帧中都拥有局部变量表、操作数栈、动态链接、方法出口信息)

局部变量表主要存放了编译器可知的各种数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型,它不同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)。

3、本地方法栈 Native Method Stack

和虚拟机栈所发挥的作用非常相似,区别是:

虚拟机栈为虚拟机执行 Java 方法 (也就是字节码)服务,而本地方法栈则为虚拟机使用到的 Native 方法服务。

在 HotSpot 虚拟机中和 Java 虚拟机栈合二为一。

本地方法被执行的时候,在本地方法栈也会创建一个栈帧,用于存放该本地方法的局部变量表、操作数栈、动态链接、出口信息。

方法执行完毕后相应的栈帧也会出栈并释放内存空间,也会出现 StackOverFlowError 和 OutOfMemoryError 两种异常。

4、Java堆 Java Heap

Heap是OOM故障最主要的发源地,它存储着几乎所有的实例对象,堆由垃圾收集器自动回收,堆区由各子线程共享使用

通常情况下,它占用的空间是所有内存区域中最大的,但如果无节制地创建大量对象,也容易消耗完所有的空间

堆的内存空间既可以固定大小,也可运行时动态地调整,通过如下参数设定初始值和最大值,比如

1
-Xms256M. -Xmx1024M

其中-X表示它是JVM运行参数

  • ms是memory start的简称 最小堆容量
  • mx是memory max的简称 最大堆容量

但是在通常情况下,服务器在运行过程中,堆空间不断地扩容与回缩,势必形成不必要的系统压力,所以在线上生产环境中,JVM的Xms和Xmx设置成一样大小,避免在GC后调整堆大小时带来的额外压力

堆分成两大块:新生代和老年代

对象产生之初在新生代,步入暮年时进入老年代,但是老年代也接纳在新生代无法容纳的超大对象

新生代= 1个Eden区+ 2个Survivor区

绝大部分对象在Eden区生成,当Eden区装填满的时候,会触发Young GC。垃圾回收的时候,在Eden区实现清除策略,没有被引用的对象则直接回收。依然存活的对象会被移送到Survivor区,这个区真是名副其实的存在

Survivor 区分为S0和S1两块内存空间,送到哪块空间呢?每次Young GC的时候,将存活的对象复制到未使用的那块空间,然后将当前正在使用的空间完全清除,交换两块空间的使用状态

如果YGC要移送的对象大于Survivor区容量上限,则直接移交给老年代

假如一些没有进取心的对象以为可以一直在新生代的Survivor区交换来交换去,那就错了。每个对象都有一个计数器,每次YGC都会加1。

1
-XX:MaxTenuringThreshold

参数能配置计数器的值到达某个阈值的时候,对象从新生代晋升至老年代。如果该参数配置为1,那么从新生代的Eden区直接移至老年代。默认值是15,可以在Survivor 区交换14次之后,晋升至老年代

若Survivor区无法放下,或者超大对象的阈值超过上限,则尝试在老年代中进行分配;

如果老年代也无法放下,则会触发Full Garbage Collection(Full GC);

如果依然无法放下,则抛OOM.

GC分类

  • Partial GC:并不收集整个GC堆的模式

    • Young GC:只收集young gen的GC,eden区分配满的时候触发
    • Old GC:只收集old gen的GC。只有CMS的concurrent collection是这个模式
    • Mixed GC:收集整个young gen以及部分old gen的GC。只有G1有这个模式
  • Full GC:收集整个堆,包括young gen、old gen、perm gen(如果存在的话)等所有部分的模式。

特点

  • Java虚拟机所需要管理的内存中最大的一块.

  • 堆内存物理上不一定要连续,只需要逻辑上连续即可,就像磁盘空间一样.

  • 堆是垃圾回收的主要区域,所以也被称为GC堆.

  • 堆的大小既可以固定也可以扩展,但主流的虚拟机堆的大小是可扩展的(通过-Xmx和-Xms控制),因此当线程请求分配内存,但堆已满,且内存已满无法再扩展时,就抛出OutOfMemoryError.

  • 线程共享

  • 整个Java虚拟机只有一个堆,所有的线程都访问同一个堆.
  • 它是被所有线程共享的一块内存区域,在虚拟机启动时创建.
  • 而程序计数器、Java虚拟机栈、本地方法栈都是一个线程对应一个

其他

  1. JAVA对象优先在Eden区分配,当Eden区没有足够的空间时触发一次Minor GC ,触发Minor GC时,Eden和from区中的存活对象会被复制到to区,然后from和to交换指针,以保证下次Minor GC时,to区还是空的,如果survival区无法容纳的对象将通过分配担保机制直接进入老年区

  2. 分配担保机制可以通过HandlePromotionFailure配置,如果不允许的话,则直接发生FULL GC

  3. 新生代(Young Generation)的最大大小将根据总堆的最大大小和NewRatio参数的值来计算。参数的“不受限制”默认值MaxNewSize意味着计算值不受限制,MaxNewSize除非MaxNewSize在命令行中指定了值

  4. 一般情况下,不允许-XX:Newratio值小于1,即Old要比Young大

  5. 大对象直接进入老年区的判断是根据PretenureSizeThreshold设置的阈值,所谓大对象时指需要大量连续内存空间的Java对象,最典型的大对象就是那种很长的字符串以及数组(笔者列出的例子中的byte[]数组就是典型的大对象)

  6. 发生full GC的条件是:

  • (1)调用System.gc时,系统建议执行Full GC,但是不必然执行
  • (2)老年代空间不足
  • (3)方法区空间不足
  • (4)通过Minor GC后进入老年代的平均大小大于老年代的可用内存
  • (5)由Eden区、From Space区向To Space区复制时,对象大小大于To Space可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小
  1. 对象存活判断
  • 引用计数:每个对象有一个引用计数属性,新增一个引用时计数加1,引用释放时计数减1,计数为0时可以回收。此方法简单,无法解决对象相互循环引用的问题
  • 可达性分析:从GC Roots开始向下搜索,搜索所走过的路径称为引用链。当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的,不可达对象
  1. GC Roots对象包括
  • 虚拟机栈(栈帧中的本地变量表)中引用的对象
  • 方法区中类静态属性引用的对象
  • 方法区中常量引用的对象
  • 本地方法栈中JNI(即一般说的Native方法)引用的对象
  • 已启动且未停止的java线程

5、方法区 Method Area

方法区与 Java 堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做 Non-Heap(非堆),目的应该是与 Java 堆区分开来。

HotSpot 虚拟机中方法区也常被称为 “永久代”,本质上两者并不等价。仅仅是因为 HotSpot 虚拟机设计团队用永久代来实现方法区而已,这样 HotSpot 虚拟机的垃圾收集器就可以像管理 Java 堆一样管理这部分内存了。但是这并不是一个好主意,因为这样更容易遇到内存溢出问题。

相对而言,垃圾收集行为在这个区域是比较少出现的,但并非数据进入方法区后就“永久存在”了。

特点

线程共享

  • 方法区是堆的一个逻辑部分,因此和堆一样,都是线程共享的.整个虚拟机中只有一个方法区.

永久代

  • 方法区中的信息一般需要长期存在,而且它又是堆的逻辑分区,因此用堆的划分方法,我们把方法区称为永久代.

内存回收效率低

  • Java虚拟机规范对方法区的要求比较宽松,可以不实现垃圾收集.
  • 方法区中的信息一般需要长期存在,回收一遍内存之后可能只有少量信息无效.
  • 对方法区的内存回收的主要目标是:对常量池的回收和对类型的卸载

和堆一样,允许固定大小,也允许可扩展的大小,还允许不实现垃圾回收。

当方法区内存空间无法满足内存分配需求时,将抛出OutOfMemoryError异常.

5.1、运行时常量池 Runtime Constant Pool

运行时常量池是方法区的一部分。

方法区中存放三种数据:类信息、常量、静态变量、即时编译器编译后的代码.其中常量存储在运行时常量池中.

java文件被编译之后生成的.class文件中除了包含:类的版本、字段、方法、接口等信息外,还有一项就是常量池

常量池中存放编译时期产生的各种字面量和符号引用,.class文件中的常量池中的所有的内容在类被加载后存放到方法区的运行时常量池中。

1
2
int age = 21; //age是一个变量,可以被赋值;21就是一个字面值常量,不能被赋值;
int final pai = 3.14; //pai就是一个符号常量,一旦被赋值之后就不能被修改。

Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池( Constant pool table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入运行时常量池中存放。运行时常量池相对于class文件常量池的另外一个特性是具备动态性,java语言并不要求常量一定只有编译器才产生,也就是并非预置入class文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中。

在近三个JDK版本(6、7、8)中, 运行时常量池的所处区域一直在不断的变化,

  • JDK6时它是方法区的一部分
  • 7又把他放到了堆内存中
  • 8之后出现了元空间,它又回到了方法区。

其实,这也说明了官方对“永久代”的优化从7就已经开始了

特性

  • class文件中的常量池具有动态性.
  • Java并不要求常量只能在编译时候产生,Java允许在运行期间将新的常量放入方法区的运行时常量池中.
  • String类中的intern()方法就是采用了运行时常量池的动态性.当调用 intern 方法时,如果池已经包含一个等于此 String 对象的字符串,则返回池中的字符串.否则,将此 String 对象添加到池中,并返回此 String 对象的引用.

异常

运行时常量池是方法区的一部分,所以会受到方法区内存的限制,因此当常量池无法再申请到内存时就会抛出OutOfMemoryError异常.

我们一般在一个类中通过public static final来声明一个常量。这个类被编译后便生成Class文件,这个类的所有信息都存储在这个class文件中。

当这个类被Java虚拟机加载后,class文件中的常量就存放在方法区的运行时常量池中。而且在运行期间,可以向常量池中添加新的常量。如:String类的intern()方法就能在运行期间向常量池中添加字符串常量。

当运行时常量池中的某些常量没有被对象引用,同时也没有被变量引用,那么就需要垃圾收集器回收。

6、直接内存 Direct Memory

直接内存不是虚拟机运行时数据区的一部分,也不是JVM规范中定义的内存区域,但在JVM的实际运行过程中会频繁地使用这块区域.而且也会抛OOM

在JDK 1.4中加入了NIO(New Input/Output)类,引入了一种基于管道和缓冲区的IO方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在堆里的DirectByteBuffer对象作为这块内存的引用来操作堆外内存中的数据.
这样能在一些场景中显著提升性能,因为避免了在Java堆和Native堆中来回复制数据.

综上看来

程序计数器、Java虚拟机栈、本地方法栈是线程私有的,即每个线程都拥有各自的程序计数器、Java虚拟机栈、本地方法区。并且他们的生命周期和所属的线程一样。
而堆、方法区是线程共享的,在Java虚拟机中只有一个堆、一个方法栈。并在JVM启动的时候就创建,JVM停止才销毁。

7、元空间 Metaspace

在JDK8,元空间的前身Perm区已经被淘汰,在JDK7及之前的版本中,只有Hotspot才有Perm区(永久代),它在启动时固定大小,很难进行调优,并且Full GC时会移动类元信息

在某些场景下,如果动态加载类过多,容易产生Perm区的OOM.

为解决该问题,需要设定运行参数

1
-XX:MaxPermSize= l280m

如果部署到新机器上,往往会因为JVM参数没有修改导致故障再现。不熟悉此应用的人排查问题时往往苦不堪言,除此之外,永久代在GC过程中还存在诸多问题

所以,JDK8使用元空间替换永久代,区别于永久代,元空间在本地内存中分配.
也就是说,只要本地内存足够,它不会出现像永久代中java.lang.OutOfMemoryError: PermGen space

默认情况下,“元空间”的大小可以动态调整,或者使用新参数MaxMetaspaceSize来限制本地内存分配给类元数据的大小.

在JDK8里,Perm 区所有内容中

  • 字符串常量移至堆内存

  • 其他内容包括类元信息、字段、静态属性、方法、常量等都移动至元空间

特点

  • 充分利用了Java语言规范:类及相关的元数据的生命周期与类加载器的一致
  • 每个类加载器都有它的内存区域-元空间
  • 只进行线性分配
  • 不会单独回收某个类(除了重定义类 RedefineClasses 或类加载失败)
  • 没有GC扫描或压缩
  • 元空间里的对象不会被转移
  • 如果GC发现某个类加载器不再存活,会对整个元空间进行集体回收

GC

  • Full GC时,指向元数据指针都不用再扫描,减少了Full GC的时间
  • 很多复杂的元数据扫描的代码(尤其是CMS里面的那些)都删除了
  • 元空间只有少量的指针指向Java堆

    这包括:类的元数据中指向java.lang.Class实例的指针;数组类的元数据中,指向java.lang.Class集合的指针。

  • 没有元数据压缩的开销

  • 减少了GC Root的扫描(不再扫描虚拟机里面的已加载类的目录和其它的内部哈希表)
  • G1回收器中,并发标记阶段完成后就可以进行类的卸载

元空间内存分配模型

  • 绝大多数的类元数据的空间都在本地内存中分配
  • 用来描述类元数据的对象也被移除
  • 为元数据分配了多个映射的虚拟内存空间
  • 为每个类加载器分配一个内存块列表

    • 块的大小取决于类加载器的类型
    • Java反射的字节码存取器(sun.reflect.DelegatingClassLoader )占用内存更小
  • 空闲块内存返还给块内存列表

  • 当元空间为空,虚拟内存空间会被回收
  • 减少了内存碎片

最后,从线程共享的角度来看

  • 堆和元空间是所有线程共享的
  • 虚拟机栈、本地方法栈、程序计数器是线程内部私有的

从这个角度看一下Java内存结构

8、从GC角度看Java堆

堆和方法区都是线程共享的区域,主要用来存放对象的相关信息。我们知道,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序运行期间才能知道会创建哪些对象,因此, 这部分的内存和回收都是动态的,垃圾收集器所关注的就是这部分内存(本节后续所说的“内存”分配与回收也仅指这部分内存)。而在JDK1.7和1.8对这部分内存的分配也有所不同,下面我们来详细看一下

二、JVM关闭

  • 正常关闭:当最后一个非守护线程结束或调用了System.exit或通过其他特定于平台的方式,比如ctrl+c。
  • 强制关闭:调用Runtime.halt方法,或在操作系统中直接kill(发送single信号)掉JVM进程。
  • 异常关闭:运行中遇到RuntimeException 异常等

在某些情况下,我们需要在JVM关闭时做一些扫尾的工作,比如删除临时文件、停止日志服务。为此JVM提供了关闭钩子(shutdown hocks)来做这些事件。

Runtime类封装java应用运行时的环境,每个java应用程序都有一个Runtime类实例,使用程序能与其运行环境相连。

关闭钩子本质上是一个线程(也称为hock线程),可以通过Runtime的addshutdownhock (Thread hock)向主jvm注册一个关闭钩子。hock线程在jvm正常关闭时执行,强制关闭不执行。

对于在jvm中注册的多个关闭钩子,他们会并发执行,jvm并不能保证他们的执行顺序。

参考

https://www.nowcoder.com/discuss/151138?type=1

http://www.importnew.com/31126.html/jvm-1

https://blog.csdn.net/yingziisme/article/details/82946084