深入分析JVM执行引擎

程序和机器沟通的桥梁

一、闲聊

相信很多朋友在出国旅游,或者与外国友人沟通的过程中,都会遇到语言不通的烦恼。这时候我们就需要掌握对应的外语或者拥有一部翻译机。而笔者只会中文,所以需要借助一部翻译器才能与不懂中文的外国友人交流。咱们的执行引擎就类似于这部“翻译机”。

二、概述

执行引擎的作用就是将字节码指令解释或者编译为对应平台上的本地机器指令。简单来说,执行引擎充当了将高级语言翻译为机器语言的翻译者。对于Hotspot虚拟机,执行引擎中包含两部分:解释器和JIT编译器(即时编译器)。下图是执行引擎的原理:

三、解释器

解释器所承担的角色就是一个运行时 翻译者 ,将字节码文件中的内容 翻译 为对应平台的本地机器码指令。当一条字节码指令被解释执行后,接着再根据pc寄存器中记录的下一条需要被执行的字节码指令执行解释操作。JVM解释器一共有两套,一套是远古的 字节码解释器 ,另一套是现在普遍使用的 模板解释器

1、字节码解释器

字节码解释器在执行过程中通过 纯软件代码 模拟字节码执行,效率非常低。

2、模板解释器

模板解释器将 每一条字节码和一个模板函数关联 ,模板函数中直接产生这条字节码指令执行时的机器码,从而提高了解释器的性能。在常用的HotSpot VM中,解释器主要由Interpreter模板和code模块构成。Interpreter模板:实现了解释器的核心功能。code模块:用于管理HotSpot VM在运行时生成的本地机器码指令。

四、即时编译器(JIT编译器)

即时编译器的目的是避免函数被解释执行,而是将整个函数体编译成机器码指令,每次函数执行时,只执行编译后的机器码即可,这种方式可以大大的提高效率。

1、热点代码及探测方式

当然,是否需要JIT编译器将字节码直接编译成对应平台的机器码,需要根据代码被调用的 执行频率 而定。需要被JIT编译器编译成机器码的字节码,也称为 热点代码 ,JIT编译器会对热点代码做出 深度优化 ,将其从字节码编译成机器码, 并缓存到方法区 ,提高代码的执行效率。

JIT编译的方式发生在方法执行过程中,因此也被称之为_栈上替换_,或简称OSR(On Stack Replacement)编译。通过 热点探测 的方法,判断一个方法被调用多少次,或循环体执行多少次才可以达到阈值,进行编译。而Hotspot VM热点探测的方式是基于计数器实现的。这种基于技术的热点探测方式又分为两种:1.方法调用计数器 2.回边计数器

关于栈上替换这里笔者不展开赘述,有兴趣的小伙伴可以自行了解下

1.1方法调用计数器

方法调用计数器用于统计方法调用次数,它的默认阈值是client模式下是1500次,在server模式下是10000次。超过这个阈值,就会触发JIT编译。当然,这个阈值也可以通过修改虚拟机参数 -XX:CompileThreshold 来手动指定。

当一个方法被调用的时候,会优先检查该方法是否被JIT编译过,如果存在,则优先使用编译过的本地代码来执行,如果不存在,则将此方法的调用计数器加一,然后再判断计数器的值是否超过配置的阈值。如果已经超过了,就会向JIT编译器提交一个该方法的编译请求。下面是方法调用计数器执行的流程图:

关于方法调用计数器,如果不做任何设置,方法调用计数器统计的并不是方法被调用的绝对次数,而是一个相对执行的频率。当超过一定的时间限度,如果方法的调用次数仍然达不到阈值,那这个方法的调用计数器就会被减少一半,这个过程称为方法调用计数器的 热度衰减 ,而这段时间被称作为该方法的 半衰周期

进行热度衰减的过程是虚拟机进行垃圾回收的时候顺便进行的,举手之劳而已。可以使用虚拟机参数 -XX:-UseCounterDecay 来关闭热度衰减。这样的话,只要运行时间足够长,绝大部分方法都会被编译成本地代码。最后,还可以使用 -XX:CounterHalfLifeTime 参数设置半衰周期的时间,单位为秒。

1.2回边计数器

它的作用是统计一个方法中 循环体代码执行次数 ,在字节码中遇到控制流向后,跳转的指令称为“回边”。显然,建立回边计数器统计的目的是为了触发OSR编译。下面是回边计数器执行的流程图:

关于OSR编译上文中有提到

2、即时编译器分类

在Hotspot VM中,内嵌有两个JIT编译器,分别为client compiler和server compiler,但是大多数情况下我们简称C1编译器和C2编译器。可以通过命令显示的指定JVM在运行时到底使用哪种JIT编译器。

2.1 c1编译器

指定Java虚拟机运行在client模式下,使用C1编译器。C1编译器会对字节码进行简单和可靠的优化,耗时短。以达到更快的编译速度,但是编译后的代码执行速度相对慢。C1编译器主要有方法内联,去虚拟化,冗余消除。

  1. 方法内联:将引用的函数代码编译到引用点处,这样可以减少栈帧的生成,减少参数传递以及跳转过程。
  2. 去虚拟化:对唯一实现的类进行内联。
  3. 冗余消除:在运行期间把一些不会执行的代码叠掉。

2.2 c2编译器

指定Java虚拟机运行在server模式下,使用C2编译器。C2编译器对代码优化时间长,编译时间也长。但是编译后的代码执行速度比较快。C2的优化主要在全局层面,逃逸分析式优化的基础。基于逃逸分析,C2上有如下几种优化:

  1. 标量替换:用标量值代替聚合对象的属性值。
  2. 栈上分配:对于未逃逸的对象分配在栈上而不是堆上。
  3. 同步消除:清楚同步操作,通常指synchronized。

2.3 Graal编译器

JDK10起,在C1编译器和C2编译器之后,HotSpot VM新增了一个Graal即时编译器。编译效果短短几年的时间就追平了C2编译器。目前,带着“实验状态”标签,需要使用开关参数 -XX:+UnlockExperimentalVMOptions-XX:+UseJVMCICompiler 去激活这个编译器,才能使用。

五、解释器和JIT并存

为什么需要解释器和JIT并存,原因有几点:

六、执行引擎执行程序的方式

在默认的情况下,HotSpot VM采用的是解释器和JIT编译器并存的架构,当然读者可以根据具体的应用场景,通过虚拟机参数,为虚拟机指定在运行时到底是完全采用解释器执行,还是完全采用即时编译器执行。

#技术交流#
全部评论
非常感谢楼主的细心整理
点赞
送花
回复
分享
发布于 2022-09-15 20:26 陕西

相关推荐

1 1 评论
分享
牛客网
牛客企业服务