一、关于解释型和编译型语言
??解释型语言就是源代码不是直接翻译成机器语言,而是先翻译成中间代码,再由解释器对中间代码进行解释执行,如Python/JavaScript/Perl/Shell/PHP
等都是解释型语言,因为代码是在运行时才被翻译成机器码,所以运行效率相对编译型语言比较低。
??编译型语言是相对于解释型语言存在的,编译型语言首先由编译器将源代码编译生成机器语言,再由机器运行机器码(二进制),典型的编译型语言有C/C++,编译型语言从效率上更胜一筹,所以很多东西比如操作系统、数据库的底层都是用C/C++实现的。
二、Java是解释型还是编译型语言?
??Java是编程语言中一个比较特殊的存在,它诞生的理念是“一次编译,到处运行”,但如果你认为它是编译型语言那就错了,Java既不是解释型语言也不是编译型语言,它更像两者的一个结合体。
??解释型语言 依赖于解释引擎(或者说解释器)的存在,能够做到平台无关性,不管是在32位还是64位,不管是Linux、Windows或mac操作系统,只要提供相应的解释引擎,就能做到写出来的代码导出运行,缺点是运行效率较低。
??编译型语言 由于是直接翻译成机器码的,所以在不同的平台上,同样的代码编译出来的机器码是不一样的,所以这也是C++比较难写的原因,数据类型所占字节、大小范围等在不同平台上的表现都不一样,在某个平台上运行良好的代码到了另外一个平台上可能水土不服,所以很难做到一次编写代码,到处运行,所以一个用编译型语言写的一个产品要实现多平台发布可能要写多份代码。
??Java集合了两者的优点,通过JVM隔离了跟底层平台的耦合性,从这点看可以将JVM看成是类解释器的存在,但是Java源代码无法被JVM直接读取解释,还要被JDK编译成字节码,一个xx.java通?;岜槐嘁氤梢桓鰔x.class文件,JVM加载读取.class文件先校验,然后转换成底层的机器指令,再交给执行引擎去执行,JVM会通过本地库接口去调用OS本地方法库,所以JVM是平台相关性的。
??Java中数据类型的大小都是固定的,不管运行在什么平台之上,JVM会帮我们去跟OS进行交互沟通解决平台相关性的问题,如下图所示,所以只要有运行在对应平台上的JVM,Java就能做到“一次编译,导出运行”。
??Java的性能比不上C/C++这种编译型语言,为了提高Java的运行效率,JVM引入了
JIT
(Just In Time Compiler),翻译为即时编译器,这是一种非虚拟机必须的优化手段。在众多厂商的JVM中,HotSpot
正是由于在JIT方面的出色表现,才得以脱颖而出成为新一代的主流JVM。??HotSpot虚拟机的执行引擎在执行Java代码时可采用【解释执行】和【编译执行】两种方式,常规情况下,解释执行也就是逐一读取字节码指令,再解释给执行引擎执行,不会用到JIT;如果某块代码被反复执行到了一定的频率(特别是递归、循环),那么就会升级为热点代码,HotSpot启动JIT机制,将热点代码编译成本地机器码,执行引擎执行热点代码时直接执行机器码,有效地提升了代码执行的效率,如下图所示:
三、JVM运行时数据区
??如图所示,JVM运行时数据区,分为线程独占区和线程共享区。
1、线程共享:所有线程能访问这块内存区域,随虚拟机或者GC而创建和销毁
2、线程独占:每个线程都会有它独立的空间,随线程声明周期而创建和销毁
(1)方法区
??JVM用来存储加载的类信息、常量、静态变量、编译后的代码等数据,在虚拟机规范中这是一个逻辑区划,具体实现根据不同虚拟机来实现
eg: oracle的HotSpot在Java7中方法区放在永久代,Java8放在元数据空间,并且通过GC机制对这个区域进行管理
(2)堆内存
??当创建一个Java对象时,这个对象就会放在堆内存中,而指向对象的引用会存在创建对象的方法的栈中,堆内存可以细分为老年代、新生代,新生代中又可以分为Eden、From Survivor、To Survivor
。垃圾回收器主要就是管理堆内存,如果满了,就会出现OutOfMemoryError
。
(3)本地方法栈/虚拟机栈
??和虚拟机栈功能类似,虚拟机栈是为虚拟机执行Java方法而准备的,本地方法栈是为虚拟机使用Native本地方法而准备的。虚拟机规范没有规定具体的实现,由不同的虚拟机厂商去实现,HotSpot虚拟机中虚拟机栈和本地方法栈的实现方式是一样的,同样地超出栈的大小以后也会抛出StackOverflowError
。
(4)程序计数器
??程序计数器(Program Counter Register)记录当前线程执行字节码的位置,存储的是字节码指令地址,如果执行Native方法,则计数器值为空。每个线程都能在这个空间有一个私有的空间,占用内存空间很少。CPU同一时间只会执行一条线程中的指令,JVM多线程会轮流切换并分配CPU执行时间的方式,为了线程切换后,需要通过程序计数器,来恢复正确的执行位置。
四、class文件内容
??class文件包含了Java程序执行的字节码,数据严格按照格式紧凑排列在class文件的二进制流,中间无任何分隔符,文件开头有一个0xcafebabe(16进制)特殊的一个标志,如图所示:
??class文件中,包含了版本(可以看出那个版本的JDK编译的)、访问标志、常量池、当前类、超类、接口、字段、方法、属性等信息,通过javap -v xx.class命令看到字节码对应的可读文字含义,如果想将看到的文本内容输出到文本文件中,可用
javap -v xx.class > xx.txt
,如下图所示:??Demo1的代码如下所示:
public class Demo1 {
public static void main(String[] args) {
int x = 500;
int y = 100;
int a = x / y;
int b = 50;
System.out.println(a + b);
}
}
1、版本号/访问控制
public class Demo1
SourceFile: "Demo1.java"
minor version: 0 // 次版本号
major version: 52 // 主版本号,JDK5,6,7,8分别对应49,50,51,52
flags: ACC_PUBLIC, ACC_SUPER // 访问标志
版本号规则:JDK5, 6, 7, 8分别对应49, 50, 51, 52
标志名称 | 标志值 | 含义 |
---|---|---|
ACC_PUBLIC | 0x0001 | 是否为public类型 |
ACC_FINAL | 0x0010 | 是否被声明为final,只有类可设置 |
ACC_SUPER | 0x0020 | 是否允许使用invokespecial字节码指令,JDK1.2之后编译出来的类的这个标志为true |
ACC_INTERFACE | 0X0200 | 标志这个是一个接口 |
ACC_ABSTRACT | 0X0400 | 是否为abstract类型,对于接口或抽象类来说,此标志值为true,其他值为false |
ACC_SYNTHETIC | 0x1000 | 标志这个类并非由用户产生的 |
ACC_ANNOTATION | 0x2000 | 标识这是一个注解 |
ACC_ENUM | 0x4000 | 标识这是一个枚举 |
2、常量池
??类信息包含的静态常量,编译之后就能确认,这里的常量跟String的常量池有区别,记录的是类的元信息,包括类名、方法名、字段及其的符号引用等,标志和含义如下:
常量类型 | 含义 |
---|---|
CONSTANT_utf_info | UTF-8编码的字符串 |
CONSTANT_Integer_info | 整型字面量 |
CONSTANT_Float_info | 浮点型字面量 |
CONSTANT_Long_info | 长整型字面量 |
CONSTANT_Double_info | 双精度浮点型字面量 |
CONSTANT_Class_info | 类或接口的符号引用 |
CONSTANT_String_info | 字符串类型字面量 |
CONSTANT_Fieldred_info | 字段的符号引用 |
CONSTANT_Methodred_info | 类中方法的符号引用 |
CONSTANT_InterfaceMethodred_info | 接口中方法的符号引用 |
CONSTANT_NameAndType_info | 字段或方法的符号引用 |
CONSTANT_MethodType_info | 标志方法类型 |
CONSTANT_MethodHandle_info | 表示方法句柄 |
CONSTANT_InvokeDynamic_info | 表示一个动态方法调用点 |
3、构造函数
public Demo1(); // 构造函数
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=1, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 2: 0
PS.没有定义构造函数时也会有隐式的构造函数
4、程序入口main方法
下面一行描述了方法的访问控制、本地变量数量、参数数量、方法对应栈帧中操作数栈的深度
stack=3, locals=5, args_size=1
接来下就是JVM执行引擎要去执行的源码编译过后的指令码,javap翻译出来的是操作符,class文件内存储的是指令码,如下面的指令,前面的数字是偏移量(字节),jvm根据这个去区分不同的指令,sipush 500指将值500入栈。
0: sipush 500
public static void main(java.lang.String[]);
descriptor: ([Ljava/lang/String;)V
flags: ACC_PUBLIC, ACC_STATIC // 方法描述,访问控制
Code:
stack=3, locals=5, args_size=1 // 本地变量数量、参数数量、方法对应栈帧中操作数栈的深度
0: sipush 500
3: istore_1
4: bipush 100
6: istore_2
7: iload_1
8: iload_2
9: idiv
10: istore_3
11: bipush 50
13: istore 4
15: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;
18: iload_3
19: iload 4
21: iadd
22: invokevirtual #3 // Method java/io/PrintStream.println:(I)V
25: return
LineNumberTable:
line 4: 0
line 5: 4
line 6: 7
line 7: 11
line 8: 15
line 9: 25
五、程序完整运行分析
1、将类信息加载到方法区中
??程序运行时会首先用类加载器加载类信息进方法区
2、JVM为线程分配内存
??JVM创建线程来执行代码,在虚拟机栈、程序计数器内存区域中创建线程独占的空间
3、指令运行分析
??每个线程都会有一个对应的程序计数器,当调用到某个类的方法时,就会在虚拟机栈中创建一个对应的方法栈帧,方法执行时会在栈帧中创建本地变量表和操作数栈。
??字节码指令对应的代码如下:
public class Demo1 {
public static void main(String[] args) {
int x = 500;
int y = 100;
int a = x / y;
int b = 50;
System.out.println(a + b);
}
}
(1)将500放入操作数栈中
(2)弹出栈顶元素500保存到本地变量表
(3)将100放入操作数栈中
(4)弹出栈顶元素100保存到本地变量表
(5)读取本地变量1,压入操作数栈
(6)读取本地变量2,压入操作数栈
(7)两栈顶元素相除,结果入栈
(8)将栈顶元素5保存到局部变量3中
(9)将50放入操作数栈
(10)将栈顶元素50保存到局部变量4中
(11)获取类或接口字段的值并将其压入操作数栈
从根据*.class翻译出来的指令操作码文件中可以看出,#2是一个静态域的引用,#2的值为#15.#16,#15是一个对System类的符号引用,#16是对out字段的符号引用(out的类型为Ljava/io/PrintStream),所以#15.#16就表示System.out,如下图所示:
(12)取出本地变量3压入操作数栈中
(13)取出本地变量4压入操作数栈中
(14)栈顶相加结果入栈
(15)创建新栈帧,执行System.out.println()方法
(16)main方法执行结束