[Java多线程编程之一] Java代码是怎么运行起来的?看完这篇你就懂了!

一、关于解释型和编译型语言

??解释型语言就是源代码不是直接翻译成机器语言,而是先翻译成中间代码,再由解释器对中间代码进行解释执行,如Python/JavaScript/Perl/Shell/PHP等都是解释型语言,因为代码是在运行时才被翻译成机器码,所以运行效率相对编译型语言比较低。
??编译型语言是相对于解释型语言存在的,编译型语言首先由编译器将源代码编译生成机器语言,再由机器运行机器码(二进制),典型的编译型语言有C/C++,编译型语言从效率上更胜一筹,所以很多东西比如操作系统、数据库的底层都是用C/C++实现的。


二、Java是解释型还是编译型语言?

??Java是编程语言中一个比较特殊的存在,它诞生的理念是“一次编译,到处运行”,但如果你认为它是编译型语言那就错了,Java既不是解释型语言也不是编译型语言,它更像两者的一个结合体。
??解释型语言 依赖于解释引擎(或者说解释器)的存在,能够做到平台无关性,不管是在32位还是64位,不管是Linux、Windows或mac操作系统,只要提供相应的解释引擎,就能做到写出来的代码导出运行,缺点是运行效率较低。
??编译型语言 由于是直接翻译成机器码的,所以在不同的平台上,同样的代码编译出来的机器码是不一样的,所以这也是C++比较难写的原因,数据类型所占字节、大小范围等在不同平台上的表现都不一样,在某个平台上运行良好的代码到了另外一个平台上可能水土不服,所以很难做到一次编写代码,到处运行,所以一个用编译型语言写的一个产品要实现多平台发布可能要写多份代码。
??Java集合了两者的优点,通过JVM隔离了跟底层平台的耦合性,从这点看可以将JVM看成是类解释器的存在,但是Java源代码无法被JVM直接读取解释,还要被JDK编译成字节码,一个xx.java通?;岜槐嘁氤梢桓鰔x.class文件,JVM加载读取.class文件先校验,然后转换成底层的机器指令,再交给执行引擎去执行,JVM会通过本地库接口去调用OS本地方法库,所以JVM是平台相关性的。
??Java中数据类型的大小都是固定的,不管运行在什么平台之上,JVM会帮我们去跟OS进行交互沟通解决平台相关性的问题,如下图所示,所以只要有运行在对应平台上的JVM,Java就能做到“一次编译,导出运行”。


??Java的性能比不上C/C++这种编译型语言,为了提高Java的运行效率,JVM引入了JIT(Just In Time Compiler),翻译为即时编译器,这是一种非虚拟机必须的优化手段。在众多厂商的JVM中,HotSpot正是由于在JIT方面的出色表现,才得以脱颖而出成为新一代的主流JVM。
??HotSpot虚拟机的执行引擎在执行Java代码时可采用【解释执行】和【编译执行】两种方式,常规情况下,解释执行也就是逐一读取字节码指令,再解释给执行引擎执行,不会用到JIT;如果某块代码被反复执行到了一定的频率(特别是递归、循环),那么就会升级为热点代码,HotSpot启动JIT机制,将热点代码编译成本地机器码,执行引擎执行热点代码时直接执行机器码,有效地提升了代码执行的效率,如下图所示:



三、JVM运行时数据区


??如图所示,JVM运行时数据区,分为线程独占区和线程共享区。

1、线程共享:所有线程能访问这块内存区域,随虚拟机或者GC而创建和销毁

2、线程独占:每个线程都会有它独立的空间,随线程声明周期而创建和销毁

(1)方法区

??JVM用来存储加载的类信息、常量、静态变量、编译后的代码等数据,在虚拟机规范中这是一个逻辑区划,具体实现根据不同虚拟机来实现
eg: oracle的HotSpot在Java7中方法区放在永久代,Java8放在元数据空间,并且通过GC机制对这个区域进行管理



(2)堆内存

??当创建一个Java对象时,这个对象就会放在堆内存中,而指向对象的引用会存在创建对象的方法的栈中,堆内存可以细分为老年代、新生代,新生代中又可以分为Eden、From Survivor、To Survivor。垃圾回收器主要就是管理堆内存,如果满了,就会出现OutOfMemoryError。



(3)本地方法栈/虚拟机栈

??和虚拟机栈功能类似,虚拟机栈是为虚拟机执行Java方法而准备的,本地方法栈是为虚拟机使用Native本地方法而准备的。虚拟机规范没有规定具体的实现,由不同的虚拟机厂商去实现,HotSpot虚拟机中虚拟机栈和本地方法栈的实现方式是一样的,同样地超出栈的大小以后也会抛出StackOverflowError。



(4)程序计数器

??程序计数器(Program Counter Register)记录当前线程执行字节码的位置,存储的是字节码指令地址,如果执行Native方法,则计数器值为空。每个线程都能在这个空间有一个私有的空间,占用内存空间很少。CPU同一时间只会执行一条线程中的指令,JVM多线程会轮流切换并分配CPU执行时间的方式,为了线程切换后,需要通过程序计数器,来恢复正确的执行位置。




四、class文件内容

??class文件包含了Java程序执行的字节码,数据严格按照格式紧凑排列在class文件的二进制流,中间无任何分隔符,文件开头有一个0xcafebabe(16进制)特殊的一个标志,如图所示:


??class文件中,包含了版本(可以看出那个版本的JDK编译的)、访问标志、常量池、当前类、超类、接口、字段、方法、属性等信息,通过javap -v xx.class命令看到字节码对应的可读文字含义,如果想将看到的文本内容输出到文本文件中,可用javap -v xx.class > xx.txt,如下图所示:

??Demo1的代码如下所示:

public class Demo1 {
    public static void main(String[] args) {
        int x = 500;
        int y = 100;
        int a = x / y;
        int b = 50;
        System.out.println(a + b);
    }
}

1、版本号/访问控制

public class Demo1
  SourceFile: "Demo1.java"
  minor version: 0   // 次版本号
  major version: 52  // 主版本号,JDK5,6,7,8分别对应49,50,51,52
  flags: ACC_PUBLIC, ACC_SUPER    // 访问标志
版本号规则:JDK5, 6, 7, 8分别对应49, 50, 51, 52
标志名称 标志值 含义
ACC_PUBLIC 0x0001 是否为public类型
ACC_FINAL 0x0010 是否被声明为final,只有类可设置
ACC_SUPER 0x0020 是否允许使用invokespecial字节码指令,JDK1.2之后编译出来的类的这个标志为true
ACC_INTERFACE 0X0200 标志这个是一个接口
ACC_ABSTRACT 0X0400 是否为abstract类型,对于接口或抽象类来说,此标志值为true,其他值为false
ACC_SYNTHETIC 0x1000 标志这个类并非由用户产生的
ACC_ANNOTATION 0x2000 标识这是一个注解
ACC_ENUM 0x4000 标识这是一个枚举


2、常量池

??类信息包含的静态常量,编译之后就能确认,这里的常量跟String的常量池有区别,记录的是类的元信息,包括类名、方法名、字段及其的符号引用等,标志和含义如下:

常量类型 含义
CONSTANT_utf_info UTF-8编码的字符串
CONSTANT_Integer_info 整型字面量
CONSTANT_Float_info 浮点型字面量
CONSTANT_Long_info 长整型字面量
CONSTANT_Double_info 双精度浮点型字面量
CONSTANT_Class_info 类或接口的符号引用
CONSTANT_String_info 字符串类型字面量
CONSTANT_Fieldred_info 字段的符号引用
CONSTANT_Methodred_info 类中方法的符号引用
CONSTANT_InterfaceMethodred_info 接口中方法的符号引用
CONSTANT_NameAndType_info 字段或方法的符号引用
CONSTANT_MethodType_info 标志方法类型
CONSTANT_MethodHandle_info 表示方法句柄
CONSTANT_InvokeDynamic_info 表示一个动态方法调用点


3、构造函数

  public Demo1();      // 构造函数
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0       
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return        
      LineNumberTable:
        line 2: 0

PS.没有定义构造函数时也会有隐式的构造函数

4、程序入口main方法

下面一行描述了方法的访问控制、本地变量数量、参数数量、方法对应栈帧中操作数栈的深度

stack=3, locals=5, args_size=1

接来下就是JVM执行引擎要去执行的源码编译过后的指令码,javap翻译出来的是操作符,class文件内存储的是指令码,如下面的指令,前面的数字是偏移量(字节),jvm根据这个去区分不同的指令,sipush 500指将值500入栈。

0: sipush        500
  public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC       // 方法描述,访问控制
    Code:  
      stack=3, locals=5, args_size=1    // 本地变量数量、参数数量、方法对应栈帧中操作数栈的深度
         0: sipush        500
         3: istore_1      
         4: bipush        100
         6: istore_2      
         7: iload_1       
         8: iload_2       
         9: idiv          
        10: istore_3      
        11: bipush        50
        13: istore        4
        15: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
        18: iload_3       
        19: iload         4
        21: iadd          
        22: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
        25: return        
      LineNumberTable:
        line 4: 0
        line 5: 4
        line 6: 7
        line 7: 11
        line 8: 15
        line 9: 25



五、程序完整运行分析

1、将类信息加载到方法区中

??程序运行时会首先用类加载器加载类信息进方法区



2、JVM为线程分配内存

??JVM创建线程来执行代码,在虚拟机栈、程序计数器内存区域中创建线程独占的空间



3、指令运行分析

??每个线程都会有一个对应的程序计数器,当调用到某个类的方法时,就会在虚拟机栈中创建一个对应的方法栈帧,方法执行时会在栈帧中创建本地变量表和操作数栈。



??字节码指令对应的代码如下:

public class Demo1 {
    public static void main(String[] args) {
        int x = 500;
        int y = 100;
        int a = x / y;
        int b = 50;
        System.out.println(a + b);
    }
}
(1)将500放入操作数栈中
(2)弹出栈顶元素500保存到本地变量表
(3)将100放入操作数栈中
(4)弹出栈顶元素100保存到本地变量表
(5)读取本地变量1,压入操作数栈
(6)读取本地变量2,压入操作数栈
(7)两栈顶元素相除,结果入栈
(8)将栈顶元素5保存到局部变量3中
(9)将50放入操作数栈
(10)将栈顶元素50保存到局部变量4中
(11)获取类或接口字段的值并将其压入操作数栈

从根据*.class翻译出来的指令操作码文件中可以看出,#2是一个静态域的引用,#2的值为#15.#16,#15是一个对System类的符号引用,#16是对out字段的符号引用(out的类型为Ljava/io/PrintStream),所以#15.#16就表示System.out,如下图所示:


(12)取出本地变量3压入操作数栈中
(13)取出本地变量4压入操作数栈中
(14)栈顶相加结果入栈
(15)创建新栈帧,执行System.out.println()方法
(16)main方法执行结束
最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,992评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,212评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,535评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,197评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,310评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,383评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,409评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,191评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,621评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,910评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,084评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,763评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,403评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,083评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,318评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,946评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,967评论 2 351

推荐阅读更多精彩内容

  • 第二部分 自动内存管理机制 第二章 java内存异常与内存溢出异常 运行数据区域 程序计数器:当前线程所执行的字节...
    小明oh阅读 1,147评论 0 2
  • 整理来自互联网 1,JDK:Java Development Kit,java的开发和运行环境,java的开发工具...
    Ncompass阅读 1,537评论 0 6
  • 这篇文章是我之前翻阅了不少的书籍以及从网络上收集的一些资料的整理,因此不免有一些不准确的地方,同时不同JDK版本的...
    高广超阅读 15,575评论 3 83
  • 《深入理解Java虚拟机》笔记_第一遍 先取看完这本书(JVM)后必须掌握的部分。 第一部分 走近 Java 从传...
    xiaogmail阅读 5,077评论 1 34
  • 一:java概述: 1,JDK:Java Development Kit,java的开发和运行环境,java的开发...
    慕容小伟阅读 1,778评论 0 10