本文是对《Java核心技术 卷二》类加载器的一篇学习笔记。
因为内容比较深奥,所以几乎都记下来了。
类加载器
Java编译器会为虚拟机转换源指令。虚拟机代码存储在以.class为扩展名的类文件中,每个类文件都包含某个类或者接口的定义和实现代码。这些类文件必须由一个程序进行解释,该程序能够将虚拟机的指令集翻译成目标机器的机器语言。
类加载过程
请注意,虚拟机只加载程序执行时所需要的类文件。例如,假设程序从MyProgram.class开始运行,下面是虚拟机执行的步骤:
- 虚拟机有一个用于加载类文件的机制,例如,从磁盘上读取文件或者请求web上的文件;它使用该机制来加载MyProgram类文件中的内容。
2.如果MyProgram类拥有类型为另一个类的域,或者是拥有超类,那么这些类文件也会被加载。(加载某个类所依赖的所有类的过程称为类的解析。)
接着,虚拟机执行MyProgram中的main方法(它是静态的,无需创建类的实例)。
如果main方法或者main调用的方法要用到更多的类,那么接下来就会加载这些类。
然而,类加载机制并非只使用单个的类加载器。每个Java程序至少拥有三个类加载器:
- 引导类加载器
- 扩展类加载器
- 系统类加载器(有时也称为应用类加载器)
引导类加载器负责加载系统类(通常从JAR文件rt.jar中进行加载)。它是虚拟机整体中的一部分,而且通常是用C语言来实现的。引导类加载器没有对应的ClassLoader对象,例如,该方法:
String.class.getClassLoader()
将返回null。
扩展类加载器用于从jre/lib/ext目录加载"标准的扩展"。可以将JAR文件放入该目录,这样即使没有任何类路径,扩展类加载器也可以找到其中的各个类。(有些人推荐使用该机制来避免"可恶的类路径",不过请看看下面提到的警告事项。)
系统类加载器用于加载应用类。它在由CLASSPATH环境变量或者-classpath命令行选项设置的类路径中的目录里或者是JAR/ZIP文件里查找这些类。
在Oracle公司的Java语言实现中,扩展类加载器和系统类加载器都是用Java来实现的。它们都是URLClassLoader类的实例。
警告:如果将JAR文件放入jre/lib/ext目录中,并且在它的类中有一个类需要调用系统类或者扩展类,那么就会遇到麻烦。扩展类加载器并不使用类路径。在使用扩展目录来解决类文件的冲突之前,要牢记这种情况。
注意:除了所有已经提到的位置,还可以从jre/lib/endorsed目录中加载类。这种机制只能用于将某个标准的Java类库替换为更新的版本(例如那些支持XML和CORBA的类)
类加载器的层次结构
类加载器有一种父/子关系。除了引导类加载器外,每个类加载器都有一个父类加载器。根据规定,类加载器会为它的父类加载器提供一个机会,以便加载任何给定的类,并且只有在其父类加载器加载失败时,它才会加载该给定类。例如,当要求系统类加载器加载一个系统类(比如,java.util.ArrayList)时,它首先要求扩展类加载器进行加载,该扩展类加载器则首先要求引导类加载器进行加载。引导类加载器查找并加载rt.jar中的这个类,而无须其他类加载器做更多的搜索。
某些程序具有插件架构,其中代码的某些部分是作为可选的插件打包的。如果插件被打包为JAR文件,那就可以直接用URLClassLoader类的实例去加载这些类。
URL url = new URL("file:///path/to/plugin.jar");
URLClassLoader pluginLoader = new URLClassLoader(new URL[] { url })
Class<?> cl = pluginLoader.loadClass("mypackage.MyClass");
因为在URLClassLoader构造器中没有指定父类加载器,因此pluginLoader的父亲就是系统类加载器。
每个线程都有一个对类加载器的引用,称为上下文类加载器。主线程的上下文类加载器是系统类加载器。当新线程创建时,它的上下文类加载器会被设置成为创建线程的上下文类加载器。因此,如果你不做任何特殊的操作,那么所有线程就都将它们的上下文类加载器设置为系统类加载器。
但是,我们也可以通过下面的调用将其设置成为任何类加载器:
Thread t = Thread.currentThread();
t.setContextClassLoader(loader);
提示:如果你编写了一个按名字来加载类的方法,那么让调用者在传递显式的类加载器和使用上下文类加载器之间进行选择就是一种好的做法。不要直接使用该方法所属的类的类加载器。
字节码校验
当类加载器将新加载的Java平台类的字节码传递给虚拟机时,这些字节码首先要接受校验器(verifier)的校验。校验器负责检查那些指令无法执行的明显有破坏性的操作。除了系统类外,所有的类都要被校验。
下面是校验器执行的一些检查:
变量要在使用之前进行初始化。
方法调用与对象引用类型之间要匹配。
访问私有数据和方法的规则没有被违反。
对本地变量的访问都在运行时堆栈内。
运行时堆栈没有溢出。
如果以上这些检查中任何一条没有通过,那么该类就被认为遭到了破坏,并且不予加载。
这种严格的校验是出于安全上的考虑,有一些偶然性的错误,比如变量没有初始化,如果这类错误没有被捕获,就很容易地对系统造成严重的破坏。更为重要的是,在因特网这样开放的环境中,你必须?;ぷ约阂苑蓝褚獾某绦蛟倍阅闶凳┕セ?,因为他们的目的就是要造成恶劣的影响。例如,通过修改运行时堆栈中的值,或者向系统对象的私有数据字段写入数据,某个程序就会突破浏览器的安全防线。
当然你可能想知道,为什么要有一个专门的校验器来检查这些特性呢。毕竟,编译器绝不会允许你生成一个这样的类文件:该类文件中有未初始化的变量或者可以通过另一个类来访问该类的某个私有数据字段。实际上,用Java语言编译器生成的类文件总是可以通过校验的。然而,类文件中使用的字节码格式是有很好的文档记录的,对于具有汇编程序设计经验并且拥有十六进制编辑器的人来说,要手工地创建一个对Java虚拟机来说,由合法的但是不安全的指令构成的类文件,是一件非常容易的事情。再次提醒你,要记住,校验器总是在防范被故意篡改的类文件,而不仅仅只是检查编译器产生的类文件。