关于java序列化,一些核心的概念。
基本概念
序列化的定义
序列化是将Java对象转换成字节流文件,反序列化就是反过来。
字节流文件,很多人写成二进制字节流,我感觉并不准确,字节流文件是二进制文件不假(1个字节是8个比特),字节流文件打开后是0和1组成的比特流(当然可以用其他进制,比如十六进制查看),但二进制字节这种说法就很不准确,我看可以说成二进制位流或二级制比特流。
序列化是的作用
- 对象的存储,jvm虚拟机生命周期结束,所有的对象的生命周期就都结束了(可能更短,比如不再被引用后,被垃圾回收),所以想把对象持久化,可以把对象序列化成字节流存储
- 用于对象在网络中传输
序列化ID (serialVersionUID)
序列化对象的唯一标识。
- 序列化流程:比如一个对象
Object
从A实例传输到B实例,序列化成字节流后通过网络传输,这个对象一定在两个实例上都是存在的(参考真实的使用场景)。从A实例传输过来的字节流包含了类属性字段的数据,在B实例处进行反序列化时,根据B实例本地的类Object
信息,填充数据,生成对应的对象。 - ID作用:序列化时,会将
serialVersionUID
,写入字节流文件,在反序列化时,与当地对象的serialVersionUID
进行比较,一致才进行序列化,不一致报错。 - 省略
serialVersionUID
:jvm会在编译时,动态的根据类的属性信息(具体生成规则,有待进一步研究)生成一个ID,可能会根据jvm版本不同,所以在运行着不同JVM实例之间进行序列化,可能会报错,不推荐使用。建议显示定义serialVersionUID
静态变量并不能序列化
序列化保存的是对象的状态,并不保存类的状态,所以对象中的静态变量并不会被序列化。
父类序列化
情境:一个子类实现了 Serializable 接口,它的父类都没有实现 Serializable 接口,序列化该子类对象,然后反序列化后输出父类定义的某变量的数值,该变量数值与序列化时的数值不同。
解决:要想将父类对象也序列化,就需要让父类也实现****Serializable 接口。如果父类不实现的话的,就 需要有默认的无参的构造函数。在父类没有实现 Serializable 接口时,虚拟机是不会序列化父对象的,而一个 Java 对象的构造必须先有父对象,才有子对象,反序列化也不例外。所以反序列化时,为了构造父对象,只能调用父类的无参构造函数作为默认的父对象。因此当我们取父对象的变量值时,它的值是调用父类无参构造函数后的值。如果你考虑到这种序列化的情况,在父类无参构造函数中对变量进行初始化,否则的话,父类变量值都是默认声明的值,如 int 型的默认是 0,string 型的默认是 null。
? 引用自—— 《Java 序列化的高级认识》
Transient 关键字
类中可能存在某些敏感的信息,我们是不想在网络中传输的,这时候我们就需要借助 transient 关键字了。被transient关键字标识的 field,不会进行序列化.
下面通过一个例子说明 transient 关键字的作用.现假设我们需要在网络中传输 Person 类:
public class Person implements Serializable{
private static final long serialVersionUID = 1L;
private String name;
private String certNo; // 身份证号码
private int age;
public Person(String name, String certNo, int age) {
this.name = name;
this.certNo = certNo;
this.age = age;
}
@Override
public String toString() {
return "Person{" +
"name='" + name + '\'' +
", certNo='" + certNo + '\'' +
", age=" + age +
'}';
}
}
若不使用 transient 关键字,反序列化时输出的信息是 :
Person{name='tianya', certNo='12314', age=23}
我们知道,身份证号码属于敏感信息,并不想在网络中传输,这时我们就可以借助 transient 关键字,如下:
private transient String certNo;
这个时候,通过反序列化获取的 Person 信息如下 :
Person{name='tianya', certNo='null', age=23}
序列化存储规则
Java 序列化机制为了节省磁盘空间,具有特定的存储规则,当写入文件的为同一对象时,并不会再将对象的内容进行存储,而只是再次存储一份引用,下面增加的 5 字节的存储空间就是新增引用和一些控制信息的空间。反序列化时,恢复引用关系。
下面示例中的 test1 和 test2 指向唯一的对象,二者相等,输出 true。该存储规则极大的节省了存储空间。
/**
* 此示例展示序列化同一个对象的存储规则:同一个对象序列化两次,为了提高存储率,使用相同的引用。
* 注:即使修改对象属性,依然无效,以第一个对象为准(都是引用第一个对象),值得注意!
*/
public class WriteTwiceObject {
public static void main(String[] args) throws Exception{
ObjectOutputStream objectOutputStream = new ObjectOutputStream(new FileOutputStream("test.obj"));
Test t = new Test();
t.test = 1;
objectOutputStream.writeObject(t);
objectOutputStream.flush();
System.out.println(new File("test.obj").length());
t.test = 2;
objectOutputStream.writeObject(t);
objectOutputStream.close();
System.out.println(new File("test.obj").length());
ObjectInputStream objectInputStream = new ObjectInputStream((new FileInputStream("test.obj")));
//对象属性的改变并没有生效
Test test1 = (Test) objectInputStream.readObject();
System.out.println(test1.test);
Test test2 = (Test) objectInputStream.readObject();
System.out.println(test2.test);
//true 表明两个对象是同一个引用
System.out.println(test1 == test2);
}
}
class Test implements Serializable{
private final static long serialVersionUID = 1l;
public int test;
}
//output:
56
61
1
1
true
Reference: