1. 什么是Java對象序列化
Java平臺允許我們在內存中創(chuàng )建可復用的Java對象,但一般情況下,只有當JVM處于運行時(shí),這些對象才可能存在,即,這些對象的生命周期不會(huì )比JVM的生命周期更長(cháng)。但在現實(shí)應用中,就可能要求在JVM停止運行之后能夠保存(持久化)指定的對象,并在將來(lái)重新讀取被保存的對象。Java對象序列化就能夠幫助我們實(shí)現該功能。
使用Java對象序列化,在保存對象時(shí),會(huì )把其狀態(tài)保存為一組字節,在未來(lái),再將這些字節組裝成對象。必須注意地是,對象序列化保存的是對象的"狀態(tài)",即它的成員變量。由此可知,對象序列化不會(huì )關(guān)注類(lèi)中的靜態(tài)變量。
除了在持久化對象時(shí)會(huì )用到對象序列化之外,當使用RMI(遠程方法調用),或在網(wǎng)絡(luò )中傳遞對象時(shí),都會(huì )用到對象序列化。Java序列化API為處理對象序列化提供了一個(gè)標準機制,該API簡(jiǎn)單易用,在本文的后續章節中將會(huì )陸續講到。
2. 簡(jiǎn)單示例
在Java中,只要一個(gè)類(lèi)實(shí)現了java.io.Serializable接口,那么它就可以被序列化。此處將創(chuàng )建一個(gè)可序列化的類(lèi)Person,本文中的所有示例將圍繞著(zhù)該類(lèi)或其修改版。
Gender類(lèi),是一個(gè)枚舉類(lèi)型,表示性別
public enum Gender {
MALE, FEMALE
}
如果熟悉Java枚舉類(lèi)型的話(huà),應該知道每個(gè)枚舉類(lèi)型都會(huì )默認繼承類(lèi)java.lang.Enum,而該類(lèi)實(shí)現了Serializable接口,所以枚舉類(lèi)型對象都是默認可以被序列化的。
Person類(lèi),實(shí)現了Serializable接口,它包含三個(gè)字段:name,String類(lèi)型;age,Integer類(lèi)型;gender,Gender類(lèi)型。另外,還重寫(xiě)該類(lèi)的toString()方法,以方便打印Person實(shí)例中的內容。
public class Person implements Serializable {
private String name = null;
private Integer age = null;
private Gender gender = null;
public Person() {
System.out.println("none-arg constructor");
}
public Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public Integer getAge() {
return age;
}
public void setAge(Integer age) {
this.age = age;
}
public Gender getGender() {
return gender;
}
public void setGender(Gender gender) {
this.gender = gender;
}
@Override
public String toString() {
return "[" + name + ", " + age + ", " + gender + "]";
}
}
SimpleSerial,是一個(gè)簡(jiǎn)單的序列化程序,它先將一個(gè)Person對象保存到文件person.out中,然后再從該文件中讀出被存儲的Person對象,并打印該對象。
public class SimpleSerial {
public static void main(String[] args) throws Exception {
File file = new File("person.out");
ObjectOutputStream oout = new ObjectOutputStream(new FileOutputStream(file));
Person person = new Person("John", 101, Gender.MALE);
oout.writeObject(person);
oout.close();
ObjectInputStream oin = new ObjectInputStream(new FileInputStream(file));
Object newPerson = oin.readObject(); // 沒(méi)有強制轉換到Person類(lèi)型
oin.close();
System.out.println(newPerson);
}
}
上述程序的輸出的結果為:
arg constructor
[John, 31, MALE]
此時(shí)必須注意的是,當重新讀取被保存的Person對象時(shí),并沒(méi)有調用Person的任何構造器,看起來(lái)就像是直接使用字節將Person對象還原出來(lái)的。
當Person對象被保存到person.out文件中之后,我們可以在其它地方去讀取該文件以還原對象,但必須確保該讀取程序的CLASSPATH中包含有Person.class(哪怕在讀取Person對象時(shí)并沒(méi)有顯示地使用Person類(lèi),如上例所示),否則會(huì )拋出ClassNotFoundException。
3. Serializable的作用
為什么一個(gè)類(lèi)實(shí)現了Serializable接口,它就可以被序列化呢?在上節的示例中,使用ObjectOutputStream來(lái)持久化對象,在該類(lèi)中有如下代碼:
private void writeObject0(Object obj, boolean unshared) throws IOException {
if (obj instanceof String) {
writeString((String) obj, unshared);
} else if (cl.isArray()) {
writeArray(obj, desc, unshared);
} else if (obj instanceof Enum) {
writeEnum((Enum) obj, desc, unshared);
} else if (obj instanceof Serializable) {
writeOrdinaryObject(obj, desc, unshared);
} else {
if (extendedDebugInfo) {
throw new NotSerializableException(cl.getName() + "\n"
+ debugInfoStack.toString());
} else {
throw new NotSerializableException(cl.getName());
}
}
}
從上述代碼可知,如果被寫(xiě)對象的類(lèi)型是String,或數組,或Enum,或Serializable,那么就可以對該對象進(jìn)行序列化,否則將拋出NotSerializableException。
4. 默認序列化機制
如果僅僅只是讓某個(gè)類(lèi)實(shí)現Serializable接口,而沒(méi)有其它任何處理的話(huà),則就是使用默認序列化機制。使用默認機制,在序列化對象時(shí),不僅會(huì )序列化當前對象本身,還會(huì )對該對象引用的其它對象也進(jìn)行序列化,同樣地,這些其它對象引用的另外對象也將被序列化,以此類(lèi)推。所以,如果一個(gè)對象包含的成員變量是容器類(lèi)對象,而這些容器所含有的元素也是容器類(lèi)對象,那么這個(gè)序列化的過(guò)程就會(huì )較復雜,開(kāi)銷(xiāo)也較大。
5. 影響序列化
在現實(shí)應用中,有些時(shí)候不能使用默認序列化機制。比如,希望在序列化過(guò)程中忽略掉敏感數據,或者簡(jiǎn)化序列化過(guò)程。下面將介紹若干影響序列化的方法。
5.1 transient關(guān)鍵字
當某個(gè)字段被聲明為transient后,默認序列化機制就會(huì )忽略該字段。此處將Person類(lèi)中的age字段聲明為transient,如下所示,
public class Person implements Serializable {
transient private Integer age = null;
}
再執行SimpleSerial應用程序,會(huì )有如下輸出:
arg constructor
[John, null, MALE]
可見(jiàn),age字段未被序列化。
5.2 writeObject()方法與readObject()方法
對于上述已被聲明為transitive的字段age,除了將transitive關(guān)鍵字去掉之外,是否還有其它方法能使它再次可被序列化?方法之一就是在Person類(lèi)中添加兩個(gè)方法:writeObject()與readObject(),如下所示:
public class Person implements Serializable {
transient private Integer age = null;
private void writeObject(ObjectOutputStream out) throws IOException {
out.defaultWriteObject();
out.writeInt(age);
}
private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {
in.defaultReadObject();
age = in.readInt();
}
}
在writeObject()方法中會(huì )先調用ObjectOutputStream中的defaultWriteObject()方法,該方法會(huì )執行默認的序列化機制,如5.1節所述,此時(shí)會(huì )忽略掉age字段。然后再調用writeInt()方法顯示地將age字段寫(xiě)入到ObjectOutputStream中。readObject()的作用則是針對對象的讀取,其原理與writeObject()方法相同。
再次執行SimpleSerial應用程序,則又會(huì )有如下輸出:
arg constructor
[John, 31, MALE]
必須注意地是,writeObject()與readObject()都是private方法,那么它們是如何被調用的呢?毫無(wú)疑問(wèn),是使用反射。詳情可見(jiàn)ObjectOutputStream中的writeSerialData方法,以及ObjectInputStream中的readSerialData方法。
5.3 Externalizable接口
無(wú)論是使用transient關(guān)鍵字,還是使用writeObject()和readObject()方法,其實(shí)都是基于Serializable接口的序列化。JDK中提供了另一個(gè)序列化接口--Externalizable,使用該接口之后,之前基于Serializable接口的序列化機制就將失效。此時(shí)將Person類(lèi)修改成如下,
public class Person implements Externalizable {
private String name = null;
transient private Integer age = null;
private Gender gender = null;
public Person() {
System.out.println("none-arg constructor");
}
public Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
private void writeObject(ObjectOutputStream out) throws IOException {
out.defaultWriteObject();
out.writeInt(age);
}
private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {
in.defaultReadObject();
age = in.readInt();
}
@Override
public void writeExternal(ObjectOutput out) throws IOException {
}
@Override
public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {
}
}
此時(shí)再執行SimpleSerial程序之后會(huì )得到如下結果:
arg constructor
none-arg constructor
[null, null, null]
從該結果,一方面可以看出Person對象中任何一個(gè)字段都沒(méi)有被序列化。另一方面,如果細心的話(huà),還可以發(fā)現這此次序列化過(guò)程調用了Person類(lèi)的無(wú)參構造器。
Externalizable繼承于Serializable,當使用該接口時(shí),序列化的細節需要由程序員去完成。如上所示的代碼,由于writeExternal()與readExternal()方法未作任何處理,那么該序列化行為將不會(huì )保存/讀取任何一個(gè)字段。這也就是為什么輸出結果中所有字段的值均為空。
另外,若使用Externalizable進(jìn)行序列化,當讀取對象時(shí),會(huì )調用被序列化類(lèi)的無(wú)參構造器去創(chuàng )建一個(gè)新的對象,然后再將被保存對象的字段的值分別填充到新對象中。這就是為什么在此次序列化過(guò)程中Person類(lèi)的無(wú)參構造器會(huì )被調用。由于這個(gè)原因,實(shí)現Externalizable接口的類(lèi)必須要提供一個(gè)無(wú)參的構造器,且它的訪(fǎng)問(wèn)權限為public。
對上述Person類(lèi)作進(jìn)一步的修改,使其能夠對name與age字段進(jìn)行序列化,但要忽略掉gender字段,如下代碼所示:
public class Person implements Externalizable {
private String name = null;
transient private Integer age = null;
private Gender gender = null;
public Person() {
System.out.println("none-arg constructor");
}
public Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
private void writeObject(ObjectOutputStream out) throws IOException {
out.defaultWriteObject();
out.writeInt(age);
}
private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {
in.defaultReadObject();
age = in.readInt();
}
@Override
public void writeExternal(ObjectOutput out) throws IOException {
out.writeObject(name);
out.writeInt(age);
}
@Override
public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {
name = (String) in.readObject();
age = in.readInt();
}
}
執行SimpleSerial之后會(huì )有如下結果:
arg constructor
none-arg constructor
[John, 31, null]
5.4 readResolve()方法
當我們使用Singleton模式時(shí),應該是期望某個(gè)類(lèi)的實(shí)例應該是唯一的,但如果該類(lèi)是可序列化的,那么情況可能會(huì )略有不同。此時(shí)對第2節使用的Person類(lèi)進(jìn)行修改,使其實(shí)現Singleton模式,如下所示:
public class Person implements Serializable {
private static class InstanceHolder {
private static final Person instatnce = new Person("John", 31, Gender.MALE);
}
public static Person getInstance() {
return InstanceHolder.instatnce;
}
private String name = null;
private Integer age = null;
private Gender gender = null;
private Person() {
System.out.println("none-arg constructor");
}
private Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
}
同時(shí)要修改SimpleSerial應用,使得能夠保存/獲取上述單例對象,并進(jìn)行對象相等性比較,如下代碼所示:
public class SimpleSerial {
public static void main(String[] args) throws Exception {
File file = new File("person.out");
ObjectOutputStream oout = new ObjectOutputStream(new FileOutputStream(file));
oout.writeObject(Person.getInstance()); // 保存單例對象
oout.close();
ObjectInputStream oin = new ObjectInputStream(new FileInputStream(file));
Object newPerson = oin.readObject();
oin.close();
System.out.println(newPerson);
System.out.println(Person.getInstance() == newPerson); // 將獲取的對象與Person類(lèi)中的單例對象進(jìn)行相等性比較
}
}
執行上述應用程序后會(huì )得到如下結果:
arg constructor
[John, 31, MALE]
false
值得注意的是,從文件person.out中獲取的Person對象與Person類(lèi)中的單例對象并不相等。為了能在序列化過(guò)程仍能保持單例的特性,可以在Person類(lèi)中添加一個(gè)readResolve()方法,在該方法中直接返回Person的單例對象,如下所示:
public class Person implements Serializable {
private static class InstanceHolder {
private static final Person instatnce = new Person("John", 31, Gender.MALE);
}
public static Person getInstance() {
return InstanceHolder.instatnce;
}
private String name = null;
private Integer age = null;
private Gender gender = null;
private Person() {
System.out.println("none-arg constructor");
}
private Person(String name, Integer age, Gender gender) {
System.out.println("arg constructor");
this.name = name;
this.age = age;
this.gender = gender;
}
private Object readResolve() throws ObjectStreamException {
return InstanceHolder.instatnce;
}
}
再次執行本節的SimpleSerial應用后將有如下輸出:
arg constructor
[John, 31, MALE]
true
無(wú)論是實(shí)現Serializable接口,或是Externalizable接口,當從I/O流中讀取對象時(shí),readResolve()方法都會(huì )被調用到。實(shí)際上就是用readResolve()中返回的對象直接替換在反序列化過(guò)程中創(chuàng )建的對象,而被創(chuàng )建的對象則會(huì )被垃圾回收掉。