XML DTD 是目前使用最廣泛的一種 XML 模式,XML Schema 則已經(jīng)成為 W3C 的正式推薦標準,并有替代 XML DTD 的趨勢。那么,從技術(shù)角度看,XML Schema 與 XML DTD 有那些區別,XML Schema 又有那些優(yōu)勢呢? 引言 XML DTD(XML的文檔類(lèi)型定義)是近幾年來(lái)XML技術(shù)領(lǐng)域所使用的最廣泛的一種模式。但是,由于XML DTD并不能完全滿(mǎn)足XML自動(dòng)化處理的要求,例如不能很好實(shí)現應用程序不同模塊間的相互協(xié)調,缺乏對文檔結構、屬性、數據類(lèi)型等約束的足夠描述等等,所以W3C于2001年5月正式推薦XML Schema為XML 的標準模式。顯然,W3C希望以XML Schema來(lái)作為XML模式描述語(yǔ)言的主流,并逐漸代替XML DTD。那么XML Schema與XML DTD相比到底有哪些優(yōu)勢呢,XML DTD是否真的會(huì )在XML的模式描述領(lǐng)域中逐漸消失呢?
| |
![]()
|
="">="">
XML模式與XML格式
XML模式是指用來(lái)描述XML結構、約束等因素的語(yǔ)言,例如XML Schema、XML DTD、XDR,SOX等等。XML格式則是XML文檔本身所具有的格式。本文以XML Schema來(lái)代表W3C所推薦的XML Schema模式標準,而以"XML模式"來(lái)代表所有的XML模式描述語(yǔ)言。
從模式的描述語(yǔ)言來(lái)說(shuō),XML Schema和XML DTD都屬于語(yǔ)法模式。與概念模式不同,語(yǔ)法模式在對同一事物描述時(shí),可以采用不同的語(yǔ)法,例如在對關(guān)系模式描述時(shí),無(wú)論是使用XML Schema還是XML DTD,都既可以用元素也可以用屬性來(lái)描述關(guān)系模式的列。
模式必須以某種格式來(lái)表示,XML Schema的格式與XML DTD的格式有著(zhù)非常明顯的區別,XML Schema事實(shí)上也是XML的一種應用,也就是說(shuō)XML Schema的格式與XML的格式是完全相同的,而作為SGML DTD的一個(gè)子集,XML DTD具有著(zhù)與XML格式完全不同的格式。這種區別會(huì )給XML Schema的使用帶來(lái)許多好處:
![]() ![]() |

![]() |
回頁(yè)首 |
數據類(lèi)型
或許,對于許多開(kāi)發(fā)人員來(lái)講,XML Schema與XML DTD相比的一個(gè)最顯著(zhù)的特征,就是其對數據類(lèi)型的支持了。這完全是因為XML DTD提供的數據類(lèi)型只有CDATA 、Enumerated、NMTOKEN 、NMTOKENS等十種內置(built-in)數據類(lèi)型。這樣少的數據類(lèi)型通常無(wú)法滿(mǎn)足文檔的可理解性和數據交換的需要。XML Schema則不同,它內置了三十七種數據類(lèi)型,如long,int,short,double等常用的數據類(lèi)型,并通過(guò)將數據類(lèi)型表示為由value space、lexical space和facet三部分組成的三元組而獲得更大的靈活性。但是, XML Schema數據類(lèi)型的真正靈活性來(lái)自于其對用戶(hù)自定義類(lèi)型的支持。XML Schema提供兩種方式來(lái)實(shí)現數據類(lèi)型的定義。
1)簡(jiǎn)單類(lèi)型定義(simpleType),即在XML Schema內置的數據類(lèi)型基礎上或其它由XML Schema內置的數據類(lèi)型繼承或定義所得到的簡(jiǎn)單的數據類(lèi)型(simpleType)基礎上,通過(guò)restriction,list 或者 union方式定義新的數據類(lèi)型。
例如:
<simpleType name='Sku'>
<restriction base='string'>
<pattern value='\d{3}-[A-Z]{2}'/>
</restriction>
</simpleType>
|
<simpleType name='listOfDouble'>
<list itemType='double'/>
</simpleType>
|
<xsd:attribute name="size">
<xsd:simpleType>
<xsd:union>
<xsd:simpleType>
<xsd:restriction base="xsd:positiveInteger">
<xsd:minInclusive value="1"/>
<xsd:maxInclusive value="12"/>
</xsd:restriction>
</xsd:simpleType>
<xsd:simpleType>
<xsd:restriction base="xsd:string">
<xsd:enumeration value="month"/>
</xsd:restriction>
</xsd:simpleType>
</xsd:union>
</xsd:simpleType>
</xsd:attribute>
|
2) 復合類(lèi)型定義(complexType),該方法提供了一種功能強大的復雜數據類(lèi)型定義機制,可以實(shí)現包括結構描述在內的復雜的數據類(lèi)型。下面是一個(gè)以complexType定義實(shí)現關(guān)系模式中表結構的例子,設有表T_C_Type(Psign,Count),其中Psign為CHAR數據類(lèi)型,Count為NUMBER數據類(lèi)型。則有:
<!--表結構類(lèi)型定義-->
<complexType name="T_C_Type">
<sequence minOccurs="0" maxOccurs="unbounded">
<element name="Psign">
<complexType>
<simpleContent>
<restriction base="string">
<attribute name="value" type="string"/>
</restriction>
</simpleContent>
</complexType>
</element>
<element name="Count" minOccurs="0">
<complexType>
<complexContent>
<restriction base="anyType">
<attribute name="value" type="int" use="optional"/>
</restriction>
</complexContent>
</complexType>
</element>
</sequence>
</complexType>
|
不僅如此,XML Schema還允許元素的內容取空值,這一點(diǎn)可以擴大XML Schema對數據情況的描述范圍,而XML DTD則無(wú)能為力。例如:
<element name='test' nullable='true'/> |
![]() ![]() |

![]() |
回頁(yè)首 |
元素順序的支持
XML DTD與XML Schema 都支持對子元素節點(diǎn)順序的描述,但XML DTD沒(méi)有提供對于無(wú)序情況的描述,也就是如果以XML DTD來(lái)描述元素的無(wú)順序出現情況,它必須采用窮舉元素各種可能出現的排列順序的方式來(lái)實(shí)現,這種方法不僅繁瑣,有時(shí)甚至是不現實(shí)的。例如對于table的a,b子元素,如果希望它們以任意的順序出現,用XML DTD來(lái)描述:
<?xml version="1.0" encoding="UTF-8"?>
<!ELEMENT ENTER_NAME_OF_ROOT_ELEMENT_HERE EMPTY>
<!ELEMENT table ((a,b)|(b,a))>
<!ELEMENT a (#PCDATA)>
<!ELEMENT b (#PCDATA)>
|
XML Schema提供了<all>標記來(lái)描述這種情況:
<xsd:element name="a" type="xsd:string"/>
<xsd:element name="b" type="xsd:string"/>
<xsd:element name="table">
<xsd:complexType>
<xsd:all>
<xsd:element ref="a"/>
<xsd:element ref="b"/>
</xsd:all>
</xsd:complexType>
</xsd:element>
|
可見(jiàn),用XML Schema來(lái)實(shí)現子元素的無(wú)序描述要簡(jiǎn)單的多。
![]() ![]() |

![]() |
回頁(yè)首 |
命名空間
在XML中引入命名空間的目的是為了能夠在一個(gè)XML文檔中使用其它XML文檔中的一些具有通用性的定義(通常是一些元素或數據類(lèi)型等的定義),并保證不產(chǎn)生語(yǔ)義上的沖突。XML DTD并不能支持這一特性,這進(jìn)一步限制了XML DTD的適用范圍。而XML Schema則很好的滿(mǎn)足了這一點(diǎn)。
并且, XML Schema還提供了include 和 import兩種引用命名空間的方法。下面的例子中XML Schema文檔引用了其它兩個(gè)XML Schema的定義,通過(guò)使用import實(shí)現了混合使用不同命名空間的目的。例子中還定義了不同命名空間中元素之間的keyref約束。
schema targetNamespace="http://202.117.84.144"
xmlns:xs="http://202.117.84.144"
xmlns="http://www.w3.org/2001/XMLSchema"
xmlns:a="http://202.117.84.228/middlewareSqlServer2000sqlservertest20211784228"
xmlns:b="http://202.117.84.228/middlewareOracle805ioracletest20211784144"
elementFormDefault="qualified">
<import namespace="http://202.117.84.228/middlewareSqlServer2000sqlservertest20211784228"
schemaLocation="F:\xml schema\middlewareSqlServer2000sqlservertest20211784228.xsd"/>
<import namespace="http://202.117.84.228/middlewareOracle805ioracletest20211784144"
schemaLocation="F:\xml schema\middlewareOrcal805ioracletest20211784144.xsd"/>
<annotation>
<documentation xml:lang="cn">
schema for Middleware
Copyright 2001 Zhou Jingtao. All rights reserved.
</documentation>
</annotation>
<element name="CombineDatabase">
<complexType>
<sequence>
<element name="CombinGlobeSchema">
<complexType>
<sequence>
<element ref="a:H-Database"/>
<element ref="b:H-Database"/>
</sequence>
</complexType>
<keyref name="SqlServerTest_T_C_Psign" refer="b:gz_jgxx_ID_pk">
<selector xpath="a:H-Database/a:SqlServerTest/a:T_C/a:Count"/>
<field xpath="@value"/>
</keyref>
</element>
</sequence>
</complexType>
</element>
</schema>
|
![]() ![]() |

![]() |
回頁(yè)首 |
對于A(yíng)PI的支持
在掌握和使用XML技術(shù)時(shí),DOM和SAX可能是技術(shù)人員最常使用到的XML API。DOM和SAX只對XML實(shí)例文檔有效,雖然可以通過(guò)它們實(shí)現以XML DTD來(lái)驗證XML文檔,但是DOM和SAX卻沒(méi)有提供解析XML DTD文檔內容的功能,也就是說(shuō)我們無(wú)法通過(guò)DOM或SAX來(lái)得到DTD中元素、屬性的聲明和約束的描述。但是在基于XML+DTD的數據交換過(guò)程中,一些應用程序需要得到DTD本身的描述內容和結構,以方便對XML文檔中數據的處理,例如在使用關(guān)系數據庫存儲XML 文檔的過(guò)程中就涉及到如何將XML DTD映射為關(guān)系模式描述的問(wèn)題。為了實(shí)現對XML DTD的解讀,研究人員必須為XML DTD開(kāi)發(fā)新的接口或者專(zhuān)用工具,帶來(lái)了很大的不便。
由于XML Schema本身就是一個(gè)XML 文檔,所以我們可以通過(guò)使用DOM、SAX或JDOM等XML API很容易的解析XML Schema,這就實(shí)現了XML文檔與其描述模式處理方式的一致性,利于數據的傳輸和交換。
![]() ![]() |

![]() |
回頁(yè)首 |
更加清晰的屬性出現情況的限制、以及缺省值和枚舉
XML DTD以關(guān)鍵字#IMPlIED、#FIXED和#REQUIRED來(lái)指定屬性是否出現,并支持屬性缺省值的定義。XML Schema則提供了更明確的標記來(lái)實(shí)現清晰易懂的表示。XML Schema廢棄了XML DTD的#IMPlIED,不再支持屬性的隱含狀態(tài),而要求必須給出明確的狀態(tài),并以prohibited來(lái)表示屬性的禁用。對于缺省值的表達則更為直觀(guān),用default來(lái)直接給出。
<!ATTLIST TestDTD testAr1 CDATA #IMPLIED>
<!ATTLIST TestDTD testAr2 CDATA #REQUIRED>
<!ATTLIST TestDTD testAr3 CDATA #FIXED "3">
<!ATTLIST TestDTD testAr4 CDATA "3">
<xsd:attribute name="TestAr1" type="xsd:string" use="optional" default="3"/>
<xsd:attribute name="TestAr2" type="xsd:string" use="prohibited"/>
<xsd:attribute name="TestAr3" type="xsd:string" use="required" fixed="3"/>
|
對于XML Schema在枚舉方面的改進(jìn),請參見(jiàn)參考資料中"XML 問(wèn)題 #7 W3C XML Schema 與文檔類(lèi)型定義 (DTD) 比較"一文(文獻9)。
![]() ![]() |

![]() |
回頁(yè)首 |
注釋
XML DTD和XML Schema都支持<!-注釋內容-->這樣的注釋方法,但是XML Schema提供了更靈活和有用的注釋方式:documentation和appinfo。它們提供了面向讀者和應用的注釋。
<xsd:annotation>
<xsd:documentation>面向用戶(hù)和應用的注釋</xsd:documentation>
<xsd:appinfo>
//這是一段C語(yǔ)言代碼。
#include stdio.h
void main()
{
int i,j;
i =1;
j=i+1;
}
</xsd:appinfo>
|
![]() ![]() |

![]() |
回頁(yè)首 |
對數據庫的支持
目前如何將關(guān)系數據表示為XML數據和如何實(shí)現基于關(guān)系數據庫的XML數據存儲、查詢(xún)和更新已經(jīng)成為了研究的熱點(diǎn)。Deutsh,Florescu[5],Kossman[5],Shanmugasundaram[6,7]和D W Lee[8]等人都在XML與關(guān)系數據的相互轉化問(wèn)題方面作了較深入的研究。然而由于XML Schema成為正式推薦標準的時(shí)間較晚,加之XML DTD語(yǔ)法相對簡(jiǎn)單,所以現在大部分的研究和應用都是基于XML DTD展開(kāi)的。但是,XML DTD在對關(guān)系數據的描述方面明顯存在著(zhù)不足,例如XML DTD有限的數據類(lèi)型根本無(wú)法完成對關(guān)系數據數據類(lèi)型的一一映射,也無(wú)法實(shí)現大部分的數據規則的描述。XML Schema提供了更多的內建數據類(lèi)型,并支持用戶(hù)對數據類(lèi)型的擴展,基本上滿(mǎn)足了關(guān)系模式在數據描述上的需要,這一點(diǎn)可以作為XML Schema比XML DTD更適合描述關(guān)系數據的一個(gè)主要的原因。
![]() ![]() |

![]() |
回頁(yè)首 |
一個(gè)結論
通過(guò)比較,可以看出,XML Schema比XML DTD具有更強的表現力,能夠更好的滿(mǎn)足不同領(lǐng)域應用的需求。那么,是不是可以說(shuō)XML DTD會(huì )很快被XML Schema替代并最終消失呢。從作者的觀(guān)點(diǎn)來(lái)看,XML Schema雖然在大多數的應用領(lǐng)域都有替代XML DTD的趨勢,但是XML DTD仍然有它的適用范圍,并不可能被XML Schema完全替代:
所以,作為一種強有力的標準,XML Schema作為XML模式的主流已經(jīng)成為一種趨勢;但作為一種最簡(jiǎn)單的XML模式,XML DTD也還將會(huì )在一段時(shí)間內發(fā)揮它應有的作用。
參考資料
學(xué)習
|
聯(lián)系客服