用XPath精確定位節點(diǎn)元素
用XPath精確定位節點(diǎn)元素
在利用XSL進(jìn)行轉換的過(guò)程中,匹配的概念非常重要。在模板聲明語(yǔ)句 xsl:template match = ""和模板應用語(yǔ)句xsl:apply-templates select = "" 中,用引號括起來(lái)的部分必須能夠精確地定位節點(diǎn)。具體的定位方法則在XPath中給出。
之所以要在XSL中引入XPath的概念,目的就是為了在匹配XML文檔結構樹(shù)時(shí)能夠準確地找到某一個(gè)節點(diǎn)元素??梢园裍Path比作文件管理路徑:通過(guò)文件管理路徑,可以按照一定的規則查找到所需要的文件;同樣,依據XPath所制定的規則,也可以很方便地找到XML結構文檔樹(shù)中的任何一個(gè)節點(diǎn),顯然這對XSLT來(lái)說(shuō)是一個(gè)最最基本的功能。
XPath數據類(lèi)型
XPath可分為四種數據類(lèi)型:
其中后三種數據類(lèi)型與其它編程語(yǔ)言中相應的數據類(lèi)型差不多,只是第一種數據類(lèi)型是XML文檔樹(shù)的特有產(chǎn)物。
XPath節點(diǎn)類(lèi)型
另外,由于XPath包含的是對文檔結構樹(shù)的一系列操作,因此搞清楚XPath節點(diǎn)類(lèi)型也是很必要的?;貞浺幌碌诙轮兄v到的XML文檔的邏輯結構,一個(gè)XML文件可以包含元素、CDATA、注釋、處理指令等邏輯要素,其中元素還可以包含屬性,并可以利用屬性來(lái)定義命名空間。相應地,在XPath中,將節點(diǎn)劃分為七種節點(diǎn)類(lèi)型:
一個(gè)XML文檔樹(shù)
我們來(lái)構造一棵XML文檔樹(shù),作為后面舉例的依托:
|
以下將要介紹一些XPath中節點(diǎn)匹配的基本方法。
路徑匹配
路徑匹配與文件路徑的表示相仿,比較好理解。有以下幾個(gè)符號:
(1)用“/”指示節點(diǎn)路徑
如“/A/C/D” 表示節點(diǎn)"A"的子節點(diǎn)"C"的子節點(diǎn)"D",即id值為d2的D節點(diǎn), “/”表示根節點(diǎn)。
(2)用“//” 表示所有路徑以"http://"后指定的子路徑結尾的元素
如“//E” 表示所有E元素,結果是所有三個(gè)E元素,如“//C/E”表示所有父節點(diǎn)為C的E元素,結果是id值為e1和e2的兩個(gè)E元素 。
(3)用“*” 表示路徑的通配符
如“/A/B/C/*”表示 A元素→B元素→C元素下的所有子元素,即name值為b的B元素、 id值為d1的D元素和id值為e1和e2的兩個(gè)E元素
“/*/*/D”表示上面有兩級節點(diǎn)的D元素,匹配結果是id值為d2的D元素 ,如“//*”表示所有的元素。
位置匹配
對于每一個(gè)元素,它的各個(gè)子元素是有序的。
如:/A/B/C[1]表示A元素→B元素→C元素的第一個(gè)子元素,得到name值為b的B元素
/A/B/C[last()]表示A元素→B元素→C元素的最后一個(gè)子元素,得到id值為e2的E元素
/A/B/C[position()>1]表示A元素→B元素→C元素之下的位置號大于1的元素,得到id值為d1的D元素和兩個(gè)具有id值的E元素
屬性及屬性值
在XPath中可以利用屬性及屬性值來(lái)匹配元素,要注意的是,元素的屬性名前要有"@"前綴。例如:
//B[@id]表示所有具有屬性id的B元素,結果為id值為b1和b2的兩個(gè)B元素
//B[@*]表示所有具有屬性的B元素,結果為兩個(gè)具有id屬性的B元素和一個(gè)具有name屬性B元素
//B[not(@*)]表示所有不具有屬性的B元素,結果為A元素→C元素下的B元素
//B[@id="b1"] id值為b1的B元素,結果為A元素下的B元素
親屬關(guān)系匹配
XML文檔可歸結為樹(shù)型結構,因此任何一個(gè)節點(diǎn)都不是孤立的。通常我們把節點(diǎn)之間的歸屬關(guān)系歸結為一種親屬關(guān)系,如父親、孩子、祖先、后代、兄弟等等。在對元素進(jìn)行匹配時(shí),同樣可以用到這些概念。例如:
//E/parent::* 表示所有E節點(diǎn)的父節點(diǎn)元素,結果為id值為a1的A元素和id值為c1的C元素
//F/ancestor::* 表示所有F元素的祖先節點(diǎn)元素,結果為id值為a1的A元素和id值為c2的C元素
/A/child::* 表示A的子元素,結果為id值為b1、b2的B元素,id值為c2的C元素,以及沒(méi)有任何屬性的E元素
/A/descendant::* 表示A的所有后代元素,結果為除A元素以外的所有其它元素
//F/self::* 表示所有F的自身元素,結果為F元素本身
//F/ancestor-or-self::* 表示所有F元素及它的祖先節點(diǎn)元素,結果為F元素、F元素的父節點(diǎn)C元素和A元素
/A/C/descendant-or-self::* 表示所有A元素→C元素及它們的后代元素,結果為id值為c2的C元素、該元素的子元素B、D、F元素
/A/C/following-sibling::* 表示A元素→C元素的緊鄰的后序所有兄弟節點(diǎn)元素,結果為沒(méi)有任何屬性的E元素
/A/C/preceding-sibling::* 表示A元素→C元素的緊鄰的前面所有兄弟節點(diǎn)元素,結果為id值為b1和b2的兩個(gè)B元素
/A/B/C/following::* 表示A元素→B元素→C元素的后序的所有元素,結果為id 為b2的B元素、無(wú)屬性的C元素、無(wú)屬性的B元素、id為d2的D元素、無(wú)屬性的F元素、\無(wú)屬性的E元素。
/A/C/preceding::* 表示A元素→C元素的前面的所有元素,結果為id為b2的B元素、id為e2的E元素、id為e1的E元素、id為d1的D元素、name為 b的B元素、id為c1的C元素、id為b1的B元素
條件匹配
條件匹配就是利用一些函數的運算結果的布爾值來(lái)匹配符合條件的節點(diǎn)。常用于條件匹配的函數有四大類(lèi):節點(diǎn)函數、字符串函數、數值函數、布爾函數。例如last()、position()等等,這里我們就不再贅述。
以上這些匹配方法中,用得最多的還要數路徑匹配。在上一章樣式表的例子中,無(wú)論是在語(yǔ)句<xsl:template match="學(xué)生花名冊">中,還是在語(yǔ)句 <xsl:value-of select="名字"/>中,都是依靠給出相對于當前路徑的子路徑來(lái)定位節點(diǎn)的。
聯(lián)系客服