建立網(wǎng)站的目標在于提高知名度與增加用戶(hù)流量。搜索引擎優(yōu)化是增加網(wǎng)站流量的一種方法。另一種方法是使用網(wǎng)站地圖,它允許你指定一個(gè)搜索引擎收錄或索引哪些頁(yè)面。網(wǎng)站地圖這一概念最初由Google開(kāi)發(fā),最近雅虎與MSN也同意應用這一標準。本周我們對網(wǎng)站地圖標準進(jìn)行說(shuō)明。
建立標準的需要
搜索引擎利用蜘蛛在互聯(lián)網(wǎng)上爬行,定位網(wǎng)頁(yè)并將它們收錄到數據庫中。這一過(guò)程需要大量資源,有時(shí),你希望索引的網(wǎng)頁(yè)被忽略,而無(wú)用的網(wǎng)頁(yè)卻被收錄。在網(wǎng)絡(luò )上搜尋變化與新網(wǎng)頁(yè),收錄它們并進(jìn)行相應歸類(lèi)的Google Googlebot蜘蛛就是一個(gè)典型的例子。
網(wǎng)站地圖為網(wǎng)站明確應索引哪些網(wǎng)頁(yè),以及網(wǎng)站中增加了哪些新內容提供了一種方法?;旧?,它在搜索引擎與網(wǎng)站間提供一個(gè)通信通道。理論上,它通過(guò)減少搜索引擎蜘蛛的處理對象來(lái)緩解資源負擔,但當前網(wǎng)站地圖不能代替爬行過(guò)程。
網(wǎng)站地圖簡(jiǎn)介
網(wǎng)站地圖是一個(gè)XML文件,它包含一個(gè)網(wǎng)址URL表和相關(guān)的屬性,詳細說(shuō)明應索引某個(gè)特定網(wǎng)站的哪些內容。網(wǎng)站地圖必須為UTF-8編碼。下面是網(wǎng)站地圖文件需要的XML元素:
文件中還有下列可選元素:
下面的網(wǎng)站地圖樣本說(shuō)明如何在一個(gè)樣本網(wǎng)頁(yè)中應用這些元素。它為一個(gè)假定的網(wǎng)站指定主頁(yè),以及它的更新頻率,上次更新的時(shí)間和網(wǎng)站中的優(yōu)先權。
<?xml version="1.0" encoding="UTF-8"?>
<urlsetxmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.test.com/</loc>
<lastmod>2006-11-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.3</priority>
</url>
</urlset>
網(wǎng)站地圖文件的位置由你自己決定,但它的位置決定了可能包含中文件中的URL集。例如,如果上面的樣本網(wǎng)站地圖文件位于http://www.test.com/sitemap.xml,那么網(wǎng)站地圖文件中可能包含任何以http://www.test.com/開(kāi)頭的URL。因此,我們建議將網(wǎng)站地圖文件存放在網(wǎng)站的根目錄下。網(wǎng)站地圖文件的大小不得超過(guò)10MB。如果一個(gè)文件超出這個(gè)限制,就需要使用gzip進(jìn)行壓縮。
建立一個(gè)網(wǎng)站地圖
既然網(wǎng)站地圖以XML為基礎,就可以方便的使用任何文本編輯器建立并編輯它們,不過(guò)也可以應用專(zhuān)門(mén)的工具。下面的列表提供了一些當前的工具:
通告搜索引擎
建立一個(gè)網(wǎng)站地圖文件后,應該將它提交給一個(gè)搜索引擎。每個(gè)搜索都擁有自己的網(wǎng)站地圖提交界面。Google的Webmaster工具集中包含了一個(gè)網(wǎng)站地圖提交頁(yè)面。在使用之前你必須注冊一個(gè)賬戶(hù)。雅虎也有一個(gè)免費的網(wǎng)站地圖提交頁(yè)面,但在使用之前同樣必須注冊一個(gè)賬戶(hù)。其它搜索引擎也會(huì )仿效Google、雅虎和MSN,提供相似的功能。
其它工具
搜索引擎收錄網(wǎng)頁(yè)的爬行過(guò)程緩慢而且需要大量資源。網(wǎng)站地圖為網(wǎng)站指定應收錄哪些內容而進(jìn)行搜索提供了一種方法。它們建立像XML一樣的簡(jiǎn)單文本格式文件,但有許多工具可以幫助你建立網(wǎng)站地圖文件?,F在,它們只是對當前的處理過(guò)程進(jìn)行補充。
聯(lián)系客服