同樣的一本搜索引擎原理書(shū)籍,不同的人可能有不同的理解程度,而且一些以前的seo理論雖然已經(jīng)根深蒂固了,但是在目前的seo情況下已經(jīng)不太實(shí)用了,比如一個(gè)收錄問(wèn)題。其實(shí)想準確了解索引、收錄、site這些之間的關(guān)系,我們可以從基本的原理出發(fā)去考慮一些問(wèn)題。
從搜索原理上講,蜘蛛先抓取到一個(gè)網(wǎng)頁(yè)的URL,然后對這個(gè)URL對應網(wǎng)頁(yè)的內容進(jìn)行下載、分析,對于符合其質(zhì)量標準或有一定用途的網(wǎng)頁(yè)進(jìn)行索引,把索引后的網(wǎng)頁(yè)放入索引數據庫中。這時(shí)候索引庫內的網(wǎng)頁(yè)有些具有用戶(hù)檢索價(jià)值的,有些是具有搜索引擎自身的檢索價(jià)值的,對于對用戶(hù)有檢索價(jià)值的被索引的網(wǎng)頁(yè),會(huì )進(jìn)行輸出,也即是我們說(shuō)的收錄。而對僅僅有搜索引擎自身檢索價(jià)值的網(wǎng)頁(yè)可能并不輸出,僅僅有一定的索引量而沒(méi)有輸出結果數,因此我們可以看到很多時(shí)候收錄量會(huì )比索引量低很多。
站在搜索的角度而言,一個(gè)網(wǎng)站的網(wǎng)頁(yè)數量有時(shí)候是大于目前所擁有的網(wǎng)頁(yè)數量的。舉例來(lái)講,比如一個(gè)站有100個(gè)網(wǎng)頁(yè),對于用戶(hù)或者站長(cháng)而言,是100個(gè)網(wǎng)頁(yè),但是這100個(gè)網(wǎng)頁(yè)可能進(jìn)行了數據更新,網(wǎng)頁(yè)改變等多個(gè)操作,不同版本或許能滿(mǎn)足不同的需求,(因此我們也可以看到很多時(shí)候一個(gè)網(wǎng)頁(yè)有不同的快照。)從這個(gè)角度而言,在搜索的眼中一個(gè)網(wǎng)站的網(wǎng)頁(yè)數量是可以大于網(wǎng)站目前所擁有的輸出網(wǎng)頁(yè)數量的,特別對于頻繁修改的網(wǎng)站或者URL不規范的站點(diǎn)。同時(shí),站在搜索引擎的數據角度而言,其數據量可能由歷史數據和更新數據等組成的,因此site相關(guān)結果值也大于site結果數。
依據上面的說(shuō)法,我們把四者的關(guān)系重新梳理下:
索引量和收錄量:索引量是所有對搜素有價(jià)值頁(yè)面的集合,這些頁(yè)面有些對用戶(hù)有價(jià)值,把這些頁(yè)面輸出出來(lái)就是收錄量(不同的人可能定義不一樣),有些頁(yè)面僅僅對搜索引擎自身有價(jià)值,這些頁(yè)面數量就造成了索引量高于收錄量的數值。
site結果數與相關(guān)結果值:我們很多時(shí)候會(huì )看到site結果一般如下圖:

我們看到一個(gè)問(wèn)題,相關(guān)結果數為215,而site結果僅僅為40左右,兩者差距甚大。造成期差距的原因可能是有多個(gè)因素造成的,比如有些網(wǎng)頁(yè)可能被重復計算了,有些網(wǎng)頁(yè)雖然被收錄了(檢索價(jià)值是有的)但是頁(yè)面質(zhì)量不高(網(wǎng)頁(yè)價(jià)值和檢索價(jià)值不是一碼事,網(wǎng)頁(yè)檢索價(jià)值僅僅是網(wǎng)頁(yè)價(jià)值的一個(gè)基礎而已,而網(wǎng)頁(yè)價(jià)值是多個(gè)因素組成的。)
同時(shí)我們也要知道,蜘蛛畢竟是機器,而且互聯(lián)網(wǎng)上很多網(wǎng)站的網(wǎng)頁(yè)數量在不同地進(jìn)行著(zhù)變化,一直有新的網(wǎng)頁(yè)產(chǎn)生和老網(wǎng)頁(yè)的刪除,我們某個(gè)時(shí)候看到的值是一個(gè)大體準確的值,而并不是100%準確的。
從包含關(guān)系而言,這四者的關(guān)系大體如下:
索引量大于收錄量,收錄量大于site結果數,而相關(guān)結果數是大于site結果數。不過(guò)在一般情況下,我們個(gè)人建議采用下面的方法簡(jiǎn)化這些關(guān)系:
1,百度索引量=百度收錄量,因為收錄量其實(shí)是無(wú)法看到的,site結果數和相關(guān)結果值也無(wú)法代表收錄量。
2,site直接結果數對seo意義和價(jià)值較大,除了可以用site結果數來(lái)判斷一些頁(yè)面價(jià)值外,在收錄上我們建議提高site結果數和百度索引量的比值、百度索引量與整個(gè)網(wǎng)站網(wǎng)頁(yè)數量的比值,從這2個(gè)比值入手進(jìn)行seo優(yōu)化和操作。至于其中糾糾結結的概念這類(lèi)的,直接無(wú)視就好了。
聯(lián)系客服