這是關(guān)于谷歌站點(diǎn)管理工具報告的最后一篇文章。
爬蟲(chóng)搜索狀態(tài)顯示Googlebot遇到的問(wèn)題,其包含以下幾個(gè)子報告:——每天爬蟲(chóng)索引的網(wǎng)頁(yè)。這一報告顯示,在過(guò)去的三個(gè)月里,每天Googlebot向多少網(wǎng)頁(yè)發(fā)出要求。這一圖表中沒(méi)有準確的數字,但零肯定是錯誤的數字。因為谷歌的爬蟲(chóng)索引非常頻繁,這主要是因為網(wǎng)頁(yè)的大部分屬于PageRank,你可能會(huì )看到頻率在增加。
——每天爬蟲(chóng)索引的字節數。這與爬蟲(chóng)每天索引的網(wǎng)頁(yè)不可能準確匹配,但它會(huì )顯示一些相似性,比如相同的高峰與谷底。
——下載一個(gè)網(wǎng)頁(yè)所需的時(shí)間。它顯示用于Googlebot從你的服務(wù)器抓取特定URL所需的時(shí)間。一般,這一圖表的高峰與谷底與上面討論的兩種情況無(wú)關(guān)。實(shí)際上,該圖表中的峰值顯示服務(wù)器問(wèn)題,因為除非你的網(wǎng)頁(yè)非常的大,否則Googlebot不會(huì )花費太長(cháng)的時(shí)間進(jìn)行下載。
——谷歌搜索引擎中你網(wǎng)頁(yè)的PageRank.該部分顯示你索引的所有網(wǎng)頁(yè),并將PageRank分類(lèi)四種:高、中、低和尚未配置。
所有的谷歌站點(diǎn)管理工具報告只是滄海一粟。網(wǎng)頁(yè)需要7到8個(gè)PageRank進(jìn)入“高”級別類(lèi)。對于絕大多數的網(wǎng)站來(lái)說(shuō),絕大多數的網(wǎng)頁(yè)會(huì )進(jìn)入“低”或是“尚未配置”之列。但你不必過(guò)于擔心,因為如果你已使用PageRank,你可能失去了一些重要的戰略。
——有最高PageRank的網(wǎng)頁(yè)。這份報告的目的是在于告訴你哪個(gè)網(wǎng)頁(yè)有最高的PageRank.在99%的網(wǎng)站中,是主頁(yè)。如果你看到列出了舊的網(wǎng)頁(yè),就在谷歌工具條中雙擊PageRank列表。
HTML建議報告在分析你的標題和宏描述數據時(shí)有很好的價(jià)值。
——宏描述:該報告顯示復制的宏描述太長(cháng)或是太短。
不要被數字迷惑。如果谷歌站點(diǎn)工具報告有600頁(yè)的描述是復制的,它意味著(zhù)兩個(gè)網(wǎng)頁(yè)有300種不同的可能性是復制數據,而600個(gè)網(wǎng)頁(yè)不一定有相同的描述。
——標題標簽:這一部分顯示失去的、復制的、長(cháng)和短的標題標簽,盡管所有的都是自我陳述性的描述,但它很難區分什么字母或是單詞包括在內。
對于“非告知性標題標簽”的不太了解,我要說(shuō)兩句。我相信,只有谷歌會(huì )發(fā)出告知,如果你在標題標簽中有單詞被反復提及,或與涉及的內容無(wú)關(guān)的話(huà)。在研究許多不同的網(wǎng)站檔案時(shí),我還沒(méi)有找到其它的例子。
——非索引性?xún)热?。有了非指令性標題標簽,我在查找URL范例時(shí)出現了問(wèn)題,在谷歌中這種問(wèn)題會(huì )做出實(shí)際匯報。最后,我發(fā)現一個(gè)網(wǎng)站有數百個(gè)入口,谷歌把他們社為圖像進(jìn)行標注,而實(shí)際上他們是部分網(wǎng)頁(yè)跟蹤URL.如果谷歌站點(diǎn)管理工具稱(chēng),你的網(wǎng)站有重要的非索引性?xún)热?,就要對報告的URL進(jìn)行認真分析。如果這些URL代表你想要索引的數據,就要考慮適合于爬蟲(chóng)索引的最好模式。如果這些URL不能代表這些數據,則要考慮通過(guò)robots.txt刪除這些數據。
我希望上述關(guān)于谷歌站點(diǎn)工具的文章會(huì )給你提供一些有益的信息。在第一部分中,我們討論了“站點(diǎn)確認部分”,第二部分中討論了“網(wǎng)絡(luò )中你的網(wǎng)站”報告,第三部分討論了“關(guān)于爬蟲(chóng)錯誤”報告的“診斷部分”。
聯(lián)系客服