(www.marketingman.net 馮英健 2005-09-21)
摘要:王小川先生在介紹搜狗搜索結果的用戶(hù)體驗時(shí),附帶介紹了搜狗的部分網(wǎng)頁(yè)排名算法的幾個(gè)相關(guān)概念:PageRank、網(wǎng)站推薦(其他網(wǎng)站的鏈接)、權威網(wǎng)站等。據此可以對搜狗搜索引擎的網(wǎng)頁(yè)排名算法推測的是,搜狗搜索在決定一個(gè)網(wǎng)站/網(wǎng)頁(yè)的排名級別時(shí),在分析用戶(hù)檢索所用的關(guān)鍵詞與網(wǎng)頁(yè)內容的相關(guān)性的同時(shí),也會(huì )注意這個(gè)網(wǎng)站的重要程度(或者叫權威性),也就與google網(wǎng)頁(yè)排名算法之一的網(wǎng)站PR值類(lèi)似。
搜狐推出的搜狗搜索引擎(sogou.com),一年來(lái)訪(fǎng)問(wèn)量上升很快(通過(guò)ALEXA網(wǎng)站訪(fǎng)問(wèn)排名來(lái)看),而且從收錄網(wǎng)頁(yè)數量和質(zhì)量來(lái)看,在某些方面已經(jīng)具有一定的領(lǐng)先優(yōu)勢,因此到了值得網(wǎng)絡(luò )營(yíng)銷(xiāo)人員關(guān)注的時(shí)候了。作為搜索引擎營(yíng)銷(xiāo)研究,我們關(guān)注的不僅是搜狗的訪(fǎng)問(wèn)量排名,而且還關(guān)注其自然檢索的規則,尤其是搜狗搜索引擎網(wǎng)頁(yè)排名算法。
在2004年8月初搜狗剛推出的時(shí)候,盡管搜狐高調宣傳其第三代搜索引擎的特征——互動(dòng)性,但從自己所關(guān)注的網(wǎng)絡(luò )營(yíng)銷(xiāo)相關(guān)檢索內容來(lái)看,感覺(jué)不到搜狗有多大的優(yōu)勢,有些信息甚至比較陳舊,好像直接調用了搜狐分類(lèi)目錄數據庫的信息,而這些內容可能很少更新,因此對于搜狗的所謂互動(dòng)性,便沒(méi)有了太大的興趣。隨后很長(cháng)時(shí)間,幾乎沒(méi)有再去關(guān)注搜狗的發(fā)展。
大概到了2005年4月份之后,通過(guò)網(wǎng)站流量統計信息發(fā)現,來(lái)自搜狗的自然檢索用戶(hù)有了一定的增長(cháng),這才讓我重新想起了搜狗搜索引擎,并且隨后在進(jìn)行《B2B電子商務(wù)網(wǎng)站診斷研究報告》的被調查網(wǎng)站取樣時(shí),搜狗的分類(lèi)目錄還幫了我不少的忙,于是對搜狗的好感增加了不少。但對于搜狗自然檢索的排名算法,一直沒(méi)有太多的考慮,自己的幾個(gè)網(wǎng)站,都是隨其自然發(fā)展的。2005年8月15日下午,我應邀參加搜狐公司在廣州舉辦的“搜索生活每一天 搜狗一周年”活動(dòng)時(shí)(我演講的題目是“搜索引擎營(yíng)銷(xiāo)的現狀與發(fā)展趨勢”www.marketingman.net/about/blog/20050916.htm),聽(tīng)到搜狗技術(shù)總監王小川先生對搜狗一些精彩功能的介紹時(shí),才較多地了解了搜狗的一些互動(dòng)特色,并且也是第一次通過(guò)搜狗搜索的開(kāi)發(fā)者了解了搜狗的部分網(wǎng)頁(yè)排名規則。
王小川先生在介紹搜狗搜索結果的用戶(hù)體驗時(shí),附帶介紹了搜狗的部分網(wǎng)頁(yè)排名算法,對此我特別用心地注意到他所提到的幾個(gè)相關(guān)概念:“PageRank”、“網(wǎng)站推薦(其他網(wǎng)站的鏈接)”、“權威網(wǎng)站”等,這些排名算法與google的網(wǎng)頁(yè)排名規則是比較接近的,當然不會(huì )完全相同,但據此可以對搜狗(sogou.com)搜索引擎的網(wǎng)頁(yè)排名算法規則推測的是,搜狗搜索在決定一個(gè)網(wǎng)站/網(wǎng)頁(yè)的排名級別時(shí),在分析用戶(hù)檢索所用的關(guān)鍵詞與網(wǎng)頁(yè)內容的相關(guān)性的同時(shí),也會(huì )注意這個(gè)網(wǎng)站的重要程度(或者叫權威性),也就與google網(wǎng)頁(yè)排名算法之一的網(wǎng)站PR值類(lèi)似。
當我用更多的關(guān)鍵詞進(jìn)行檢索,并對排名靠前的網(wǎng)站進(jìn)行初步分析發(fā)現,搜狗在索引網(wǎng)頁(yè)的摘要信息時(shí)與google有一定的差異,幾乎不考慮網(wǎng)頁(yè)中的META標簽內容,而是更加重視網(wǎng)頁(yè)標題以及網(wǎng)頁(yè)內容中所包含的關(guān)鍵詞。另外,據王小川先生介紹,搜狗網(wǎng)頁(yè)提高用戶(hù)體驗的算法規則之一是,相同內容的網(wǎng)頁(yè)只出現一個(gè),不像有些搜索引擎一樣,同樣內容的網(wǎng)頁(yè)可能有無(wú)數個(gè),至于出現的是哪一個(gè)網(wǎng)頁(yè),個(gè)人推測大概與該網(wǎng)站的“權威性”有關(guān),但網(wǎng)站的權威性未必與“PR值”是一回事,權威性可以增加PR值,但PR值并不完全等于權威性,因為PR值還要考慮更多的因素,是網(wǎng)站各種因素綜合計算的排名級別。對于搜狗這一增加用戶(hù)體驗的規則,我有點(diǎn)納悶的是,如果被搜狗認為是“權威”的網(wǎng)站出現的信息,有可能是轉自其他網(wǎng)站,如果這個(gè)“權威網(wǎng)站”屬于侵權轉載(例如沒(méi)有說(shuō)明原文來(lái)源和版權信息),那豈不是很對不住那些不是
“權威”的網(wǎng)站?當然,也許搜狗已經(jīng)有自己的辦法解決這一問(wèn)題。
聯(lián)系客服