本文主要針對百度和Google搜索引擎的關(guān)鍵字過(guò)濾功能進(jìn)行比較和分析。
最近部分國內媒體刊登了一系列文章,包括“Google可搜大量色情鏈接 過(guò)濾可能損失流量”,“Google搜索不良條目量攀升 社會(huì )責任遭考驗”,以大量篇幅論證Google包含色情違法信息,甚至有一種傾向,即將色情、違法信息泛濫的罪責推向了Google,似乎封殺了Google或搞定了Google關(guān)鍵詞過(guò)濾,網(wǎng)絡(luò )世界從此就會(huì )如同真空一樣純凈。
雖然Google推出了專(zhuān)門(mén)針對中國國情的“谷歌”(Google.cn),并使用了頗受爭議的信息過(guò)濾技術(shù),然而即使如此依舊無(wú)法擺脫被惡意攻擊和誹謗的命運。
該文章攻擊道:“最常用的信息過(guò)濾、屏蔽技術(shù)被稱(chēng)為‘關(guān)鍵字過(guò)濾’,這項技術(shù)為廣大搜索引擎企業(yè)所掌握”。并聲稱(chēng)“這項‘信息過(guò)濾’技術(shù)不算是特別復雜的技術(shù)”。
據我所知,Google.cn(以后簡(jiǎn)稱(chēng)Google)和百度目前都對色情違法信息進(jìn)行了過(guò)濾技術(shù),不同的是,百度還增加了一項關(guān)鍵詞屏蔽技術(shù),就是對于一批敏感關(guān)鍵詞,當服務(wù)器接收到用戶(hù)提交的搜索詞后,先將搜索詞和上述“過(guò)濾詞匯表”進(jìn)行匹配對比;一旦匹配成功,服務(wù)器即返回“您輸入的關(guān)鍵詞可能涉及不符合相關(guān)法律法規的內容”,然后結束搜索。比如在百度搜索“色情”等詞語(yǔ)后顯示的效果。
然而,從技術(shù)上講,這種“過(guò)濾詞匯表”實(shí)際上有很大缺陷和漏洞,對于稍懂一點(diǎn)電腦知識的人來(lái)說(shuō)形同虛設,例如在百度搜索“色情”的確不讓搜索,但是搜索“"色情"”(帶引號的色情)即可返回18,300,000萬(wàn)條搜索記錄,遠遠多于Google搜索出的記錄(另外提一下,我用Google搜索“色情”返回的結果是“該頁(yè)無(wú)法顯示”,不知道這個(gè)記者用什么線(xiàn)路上網(wǎng)的,莫非是百度提供的專(zhuān)線(xiàn)?)。推而廣之,所有百度通過(guò)“過(guò)濾詞匯表”屏蔽的詞匯,大部分只要加上個(gè)引號就全都可以搜索,另外,將多個(gè)屏蔽關(guān)鍵字組合在一起也可以搜索出結果,更可笑的是,在百度不可以搜索“色情”,但卻可以搜索出“色情圖片”70萬(wàn)條記錄,“色情電影”51萬(wàn)條記錄,“色情小說(shuō)”23萬(wàn)條記錄,“色情網(wǎng)站”79萬(wàn)條記錄,可見(jiàn)這種屏蔽的方法實(shí)在是用來(lái)忽悠媒體的,實(shí)際作用非常有限。
其次,對于使用具體過(guò)濾技術(shù)來(lái)看,Google和百度都通過(guò)內容的相關(guān)性過(guò)濾掉色情違法網(wǎng)站,Google過(guò)濾是會(huì )在頁(yè)面底部顯示“據當地法律法規和政策,部分搜索結果未予顯示”。兩者的過(guò)濾效果來(lái)看,搜索幾個(gè)關(guān)鍵字即可感覺(jué)出來(lái)。
百度搜索“色情圖片”,第一頁(yè)的大多數是論壇上的文章,并有4、5條包含色情信息,而在Google搜索“色情圖片”,則第一頁(yè)沒(méi)有一篇是色情信息。搜索其他的信息進(jìn)行對比也可以發(fā)現Google的確在信息過(guò)濾上做了不少工作,而百度則過(guò)濾的信息遠不如Google,更進(jìn)一步,用百度和Google搜索英文,我們發(fā)現百度對于英文網(wǎng)站的過(guò)濾效果更差,用百度搜索“hardcore”,結果出現了170萬(wàn)條數據,可以打開(kāi)查看到非常多的色情網(wǎng)站,而在Google中搜索“hardcore ”只能搜索到288條結果,這個(gè)夸張的對比可以看出兩者在過(guò)濾功能上所做的工作實(shí)在差距太大,所以,如果百度在這方面對Google進(jìn)行指責攻擊,那實(shí)在是顛倒黑白,指鹿為馬。
當然,這也反映出一個(gè)問(wèn)題,就是Google和百度不同,Google根本不了解中國的國情,中國的國情就是人治,說(shuō)明白點(diǎn)就是某些人憑自己的主觀(guān)意志決定一切,你其實(shí)什么都不用做,但你其實(shí)什么都做了, 以前有個(gè)對聯(lián)是“說(shuō)你行,你就行,不行也行;說(shuō)不行,就不行,行也不行”, 橫批是“不服不行”。要深刻理解這種國情,必須知道這里誰(shuí)說(shuō)了算,誰(shuí)能決定你企業(yè)的命運呢?當然是有權的人,只有他們才是主人,要想成功就需要積極向他們靠攏,爭取進(jìn)入他們的利益集團,形成共同利益,這才是在中國立于不敗之地的方法。在中國做成功的企業(yè)要完全放棄自己的道德、良心和價(jià)值觀(guān),百度是“只說(shuō)不做”,而Google是“只做不說(shuō)”,Google還天真的以為配合中國進(jìn)行信息過(guò)濾就可以順利進(jìn)入中國市場(chǎng),其實(shí)百度在過(guò)濾上做的工作可能還不如Google的十分之一,但是百度卻能讓別人以為百度比Google做的多十倍。
當然,我不希望Google更象百度,Google是個(gè)很值得敬佩的企業(yè),在企業(yè)的價(jià)值觀(guān)、道德觀(guān)方面,Google堅持“你可以?huà)赍X(qián)而不必做懷事”,在公司內部,每個(gè)人都努力成為“極具創(chuàng )新精神、值得信賴(lài)、行事正直,而且極大地改變了這個(gè)世界的人”。Google無(wú)論在管理領(lǐng)域還是在服務(wù)領(lǐng)域都順應個(gè)人化、大眾化、社會(huì )化的趨勢,堅持“做正確的事情”。
因此,Google其實(shí)不必理會(huì )百度這樣的公司,Google只需要做一個(gè)純潔、真實(shí)的自己,我們就會(huì )永遠支持她。
聯(lián)系客服