盡管我們在去年8月就知道Google要上馬Caffeine網(wǎng)頁(yè)索引系統了,但是Google官方今天才正式宣布。Caffeine系統可提供比以前多一半的新的索引結果,也就是說(shuō)Google可以收集到比以前更多的信息,而且Caffeine的索引速度比以前更快,它也是Google實(shí)時(shí)搜索可以實(shí)現的重要元素。
實(shí)際上當你在Google進(jìn)行搜索的時(shí)候,Google并不是在做實(shí)時(shí)搜索,而是搜索Google之前已經(jīng)索引到的存放在數據庫里的內容,隨著(zhù)網(wǎng)絡(luò )的進(jìn)化,內容極大的豐富,不僅是數量上的增加,還包括更豐富的形式,比如視頻、圖片、新聞、實(shí)時(shí)更新等等,而且人們對搜索引擎的期待越來(lái)越高,他們希望找到最新的最相關(guān)的信息,內容發(fā)布商則希望他們前腳發(fā)出的內容,后腳就可以在Google搜索到。
為了趕上網(wǎng)絡(luò )的進(jìn)化和人們的期望,Google祭出了Caffeine,上圖顯示了老式索引系統和Caffeine索引系統的區別。老系統有多個(gè)層,一些是最新的內容而其它則是較老的內容,但大多數的層需要幾周才會(huì )更新一次。為了更新一個(gè)老的索引層,Google需要重新將整個(gè)網(wǎng)絡(luò )分析一遍才可以,所以不能保證讓你看到最新的內容。
而有了Caffeine,Google可以在很短的周期里就分析一遍網(wǎng)絡(luò ),并更新索引庫。而且Google可以做到只要一發(fā)現新的網(wǎng)頁(yè)、網(wǎng)頁(yè)里新的信息就立即將它們加入到索引庫里,它們立刻就會(huì )被你搜索到。
Google還透露說(shuō),Caffeine每一秒可以并行處理成百上千個(gè)頁(yè)面,如果將這些網(wǎng)頁(yè)都打印出來(lái),堆在一起能達到3英里厚。Caffeine每天會(huì )在單個(gè)數據庫里增加將近1億GB的新數據,你需要62萬(wàn)5千個(gè)最大的iPod才能存的下這些信息,如果將這些iPod連起來(lái)能排出40英里。
Via Google Blog
musiXboy 發(fā)表于 谷奧——探尋谷歌的奧秘 ( http://www.google.org.cn ), 2010. | 9 條評論 | 永久鏈接 | 關(guān)于谷奧 | 投稿/爆料
Post tags: Caffeine, Google Search, Real Time Search
歡迎訂閱谷安子站,關(guān)注Android新聞,技巧及更多