記得有一個(gè)記載:清末一個(gè)官員第一次在長(cháng)江中看到英國的“小火輪”后即刻暈了過(guò)去,醒來(lái)的第一句話(huà)就是“這個(gè)世界要變天了……”,這我第一次使用Google搜索引擎的時(shí)候感覺(jué)是類(lèi)似的。
四年前的9.11也是一個(gè)對世界改變很多的日子,而那天對我來(lái)說(shuō)卻有特別的意義:那天夜里我是在北京網(wǎng)易的辦公室里加班度過(guò)的。那天我們完成了基于Lucene的新版網(wǎng)易搜索引擎(指的是用Lucene代替了當時(shí)大部分門(mén)戶(hù)使用的GAIS),而剛剛成功切換到新引擎的喜悅很快被Judie通過(guò)MSN發(fā)給我的消息所打破:“紐約發(fā)生恐怖襲擊的消息,快去看新浪論壇……”
回想起來(lái):從Jack Xu確定我們使用Lucene這個(gè)方向到項目上線(xiàn):我們用了將近4個(gè)月左右的時(shí)間:而當時(shí)Lucene 1.2還是一個(gè)在SourceForge孵化的項目。還要感謝當時(shí)網(wǎng)易的搜索產(chǎn)品經(jīng)理:肖尚雷給我的機會(huì ),是他帶我進(jìn)入這個(gè)行業(yè),讓我能有時(shí)間從頭到尾學(xué)習了Lucene這個(gè)項目的源代碼。在Lucene之前,各個(gè)門(mén)戶(hù)網(wǎng)站的搜索用的還是臺灣中正大學(xué)中正大學(xué)資工所創(chuàng )立的一個(gè)索引/查詢(xún)引擎GAIS,GAIS不提供源代碼,只有可執行版本的工具包(有不同平臺下的binary發(fā)布版)。四年過(guò)去了:Lucene項目發(fā)展很快并應用到大量的WEB和桌面應用中。網(wǎng)易也許是第一個(gè)使用Lucene引擎的,我也很高興將Lucene推廣并應用到了更多的項目中,包括:
搜房的后臺全文檢索;
BlogChina的全文檢索;
GrassLand Blog搜索項目;
全文檢索對于CMS中一個(gè)非常重要的提升:至少解決了站內搜索問(wèn)題。雖然很多網(wǎng)站并不直接獲得非常多的站內搜索流量,但是全文檢索技術(shù)是將網(wǎng)站內部資源很好的相互引用起來(lái)的總要手段,從而成為網(wǎng)站發(fā)布系統很關(guān)鍵的一個(gè)環(huán)節。而且以L(fǎng)ucene為索引/檢索核心的完整搜索引擎項目Nutch也在A(yíng)pache基金會(huì )的支持下不斷進(jìn)步中,結合自動(dòng)分類(lèi)技術(shù),蜘蛛/分類(lèi)技術(shù)也會(huì )成為下一輪CMS改進(jìn)的另外一個(gè)發(fā)展趨勢。
聯(lián)系客服