Lucene學(xué)習筆記(2)
不僅僅在
推廣和介紹方面,
車(chē)東在Lucene的漢化及
web應用,也作出了極大的極大的貢獻。他將自己的漢化和web應用兩方面的成果,放在
sourceforge上成了開(kāi)源的項目。下面主要是對這個(gè)項目的學(xué)習筆記。
對Lucene的漢化,車(chē)東開(kāi)發(fā)了兩個(gè)Analyzer,一個(gè)是二元切分,一個(gè)單字切分。利用這兩個(gè)中的任一個(gè)進(jìn)行分析,都可以進(jìn)行漢字的索引和檢索了。我把這兩個(gè)Analyzer編譯后一起打入到lucene-1.2.jar中了,如果不愿自己動(dòng)手進(jìn)行編譯這兩個(gè)Analyzer的朋友,可以從這兒下載。
有了新的Analyzer,我把IndexFiles、IndexHTML和SearchFiles中的Analyzer也用了新CJKAnalyzer做了替換,并重新編譯打了包lucene-demo-1.2.jar,可以從這兒
下載。包內帶有修改后的三個(gè)java文件。
用上面兩個(gè)jar文件,分別替換同名的原來(lái)的文件,就可以索引和檢索漢語(yǔ)了。右面是我做的測試。
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請
點(diǎn)擊舉報。