欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
Lucene.Net系列一 ---simple example
Lucene.Net系列一 ---simple example - -
What’s Lucene
Lucene是一個(gè)信息檢索的函數庫(Library),利用它你可以為你的應用加上索引和搜索的功能.
Lucene的使用者不需要深入了解有關(guān)全文檢索的知識,僅僅學(xué)會(huì )使用庫中的一個(gè)類(lèi),你就為你的應用實(shí)現全文檢索的功能.
不過(guò)千萬(wàn)別以為L(cháng)ucene是一個(gè)象google那樣的搜索引擎,Lucene甚至不是一個(gè)應用程序,它僅僅是一個(gè)工具,一個(gè)Library.你也可以把它理解為一個(gè)將索引,搜索功能封裝的很好的一套簡(jiǎn)單易用的API.利用這套API你可以做很多有關(guān)搜索的事情,而且很方便.
What Can Lucene Do
Lucene可以對任何的數據做索引和搜索. Lucene不管數據源是什么格式,只要它能被轉化為文字的形式,就可以被Lucene所分析利用.也就是說(shuō)不管是MS word, Html ,pdf還是其他什么形式的文件只要你可以從中抽取出文字形式的內容就可以被Lucene所用.你就可以用Lucene對它們進(jìn)行索引以及搜索.
How To Use Lucene --- A Simple Example
示例介紹:
為作為輸入參數的文件夾下的所有txt類(lèi)型的文件做索引,做好的索引文件放入index文件夾.
然后在索引的基礎上對文件進(jìn)行全文搜索.
1.       建立索引
IndexWriter writer = new IndexWriter("index", new StandardAnalyzer(), true);
IndexDocs(writer, new System.IO.FileInfo(args[0]));
writer.Optimize();
writer.Close();
IndexWriter是對索引進(jìn)行寫(xiě)操作的一個(gè)類(lèi),利用它可以創(chuàng )建一個(gè)索引對象然后往其中添加文件.需要注意它并不是唯一可以修改索引的類(lèi).在索引建好后利用其他類(lèi)還可以對其進(jìn)行修改.
構造函數第一個(gè)參數是建立的索引所要放的文件夾的名字.第二個(gè)參數是一個(gè)分析對象,主要用于從文本中抽取那些需要建立索引的內容,把不需要參與建索引的文本內容去掉.比如去掉一些a the之類(lèi)的常用詞,還有決定是否大小寫(xiě)敏感.不同的選項通過(guò)指定不同的分析對象控制.第三個(gè)參數用于確定是否覆蓋原有索引的.
第二步就是利用這個(gè)writer往索引中添加文件.具體后面再說(shuō).
第三步進(jìn)行優(yōu)化.
第四步關(guān)閉writer.
下面具體看看第二步:
  public static void IndexDirectory(IndexWriter writer, FileInfo file)
         
{
              if (Directory.Exists(file.FullName))
              
{
                   String[] files = Directory.GetFileSystemEntries(file.FullName);
                   // an IO error could occur
                   if (files != null)
                   
{
                       for (int i = 0; i < files.Length; i++)
                       
{
                            IndexDirectory(writer, new FileInfo(files[i]));  //這里是一個(gè)遞歸
                       }
                   }
              }
              else if (file.Extension == ".txt")
              
{
                   IndexFile(file, writer);
              }
         }
         private static void IndexFile(FileInfo file, IndexWriter writer)
         
{
              Console.Out.WriteLine("adding " + file);
              try
              
{
                   Document doc = new Document();
                   doc.Add(Field.Keyword("filename", file.FullName));
                   doc.Add(Field.Text("contents", new StreamReader(file.FullName)));
                   writer.AddDocument(doc);
              }
              catch (FileNotFoundException fnfe)
              
{
              }
     }
主要就是兩個(gè)函數一個(gè)用于處理文件夾(不是為文件夾建立索引),一個(gè)用于真正為文件建立索引.
因此主要集中看一下IndexFile這個(gè)方法.首先建立Document對象,然后為Document對象添加一些屬性Field.你可以把Document對象看成是虛擬文件,將來(lái)將從此獲取信息.而Field則看成是描述此虛擬文件的元數據(metadata).
其中Field包括四個(gè)類(lèi)型:
Keywork
該類(lèi)型的數據將不被分析,而會(huì )被索引并保存保存在索引中.
UnIndexed
該類(lèi)型的數據不會(huì )被分析也不會(huì )被索引,但是會(huì )保存在索引.
UnStored
和UnIndexed剛好相反,被分析被索引,但是不被保存.
Text
和UnStrored類(lèi)似.如果值的類(lèi)型為string還會(huì )被保存.如果值的類(lèi)型為Reader就不會(huì )被保存和UnStored一樣.
最后將每一個(gè)Document添加到索引當中.
需要注意的是索引不僅可以建立在文件系統上,也可以建立在內存中.
例如
IndexWriter writer = new IndexWriter("index", new StandardAnalyzer(), true);
在第一個(gè)參數不是指定文件夾的名字而是使用Directory對象,并使用它的子類(lèi)RAMDirectory,就可以將索引建立在內存當中.
2.       對索引進(jìn)行搜索
IndexSearcher indexSearcher= new IndexSearcher(indexDir);
Query query = QueryParser.Parse(queryString, "contents",new StandardAnalyzer());
Hits hits = indexSearcher.Search(query);
第一步利用IndexSearcher打開(kāi)索引文件用于后面搜索,其中的參數是索引文件的路徑.
第二步使用QueryParser將可讀性較好的查詢(xún)語(yǔ)句(比如查詢(xún)的詞lucene ,以及一些高級方式lucene AND .net)轉化為L(cháng)ucene內部使用的查詢(xún)對象.
第三步執行搜索.并將結果返回到hits集合.需要注意的是Lucene并不是一次將所有的結果放入hits中而是采取一次放一部分的方式.出于空間考慮.
至此,本文演示了如何從一個(gè)文件夾下的所有txt文件中查找特定的詞。并圍繞該個(gè)實(shí)例介紹了lucene.net的索引的建立以及如何針對索引進(jìn)行搜索.最后給出源代碼供大家學(xué)習.
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
Apache Lucene與Lucene.Net——全文檢索服務(wù)器
.索引的建立和優(yōu)化
lucene爬數據庫中的數據無(wú)非也是查詢(xún)數據。所有我們用lucene搜索數據主要有下面幾個(gè)步驟
Lucene
跟我一起云計算(4)lucene
[Lucene.Net] 基本用法
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久