欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
信息檢索的核心支撐技術(shù) 中文全文檢索網(wǎng)
信息檢索的核心支撐技術(shù)
http://FullSearch.Com 中文全文檢索網(wǎng) 2004-9-15 9:52:54
關(guān)鍵詞:信息檢索

 ?。↖nformation Retrieval),通常指文本信息檢索,包括信息的存儲、組織、表現、查詢(xún)、存取等各個(gè)方面,其核心為文本信息的索引和檢索。從歷史上看,信息檢索經(jīng)歷了手工檢索、計算機檢索到目前網(wǎng)絡(luò )化、智能化檢索等多個(gè)發(fā)展階段。

  目前,信息檢索已經(jīng)發(fā)展到網(wǎng)絡(luò )化和智能化的階段。信息檢索的對象從相對封閉、穩定一致、由獨立數據庫集中管理的信息內容擴展到開(kāi)放、動(dòng)態(tài)、更新快、分布廣泛、管理松散的Web內容;信息檢索的用戶(hù)也由原來(lái)的情報專(zhuān)業(yè)人員擴展到包括商務(wù)人員、管理人員、教師學(xué)生、各專(zhuān)業(yè)人士等在內的普通大眾,他們對信息檢索從結果到方式提出了更高、更多樣化的要求。適應網(wǎng)絡(luò )化、智能化以及個(gè)性化的需要是目前信息檢索技術(shù)發(fā)展的新趨勢。

  信息檢索技術(shù)的熱點(diǎn)

  ◆ 智能檢索或知識檢索

  傳統的全文檢索技術(shù)基于關(guān)鍵詞匹配進(jìn)行檢索,往往存在查不全、查不準、檢索質(zhì)量不高的現象,特別是在網(wǎng)絡(luò )信息時(shí)代,利用關(guān)鍵詞匹配很難滿(mǎn)足人們檢索的要求。智能檢索利用分詞詞典、同義詞典,同音詞典改善檢索效果,比如用戶(hù)查詢(xún)“計算機”,與“電腦”相關(guān)的信息也能檢索出來(lái);進(jìn)一步還可在知識層面或者說(shuō)概念層面上輔助查詢(xún),通過(guò)主題詞典、上下位詞典、相關(guān)同級詞典,形成一個(gè)知識體系或概念網(wǎng)絡(luò ),給予用戶(hù)智能知識提示,最終幫助用戶(hù)獲得最佳的檢索效果,比如用戶(hù)可以進(jìn)一步縮小查詢(xún)范圍至“微機”、“服務(wù)器”或擴大查詢(xún)至“信息技術(shù)”或查詢(xún)相關(guān)的“電子技術(shù)”、“軟件”、“計算機應用”等范疇。另外,智能檢索還包括歧義信息和檢索處理,如“蘋(píng)果”,究竟是指水果還是電腦品牌,“華人”與“中華人民共和國”的區分,將通過(guò)歧義知識描述庫、全文索引、用戶(hù)檢索上下文分析以及用戶(hù)相關(guān)性反饋等技術(shù)結合處理,高效、準確地反饋給用戶(hù)最需要的信息。

  ◆ 知識挖掘

  目前主要指文本挖掘技術(shù)的發(fā)展,目的是幫助人們更好的發(fā)現、組織、表示信息,提取知識,滿(mǎn)足信息檢索的高層次需要。 知識挖掘包括摘要、分類(lèi)(聚類(lèi))和相似性檢索等方面。

  自動(dòng)摘要就是利用計算機自動(dòng)地從原始文獻中提取文摘。在信息檢索中,自動(dòng)摘要有助于用戶(hù)快速評價(jià)檢索結果的相關(guān)程度,在信息服務(wù)中,自動(dòng)摘要有助于多種形式的內容分發(fā),如發(fā)往PDA、手機等。相似性檢索技術(shù)基于文檔內容特征檢索與其相似或相關(guān)的文檔,是實(shí)現用戶(hù)個(gè)性化相關(guān)反饋的基礎,也可用于去重分析。自動(dòng)分類(lèi)可基于統計或規則,經(jīng)過(guò)機器學(xué)習形成預定義分類(lèi)樹(shù),再根據文檔的內容特征將其歸類(lèi);自動(dòng)聚類(lèi)則是根據文檔內容的相關(guān)程度進(jìn)行分組歸并。自動(dòng)分類(lèi)(聚類(lèi))在信息組織、導航方面非常有用。

  ◆ 異構信息整合檢索和全息檢索

  在信息檢索分布化和網(wǎng)絡(luò )化的趨勢下,信息檢索系統的開(kāi)放性和集成性要求越來(lái)越高,需要能夠檢索和整合不同來(lái)源和結構的信息,這是異構信息檢索技術(shù)發(fā)展的基點(diǎn),包括支持各種格式化文件,如TEXT、HTML、XML、RTF、MS Office、PDF、PS2/PS、MARC、ISO2709等處理和檢索;支持多語(yǔ)種信息的檢索;支持結構化數據、半結構化數據及非結構化數據的統一處理;和關(guān)系數據庫檢索的無(wú)縫集成以及其他開(kāi)放檢索接口的集成等。所謂“全息檢索”的概念就是支持一切格式和方式的檢索,從目前實(shí)踐來(lái)講,發(fā)展到異構信息整合檢索的層面,基于自然語(yǔ)言理解的人機交互以及多媒體信息檢索整合等方面尚有待取得進(jìn)一步突破。

  另外,從工程實(shí)踐角度,綜合采用內存和外部存儲的多級緩存、分布式群集和負載均衡技術(shù)也是信息檢索技術(shù)發(fā)展的重要方面。

  隨著(zhù)互聯(lián)網(wǎng)的普及和電子商務(wù)的發(fā)展,企業(yè)和個(gè)人可獲取、需處理的信息量呈爆發(fā)式增長(cháng),而且其中絕大部分都是非結構化和半結構化數據。內容管理的重要性日益凸現,而信息檢索作為內容管理的核心支撐技術(shù),隨著(zhù)內容管理的發(fā)展和普及,亦將應用到各個(gè)領(lǐng)域,成為人們日常工作生活的密切伙伴。

  信息檢索不等于 搜索引擎

  互聯(lián)網(wǎng)的發(fā)展明顯地促進(jìn)了信息檢索技術(shù)的發(fā)展和應用,一大批搜索引擎產(chǎn)品誕生,為網(wǎng)民提供了很好的快速信息獲取和網(wǎng)絡(luò )信息導航工具,但是將信息檢索等同于使用搜索引擎就陷入了誤區。搜索引擎技術(shù)中也普遍采用了全文信息檢索技術(shù),但互聯(lián)網(wǎng)信息搜索和企業(yè)信息搜索是不同的。

  一是數據量。傳統信息檢索系統一般索引庫規模多在GB級,但互聯(lián)網(wǎng)網(wǎng)頁(yè)搜索需要處理幾千萬(wàn)上億的網(wǎng)頁(yè),搜索引擎的基本策略都是采用檢索服務(wù)器群集,對大多數企業(yè)應用是不合適和不必要的,并不適用于企業(yè)應用。

  二是內容相關(guān)性。信息太多,查準和排序就特別重要,Google等搜索引擎發(fā)展了網(wǎng)頁(yè)鏈接分析技術(shù),根據互聯(lián)網(wǎng)上網(wǎng)頁(yè)被連接次數作為重要性評判的依據。但企業(yè)網(wǎng)站內部的網(wǎng)頁(yè)鏈接由網(wǎng)站內容采編發(fā)布系統決定,其鏈接次數存在偶然因素,不能作為判別重要性的依據。真正的企業(yè)應用的檢索要求基于內容的相關(guān)性排序,就是說(shuō),和檢索要求最相關(guān)的信息排在檢索結果的前面,鏈接分析技術(shù)此種排序基本不起作用。

  三是實(shí)時(shí)性。搜索引擎的索引生成和檢索服務(wù)是分開(kāi)的,周期性更新和同步數據,大的搜索引擎的更新周期需要以周乃至月度量;而企業(yè)信息檢索需要實(shí)時(shí)反映內外信息變化,搜索引擎系統機制并不能適應企業(yè)中動(dòng)態(tài)性數據增長(cháng)和修改的要求。

  四是安全性?;ヂ?lián)網(wǎng)搜索引擎都基于文件系統,但企業(yè)應用中內容一般均會(huì )安全和集中地存放在數據倉庫中以保證數據安全和管理的要求。

  五是個(gè)性化和智能化。由于搜索引擎數據和客戶(hù)規模的限制,相關(guān)反饋、知識檢索、知識挖掘等計算密集的智能技術(shù)很難應用,而專(zhuān)門(mén)針對企業(yè)的信息檢索應用能在智能化和個(gè)性走得更遠。

  信息檢索的起源

  信息檢索起源于圖書(shū)館的參考咨詢(xún)和文摘索引工作,從19世紀下半葉首先開(kāi)始發(fā)展,至20世紀40年代,索引和檢索成已為圖書(shū)館獨立的工具和用戶(hù)服務(wù)項目。

  隨著(zhù)1946年世界上第一臺電子計算機問(wèn)世,計算機技術(shù)逐步走進(jìn)信息檢索領(lǐng)域,并與信息檢索理論緊密結合起來(lái);脫機批量情報檢索系統、聯(lián)機實(shí)時(shí)情報檢索系統相繼研制成功并商業(yè)化,20世紀60年代到80年代,在信息處理技術(shù)、通訊技術(shù)、計算機和數據庫技術(shù)的推動(dòng)下,信息檢索在教育、軍事和商業(yè)等各領(lǐng)域高速發(fā)展,得到了廣泛的應用。Dialog國際聯(lián)機情報檢索系統是這一時(shí)期的信息檢索領(lǐng)域的代表,至今仍是世界上最著(zhù)名的系統之一。

本文地址:http://www.FullSearcher.Com/n200491595254735.asp
網(wǎng)站地址:http://www.FullSearcher.Com/
文章來(lái)源:
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
語(yǔ)義搜索引擎綜述
醫學(xué)文獻檢索
高中信息技術(shù)《因特網(wǎng)信息資源檢索》練習題(含解析)
搜索引擎發(fā)展綜述_eric的空間
信息檢索初級篇
搜索引擎要涉及的專(zhuān)業(yè)知識要點(diǎn)分析
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久