收錄范圍
《國學(xué)寶典》收錄范圍為上起先秦、下至清末兩千多年的所有用漢字作為載體的典籍文獻。選書(shū)時(shí)充分吸收了清代以后至當代學(xué)人有關(guān)古籍整理的重要成果,充分考慮文獻的實(shí)用價(jià)值,一批通俗小說(shuō)、戲曲等均為《四庫全書(shū)》所未收。大部分文獻附有內容提要,包括作者簡(jiǎn)介、內容組成、版本等相關(guān)信息,增加了數據庫的附加值。迄今為止,該系統已收入古籍文獻4000余部,總字數逾10億字,近10萬(wàn)卷,基本涵蓋了文史研究領(lǐng)域所有重要的文獻資料,且目前仍以每年1~2億字的速度擴充數據庫內容。其目標是建成一個(gè)包含所有重要中文古籍的全文電子數據庫。
收錄標準
1.歷代經(jīng)典名著(zhù);
2.各學(xué)科的基本文獻;
3.經(jīng)過(guò)整理,具有一定史料價(jià)值和研究?jì)r(jià)值的文獻;
4.用戶(hù)所需的其它文獻。
底本選擇
1.完整本而非選本或殘本;
2.母本或現存最早的版本及精校本;
3.經(jīng)整理的標點(diǎn)本。
分類(lèi)方法
《國學(xué)寶典》按照電子文獻的特點(diǎn),以四庫分類(lèi)法為基礎,建立了一套兼容古籍文獻和電子數據庫特點(diǎn)的分類(lèi)方法,采用北京國學(xué)時(shí)代文化傳播有限公司所獨立開(kāi)發(fā)的數據庫格式進(jìn)行儲存管理。
數據格式
《國學(xué)寶典》的電子數據主要有以下幾種格式:
TXT,純文本,僅含文字
DBF,數據庫,含文字和相關(guān)標示
HTM,網(wǎng)頁(yè)格式,含文字和圖片、聲音等
其它格式,如Word,北大方正等。
檢索功能
《國學(xué)寶典》擁有強大的檢索功能,速度之快,足令古人廢書(shū)而嘆,從10億字近10萬(wàn)卷的古籍數據庫中任意范圍查找任何一個(gè)字或詞,都可以在1秒鐘內得得結果,并可滿(mǎn)足多人同時(shí)在線(xiàn)檢索。更方便的是,數據庫中不僅可以檢索字、詞、句,而且可以多條件組合檢索,其檢索結果可以復制、打印或直接保存下來(lái)。
標題檢索:通過(guò)所有書(shū)的標題(包括段、卷、回名),相當于標題索引。
全文檢索:通過(guò)輸入關(guān)鍵詞在《國學(xué)寶典》全部?jì)热堇镞M(jìn)行檢索。同時(shí)還可以限定書(shū)名、著(zhù)者、分類(lèi)條件,還可實(shí)現不同關(guān)鍵詞的組配檢索。
分類(lèi)檢索:可以指定經(jīng)、史、子、集任意一類(lèi),也可以選“十三經(jīng)”、“二十四史”、“六十種曲”等特定專(zhuān)題進(jìn)行全文檢索。
專(zhuān)書(shū)檢索:可以選《全唐文》、《列朝詩(shī)集》等任意一部書(shū)進(jìn)行全文檢索,甚至可以指定在某一卷書(shū)中查詢(xún)。
高級檢索:國學(xué)寶典的高級用戶(hù)可以使用國學(xué)寶典強大的高級檢索功能,檢索語(yǔ)法請參見(jiàn)用戶(hù)手冊。用戶(hù)只需要將合乎檢索系統語(yǔ)法要求的腳本文件(TXT文本文件)通過(guò)高級檢索接口上載到服務(wù)上,在通過(guò)語(yǔ)法檢查后,系統會(huì )自動(dòng)處理用戶(hù)的請求。檢索結果將會(huì )按照標準的zip格式壓縮,并自動(dòng)提示用戶(hù)下載;如果處理時(shí)間較長(cháng),系統將以郵件附件的方式把結果發(fā)送到用戶(hù)指定的電子信箱中。
輔助工具
國學(xué)字典:可提供所收《國學(xué)寶典》數據庫中所有漢字和符號的發(fā)音和釋義。
人名詞典:輸入一個(gè)人名或字號、別稱(chēng),即可查出該人的生平資料等相關(guān)信息。目前已收入古代3萬(wàn)多人的資料。此數據庫資料主要來(lái)源于古籍文獻,如《全上古三代秦漢三國六朝文》、《全唐文》、《列朝詩(shī)集》等。
書(shū)名詞典:輸入一個(gè)書(shū)名,即可查出該書(shū)的相關(guān)資料。目前已收入古代近2萬(wàn)種古籍的提要。此數據庫資料部分來(lái)源于古籍文獻,《四庫全書(shū)總目提要》,部分來(lái)源于今人授權的編纂資料。
國學(xué)字簞:國學(xué)網(wǎng)專(zhuān)門(mén)為處理古籍文獻而開(kāi)發(fā)的7萬(wàn)漢字輸入軟件,支持筆順、筆畫(huà)、偏旁輸入,采用unicode編碼,適合各種語(yǔ)言的Windows操作系統。
特別機制
漢字顯示:系統采用unicode大字符集,對極生僻的字(包括不常用異體字、死字)等,系統配有2000多個(gè)圖形字,基本解決了了古籍中全部漢字的顯示和檢索難題。古籍中配的大量插圖,整卷顯示時(shí)可與文字同屏查示;古籍中原缺字及無(wú)法辨別的殘缺字,均用囗符號代替;特殊文字如篆字、蒙文等都按圖形處理。核心采用國際通用的標準unicode編碼,任何語(yǔ)言的Windows操做系統都能正常顯示。
整卷閱讀:所有文獻資料均可顯示書(shū)名、作者、卷數,并可在線(xiàn)閱讀。
聯(lián)系客服