字庫基本知識
要想定制自己的字庫,最好有一些相應的知識。一者,隨著(zhù)相關(guān)知識的增加,進(jìn)入到專(zhuān)業(yè)人士之內,你可以對這個(gè)行業(yè)內部的規律更加了解,花多少錢(qián),辦多少事,自己心里明白,可以做到少花錢(qián)多辦事;二者也便于我們相互之間的交流和溝通。下面就字庫的基本知識作一個(gè)十分簡(jiǎn)要的介紹:
字庫,就是我們使用計算機是顯示漢字的圖像源。計算機調用字庫顯示漢字,不是直接調用相同的圖像,而是調用這個(gè)漢字的內碼,程序通過(guò)這個(gè)內碼,再到相應的圖像源(字庫)當中尋找相應的圖像信息,并畫(huà)到屏幕上或者打印到紙上。所以,只要是文本文件,在以二進(jìn)制模式打開(kāi)的時(shí)候,顯示的都是這些字的內碼而不是圖形。
人們一般常用的都是PC機。操作環(huán)境一般使用的都是Windows操作系統。它的字庫都存放在C:\Windows\fonts\目錄下。打開(kāi)這個(gè)目錄就可以看到各式各樣的字庫。其中顯示為漢字的(如"宋體"),就是中文字庫。安裝字庫的時(shí)候,只要用鼠標點(diǎn)擊瀏覽器的文件→安裝新字體,就顯示出一個(gè)文件操作界面。選中相關(guān)字庫文件所在的目錄,系統就會(huì )自動(dòng)掃描字庫文件,選中之后再點(diǎn)擊"安裝",字庫就會(huì )拷貝到C:\Windows\fonts\目錄下了,這就算安裝好了。如果你對文件所在位置比較熟悉,也可以直接將其拷貝到該目錄下,之后,當你再啟動(dòng)應用軟件(如Word、WPS等等)的時(shí)候,在選擇字庫的時(shí)就可以選用你安裝的字庫了。想刪除字庫,同樣也是進(jìn)入到該目錄下,選中想要刪除的字庫,點(diǎn)擊文件→刪除就可以了,更為便捷的,使用鼠標右鍵,直接刪除。
字庫的內部結構。用常見(jiàn)的字庫程序(詳見(jiàn)文件下載部分)可以打開(kāi)字庫。字庫打開(kāi)之后可以發(fā)現,字庫內的每一個(gè)字的圖像都是由曲線(xiàn)環(huán)繞而成。曲線(xiàn)上有很多的小點(diǎn)點(diǎn)。當鼠標拖動(dòng)這些控制點(diǎn)的時(shí)候,曲線(xiàn)會(huì )發(fā)生變化,字的圖像也就改變了。如果就這樣存盤(pán),在使用這個(gè)字庫的這個(gè)字的時(shí)候,就會(huì )和原來(lái)的不一樣而和你修改后的樣子相同。這就是字庫的編輯,很簡(jiǎn)單,每一個(gè)人都會(huì )做的。
這時(shí)你會(huì )發(fā)現,打開(kāi)一個(gè)西方文字的字庫,最多也不會(huì )超過(guò)256個(gè)字符圖像。一般大致二十六個(gè)拉丁字母(因文字不同而小有區別)的大小寫(xiě)、數字、常用標點(diǎn)符號等等,一個(gè)人搞個(gè)一天兩天,完全可以解決問(wèn)題。而漢字的就大不相同了。最小的漢字字庫也要6763個(gè)漢字。要想搞定一版漢字字庫,顯然不是一兩個(gè)人一兩年的事(一般需要3~5人/年)。它需要大量的人力和時(shí)間。所以說(shuō),漢字庫不是太復雜,而是太繁瑣,非專(zhuān)業(yè)人士難以涉足。
現在全世界有文字的語(yǔ)言至少有幾百種,它代表著(zhù)全人類(lèi)的文化。從前,當您發(fā)行一種文件(譬如報紙)或者軟件,都需要使用當地語(yǔ)言的操作系統重新輸入語(yǔ)言代碼。由于代碼不同,如果一種語(yǔ)言的文化想跟上世界發(fā)展水平,或者發(fā)展水平高的向水平低的普及的話(huà),就很困難。所以人們發(fā)明了UNICODE,將全人類(lèi)的文字統編到同一個(gè)編碼系統當中。雖然各種語(yǔ)言文化系統使用不同的代碼系統,但是使用UNICODE就可以使用同一個(gè)操作系統去識別不同的語(yǔ)言文字。
LINUX、UNIX、WindowsNT、MAC等都使用UNICODE。由于不少文化歷史地存在著(zhù)互影響的,所以其語(yǔ)言也有著(zhù)血緣關(guān)系,譬如中國大陸使用簡(jiǎn)體中文,臺灣使用繁體中文。大陸和臺灣有著(zhù)血緣關(guān)系。簡(jiǎn)體中文中有一大部分是繁體中文中也使用的。怎樣既區別又兼容這種現象呢?人們發(fā)明了以代碼頁(yè)命名的區別系統。譬如同屬于中國文化圈的中國大陸、臺灣、日本、韓國,日常使用的文字當中都有漢字,所以以936、950、932、949等四個(gè)代碼頁(yè)相互區別。
漢字的使用當然還是以中國為核心,所以漢字文化圈叫做CJK系統(C指中國,J指日本,K指韓國)。中國大陸使用的簡(jiǎn)體中文叫做GBK(即:GB_13000)。其代碼頁(yè)和輸入法在Windows\GBK.txt全部提供了,可以參考。臺灣繁體字編碼系統叫做BIG5(大5碼)。GBK包含GB_2312和BIG5,共有20902個(gè)漢字。新出版的GB_18064,共有六萬(wàn)多個(gè)字符,字符代碼又擴大了。
聯(lián)系客服