A
在GB2312字庫中,區位碼0101到0994 是各種數字符號,1601到8794是漢字。
漢字應用國標標準漢字字符集(區位碼范圍:1601-8794)中的漢字。
背景知識:
簡(jiǎn)體中文國標字庫(1981年訂,中國大陸)。7445個(gè)字符,其中漢字6773個(gè),包括一級漢字3755個(gè),二級漢字3008個(gè)。采用2字節(16位二進(jìn)制)編碼。
區位碼:國標GB2312規定,所有的國標漢字與符號組成一個(gè)94×94的矩陣。在此方陣中,每一行稱(chēng)為一個(gè)”區”,每一列稱(chēng)為一個(gè)”位”,因此,這個(gè)方陣實(shí)際上組成了一個(gè)有94個(gè)區(區號分別為0 1到94)、每個(gè)區內有94個(gè)位(位號分別為01到94)的漢字字符集。一個(gè)漢字所在的區號和位號簡(jiǎn)單地組合在一起就構成了該漢字的”區位碼”。在漢字的區位碼中,高兩位為區號,低兩位為位號。由此可見(jiàn),區位碼與漢字或符號之間是一一對應的。
內碼:漢字的內碼是指在計算機中表示漢字的編碼。機內碼與區位碼稍有區別。為什么不直接用區位碼作為計算機內的編碼呢? 這是因為漢字的區碼和位碼的范圍都在1到94內, 如果直接用區位碼作機內碼, 就會(huì )與基本ASCII碼沖突。 漢字的內碼通常與所使用的計算機系統有關(guān)。目前,對于國內大多數的計算機系統,一個(gè)漢字的內碼占兩個(gè)字節,分別稱(chēng)為高位字節與低位字節,且這兩位字節與區位碼的關(guān)系如下: 內碼高位=區碼+A0H(H表示十六進(jìn)制) 內碼低位=位碼+A0H 例如,漢字”啊”的區位碼為”1601〃,區碼和位碼分別用十六進(jìn)制表示即為”1001H”,則它的內碼為”B0A1H”。其中B0H為內碼的高位字節,A1H為內碼的低位字節。
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請
點(diǎn)擊舉報。