Endianness 的問(wèn)題實(shí)質(zhì)就是關(guān)于計算機如何存儲大的數值的問(wèn)題。
我們知道一個(gè)基本存儲單元可以保存一個(gè)字節,每個(gè)存儲單元對應一個(gè)地址。對于大于十進(jìn)制255(16進(jìn)制0xff)的整數,需要多個(gè)存儲單元。例如,4660對應于0x1234,需要兩個(gè)字節。不同的計算機系統使用不同的方法保存這兩個(gè)字節。在我們常用的PC機中,低位的字節0x34保存在低地址的存儲單元,高位的字節0x12保存在高地址的存儲單元;而在Sun工作站中,情況恰恰相反,0x34位于高地址的存儲單元,0x12位于低地址的存儲單元。前一種就被稱(chēng)為L(cháng)ittle Endian,后一種就是Big Endian。
如何記住這兩種存儲模式?其實(shí)很簡(jiǎn)單。首先記住我們所說(shuō)的存儲單元的地址總是由低到高排列。對于多字節的數值,如果先見(jiàn)到的是低位的字節,則系統就是Little Endian的,Little 就是"小,少"的意思,也就對應"低"。相反就是Big Endian,這里 Big "大"對應"高"。
為了加深對Endianness的理解,讓我們來(lái)看下面的C程序例子:
char a = 1;
char b = 2; 地址偏移量 內存映像
short c = 255; /* 0x00ff */ 0x0000: 01 02 FF 00
long d = 0x44332211; 0x0004: 11 22 33 44
在右側我們可以見(jiàn)到在基于Intel 80x86的系統上的內存映像,顯然我們可以馬上判定這一系統是Little Endian的。對于16位的整形數(short)c,我們先見(jiàn)到其低位的0xff,下一個(gè)才是0x00。同樣對于32位長(cháng)整形數(long)d,在最低的地址0x0004存的是最低位字節0x11。如果是在Big Endian的計算機中,則地址偏移量從0x0000到0x0007的整個(gè)內存映像將為:01 02 00 FF 44 33 22 11。
所有計算機處理器都必須在這兩種Endian間作出選擇。但某些處理器(如MIPS和IA-64)支持兩種模式,可由編程者通過(guò)軟件或硬件設置一種Endian。以下是一個(gè)處理器類(lèi)型與對應的Endian的簡(jiǎn)表:
純Big Endian: Sun
SPARC,
Motorola 68000,
Java Virtual MachineBi-Endian, 運行Big Endian模式:
MIPS運行IRIX,
PA-RISC,大多數
Power和
PowerPC系統Bi-Endian, 運行Little Endian模式:
MIPS 運行Ultrix,大多數DEC
Alpha,
IA-64運行LinuxLittle Endian:
Intel x86,
AMD64,DEC
VAX如何在程序中檢測本系統的Endianess?可調用下面的函數來(lái)快速驗證,如果返回值為1,則為L(cháng)ittle Endian;為0則是Big Endian:int testendian() {
int x = 1;
return *((char *)&x);
}
Endianness對于網(wǎng)絡(luò )通信也很重要。試想當Little Endian系統與Big Endian的系統通信時(shí),如果不做適當處理,接收方與發(fā)送方對數據的解釋將完全不一樣。比如對以上C程序段中的變量d,Little Endian發(fā)送方發(fā)出11 22 33 44四個(gè)字節,Big Endian接收方將其轉換為數值0x11223344。這與原始的數值大相徑庭。為了解決這個(gè)問(wèn)題,TCP/IP協(xié)議規定了專(zhuān)門(mén)的"網(wǎng)絡(luò )字節次序",即無(wú)論計算機系統支持何種Endian,在傳輸數據時(shí),總是數值最高位的字節最先發(fā)送。從定義可以看出,網(wǎng)絡(luò )字節次序其實(shí)是對應Big Endian的。
為了避免因為Endianness造成的通信問(wèn)題,及便于軟件開(kāi)發(fā)者編寫(xiě)易于平臺移植的程序,特別定義了一些C語(yǔ)言預處理的宏來(lái)實(shí)現網(wǎng)絡(luò )字節與主機字節次序之間的相互轉換。htons()和htonl()用來(lái)將主機字節次序轉成網(wǎng)絡(luò )字節次序,前者應用于16位無(wú)符號數,后者應用于32位無(wú)符號數。ntohs()和ntohl()實(shí)現反方向的轉換。這四個(gè)宏的原型定義可參考如下(Linux系統中可在netinet/in.h文件里找到):
#if defined(BIG_ENDIAN) && !defined(LITTLE_ENDIAN)#define htons(A) (A)#define htonl(A) (A)#define ntohs(A) (A)#define ntohl(A) (A)#elif defined(LITTLE_ENDIAN) && !defined(BIG_ENDIAN)#define htons(A) ((((uint16)(A) & 0xff00) >> 8) | (((uint16)(A) & 0x00ff) << 8))#define htonl(A) ((((uint32)(A) & 0xff000000) >> 24) | (((uint32)(A) & 0x00ff0000) >> 8) | (((uint32)(A) & 0x0000ff00) << 8) | (((uint32)(A) & 0x000000ff) << 24))#define ntohs htons#define ntohl htohl#else#error "Either BIG_ENDIAN or LITTLE_ENDIAN must be #defined, but not both."#endif