從兩道經(jīng)典試題談C/C++中聯(lián)合體(union)的使用
試題一:編寫(xiě)一段程序判斷系統中的CPU是Little endian還是Big endian模式?
分析:
作為一個(gè)計算機相關(guān)專(zhuān)業(yè)的人,我們應該在計算機組成中都學(xué)習過(guò)什么叫Little endian和Big endian。Littleendian和Big endian是CPU存放數據的兩種不同順序。對于整型、長(cháng)整型等數據類(lèi)型,Bigendian認為第一個(gè)字節是最高位字節(按照從低地址到高地址的順序存放數據的高位字節到低位字節);而Littleendian則相反,它認為第一個(gè)字節是最低位字節(按照從低地址到高地址的順序存放數據的低位字節到高位字節)。
例如,假設從內存地址0x0000開(kāi)始有以下數據:
| 0x0000 | 0x0001 | 0x0002 | 0x0003 |
| 0x12 | 0x34 | 0xab | 0xcd |
如果我們去讀取一個(gè)地址為0x0000的四個(gè)字節變量,若字節序為big-endian,則讀出結果為0x1234abcd;若字節序位little-endian,則讀出結果為0xcdab3412。如果我們將0x1234abcd寫(xiě)入到以0x0000開(kāi)始的內存中,則Littleendian和Big endian模式的存放結果如下:
| 地址 | 0x0000 | 0x0001 | 0x0002 | 0x0003 |
| big-endian | 0x12 | 0x34 | 0xab | 0xcd |
| little-endian | 0xcd | 0xab | 0x34 | 0x12 |
一般來(lái)說(shuō),x86系列CPU都是little-endian的字節序,PowerPC通常是Big endian,還有的CPU能通過(guò)跳線(xiàn)來(lái)設置CPU工作于Little endian還是Big endian模式。
解答:
顯然,解答這個(gè)問(wèn)題的方法只能是將一個(gè)字節(CHAR/BYTE類(lèi)型)的數據和一個(gè)整型數據存放于同樣的內存開(kāi)始地址,通過(guò)讀取整型數據,分析CHAR/BYTE數據在整型數據的高位還是低位來(lái)判斷CPU工作于Little endian還是Big endian模式。得出如下的答案:
typedef unsigned char BYTE;
int main(int argc, char* argv[])
{
unsigned int num,*p;
p = #
num = 0;
*(BYTE *)p = 0xff;
if(num == 0xff)
{
printf("The endian of cpu is little\n");
}
else //num == 0xff000000
{
printf("The endian of cpu is big\n");
}
return 0;
}
除了上述方法(通過(guò)指針類(lèi)型強制轉換并對整型數據首字節賦值,判斷該賦值賦給了高位還是低位)外,還有沒(méi)有更好的辦法呢?我們知道,union的成員本身就被存放在相同的內存空間(共享內存,正是union發(fā)揮作用、做貢獻的去處),因此,我們可以將一個(gè)CHAR/BYTE數據和一個(gè)整型數據同時(shí)作為一個(gè)union的成員,得出如下答案:
int checkCPU()
{
{
union w
{
int a;
char b;
} c;
c.a = 1;
return (c.b == 1);
}
}
實(shí)現同樣的功能,我們來(lái)看看Linux操作系統中相關(guān)的源代碼是怎么做的:
static union { char c[4]; unsigned long l; } endian_test = { { ‘l‘, ‘?‘, ‘?‘, ‘b‘ } };
#define ENDIANNESS ((char)endian_test.l)
Linux的內核作者們僅僅用一個(gè)union變量和一個(gè)簡(jiǎn)單的宏定義就實(shí)現了一大段代碼同樣的功能!由以上一段代碼我們可以深刻領(lǐng)會(huì )到Linux源代碼的精妙之處!
試題二:假設網(wǎng)絡(luò )節點(diǎn)A和網(wǎng)絡(luò )節點(diǎn)B中的通信協(xié)議涉及四類(lèi)報文,報文格式為“報文類(lèi)型字段+報文內容的結構體”,四個(gè)報文內容的結構體類(lèi)型分別為STRUCTTYPE1~ STRUCTTYPE4,請編寫(xiě)程序以最簡(jiǎn)單的方式組織一個(gè)統一的報文數據結構。
分析:
報文的格式為“報文類(lèi)型+報文內容的結構體”,在真實(shí)的通信中,每次只能發(fā)四類(lèi)報文中的一種,我們可以將四類(lèi)報文的結構體組織為一個(gè)union(共享一段內存,但每次有效的只是一種),然后和報文類(lèi)型字段統一組織成一個(gè)報文數據結構。
解答:
根據上述分析,我們很自然地得出如下答案:
typedef unsigned char BYTE;
//報文內容聯(lián)合體
typedef union tagPacketContent
{
STRUCTTYPE1 pkt1;
STRUCTTYPE2 pkt2;
STRUCTTYPE3 pkt1;
STRUCTTYPE4 pkt2;
}PacketContent;
//統一的報文數據結構
typedef struct tagPacket
{
BYTE pktType;
PacketContent pktContent;
}Packet;
總結
在C/C++程序的編寫(xiě)中,當多個(gè)基本數據類(lèi)型或復合數據結構要占用同一片內存時(shí),我們要使用聯(lián)合體(試題一是這樣的例證);當多種類(lèi)型,多個(gè)對象,多個(gè)事物只取其一時(shí)(我們姑且通俗地稱(chēng)其為“n選1”),我們也可以使用聯(lián)合體來(lái)發(fā)揮其長(cháng)處(試題二是這樣的例證)。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=1054811