| 2005 年 1 月 01 日 本文主要介紹可變參數的函數使用,然后分析它的原理,程序員自己如何對它們實(shí)現和封裝,最后是可能會(huì )出現的問(wèn)題和避免措施。 VA函數(variable argument function),參數個(gè)數可變函數,又稱(chēng)可變參數函數。C/C++編程中,系統提供給編程人員的va函數很少。*printf()/*scanf() 系列函數,用于輸入輸出時(shí)格式化字符串;exec*()系列函數,用于在程序中執行外部文件(main(int argc, char* argv[]算不算呢,與其說(shuō)main()也是一個(gè)可變參數函數,倒不如說(shuō)它是exec*()經(jīng)過(guò)封裝后的具備特殊功能和意義的函數,至少在原理這一級上 有很多相似之處)。由于參數個(gè)數的不確定,使va函數具有很大的靈活性,易用性,對沒(méi)有使用過(guò)可變參數函數的編程人員很有誘惑力;那么,該如何編寫(xiě)自己的 va函數,va函數的運用時(shí)機、編譯實(shí)現又是如何。作者借本文談?wù)勛约宏P(guān)于va函數的一些淺見(jiàn)。 從大家都很熟悉的格式化字符串函數開(kāi)始介紹可變參數函數。 原型:int printf(const char * format, ...); 參數format表示如何來(lái)格式字符串的指令,… 表示可選參數,調用時(shí)傳遞給"..."的參數可有可無(wú),根據實(shí)際情況而定。 系統提供了vprintf系列格式化字符串的函數,用于編程人員封裝自己的I/O函數。 int vprintf / vscanf(const char * format, va_list ap); // 從標準輸入/輸出格式化字符串 // 例1:格式化到一個(gè)文件流,可用于日志文件
同理,也可以從文件中執行格式化輸入;或者對標準輸入輸出,字符串執行格式化。 在上面的例1中,WriteLog()函數可以接受參數個(gè)數可變的輸入,本質(zhì)上,它的實(shí)現需要vprintf()的支持。如何真正實(shí)現屬于自己的可變參數函數,包括控制每一個(gè)傳入的可選參數。
C 語(yǔ)言支持va函數,作為C語(yǔ)言的擴展--C++同樣支持va函數,但在C++中并不推薦使用,C++引入的多態(tài)性同樣可以實(shí)現參數個(gè)數可變的函數。不 過(guò),C++的重載功能畢竟只能是有限多個(gè)可以預見(jiàn)的參數個(gè)數。比較而言,C中的va函數則可以定義無(wú)窮多個(gè)相當于C++的重載函數,這方面C++是無(wú)能為 力的。va函數的優(yōu)勢表現在使用的方便性和易用性上,可以使代碼更簡(jiǎn)潔。C編譯器為了統一在不同的硬件架構、硬件平臺上的實(shí)現,和增加代碼的可移植性,提 供了一系列宏來(lái)屏蔽硬件環(huán)境不同帶來(lái)的差異。 ANSI C標準下,va的宏定義在stdarg.h中,它們有:va_list,va_start(),va_arg(),va_end()。 // 例2:求任意個(gè)自然數的平方和:
可變參數函數的原型聲明格式為: type VAFunction(type arg1, type arg2, … ); 參數可以分為兩部分:個(gè)數確定的固定參數和個(gè)數可變的可選參數。函數至少需要一個(gè)固定參數,固定參數的聲明和普通函數一樣;可選參數由于個(gè)數不確定,聲明時(shí)用"…"表示。固定參數和可選參數公同構成一個(gè)函數的參數列表。 借助上面這個(gè)簡(jiǎn)單的例2,來(lái)看看各個(gè)va_xxx的作用。 va_start(arg_ptr, argN):使參數列表指針arg_ptr指向函數參數列表中的第一個(gè)可選參數, 說(shuō)明:argN是位于第一個(gè)可選參數之前的固定參數,(或者說(shuō),最后一個(gè)固定參數;…之前的一個(gè)參數),函數參數列表中參數在內存中的順序與函數聲明時(shí)的 順序是一致的。如果有一va函數的聲明是void va_test(char a, char b, char c, …),則它的固定參數依次是a,b,c,最后一個(gè)固定參數argN為c,因此就是va_start(arg_ptr, c)。 va_arg(arg_ptr, type):返回參數列表中指針arg_ptr所指的參數,返回類(lèi)型為type,并使指針arg_ptr指向參數列表中下一個(gè)參數。 va_copy(dest, src):dest,src的類(lèi)型都是va_list,va_copy()用于復制參數列表指針,將dest初始化為src。 va_end(arg_ptr): 清空參數列表,并置參數指針arg_ptr無(wú)效。 說(shuō)明:指針arg_ptr被置無(wú)效后,可以通過(guò)調用va_start()、va_copy()恢復arg_ptr。每次調用va_start() / va_copy()后,必須得有相應的va_end()與之匹配。參數指針可以在參數列表中隨意地來(lái)回移動(dòng),但必須在va_start() … va_end()之內。
例2中調用SqSum(7, 2, 7, 11, -1)來(lái)求7, 2, 7, 11的平方和,-1是結束標志。 簡(jiǎn)單地說(shuō),va函數的實(shí)現就是對參數指針的使用和控制。
函數的固定參數部分,可以直接從函數定義時(shí)的參數名獲得;對于可選參數部分,先將指針指向第一個(gè)可選參數,然后依次后移指針,根據與結束標志的比較來(lái)判斷是否已經(jīng)獲得全部參數。因此,va函數中結束標志必須事先約定好,否則,指針會(huì )指向無(wú)效的內存地址,導致出錯。 這 里,移動(dòng)指針使其指向下一個(gè)參數,那么移動(dòng)指針時(shí)的偏移量是多少呢,沒(méi)有具體答案,因為這里涉及到內存對齊(alignment)問(wèn)題,內存對齊跟具體使 用的硬件平臺有密切關(guān)系,比如大家熟知的32位x86平臺規定所有的變量地址必須是4的倍數(sizeof(int) = 4)。va機制中用宏_INTSIZEOF(n)來(lái)解決這個(gè)問(wèn)題,沒(méi)有這些宏,va的可移植性無(wú)從談起。 首先介紹宏_INTSIZEOF(n),它求出變量占用內存空間的大小,是va的實(shí)現的基礎。
下表是針對函數int TestFunc(int n1, int n2, int n3, …) 參數傳遞時(shí)的內存堆棧情況。(C編譯器默認的參數傳遞方式是__cdecl。) 對該函數的調用為int result = TestFunc(a, b, c, d. e); 其中e為結束標志。 ![]() 從上圖中可以很清楚地看出va_xxx宏如此編寫(xiě)的原因。 1. va_start。為了得到第一個(gè)可選參數的地址,我們有三種辦法可以做到: A) = &n3 + _INTSIZEOF(n3) B) = &n2 + _INTSIZEOF(n3) + _INTSIZEOF(n2) C) = &n1 + _INTSIZEOF(n3) + _INTSIZEOF(n2) + _INTSIZEOF(n1) 從 編譯器實(shí)現角度來(lái)看,方法B),方法C)為了求出地址,編譯器還需知道有多少個(gè)固定參數,以及它們的大小,沒(méi)有把問(wèn)題分解到最簡(jiǎn)單,所以不是很聰明的途 徑,不予采納;相對來(lái)說(shuō),方法A)中運算的兩個(gè)值則完全可以確定。va_start()正是采用A)方法,接受最后一個(gè)固定參數。調用 va_start()的結果總是使指針指向下一個(gè)參數的地址,并把它作為第一個(gè)可選參數。在含多個(gè)固定參數的函數中,調用va_start()時(shí),如果不 是用最后一個(gè)固定參數,對于編譯器來(lái)說(shuō),可選參數的個(gè)數已經(jīng)增加,將給程序帶來(lái)一些意想不到的錯誤。(當然如果你認為自己對指針已經(jīng)知根知底,游刃有余, 那么,怎么用就隨你,你甚至可以用它完成一些很優(yōu)秀(高效)的代碼,但是,這樣會(huì )大大降低代碼的可讀性。) 注意:宏va_start是對參數的地址進(jìn)行操作的,要求參數地址必須是有效的。一些地址無(wú)效的類(lèi)型不能當作固定參數類(lèi)型。比如:寄存器類(lèi)型,它的地址不是有效的內存地址值;數組和函數也不允許,他們的長(cháng)度是個(gè)問(wèn)題。因此,這些類(lèi)型時(shí)不能作為va函數的參數的。 2. va_arg身兼二職:返回當前參數,并使參數指針指向下一個(gè)參數。 初看va_arg宏定義很別扭,如果把它拆成兩個(gè)語(yǔ)句,可以很清楚地看出它完成的兩個(gè)職責。
回想到printf/scanf系列函數的%d %s之類(lèi)的格式化指令,我們不難理解這些它們的用途了- 明示參數強制轉換的類(lèi)型。 (注:printf/scanf沒(méi)有使用va_xxx來(lái)實(shí)現,但原理是一致的。) 3.va_end很簡(jiǎn)單,僅僅是把指針作廢而已。 #define va_end(ap) (ap = (va_list)0) // x86平臺
從va的實(shí)現可以看出,指針的合理運用,把C語(yǔ)言簡(jiǎn)潔、靈活的特性表現得淋漓盡致,叫人不得不佩服C的強大和高效。不可否認的是,給編程人員太多自由空間必然使程序的安全性降低。va中,為了得到所有傳遞給函數的參數,需要用va_arg依次遍歷。其中存在兩個(gè)隱患: 1)如何確定參數的類(lèi)型。 va_arg在類(lèi)型檢查方面與其說(shuō)非常靈活,不如說(shuō)是很不負責,因為是強制類(lèi)型轉換,va_arg都把當前指針所指向的內容強制轉換到指定類(lèi)型; 2) 結束標志。如果沒(méi)有結束標志的判斷,va將按默認類(lèi)型依次返回內存中的內容,直到訪(fǎng)問(wèn)到非法內存而出錯退出。例2中SqSum()求的是自然數的平方和, 所以我把負數和0作為它的結束標志。例如scanf把接收到的回車(chē)符作為結束標志,大家熟知的printf()對字符串的處理用'\0'作為結束標志,無(wú) 法想象C中的字符串如果沒(méi)有'\0', 代碼將會(huì )是怎樣一番情景,估計那時(shí)最流行的可能是字符數組,或者是malloc/free。 允許對內存的隨意訪(fǎng)問(wèn),會(huì )留給不懷好意者留下攻擊的可能。當處理cracker精心設計好的一串字符串后,程序將跳轉到一些惡意代碼區域執行,以使cracker達到其攻擊目的。(常見(jiàn)的exploit攻擊)所以,必需禁止對內存的隨意訪(fǎng)問(wèn)和嚴格控制內存訪(fǎng)問(wèn)邊界。
上 面介紹可變參數函數的聲明是采用ANSI標準的,Unix System V兼容方式的聲明有一點(diǎn)點(diǎn)區別,它增加了兩個(gè)宏:va_alist,va_dcl。而且它們不是定義在stdarg.h中,而是varargs.h中。 stdarg.h是ANSI標準的;varargs.h僅僅是為了能與以前的程序保持兼容而出現的,現在的編程中不推薦使用。 va_alist:函數聲明/定義時(shí)出現在函數頭,用以接受參數列表。 va_dcl:對va_alist的聲明,其后無(wú)需跟分號";" va_start的定義也不相同。因為System V可變參數函數聲明不區分固定參數和可選參數,直接對參數列表操作。所以va_start()不是va_start(ap,v),而是簡(jiǎn)化為va_start(ap)。其中,ap是va_list型的參數指針。 Unix System V兼容方式下函數的聲明形式: type VAFunction(va_alist) va_dcl // 這里無(wú)需分號 { // 函數體內同ANSI標準 } // 例3:猜測execl的實(shí)現(Unix System V兼容方式),摘自SUS V2
個(gè)數可變參數在聲明時(shí)只需"..."即可;但是,我們在接受這些參數時(shí)不能"..."。va函數實(shí)現的關(guān)鍵就是如何得到參數列表中可選參數,包括參數的值和類(lèi)型。以上的所有實(shí)現都是基于來(lái)自stdarg.h的va_xxx的宏定義。 <思考>能不能不借助于va_xxx,自己實(shí)現VA呢?,我想到的方法是匯編。在C中,我們當然就用C的嵌入匯編來(lái)實(shí)現,這應該是可以做得到的。至于能做到什么程度,穩定性和效率怎么樣,主要要看你對內存和指針的控制了。
| |||||||||||||||||||||||||||||||||
聯(lián)系客服