它把 CString 強制類(lèi)型轉化成 LPCTSTR,也就是說(shuō)先獲得改字符串的地址,然后再強制類(lèi)型轉化成 LPTSTR,以便可以對之進(jìn)行賦值操作。 注意這只有在使用 Set 或 Insert 之類(lèi)的方法才有效!如果你試圖獲取數據,則不能這么做。 如果你打算獲取存儲在控件中的數據,則方法稍有不同,例如,對某個(gè) CTreeCtrl 使用 GetItem 方法,我想獲取項目的文本。我知道這些 文本的長(cháng)度不會(huì )超過(guò) MY_LIMIT,因此我可以這樣寫(xiě): TVITEM tvi;// ... assorted initialization of other fields of tvitvi.pszText = s.GetBuffer(MY_LIMIT);tvi.cchTextMax = MY_LIMIT;c_MyTree.GetItem(&tvi);s.ReleaseBuffer(); 可以看出來(lái),其實(shí)上面的代碼對所有類(lèi)型的 Set 方法都適用,但是并不需要這么做,因為所有的類(lèi) Set 方法(包括 Insert方法)不會(huì )改變字符串的內容。但是當你需要寫(xiě) CString 對象時(shí),必須保證緩沖是可寫(xiě)的,這正是 GetBuffer 所做的事情。再次強調: 一旦做了一次 GetBuffer 調用,那么在調用 ReleaseBuffer 之前不要對這個(gè) CString 對象做任何操作。
5、CString 型轉化成 BSTR 型
當我們使用 ActiveX 控件編程時(shí),經(jīng)常需要用到將某個(gè)值表示成 BSTR 類(lèi)型。BSTR 是一種記數字符串,Intel平臺上的寬字符串(Unicode),并且 可以包含嵌入的 NULL 字符。
你可以調用 CString 對象的 AllocSysString 方法將 CString 轉化成 BSTR:CString s;s = ... ; // whateverBSTR b = s.AllocSysString(); 現在指針 b 指向的就是一個(gè)新分配的 BSTR 對象,該對象是 CString 的一個(gè)拷貝,包含終結 NULL字符?,F在你可以將它傳遞給任何需要 BSTR 的接口。通常,BSTR 由接收它的組件來(lái)釋放,如果你需要自己釋放 BSTR 的話(huà),可以這么做: ::SysFreeString(b); 對于如何表示傳遞給 ActiveX 控件的字符串,在微軟內部曾一度爭論不休,最后 Visual Basic 的人占了上風(fēng),BSTR(“Basic String”的首字母縮寫(xiě))就是這場(chǎng)爭論的結果。
6、BSTR 型轉化成 CString 型
由于 BSTR 是記數 Unicode 字符串,你可以用標準轉換方法來(lái)創(chuàng )建 8 位的 CString。實(shí)際上,這是 CString 內建的功能。在 CString 中 有特殊的構造函數可以把 ANSI 轉化成 Unicode,也可以把Unicode 轉化成 ANSI。你同樣可以從 VARIANT 類(lèi)型的變量中獲得 BSTR 類(lèi)型的字符串,VARIANT 類(lèi)型是 由各種 COM 和 Automation (自動(dòng)化)調用返回的類(lèi)型。
例如,在一個(gè)ANSI程序中:BSTR b;b = ...; // whateverCString s(b == NULL ? L"" : b) 對于單個(gè)的 BSTR 串來(lái)說(shuō),這種用法可以工作得很好,這是因為 CString 有一個(gè)特殊的構造函數以L(fǎng)PCWSTR(BSTR正是這種類(lèi)型) 為參數,并將它轉化成 ANSI 類(lèi)型。專(zhuān)門(mén)檢查是必須的,因為 BSTR 可能為空值,而 CString 的構造函數對于 NULL 值情況考慮的不是很周到,(感謝 Brian Ross 指出這一點(diǎn)!)。這種用法也只能處理包含 NUL 終結字符的單字符串;如果要轉化含有多個(gè) NULL 字符 串,你得額外做一些工作才行。在 CString 中內嵌的 NULL 字符通常表現不盡如人意,應該盡量避免。 根據 C/C++ 規則,如果你有一個(gè) LPWSTR,那么它別無(wú)選擇,只能和 LPCWSTR 參數匹配。
在 Unicode 模式下,它的構造函數是: CString::CString(LPCTSTR); 正如上面所表示的,在 ANSI 模式下,它有一個(gè)特殊的構造函數: CString::CString(LPCWSTR); 它會(huì )調用一個(gè)內部的函數將 Unicode 字符串轉換成 ANSI 字符串。(在Unicode模式下,有一個(gè)專(zhuān)門(mén)的構造函數,該函數有一個(gè)參數是LPCSTR類(lèi)型——一個(gè)8位 ANSI 字符串 指針,該函數將它加寬為 Unicode 的字符串?。┰俅螐娬{:一定要檢查 BSTR 的值是否為 NULL。 另外還有一個(gè)問(wèn)題,正如上文提到的:BSTRs可以含有多個(gè)內嵌的NULL字符,但是 CString 的構造函數只能處理某個(gè)串中單個(gè) NULL 字符。 也就是說(shuō),如果串中含有嵌入的 NUL字節,CString 將會(huì )計算出錯誤的串長(cháng)度。你必須自己處理它。如果你看看 strcore.cpp 中的構造函數,你會(huì )發(fā)現 它們都調用了lstrlen,也就是計算字符串的長(cháng)度。 注意從 Unicode 到 ANSI 的轉換使用帶專(zhuān)門(mén)參數的 ::WideCharToMultiByte,如果你不想使用這種默認的轉換方式,則必須編寫(xiě)自己的轉化代碼。 如果你在 UNICODE 模式下編譯代碼,你可以簡(jiǎn)單地寫(xiě)成:
CString convert(BSTR b){ if(b == NULL) return CString(_T("")); CString s(b); // in UNICODE mode return s;} 如果是 ANSI 模式,則需要更復雜的過(guò)程來(lái)轉換。注意這個(gè)代碼使用與 ::WideCharToMultiByte 相同的參數值。所以你 只能在想要改變這些參數進(jìn)行轉換時(shí)使用該技術(shù)。例如,指定不同的默認字符,不同的標志集等。 CString convert(BSTR b){ CString s; if(b == NULL) return s; // empty for NULL BSTR#ifdef UNICODE s = b;#else LPSTR p = s.GetBuffer(SysStringLen(b) + 1); ::WideCharToMultiByte(CP_ACP, // ANSI Code Page 0, // no flags b, // source widechar string -1, // assume NUL-terminated p, // target buffer SysStringLen(b)+1, // target buffer length NULL, // use system default char NULL); // don‘‘t care if default used s.ReleaseBuffer();#endif return s;} 我并不擔心如果 BSTR 包含沒(méi)有映射到 8 位字符集的 Unicode 字符時(shí)會(huì )發(fā)生什么,因為我指定了::WideCharToMultiByte 的最后兩個(gè)參數為 NULL。這就是你可能需要改變的地方。
7、VARIANT 型轉化成 CString 型
事實(shí)上,我從來(lái)沒(méi)有這么做過(guò),因為我沒(méi)有用 COM/OLE/ActiveX 編寫(xiě)過(guò)程序。但是我在microsoft.public.vc.mfc 新聞組上看到了 Robert Quirk 的一篇帖子談到了這種轉化,我覺(jué)得把他的文章包含在我的文章里是不太好的做法,所以在這里多做一些解釋和演示。如果和他的文章有相孛的地方可能是我的疏忽。 VARIANT 類(lèi)型經(jīng)常用來(lái)給 COM 對象傳遞參數,或者接收從 COM 對象返回的值。你也能自己編寫(xiě)返回 VARIANT 類(lèi)型的方法,函數返回什么類(lèi)型 依賴(lài)可能(并且常常)方法的輸入參數(比如,在自動(dòng)化操作中,依賴(lài)與你調用哪個(gè)方法。IDispatch::Invoke 可能返回(通過(guò)其一個(gè)參數)一個(gè) 包含有BYTE、WORD、float、double、date、BSTR 等等 VARIANT 類(lèi)型的結果,(詳見(jiàn) MSDN 上的 VARIANT 結構的定義)。在下面的例子中,假設 類(lèi)型是一個(gè)BSTR的變體,也就是說(shuō)在串中的值是通過(guò) bsrtVal 來(lái)引用,其優(yōu)點(diǎn)是在 ANSI 應用中,有一個(gè)構造函數會(huì )把 LPCWCHAR 引用的值轉換為一個(gè) CString(見(jiàn) BSTR-to-CString 部分)。在 Unicode 模式中,將成為標準的 CString 構造函數,參見(jiàn)對缺省::WideCharToMultiByte 轉換的告誡,以及你覺(jué)得是否可以接受(大多數情況下,你會(huì )滿(mǎn)意的)。VARIANT vaData;vaData = m_com.YourMethodHere();ASSERT(vaData.vt == VT_BSTR);CString strData(vaData.bstrVal); 你還可以根據 vt 域的不同來(lái)建立更通用的轉換例程。為此你可能會(huì )考慮:
CString VariantToString(VARIANT * va){ CString s; switch(va->vt) { /* vt */ case VT_BSTR: return CString(vaData->bstrVal); case VT_BSTR | VT_BYREF: return CString(*vaData->pbstrVal); case VT_I4: s.Format(_T("%d"), va->lVal); return s; case VT_I4 | VT_BYREF: s.Format(_T("%d"), *va->plVal); case VT_R8: s.Format(_T("%f"), va->dblVal); return s; ... 剩下的類(lèi)型轉換由讀者自己完成 default: ASSERT(FALSE); // unknown VARIANT type (this ASSERT is optional) return CString(""); } /* vt */} 8、載入字符串表資源
如果你想創(chuàng )建一個(gè)容易進(jìn)行語(yǔ)言版本移植的應用程序,你就不能在你的源代碼中直接包含本土語(yǔ)言字符串 (下面這些例子我用的語(yǔ)言都是英語(yǔ),因為我的本土語(yǔ)是英語(yǔ)),比如下面這種寫(xiě)法就很糟:CString s = "There is an error"; 你應該把你所有特定語(yǔ)言的字符串單獨擺放(調試信息、在發(fā)布版本中不出現的信息除外)。這意味著(zhù)向下面這樣寫(xiě)比較好: s.Format(_T("%d - %s"), code, text); 在你的程序中,文字字符串不是語(yǔ)言敏感的。不管怎樣,你必須很小心,不要使用下面這樣的串: // fmt is "Error in %s file %s"http:// readorwrite is "reading" or "writing"s.Format(fmt, readorwrite, filename); 這是我的切身體會(huì )。在我的第一個(gè)國際化的應用程序中我犯了這個(gè)錯誤,盡管我懂德語(yǔ),知道在德語(yǔ)的語(yǔ)法中動(dòng)詞放在句子的最后面,我們的德國方面的發(fā)行人還是苦苦的抱怨他們不得不提取那些不可思議的德語(yǔ)錯誤提示信息然后重新格式化以讓它們能正常工作。比較好的辦法(也是我現在使用的辦法)是使用兩個(gè)字符串,一個(gè)用 于讀,一個(gè)用于寫(xiě),在使用時(shí)加載合適的版本,使得它們對字符串參數是非敏感的。也就是說(shuō)加載整個(gè)格式,而不是加載串“reading”,“writing”: // fmt is "Error in reading file %s"http:// "Error in writing file %s"s.Format(fmt, filename); 一定要注意,如果你有好幾個(gè)地方需要替換,你一定要保證替換后句子的結構不會(huì )出現問(wèn)題,比如在英語(yǔ)中,可以是主語(yǔ)-賓語(yǔ),主語(yǔ)-謂語(yǔ),動(dòng)詞-賓語(yǔ)的結構等等。 在這里,我們并不討論 FormatMessage,其實(shí)它比 sprintf/Format 還要有優(yōu)勢,但是不太容易和CString 結合使用。解決這種問(wèn)題的辦法就是我們按照參數出現在參數表中的位置給參數取名字,這樣在你輸出的時(shí)候就不會(huì )把他們的位置排錯了。 接下來(lái)我們討論我們這些獨立的字符串放在什么地方。我們可以把字符串的值放入資源文件中的一個(gè)稱(chēng)為 STRINGTABLE 的段中。過(guò)程如下:首先使用 Visual Studio 的資源編輯器創(chuàng )建一個(gè)字符串,然后給每一個(gè)字符串取一個(gè)ID,一般我們給它取名字都以 IDS_開(kāi)頭。所以如果你有一個(gè)信息,你可以創(chuàng )建一個(gè)字符串資源然后取名為 IDS_READING_FILE,另外一個(gè)就取名為 IDS_WRITING_FILE。它們以下面的形式出現在你的 .rc 文件中: STRINGTABLEIDS_READING_FILE "Reading file %s"IDS_WRITING_FILE "Writing file %s"END 注意:這些資源都以 Unicode 的格式保存,不管你是在什么環(huán)境下編譯。他們在Win9x系統上也是以Unicode 的形式存在,雖然 Win9x 不能真正處理 Unicode。 然后你可以這樣使用這些資源: // 在使用資源串表之前,程序是這樣寫(xiě)的:
CString fmt; if(...) fmt = "Reading file %s"; else fmt = "Writing file %s"; ... // much later CString s; s.Format(fmt, filename); // 使用資源串表之后,程序這樣寫(xiě): CString fmt; if(...) fmt.LoadString(IDS_READING_FILE); else fmt.LoadString(DS_WRITING_FILE); ... // much later CString s; s.Format(fmt, filename); 現在,你的代碼可以移植到任何語(yǔ)言中去。LoadString 方法需要一個(gè)字符串資源的 ID 作為參數,然后它從 STRINGTABLE 中取出它對應的字符串,賦值給 CString 對象。 CString 對象的構造函數還有一個(gè)更加聰明的特征可以簡(jiǎn)化 STRINGTABLE 的使用。這個(gè)用法在 CString::CString 的文檔中沒(méi)有指出,但是在 構造函數的示例程序中使用了。(為什么這個(gè)特性沒(méi)有成為正式文檔的一部分,而是放在了一個(gè)例子中,我記不得了?。?b>譯者注:從這句話(huà)看,作者可能是CString的設計者。其實(shí)前面還有一句類(lèi)似的話(huà)。說(shuō)他沒(méi)有對使用GetBuffer(0)獲得的指針指向的地址是否可讀做有效性檢查 】。這個(gè)特征就是:如果你將一個(gè)字符串資源的ID強制類(lèi)型轉換為 LPCTSTR,將會(huì )隱含調用 LoadString。因此,下面兩個(gè)構造字符串的例子具有相同的效果,而且其 ASSERT 在debug模式下不會(huì )被觸發(fā):CString s;s.LoadString(IDS_WHATEVER);CString t( (LPCTSTR)IDS_WHATEVER );ASSERT(s == t);//不會(huì )被觸發(fā),說(shuō)明s和t是相同的。 現在,你可能會(huì )想:這怎么可能工作呢?我們怎么能把 STRINGTABLE ID 轉化成一個(gè)指針呢?很簡(jiǎn)單:所有的字符串 ID 都在1~65535這個(gè)范圍內,也就是說(shuō),它所有的高位都是0,而我們在程序中所使用的指針是不可能小于65535的,因為程序的低 64K 內存永遠也不可能存在的,如果你試圖訪(fǎng)問(wèn)0x00000000到0x0000FFFF之間的內存,將會(huì )引發(fā)一個(gè)內存越界錯誤。所以說(shuō)1~65535的值不可能是一個(gè)內存地址,所以我們可以用這些值來(lái)作為字符串資源的ID。 我傾向于使用 MAKEINTRESOURCE 宏顯式地做這種轉換。我認為這樣可以讓代碼更加易于閱讀。這是個(gè)只適合在 MFC 中使用的標準宏。你要記住,大多數的方法即可以接受一個(gè) UINT 型的參數,也可以接受一個(gè) LPCTSTR 型的參數,這是依賴(lài) C++ 的重載功能做到的。C++重載函數帶來(lái)的 弊端就是造成所有的強制類(lèi)型轉化都需要顯示聲明。同樣,你也可以給很多種結構只傳遞一個(gè)資源名。 CString s;s.LoadString(IDS_WHATEVER);CString t( MAKEINTRESOURCE(IDS_WHATEVER));ASSERT(s == t); 告訴你吧:我不僅只是在這里鼓吹,事實(shí)上我也是這么做的。在我的代碼中,你幾乎不可能找到一個(gè)字符串,當然,那些只是偶然在調試中出現的或者和語(yǔ)言無(wú)關(guān)的字符串除外。
9、CString 和臨時(shí)對象
這是出現在 microsoft.public.vc.mfc 新聞組中的一個(gè)小問(wèn)題,我簡(jiǎn)單的提一下,這個(gè)問(wèn)題是有個(gè)程序員需要往注冊表中寫(xiě)入一個(gè)字符串,他寫(xiě)道: 我試著(zhù)用 RegSetValueEx() 設置一個(gè)注冊表鍵的值,但是它的結果總是令我困惑。當我用char[]聲明一個(gè)變量時(shí)它能正常工作,但是當我用 CString 的時(shí)候,總是得到一些垃圾:"ÝÝÝÝ...ÝÝÝÝÝÝ"為了確認是不是我的 CString 數據出了問(wèn)題,我試著(zhù)用 GetBuffer,然后強制轉化成 char*,LPCSTR。GetBuffer 返回的值是正確的,但是當我把它賦值給 char* 時(shí),它就變成垃圾了。以下是我的程序段:char* szName = GetName().GetBuffer(20);RegSetValueEx(hKey, "Name", 0, REG_SZ, (CONST BYTE *) szName, strlen (szName + 1)); 這個(gè) Name 字符串的長(cháng)度小于 20,所以我不認為是 GetBuffer 的參數的問(wèn)題。
真讓人困惑,請幫幫我。
親愛(ài)的 Frustrated,
你犯了一個(gè)相當微妙的錯誤,聰明反被聰明誤,正確的代碼應該象下面這樣:
CString Name = GetName();RegSetValueEx(hKey, _T("Name"), 0, REG_SZ, (CONST BYTE *) (LPCTSTR)Name, (Name.GetLength() + 1) * sizeof(TCHAR)); 為什么我寫(xiě)的代碼能行而你寫(xiě)的就有問(wèn)題呢?主要是因為當你調用 GetName 時(shí)返回的 CString 對象是一個(gè)臨時(shí)對象。參見(jiàn):《C++ Reference manual》§12.2 在一些環(huán)境中,編譯器有必要創(chuàng )建一個(gè)臨時(shí)對象,這樣引入臨時(shí)對象是依賴(lài)于實(shí)現的。如果編譯器引入的這個(gè)臨時(shí)對象所屬的類(lèi)有構造函數的話(huà),編譯器要確保這個(gè)類(lèi)的構造函數被調用。同樣的,如果這個(gè)類(lèi)聲明有析構函數的話(huà),也要保證這個(gè)臨時(shí)對象的析構函數被調用。 編譯器必須保證這個(gè)臨時(shí)對象被銷(xiāo)毀了。被銷(xiāo)毀的確切地點(diǎn)依賴(lài)于實(shí)現.....這個(gè)析構函數必須在退出創(chuàng )建該臨時(shí)對象的范圍之前被調用。 大部分的編譯器是這樣設計的:在臨時(shí)對象被創(chuàng )建的代碼的下一個(gè)執行步驟處隱含調用這個(gè)臨時(shí)對象的析構函數,實(shí)現起來(lái),一般都是在下一個(gè)分號處。因此,這個(gè) CString 對象在 GetBuffer 調用之后就被析構了(順便提一句,你沒(méi)有理由給 GetBuffer 函數傳遞一個(gè)參數,而且沒(méi)有使用ReleaseBuffer 也是不對的)。所以 GetBuffer 本來(lái)返回的是指向這個(gè)臨時(shí)對象中字符串的地址的指針,但是當這個(gè)臨時(shí)對象被析構后,這塊內存就被釋放了。然后 MFC 的調試內存分配器會(huì )重新為這塊內存全部填上 0xDD,顯示出來(lái)剛好就是“Ý”符號。在這個(gè)時(shí)候你向注冊表中寫(xiě)數據,字符串的內容當然全被破壞了。 我們不應該立即把這個(gè)臨時(shí)對象轉化成 char* 類(lèi)型,應該先把它保存到一個(gè) CString 對象中,這意味著(zhù)把臨時(shí)對象復制了一份,所以當臨時(shí)的 CString 對象被析構了之后,這個(gè) CString 對象中的值依然保存著(zhù)。這個(gè)時(shí)候再向注冊表中寫(xiě)數據就沒(méi)有問(wèn)題了。 此外,我的代碼是具有 Unicode 意識的。那個(gè)操作注冊表的函數需要一個(gè)字節大小,使用lstrlen(Name+1) 得到的實(shí)際結果對于 Unicode 字符來(lái)說(shuō)比 ANSI 字符要小一半,而且它也不能從這個(gè)字符串的第二個(gè)字符起開(kāi)始計算,也許你的本意是 lstrlen(Name) + 1(OK,我承認,我也犯了同樣的錯誤?。?。不論如何,在 Unicode 模式下,所有的字符都是2個(gè)字節大小,我們需要處理這個(gè)問(wèn)題。微軟的文檔令人驚訝地對此保持緘默:REG_SZ 的值究竟是以字節計算還是以字符計算呢?我們假設它指的是以字節為單位計算,你需要對你的代碼做一些修改來(lái)計算這個(gè)字符串所含有的字節大小。
10、CString 的效率
CString 的一個(gè)問(wèn)題是它確實(shí)掩藏了一些低效率的東西。從另外一個(gè)方面講,它也確實(shí)可以被實(shí)現得更加高效,你可能會(huì )說(shuō)下面的代碼:CString s = SomeCString1;s += SomeCString2;s += SomeCString3;s += ",";s += SomeCString4; 比起下面的代碼來(lái),效率要低多了: char s[1024];lstrcpy(s, SomeString1);lstrcat(s, SomeString2);lstrcat(s, SomeString 3);lstrcat(s, ",");lstrcat(s, SomeString4); 總之,你可能會(huì )想,首先,它為 SomeCString1 分配一塊內存,然后把 SomeCString1 復制到里面,然后發(fā)現它要做一個(gè)連接,則重新分配一塊新的足夠大的內存,大到能夠放下當前的字符串加上SomeCString2,把內容復制到這塊內存 ,然后把 SomeCString2 連接到后面,然后釋放第一塊內存,并把指針重新指向新內存。然后為每個(gè)字符串重復這個(gè)過(guò)程。把這 4 個(gè)字符串連接起來(lái)效率多低啊。事實(shí)上,在很多情況下根本就不需要復制源字符串(在 += 操作符左邊的字符串)。 在 VC++6.0 中,Release 模式下,所有的 CString 中的緩存都是按預定義量子分配的。所謂量子,即確定為 64、128、256 或者 512 字節。這意味著(zhù)除非字符串非常長(cháng),連接字符串的操作實(shí)際上就是 strcat 經(jīng)過(guò)優(yōu)化后的版本(因為它知道本地的字符串應該在什么地方結束,所以不需要尋找字符串的結尾;只需要把內存中的數據拷貝到指定的地方即可)加上重新計算字符串的長(cháng)度。所以它的執行效率和純 C 的代碼是一樣的,但是它更容易寫(xiě)、更容易維護和更容易理解。 如果你還是不能確定究竟發(fā)生了怎樣的過(guò)程,請看看 CString 的源代碼,strcore.cpp,在你 vc98的安裝目錄的 mfc\src 子目錄中??纯?ConcatInPlace 方法,它被在所有的 += 操作符中調用。
啊哈!難道 CString 真的這么"高效"嗎?比如,如果我創(chuàng )建 CString cat("Mew!"); 然后我并不是得到了一個(gè)高效的、精簡(jiǎn)的5個(gè)字節大小的緩沖區(4個(gè)字符加一個(gè)結束字符),系統將給我分配64個(gè)字節,而其中59個(gè)字節都被浪費了。 如果你也是這么想的話(huà),那么就請準備好接受再教育吧??赡茉谀硞€(gè)地方某個(gè)人給你講過(guò)盡量使用少的空間是件好事情。不錯,這種說(shuō)法的確正確,但是他忽略了事實(shí)中一個(gè)很重要的方面。 如果你編寫(xiě)的是運行在16K EPROMs下的嵌入式程序的話(huà),你有理由盡量少使用空間,在這種環(huán)境下,它能使你的程序更健壯。但是在 500MHz, 256MB的機器上寫(xiě) Windows 程序,如果你還是這么做,它只會(huì )比你認為的“低效”的代碼運行得更糟。 舉例來(lái)說(shuō)。字符串的大小被認為是影響效率的首要因素,使字符串盡可能小可以提高效率,反之則降低效率,這是大家一貫的想法。但是這種想法是不對的,精確的內存分配的后果要在程序運行了好幾個(gè)小時(shí)后才能體現得出來(lái),那時(shí),程序的堆中將充滿(mǎn)小片的內存,它們太小以至于不能用來(lái)做任何事,但是他們增加了你程序的內存用量,增加了內存頁(yè)面交換的次數,當頁(yè)面交換的次數增加到系統能夠忍受的上限,系統則會(huì )為你的程序分配更多的頁(yè)面,直到你的程序占用了所有的可用內存。由此可見(jiàn),雖然內存碎片是決定效率的次要因素,但正是這些因素實(shí)際控制了系統的行為,最終,它損害了系統的可靠性,這是令人無(wú)法接受的。 記住,在 debug 模式下,內存往往是精確分配的,這是為了更好的排錯。 假設你的應用程序通常需要連續工作好幾個(gè)月。比如,我常打開(kāi) VC++,Word,PowerPoint,Frontpage,Outlook Express,Forté Agent,Internet Explorer和其它的一些程序,而且通常不關(guān)閉它們。我曾經(jīng)夜以繼日地連續用 PowerPoint 工作了好幾天(反之,如果你不幸不得不使用像 Adobe FrameMaker 這樣的程序的話(huà),你將會(huì )體會(huì )到可靠性的重要;這個(gè)程序機會(huì )每天都要崩潰4~6次,每次都是因為用完了所有的空間并填滿(mǎn)我所有的交換頁(yè)面)。所以精確內存分配是不可取的,它會(huì )危及到系統的可靠性,并引起應用程序崩潰。 按量子的倍數為字符串分配內存,內存分配器就可以回收用過(guò)的內存塊,通常這些回收的內存塊馬上就可以被其它的 CString 對象重新用到,這樣就可以保證碎片最少。分配器的功能加強了,應用程序用到的內存就能盡可能保持最小,這樣的程序就可以運行幾個(gè)星期或幾個(gè)月而不出現問(wèn)題。 題外話(huà):很多年以前,我們在 CMU 寫(xiě)一個(gè)交互式系統的時(shí)候,一些對內存分配器的研究顯示出它往往產(chǎn)生很多內存碎片。Jim Mitchell,現在他在 Sun Microsystems 工作,那時(shí)侯他創(chuàng )造了一種內存分配器,它保留了一個(gè)內存分配狀況的運行時(shí)統計表,這種技術(shù)和當時(shí)的主流分配器所用的技術(shù)都不同,且較為領(lǐng)先。當一個(gè)內存塊需要被分割得比某一個(gè)值小的話(huà),他并不分割它,因此可以避免產(chǎn)生太多小到什么事都干不了的內存碎片。事實(shí)上他在內存分配器中使用了一個(gè)浮動(dòng)指針,他認為:與其讓指令做長(cháng)時(shí)間的存取內存操作,還不如簡(jiǎn)單的忽略那些太小的內存塊而只做一些浮動(dòng)指針的操作。(His observation was that the long-term saving in instructions by not having to ignore unusable small storage chunks far and away exceeded the additional cost of doing a few floating point operations on an allocation operation.)他是對的。 永遠不要認為所謂的“最優(yōu)化”是建立在每一行代碼都高速且節省內存的基礎上的,事實(shí)上,高速且節省內存應該是在一個(gè)應用程序的整體水平上考慮的。在軟件的整體水平上,只使用最小內存的字符串分配策略可能是最糟糕的一種方法。 如果你認為優(yōu)化是你在每一行代碼上做的那些努力的話(huà),你應該想一想:在每一行代碼中做的優(yōu)化很少能真正起作用。你可以看我的另一篇關(guān)于優(yōu)化問(wèn)題的文章《Your Worst Enemy for some thought-provoking ideas》。 記住,+= 運算符只是一種特例,如果你寫(xiě)成下面這樣: CString s = SomeCString1 + SomeCString2 + SomeCString3 + "," + SomeCString4; 則每一個(gè) + 的應用會(huì )造成一個(gè)新的字符串被創(chuàng )建和一次復制操作。
總結
以上是使用 CString 的一些技巧。我每天寫(xiě)程序的時(shí)候都會(huì )用到這些。CString 并不是一種很難使用的類(lèi),但是 MFC 沒(méi)有很明顯的指出這些特征,需要你自己去探索、去發(fā)現。
|