getchar()和EOF總結
大師級經(jīng)典的著(zhù)作,要字斟句酌的去讀,去理解。以前在看K&R的The C Programming Language(SecondEdition) 第1.5節的字符輸入/輸出,被getchar()和EOF所迷惑了??赡苤饕€是由于沒(méi)有搞清楚getchar()的工作原理和EOF的用法。因此,感覺(jué)很有必要總結一下,不然,很多瑣碎的知識點(diǎn)長(cháng)時(shí)間過(guò)后就會(huì )淡忘的,只有寫(xiě)下來(lái)才是最好的方法。 其實(shí),getchar()最典型的程序也就幾行代碼而已。本人所用的環(huán)境是DebianGNU/Linux,在其他系統下也一樣。 一、getchar的兩點(diǎn)總結: 1.getchar是以行為單位進(jìn)行存取的。 當用getchar進(jìn)行輸入時(shí),如果輸入的第一個(gè)字符為有效字符(即輸入是文件結束符EOF,Windows下為組合鍵Ctrl+Z, Unix/Linux下為組合鍵Ctrl+D),那么只有當最后一個(gè)輸入字符為換行符'\n'(也可以是文件結束符EOF,EOF將在后面討論)時(shí), getchar才會(huì )停止執行,整個(gè)程序將會(huì )往下執行。譬如下面程序段: while((c = getchar()) != EOF){ putchar(c); } 執行程序,輸入:abc,然后回車(chē)。則程序就會(huì )去執行puchar(c),然后輸出abc,這個(gè)地方不要忘了,系統輸出的還有一個(gè)回車(chē)。然后可以繼續輸入,再次遇到換行符的時(shí)候,程序又會(huì )把那一行的輸入的字符輸出在終端上。 對于getchar,肯定很多初學(xué)的朋友會(huì )問(wèn),getchar不是以字符為單位讀取的嗎?那么,既然我輸入了第一個(gè)字符a,肯定滿(mǎn)足while循環(huán)(c = getchar()) != EOF的條件阿,那么應該執行putchar(c)在終端輸出一個(gè)字符a。不錯,我在用getchar的時(shí)候也是一直這么想的,但是程序就偏偏不著(zhù)樣執行,而是必需讀到一個(gè)換行符或者文件結束符EOF才進(jìn)行一次輸出。 對這個(gè)問(wèn)題的一個(gè)解釋是,在大師編寫(xiě)C的時(shí)候,當時(shí)并沒(méi)有所謂終端輸入的概念,所有的輸入實(shí)際上都是按照文件進(jìn)行讀取的,文件中一般都是以行為單位的。因此,只有遇到換行符,那么程序會(huì )認為輸入結束,然后采取執行程序的其他部分。同時(shí),輸入是按照文件的方式存取的,那么要結束一個(gè)文件的輸入就需用到EOF (Enf Of File). 這也就是為什么getchar結束輸入退出時(shí)要用EOF的原因。 2.getchar()的返回值一般情況下是字符,但也可能是負值,即返回EOF。 這里要強調的一點(diǎn)就是,getchar函數通常返回終端所輸入的字符,這些字符系統中對應的ASCII值都是非負的。因此,很多時(shí)候,我們會(huì )寫(xiě)這樣的兩行代碼: char c; c = getchar(); 這樣就很有可能出現問(wèn)題。因為getchar函數除了返回終端輸入的字符外,在遇到Ctrl+D(Linux下)即文件結束符EOF時(shí),getchar ()的返回EOF,這個(gè)EOF在函數庫里一般定義為-1。因此,在這種情況下,getchar函數返回一個(gè)負值,把一個(gè)負值賦給一個(gè)char型的變量是不正確的。為了能夠讓所定義的變量能夠包含getchar函數返回的所有可能的值,正確的定義方法如下(K&R C中特別提到了這個(gè)問(wèn)題): int c; c = getchar(); 二、EOF的兩點(diǎn)總結(主要指普通終端中的EOF) 1.EOF作為文件結束符時(shí)的情況: EOF雖然是文件結束符,但并不是在任何情況下輸入Ctrl+D(Windows下Ctrl+Z)都能夠實(shí)現文件結束的功能,只有在下列的條件下,才作為文件結束符。 (1)遇到getcahr函數執行時(shí),要輸入第一個(gè)字符時(shí)就直接輸入Ctrl+D,就可以跳出getchar(),去執行程序的其他部分; (2)在前面輸入的字符為換行符時(shí),接著(zhù)輸入Ctrl+D; (3)在前面有字符輸入且不為換行符時(shí),要連著(zhù)輸入兩次Ctrl+D,這時(shí)第二次輸入的Ctrl+D起到文件結束符的功能,至于第一次的Ctrl+D的作用將在下面介紹。 其實(shí),這三種情況都可以總結為只有在getchar()提示新的一次輸入時(shí),直接輸入Ctrl+D才相當于文件結束符。 2.EOF作為行結束符時(shí)的情況,這時(shí)候輸入Ctrl+D并不能結束getchar(),而只能引發(fā)getchar()提示下一輪的輸入。 這種情況主要是在進(jìn)行g(shù)etchar()新的一行輸入時(shí),當輸入了若干字符(不能包含換行符)之后,直接輸入Ctrl+D,此時(shí)的Ctrl+D并不是文件結束符,而只是相當于換行符的功能,即結束當前的輸入。以上面的代碼段為例,如果執行時(shí)輸入abc,然后Ctrl+D,程序輸出結果為: abcabc 注意:第一組abc為從終端輸入的,然后輸入Ctrl+D,就輸出第二組abc,同時(shí)光標停在第二組字符的c后面,然后可以進(jìn)行新一次的輸入。這時(shí)如果再次輸入Ctrl+D,則起到了文件結束符的作用,結束getchar()。 如果輸入abc之后,然后回車(chē),輸入換行符的話(huà),則終端顯示為: abc //第一行,帶回車(chē) abc //第二行 //第三行 其中第一行為終端輸入,第二行為終端輸出,光標停在了第三行處,等待新一次的終端輸入。 從這里也可以看出Ctrl+D和換行符分別作為行結束符時(shí),輸出的不同結果。 EOF的作用也可以總結為:當終端有字符輸入時(shí),Ctrl+D產(chǎn)生的EOF相當于結束本行的輸入,將引起getchar()新一輪的輸入;當終端沒(méi)有字符輸入或者可以說(shuō)當getchar()讀取新的一次輸入時(shí),輸入Ctrl+D,此時(shí)產(chǎn)生的EOF相當于文件結束符,程序將結束getchar()的執行。 【補充】本文第二部分中關(guān)于EOF的總結部分,適用于終端驅動(dòng)處于一次一行的模式下。也就是雖然getchar()和putchar()確實(shí)是按照每次一個(gè)字符 進(jìn)行的。但是終端驅動(dòng)處于一次一行的模式,它的輸入只有到“\n”或者EOF時(shí)才結束,因此,終端上得到的輸出也都是按行的。如果要實(shí)現終端在讀一個(gè)字符就結束輸入的話(huà),下面的程序是一種實(shí)現的方法(參考《C專(zhuān)家編程》,略有改動(dòng)): /*Edit by Godbach CU Blog: http://blog.chinaunix.net/u/33048/ */ #include stdio.h> #include stdlib.h> int main(void) { int c; /* 終端驅動(dòng)處于普通的一次一行模式 */ system("stty raw"); /* 現在的終端驅動(dòng)處于一次一個(gè)字符模式 */ c = getchar(); putchar(); /* 終端驅動(dòng)處又回到一次一行模式 */ system("stty cooked"); return 0; } 編譯運行該程序,則當如入一個(gè)字符時(shí),直接出處一個(gè)字符,然后程序結束。 由此可見(jiàn),由于終端驅動(dòng)的模式不同,造成了getchar()輸入結束的條件不一樣。普通模式下需要回車(chē)或者EOF,而在一次一個(gè)字符的模式下,則輸入一個(gè)字符之后就結束了。 希望本文可以對初學(xué)C的朋友提供一點(diǎn)幫助,也希望能和其他朋友進(jìn)行交流。其中理解不對的地方若能得到指正和建議,本人將不勝感激。同時(shí),本文參考了chinaunix.net關(guān)于getchar討論的帖子和一位博友的文章,鏈接地址分別為: http://blog.chinaunix.net/u/9861/showart_64652.html http://bbs.chinaunix.net/viewthread.php?tid=679688&extra=&page=1 歡迎交流和指正。
本文來(lái)自ChinaUnix博客,如果查看原文請點(diǎn):http://blog.chinaunix.net/u1/53811/showart_421385.html |