首先, 我會(huì )說(shuō)不保證你在使用者模式 (user-mode) 中執行的行程 (process) 能夠精確地控制時(shí)序因為 Linux 是個(gè)多工的作業(yè)環(huán)境. 你在執行中的行程 (process) 隨時(shí)會(huì )因為各種原因被暫停大約 10 毫秒到數秒 (在系統負荷非常高的時(shí)候). 然而, 對於大多數使用 I/O 埠的應用而言, 這個(gè)延遲時(shí)間實(shí)際上算不了什麼. 要縮短延遲時(shí)間, 你得使用函式 nice 將你在執行中的行程 (process ) 設定成高優(yōu)先權(請參考 nice(2) 使用說(shuō)明文件) 或使用即時(shí)排程法 (real-time scheduling) (請看下面).
如果你想獲得比在一般使用者模式 (user-mode) 中執行的行程 (process) 還要精確的時(shí)序, 有一些方法可以讓你在使用者模式 (user-mode) 中做到 `即時(shí)' 排程的支援. Linux 2.x 版本的核心中有軟體方式的即時(shí)排程支援; 詳細的說(shuō)明請參考 sched_setscheduler(2) 使用說(shuō)明文件. 有一個(gè)特殊的核心支援硬體的即時(shí)排程;
(Sleeping) : sleep() 與 usleep()
現在, 讓我們開(kāi)始較簡(jiǎn)單的時(shí)序函式呼叫. 想要延遲數秒的時(shí)間, 最佳的方法大概 是使用函式 sleep() . 想要延遲至少數十毫秒的時(shí)間 (10 ms 似乎已是最短的 延遲時(shí)間了), 函式 usleep() 應該可以使用. 這些函式是讓出 CPU 的使用權 給其他想要執行的行程 (processes) (``自己休息去了''), 所以沒(méi)有浪費掉 CPU 的時(shí)間. 細節請參考 sleep(3) 與 usleep(3) 的說(shuō)明文件.
如果讓出 CPU 的使用權因而使得時(shí)間延遲了大約 50 毫秒 (這取決於處理器與機器的速度, 以及系統的負荷), 就浪費掉 CPU 太多的時(shí)間, 因為 Linux 的排程器 (scheduler) (單就 x86 架構而言) 在將控制權發(fā)還給你的行程 (process) 之前通常至少要花費 10-30 毫秒的時(shí)間. 因此, 短時(shí)間的延遲, 使用函式 usleep(3) 所得到的延遲結果通常會(huì )大於你在參數所指定的值, 大約至少有 10 ms.
nanosleep()
在 Linux 2.0.x 一系列的核心發(fā)行版本中, 有一個(gè)新的系統呼叫 (system call), nanosleep() (請參考 nanosleep(2) 的說(shuō)明文件), 他讓你能夠 休息或延遲一個(gè)短的時(shí)間 (數微秒或更多).
如果延遲的時(shí)間 <= 2 ms, 若(且唯若)你執行中的行程 (process) 設定了軟體的即時(shí) 排程 (就是使用函式 tt/sched_setscheduler()/), 呼叫函式 nanosleep() 時(shí) 不是使用一個(gè)忙碌回圈來(lái)延遲時(shí)間; 就是會(huì )像函式 usleep() 一樣讓出 CPU 的使用權休息去了.
這個(gè)忙碌回圈使用函式 udelay() (一個(gè)驅動(dòng)程式常會(huì )用到的核心內部的函式) 來(lái)達成, 并且使用 BogoMips 值 (BogoMips 可以準確量測這類(lèi)忙碌回圈的速度) 來(lái)計算回圈延遲的時(shí)間長(cháng)度. 其如何動(dòng)作的細節請參考 /usr/include/asm/delay.h).
使用 I/O 埠來(lái)延遲時(shí)間
另一個(gè)延遲數微秒的方法是使用 I/O 埠. 就是從埠位址 0x80 輸入或輸出任何 byte 的資料 (請參考前面) 等待的時(shí)間應該幾乎只要 1 微秒這要看你的處理器的型別與速度. 如果要延遲數微秒的時(shí)間你可以將這個(gè)動(dòng)作多做幾次. 在任何標準的機器上輸出資料到該 埠位址應該不會(huì )有不良的後果□對 (而且有些核心的設備驅動(dòng)程式也在使用他). {in|out}[bw]_p() 等函式就是使用這個(gè)方法來(lái)產(chǎn)生時(shí)間延遲的 (請參考檔案 asm/io.h).
實(shí)際上, 一個(gè)使用到埠位址□圍為 0-0x3ff 的 I/O 埠指令幾乎只要 1 微秒的時(shí)間, 所以如果你要如此做, 例如, 直接使用并列埠, 只要加上幾個(gè) inb() 函式從該 埠位址□圍讀入 byte 的資料即可.
使用組合語(yǔ)言來(lái)延遲時(shí)間
如果你知道執行程式所在機器的處理器型別與時(shí)鐘速度, 你可以執行某些組合語(yǔ)言指令以便獲得較短的延遲時(shí)間 (但是記住, 你在執行中的行程 (process) 隨時(shí)會(huì )被暫停, 所以有時(shí)延遲的時(shí)間會(huì )比實(shí)際長(cháng)). 如下面的表格所示, 內部處理器的速度決定了所要使用的時(shí)鐘周期數; 如, 一個(gè) 50 MHz 的處理器 (486DX-50 或 486DX2-50), 一個(gè)時(shí)鐘周期要花費 1/50000000 秒 (=200 奈秒).
指令 i386 時(shí)鐘周期數 i486 時(shí)鐘周期數nop 3 1xchg %ax,%ax 3 3or %ax,%ax 2 1mov %ax,%ax 2 1add %ax,0 2 1
(對不起, 我不知道 Pentiums 的資料, 或許與 i486 接近吧. 我無(wú)法在 i386 的資料上找到只花費一個(gè)時(shí)鐘周期的指令. 如果能夠就請使用花費一個(gè)時(shí)鐘周期的指令, 要不然就使用管線(xiàn)技術(shù)的新式處理器也是可以縮短時(shí)間的.)
上面的表格中指令 nop 與 xchg 應該不會(huì )有不良的後果. 指令最後可能會(huì ) 改變旗號暫存器的內容, 但是這沒(méi)關(guān)系因為 gcc 會(huì )處理. 指令 nop 是個(gè)好的選擇.
想要在你的程式中使用到這些指令, 你得使用 asm("instruction"). 指令的語(yǔ)法就如同上面表格的用法; 如果你想要在單一的 asm() 敘述中使用多個(gè)指令, 可以使用分號將他們隔開(kāi). 例如, asm("nop ; nop ; nop ; nop") 會(huì )執行四個(gè) nop 指令, 在 i486 或 Pentium 處理器中會(huì )延遲四個(gè)時(shí)鐘周期 (或是 i386 會(huì )延遲 12 個(gè)時(shí)鐘周期).
gcc 會(huì )將 asm() 翻譯成單行組合語(yǔ)言程式碼, 所以不會(huì )有呼叫函式的負荷.
在 Intel x86 架構中不可能有比一個(gè)時(shí)鐘周期還短的時(shí)間延遲.
在 Pentiums 處理器上使用函式 rdtsc
對於 Pentiums 處理器而言, 你可以使用下面的 C 語(yǔ)言程式碼來(lái)取得自從上次重新開(kāi)機 到現在經(jīng)過(guò)了多少個(gè)時(shí)鐘周期:
--------------------------------------------------------------------------------
extern __inline__ unsigned long long int rdtsc() { unsigned long long int x; __asm__ volatile (".byte 0x0f, 0x31" : "=A" (x)); return x; }
--------------------------------------------------------------------------------
你可以詢(xún)問(wèn)參考此值以便延遲你想要的時(shí)鐘周期數.
想要時(shí)間精確到一秒鐘, 使用函式 time() 或許是最簡(jiǎn)單的方法. 想要時(shí)間更精確, 函式 gettimeofday() 大約可以精確到微秒 (但是如前所述會(huì )受到 CPU 排程的影響). 至於 Pentiums 處理器, 使用上面的程式碼片斷就可以精確到一個(gè)時(shí)鐘周期.
如果你要你執行中的行程 (process) 在一段時(shí)間到了之後能夠被通知 (get a signal), 你得使用函式 setitimer() 或 alarm() . 細節請參考函式的使用說(shuō)明文件.

