剖析Linux系統啟動(dòng)過(guò)程
出處:天極網(wǎng) 作者:天極網(wǎng) 時(shí)間:2004-11-29 10:27:00
內容提要
本文以RedHat9.0和i386平臺為例,剖析了從用戶(hù)打開(kāi)電源直到屏幕出現命令行提示符的整個(gè)Linux啟動(dòng)過(guò)程。并且介紹了啟動(dòng)中涉及到的各種文件。
閱讀Linux源代碼,無(wú)疑是深入學(xué)習Linux的最好方法。在本文對Linux啟動(dòng)過(guò)程的介紹中,我們也嘗試從源代碼的視角來(lái)更深入的剖析Linux的啟動(dòng)過(guò)程,所以其中也簡(jiǎn)單涉及到部分相關(guān)的Linux源代碼,Linux啟動(dòng)這部分的源碼主要使用的是C語(yǔ)言,也涉及到了少量的匯編。而啟動(dòng)過(guò)程中也執行了大量的shell(主要是bash shell)所寫(xiě)腳本。為了方便讀者閱讀,筆者將整個(gè)Linux啟動(dòng)過(guò)程分成以下幾個(gè)部分逐一介紹,大家可以參考下圖:
當用戶(hù)打開(kāi)PC的電源,BIOS開(kāi)機自檢,按BIOS中設置的啟動(dòng)設備(通常是硬盤(pán))啟動(dòng),接著(zhù)啟動(dòng)設備上安裝的引導程序lilo或grub開(kāi)始引導Linux,Linux首先進(jìn)行內核的引導,接下來(lái)執行init程序,init程序調用了rc.sysinit和rc等程序,rc.sysinit和rc當完成系統初始化和運行服務(wù)的任務(wù)后,返回init;init啟動(dòng)了mingetty后,打開(kāi)了終端供用戶(hù)登錄系統,用戶(hù)登錄成功后進(jìn)入了Shell,這樣就完成了從開(kāi)機到登錄的整個(gè)啟動(dòng)過(guò)程。
下面就將逐一介紹其中幾個(gè)關(guān)鍵的部分:
第一部分:內核的引導(核內引導)
Red Hat9.0可以使用lilo或grub等引導程序開(kāi)始引導Linux系統,當引導程序成功完成引導任務(wù)后,Linux從它們手中接管了CPU的控制權,然后CPU就開(kāi)始執行Linux的核心映象代碼,開(kāi)始了Linux啟動(dòng)過(guò)程。這里使用了幾個(gè)匯編程序來(lái)引導Linux,這一步泛及到Linux源代碼樹(shù)中的“arch/i386/boot”下的這幾個(gè)文件:bootsect.S、setup.S、video.S等。
其中bootsect.S是生成引導扇區的匯編源碼,它完成加載動(dòng)作后直接跳轉到setup.S的程序入口。setup.S的主要功能就是將系統參數(包括內存、磁盤(pán)等,由BIOS返回)拷貝到特別內存中,以便以后這些參數被保護模式下的代碼來(lái)讀取。此外,setup.S還將video.S中的代碼包含進(jìn)來(lái),檢測和設置顯示器和顯示模式。最后,setup.S將系統轉換到保護模式,并跳轉到 0x100000。
那么0x100000這個(gè)內存地址中存放的是什么代碼?而這些代碼又是從何而來(lái)的呢?
0x100000這個(gè)內存地址存放的是解壓后的內核,因為Red Hat提供的內核包含了眾多驅動(dòng)和功能而顯得比較大,所以在內核編譯中使用了“makebzImage”方式,從而生成壓縮過(guò)的內核,在RedHat中內核常常被命名為vmlinuz,在Linux的最初引導過(guò)程中,是通過(guò)"arch/i386/boot/compressed/"中的head.S利用misc.c中定義的decompress_kernel()函數,將內核vmlinuz解壓到0x100000的。
當CPU跳到0x100000時(shí),將執行"arch/i386/kernel/head.S"中的startup_32,它也是vmlinux的入口,然后就跳轉到start_kernel()中去了。start_kernel()是"init/main.c"中的定義的函數,start_kernel()中調用了一系列初始化函數,以完成kernel本身的設置。start_kernel()函數中,做了大量的工作來(lái)建立基本的Linux核心環(huán)境。如果順利執行完start_kernel(),則基本的Linux核心環(huán)境已經(jīng)建立起來(lái)了。
在start_kernel()的最后,通過(guò)調用init()函數,系統創(chuàng )建第一個(gè)核心線(xiàn)程,啟動(dòng)了init過(guò)程。而核心線(xiàn)程init()主要是來(lái)進(jìn)行一些外設初始化的工作的,包括調用do_basic_setup()完成外設及其驅動(dòng)程序的加載和初始化。并完成文件系統初始化和root文件系統的安裝。
當do_basic_setup()函數返回init(),init()又打開(kāi)了/dev/console設備,重定向三個(gè)標準的輸入輸出文件stdin、stdout和stderr到控制臺,最后,搜索文件系統中的init程序(或者由init=命令行參數指定的程序),并使用 execve()系統調用加載執行init程序。到此init()函數結束,內核的引導部分也到此結束了,
第二部分:運行init
init的進(jìn)程號是1,從這一點(diǎn)就能看出,init進(jìn)程是系統所有進(jìn)程的起點(diǎn),Linux在完成核內引導以后,就開(kāi)始運行init程序,。init程序需要讀取配置文件/etc/inittab。inittab是一個(gè)不可執行的文本文件,它有若干行指令所組成。在Redhat系統中,inittab的內容如下所示(以“###"開(kāi)始的中注釋為筆者增加的):
#
# inittab This file describes how the INIT process should set up
# the system in a certain run-level.
#
# Author: Miquel van Smoorenburg,
# Modified for RHS Linux by Marc Ewing and Donnie Barnes
#
# Default runlevel. The runlevels used by RHS are:
# 0 - halt (Do NOT set initdefault to this)
# 1 - Single user mode
# 2 - Multiuser, without NFS (The same as 3, if you do not havenetworking)
# 3 - Full multiuser mode
# 4 - unused
# 5 - X11
# 6 - reboot (Do NOT set initdefault to this)
#
###表示當前缺省運行級別為5(initdefault);
id:5:initdefault:
###啟動(dòng)時(shí)自動(dòng)執行/etc/rc.d/rc.sysinit腳本(sysinit)
# System initialization.
si::sysinit:/etc/rc.d/rc.sysinit
l0:0:wait:/etc/rc.d/rc 0
l1:1:wait:/etc/rc.d/rc 1
l2:2:wait:/etc/rc.d/rc 2
l3:3:wait:/etc/rc.d/rc 3
l4:4:wait:/etc/rc.d/rc 4
###當運行級別為5時(shí),以5為參數運行/etc/rc.d/rc腳本,init將等待其返回(wait)
l5:5:wait:/etc/rc.d/rc 5
l6:6:wait:/etc/rc.d/rc 6
###在啟動(dòng)過(guò)程中允許按CTRL-ALT-DELETE重啟系統
# Trap CTRL-ALT-DELETE
ca::ctrlaltdel:/sbin/shutdown -t3 -r now
# When our UPS tells us power has failed, assume we have a few minutes
# of power left. Schedule a shutdown for 2 minutes from now.
# This does, of course, assume you have powerd installed and your
# UPS connected and working correctly.
pf::powerfail:/sbin/shutdown -f -h +2 "Power Failure; System Shutting Down"
# If power was restored before the shutdown kicked in, cancel it.
pr:12345:powerokwait:/sbin/shutdown -c "Power Restored; Shutdown Cancelled"
###在2、3、4、5級別上以ttyX為參數執行/sbin/mingetty程序,打開(kāi)ttyX終端用于用戶(hù)登錄,
###如果進(jìn)程退出則再次運行mingetty程序(respawn)
# Run gettys in standard runlevels
1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6
###在5級別上運行xdm程序,提供xdm圖形方式登錄界面,并在退出時(shí)重新執行(respawn)
# Run xdm in runlevel 5
x:5:respawn:/etc/X11/prefdm -nodaemon
以上面的inittab文件為例,來(lái)說(shuō)明一下inittab的格式。其中以#開(kāi)始的行是注釋行,除了注釋行之外,每一行都有以下格式:
id:runlevel:action:process
對上面各項的詳細解釋如下:
1. id
id是指入口標識符,它是一個(gè)字符串,對于getty或mingetty等其他login程序項,要求id與tty的編號相同,否則getty程序將不能正常工作。
2. runlevel
runlevel是init所處于的運行級別的標識,一般使用0-6以及S或s。0、1、6運行級別被系統保留:其中0作為shutdown動(dòng)作,1作為重啟至單用戶(hù)模式,6為重啟;S和s意義相同,表示單用戶(hù)模式,且無(wú)需inittab文件,因此也不在inittab中出現,實(shí)際上,進(jìn)入單用戶(hù)模式時(shí),init直接在控制臺(/dev/console)上運行/sbin/sulogin。在一般的系統實(shí)現中,都使用了2、3、4、5幾個(gè)級別,在Redhat系統中,2表示無(wú)NFS支持的多用戶(hù)模式,3表示完全多用戶(hù)模式(也是最常用的級別),4保留給用戶(hù)自定義,5表示XDM圖形登錄方式。7-9級別也是可以使用的,傳統的Unix系統沒(méi)有定義這幾個(gè)級別。runlevel可以是并列的多個(gè)值,以匹配多個(gè)運行級別,對大多數action來(lái)說(shuō),僅當runlevel與當前運行級別匹配成功才會(huì )執行。
3. action
action是描述其后的process的運行方式的。action可取的值包括:initdefault、sysinit、boot、bootwait等:
initdefault是一個(gè)特殊的action值,用于標識缺省的啟動(dòng)級別;當init由核心激活以后,它將讀取inittab中的initdefault項,取得其中的runlevel,并作為當前的運行級別。如果沒(méi)有inittab文件,或者其中沒(méi)有initdefault項,init將在控制臺上請求輸入runlevel。
sysinit、boot、bootwait等action將在系統啟動(dòng)時(shí)無(wú)條件運行,而忽略其中的runlevel。
其余的action(不含initdefault)都與某個(gè)runlevel相關(guān)。各個(gè)action的定義在inittab的man手冊中有詳細的描述。
4. process
process為具體的執行程序。程序后面可以帶參數。
第三部分:系統初始化
在init的配置文件中有這么一行:
si::sysinit:/etc/rc.d/rc.sysinit
它調用執行了/etc/rc.d/rc.sysinit,而rc.sysinit是一個(gè)bash shell的腳本,它主要是完成一些系統初始化的工作,rc.sysinit是每一個(gè)運行級別都要首先運行的重要腳本。它主要完成的工作有:激活交換分區,檢查磁盤(pán),加載硬件模塊以及其它一些需要優(yōu)先執行任務(wù)。
rc.sysinit約有850多行,但是每個(gè)單一的功能還是比較簡(jiǎn)單,而且帶有注釋?zhuān)ㄗh有興趣的用戶(hù)可以自行閱讀自己機器上的該文件,以了解系統初始化所詳細情況。由于此文件較長(cháng),所以不在本文中列出來(lái),也不做具體的介紹。
當rc.sysinit程序執行完畢后,將返回init繼續下一步。
第四部分:?jiǎn)?dòng)對應運行級別的守護進(jìn)程
在rc.sysinit執行后,將返回init繼續其它的動(dòng)作,通常接下來(lái)會(huì )執行到/etc/rc.d/rc程序。以運行級別3為例,init將執行配置文件inittab中的以下這行:
l5:5:wait:/etc/rc.d/rc 5
這一行表示以5為參數運行/etc/rc.d/rc,/etc/rc.d/rc是一個(gè)Shell腳本,它接受5作為參數,去執行/etc/rc.d/rc5.d/目錄下的所有的rc啟動(dòng)腳本,/etc/rc.d/rc5.d/目錄中的這些啟動(dòng)腳本實(shí)際上都是一些鏈接文件,而不是真正的rc啟動(dòng)腳本,真正的rc啟動(dòng)腳本實(shí)際上都是放在/etc/rc.d/init.d/目錄下。而這些rc啟動(dòng)腳本有著(zhù)類(lèi)似的用法,它們一般能接受start、stop、restart、status等參數。
/etc/rc.d/rc5.d/中的rc啟動(dòng)腳本通常是K或S開(kāi)頭的鏈接文件,對于以以S開(kāi)頭的啟動(dòng)腳本,將以start參數來(lái)運行。而如果發(fā)現存在相應的腳本也存在K打頭的鏈接,而且已經(jīng)處于運行態(tài)了(以/var/lock/subsys/下的文件作為標志),則將首先以stop為參數停止這些已經(jīng)啟動(dòng)了的守護進(jìn)程,然后再重新運行。這樣做是為了保證是當init改變運行級別時(shí),所有相關(guān)的守護進(jìn)程都將重啟。
至于在每個(gè)運行級中將運行哪些守護進(jìn)程,用戶(hù)可以通過(guò)chkconfig或setup中的"System Services"來(lái)自行設定。常見(jiàn)的守護進(jìn)程有:
amd:自動(dòng)安裝NFS守護進(jìn)程
apmd:高級電源管理守護進(jìn)程
arpwatch:記錄日志并構建一個(gè)在LAN接口上看到的以太網(wǎng)地址和IP地址對數據庫
autofs:自動(dòng)安裝管理進(jìn)程automount,與NFS相關(guān),依賴(lài)于NIS
crond:Linux下的計劃任務(wù)的守護進(jìn)程
named:DNS服務(wù)器
netfs:安裝NFS、Samba和NetWare網(wǎng)絡(luò )文件系統
network:激活已配置網(wǎng)絡(luò )接口的腳本程序
nfs:打開(kāi)NFS服務(wù)
portmap:RPC portmap管理器,它管理基于RPC服務(wù)的連接
sendmail:郵件服務(wù)器sendmail
smb:Samba文件共享/打印服務(wù)
syslog:一個(gè)讓系統引導時(shí)起動(dòng)syslog和klogd系統日志守候進(jìn)程的腳本
xfs:X Window字型服務(wù)器,為本地和遠程X服務(wù)器提供字型集
Xinetd:支持多種網(wǎng)絡(luò )服務(wù)的核心守護進(jìn)程,可以管理wuftp、sshd、telnet等服務(wù)
這些守護進(jìn)程也啟動(dòng)完成了,rc程序也就執行完了,然后又將返回init繼續下一步。
第五部分:建立終端
rc執行完畢后,返回init。這時(shí)基本系統環(huán)境已經(jīng)設置好了,各種守護進(jìn)程也已經(jīng)啟動(dòng)了。init接下來(lái)會(huì )打開(kāi)6個(gè)終端,以便用戶(hù)登錄系統。通過(guò)按Alt+Fn(n對應1-6)可以在這6個(gè)終端中切換。在inittab中的以下6行就是定義了6個(gè)終端:
1:2345:respawn:/sbin/mingetty tty1
2:2345:respawn:/sbin/mingetty tty2
3:2345:respawn:/sbin/mingetty tty3
4:2345:respawn:/sbin/mingetty tty4
5:2345:respawn:/sbin/mingetty tty5
6:2345:respawn:/sbin/mingetty tty6
從上面可以看出在2、3、4、5的運行級別中都將以respawn方式運行mingetty程序,mingetty程序能打開(kāi)終端、設置模式。同時(shí)它會(huì )顯示一個(gè)文本登錄界面,這個(gè)界面就是我們經(jīng)??吹降牡卿浗缑?,在這個(gè)登錄界面中會(huì )提示用戶(hù)輸入用戶(hù)名,而用戶(hù)輸入的用戶(hù)將作為參數傳給login程序來(lái)驗證用戶(hù)的身份。
第六部分:登錄系統,啟動(dòng)完成
對于運行級別為5的圖形方式用戶(hù)來(lái)說(shuō),他們的登錄是通過(guò)一個(gè)圖形化的登錄界面。登錄成功后可以直接進(jìn)入KDE、Gnome等窗口管理器。而本文主要講的還是文本方式登錄的情況:
當我們看到mingetty的登錄界面時(shí),我們就可以輸入用戶(hù)名和密碼來(lái)登錄系統了。
Linux的賬號驗證程序是login,login會(huì )接收mingetty傳來(lái)的用戶(hù)名作為用戶(hù)名參數。然后login會(huì )對用戶(hù)名進(jìn)行分析:如果用戶(hù)名不是root,且存在/etc/nologin文件,login將輸出nologin文件的內容,然后退出。這通常用來(lái)系統維護時(shí)防止非root用戶(hù)登錄。只有/etc/securetty中登記了的終端才允許root用戶(hù)登錄,如果不存在這個(gè)文件,則root可以在任何終端上登錄。/etc/usertty文件用于對用戶(hù)作出附加訪(fǎng)問(wèn)限制,如果不存在這個(gè)文件,則沒(méi)有其他限制。
在分析完用戶(hù)名后,login將搜索/etc/passwd以及/etc/shadow來(lái)驗證密碼以及設置賬戶(hù)的其它信息,比如:主目錄是什么、使用何種shell。如果沒(méi)有指定主目錄,將默認為根目錄;如果沒(méi)有指定shell,將默認為/bin/bash。
login程序成功后,會(huì )向對應的終端在輸出最近一次登錄的信息(在/var/log/lastlog中有記錄),并檢查用戶(hù)是否有新郵件(在/usr/spool/mail/的對應用戶(hù)名目錄下)。然后開(kāi)始設置各種環(huán)境變量:對于bash來(lái)說(shuō),系統首先尋找/etc/profile腳本文件,并執行它;然后如果用戶(hù)的主目錄中存在.bash_profile文件,就執行它,在這些文件中又可能調用了其它配置文件,所有的配置文件執行后后,各種環(huán)境變量也設好了,這時(shí)會(huì )出現大家熟悉的命令行提示符,到此整個(gè)啟動(dòng)過(guò)程就結束了。
希望通過(guò)上面對Linux啟動(dòng)過(guò)程的剖析能幫助那些想深入學(xué)習Linux用戶(hù)建立一個(gè)相關(guān)Linux啟動(dòng)過(guò)程的清晰概念,進(jìn)而可以進(jìn)一步研究Linux接下來(lái)是如何工作的。
, ,