在傳統的終端/主機的網(wǎng)絡(luò )模式時(shí)代,終端功能簡(jiǎn)單,無(wú)需維護工作,在主機一端進(jìn)行專(zhuān)門(mén)的管理與維護,具有資源共享、便于管理的特點(diǎn)。但是,主機造價(jià)昂貴,終端沒(méi)有處理能力,限制了網(wǎng)絡(luò )的規?;l(fā)展。之后的客戶(hù)機/服務(wù)器模式推進(jìn)了計算產(chǎn)業(yè)的標準化和開(kāi)發(fā)化的發(fā)展,為系統提供了相當大的靈活性,但是隨著(zhù)分布系統規模的規模擴大,系統的維護和管理帶來(lái)了巨大的開(kāi)銷(xiāo)。
面向Internet的服務(wù)型應用,需要高性能的硬件平臺作為支持,將并行技術(shù)應用在服務(wù)器領(lǐng)域中,是計算機發(fā)展的必然趨勢。并行處理技術(shù)在高性能計算領(lǐng)域中,高可用和高性能是集群服務(wù)器系統發(fā)展的兩個(gè)重要方向。
集群的概念
集群英文名稱(chēng)是CLUSTER,是一組相互獨立的、通過(guò)高速網(wǎng)絡(luò )互聯(lián)的計算機,它們構
成了一個(gè)組,并以單一系統的模式加以管理。一個(gè)客戶(hù)與集群相互作用時(shí),集群像是一個(gè)獨立的服務(wù)器。集群配置是用于提高可用性和可縮放性。
和傳統的高性能計算機技術(shù)相比,集群技術(shù)可以利用各檔次的服務(wù)器作為節點(diǎn),系統造價(jià)低,可以實(shí)現很高的運算速度,完成大運算量的計算,具有較高的響應能力,能夠滿(mǎn)足當今日益增長(cháng)的信息服務(wù)的需求。
集群技術(shù)應用的需求
Internet用戶(hù)數量呈幾何級數增長(cháng)和科學(xué)計算的復雜性要求計算機有更高的處理能力,而CPU的發(fā)展無(wú)法跟上不斷增長(cháng)的需求,于是我們面臨以下問(wèn)題:
●大規模計算如基因數據的分析、氣象預報、石油勘探需要極高的計算性能。
●應用規模的發(fā)展使單個(gè)服務(wù)器難以承擔負載。
●不斷增長(cháng)的需求需要硬件有靈活的可擴展性。
●關(guān)鍵性的業(yè)務(wù)需要可靠的容錯機制。
IA集群系統(CLUSTER)的特點(diǎn)
●由若干完整的計算機互聯(lián)組成一個(gè)統一的計算機系統;
●可以采用現成的通用硬件設備或特殊應用的硬件設備,例如專(zhuān)用的通訊設備;
●需要特殊軟件支持,例如支持集群技術(shù)的操作系統或數據庫等等;
●可實(shí)現單一系統映像,即操作控制、IP登錄點(diǎn)、文件結構、存儲空間、I/O空間、作業(yè)管理系統等等的單一化;
●在集群系統中可以動(dòng)態(tài)地加入新的服務(wù)器和刪除需要淘汰的服務(wù)器,從而能夠最大限度地擴展系統以滿(mǎn)足不斷增長(cháng)的應用的需要;
●可用性是集群系統應用中最重要的因素,是評價(jià)和衡量系統的一個(gè)重要指標;
●能夠為用戶(hù)提供不間斷的服務(wù),由于系統中包括了多個(gè)結點(diǎn),當一個(gè)結點(diǎn)出現故障的時(shí)候,整個(gè)系統仍然能夠繼續為用戶(hù)提供服務(wù);
●具有極高的性能價(jià)格比,和傳統的大型主機相比,具有很大的價(jià)格優(yōu)勢;
●資源可充分利用,集群系統的每個(gè)結點(diǎn)都是相對獨立的機器,當這些機器不提供服務(wù)或者不需要使用的時(shí)候,仍然能夠被充分利用。而大型主機上更新下來(lái)的配件就難以被重新利用了。
實(shí)現服務(wù)器集群的硬件配置
●網(wǎng)絡(luò )服務(wù)器 兩臺
●服務(wù)器操作系統硬盤(pán) 兩塊
●ULTRA 160 LVD SCSI磁盤(pán)陣列 一個(gè)
●18G SCSI硬盤(pán) 三塊
●網(wǎng)絡(luò )服務(wù)網(wǎng)卡 四塊
服務(wù)器集群的實(shí)踐步驟
●在安裝機群服務(wù)之前的準備:
1、 三塊18G SCSI硬盤(pán)組成磁盤(pán)陣列,做RAID5。
2、 兩臺服務(wù)器要求都配置雙網(wǎng)卡,分別安裝Microsoft Windows 2000 Advance Server操作系統,并配置網(wǎng)絡(luò )。
3、 所有磁盤(pán)必須設置成基本盤(pán),陣列磁盤(pán)分區必須大于2個(gè)。
4、 每臺服務(wù)器都要加入域當中,成為域成員,并且在每臺服務(wù)器上都要有管理員權限。
●安裝配置服務(wù)器網(wǎng)絡(luò )要點(diǎn)
1、在這一部分,每個(gè)服務(wù)器需要兩個(gè)網(wǎng)絡(luò )適配器,一個(gè)連接公眾網(wǎng),一個(gè)連接內部網(wǎng)(它只包含了群集節點(diǎn))。 內部網(wǎng)適配器建立點(diǎn)對點(diǎn)的通信、群集狀態(tài)信號和群集管理。每個(gè)節點(diǎn)的公眾網(wǎng)適配器連接該群集到公眾網(wǎng)上,并在此駐留客戶(hù)。
2、安裝Microsoft Windows 2000 Adwance Server 操作系統后,開(kāi)始配置每臺服務(wù)器的網(wǎng)絡(luò )。在網(wǎng)絡(luò )連接中我們給連接公眾網(wǎng)的命名為"外網(wǎng)",連接內部網(wǎng)的命名為"內網(wǎng)"并分別指定IP地址為:
節點(diǎn)1:內網(wǎng):ip:10.10.10.11 外網(wǎng)ip:192.168.0.192 子網(wǎng)掩碼:255.255.255.0 網(wǎng)關(guān):192.168.0.191(主域控制器ip)
節點(diǎn)2:內網(wǎng):ip:10.10.10.12 外網(wǎng) ip:192.168.0.193 子網(wǎng)掩碼:255.255.255.0 網(wǎng)關(guān):192.168.0.191
●安裝配置陣列
1、對陣列做可校驗的RAID5。并劃分分區。創(chuàng )建一個(gè)小分區(至少50兆)用來(lái)存儲群集
配置數據庫的檢測點(diǎn)和日志文件。這是集群中一個(gè)重要的關(guān)鍵分區,一但他出現故障,將導
致整個(gè)集群的失敗。這里我們分配給他1G的空間,并命名為X盤(pán)符。
2、其他的分區根據用戶(hù)的需求可以自行設定。我們?yōu)榱朔奖阒环至艘粋€(gè)Y區。
3、注意:在集群中所有的磁盤(pán)都必須是基本盤(pán)并且都要采用NTFS格式。
●安裝集群服務(wù)軟件
【配置首節點(diǎn)】
1、所有的設備都先關(guān)閉(兩臺服務(wù)器、一臺磁盤(pán)陣列)。
2、先開(kāi)啟磁盤(pán)陣列(在任何時(shí)候都要先開(kāi)啟磁盤(pán)陣列,以免造成磁盤(pán)混亂)。
3、開(kāi)啟節點(diǎn)1,用有管理員權限的用戶(hù)名登陸到域,用添加刪除程序來(lái)添加組件-集群服
務(wù)。在安裝過(guò)程中選擇這是集群的首節點(diǎn)。創(chuàng )建集群名稱(chēng)。我們給命名為Mycluster。
5、 配置群集磁盤(pán)。由于我們只有一個(gè)共享的磁盤(pán)陣列,所以我們將這個(gè)陣列中的兩個(gè)分區
都配置成群集磁盤(pán)。
6、配置群集網(wǎng)絡(luò )。首先我們配置外網(wǎng),網(wǎng)絡(luò )名稱(chēng)選擇外網(wǎng)。IP地址保持和外網(wǎng)的IP地址一致。選中該網(wǎng)絡(luò )可用于集群服務(wù)。選中所有的通信(混合網(wǎng)絡(luò ))選項。進(jìn)行下一步。接下來(lái)配置內網(wǎng),確保網(wǎng)絡(luò )名稱(chēng)和IP地址跟內網(wǎng)的一致,選中該網(wǎng)絡(luò )可用于集群服務(wù)。選中只用于內部群集通信選項。
7、 點(diǎn)擊下一步按鈕,屏幕出現使用網(wǎng)絡(luò )的順序。我們調整為表里的第一個(gè)連接是內網(wǎng)。這是因為:在正常的操作中,該連接將用于群集通信。如果內部網(wǎng)絡(luò )連接失效,群集服務(wù)將自動(dòng)切換到表里的下一個(gè)網(wǎng)絡(luò )。
8、執行下一步將出現集群的IP和掩碼選項。這里輸入唯一的集群IP,我們設定為192.168.0.195 掩碼當然還是:255.255.255.0。
9、單擊完成,完成首節點(diǎn)的群集配置。
【配置第二個(gè)節點(diǎn)】
1、保持陣列和第一個(gè)節點(diǎn)的開(kāi)機和可用。給第二個(gè)節點(diǎn)上電開(kāi)機。
2、象在首節點(diǎn)上安裝群集服務(wù)一樣,對第二個(gè)節點(diǎn)開(kāi)始進(jìn)行安裝。
3、過(guò)程跟在首節點(diǎn)上在安裝群集服務(wù)大體相同,只有下列的不同之處:
在創(chuàng )建或添加群集對話(huà)框中,在群集中選擇第二個(gè)或下一個(gè)節點(diǎn),并單擊下一步。
輸入前面所創(chuàng )建的群集名稱(chēng)(在本例中,是MyCluster),并單擊下一步。
將連接到群集設為未選中。群集服務(wù)配置向導將自動(dòng)提供,在安裝首節點(diǎn)時(shí)選定 的用戶(hù)賬號名稱(chēng)。
輸入該賬號的口令(如果有的話(huà)),并單擊下一步。
在下一個(gè)對話(huà)框中,單擊完成,結束配置。
將啟動(dòng)群集服務(wù)。單擊確定。
關(guān)閉添加/刪除程序
如果要安裝額外的節點(diǎn),重復這些步驟,以便在其它節點(diǎn)上安裝群集服務(wù)。
檢驗安裝
單擊開(kāi)始,單擊程序,單擊管理工具,并單擊群集管理器。顯示的兩個(gè)節點(diǎn)表明,存在群集,而且它在運行。
效能評測
●容錯能力的檢驗
對于他的容錯能力我們做了以下幾個(gè)實(shí)驗:
1、在兩臺節點(diǎn)和集群服務(wù)同時(shí)運行的情況下,斷掉其中一個(gè)節點(diǎn)的外網(wǎng)連接或是當掉一臺節點(diǎn),此時(shí)運行在這個(gè)節點(diǎn)上的集群服務(wù)被迫斷開(kāi)并轉移到另外一個(gè)連接正常的節點(diǎn)上,此過(guò)程大概要4秒鐘(視集群上運行的服務(wù)數量而定,在安裝了SQL Server 2000服務(wù)之后這個(gè)過(guò)程延長(cháng)到了9-15秒)。
2、在兩臺節點(diǎn)和集群服務(wù)同時(shí)運行的情況下,我們更改了一臺節點(diǎn)的時(shí)間,在經(jīng)過(guò)大約10分鐘時(shí)間被修改的時(shí)間自動(dòng)調整成同另一臺節點(diǎn)相同的設置。
3、我們在集群服務(wù)上開(kāi)啟了web服務(wù),并設置了下載項目。在客戶(hù)端正在下載過(guò)程中斷掉集群中的一個(gè)節點(diǎn),客戶(hù)端并沒(méi)有明顯的感覺(jué)出有變化。
由以上實(shí)驗可見(jiàn)用Windows 2000 Advance Server所做的集群在容錯方面具有良好的效能,他幾乎是瞬間就能把出錯的節點(diǎn)上的服務(wù)接管過(guò)來(lái),相對于客戶(hù)端幾乎感覺(jué)不到有任何變化。同時(shí)他在周期時(shí)間內所有節點(diǎn)進(jìn)行同步,以保證其一致性。
●負載均衡能力的檢驗
1、 Windows 2000 Advance Server 所做的集群是基于TCP/IP構建的,他為共同工作且使用兩個(gè)或兩個(gè)以上主機群集的Web服務(wù)器提供了高度可用性和可伸縮性。因特網(wǎng)客戶(hù)使用單一的IP地址訪(fǎng)問(wèn)群集??蛻?hù)不能將單一服務(wù)器從群集中區分開(kāi)來(lái)。服務(wù)器程序不能識別它們正運行于一個(gè)群集中。但是,由于網(wǎng)絡(luò )負載均衡群集即使在群集主機發(fā)生故障的情況下仍能提供了不間斷的服務(wù),故而,它與運行單一服務(wù)器程序的單一主機大相徑庭。與單一主機相比,群集還能對客戶(hù)需求做出更迅捷的反應。
注意要點(diǎn)
我們在做集群實(shí)驗的過(guò)程當中遇到了一些問(wèn)題,雖然最后都順利的解決了,但我想還是要在這里提出來(lái)讓大家注意,避免在今后的工作中出現不必要的重復的錯誤。
1、共享磁盤(pán)之中X盤(pán)的重要性。在實(shí)驗的過(guò)程中我們也知道X盤(pán)相當重要,為了驗證他的重要地位,我們做了如下實(shí)驗:我們首先看到在X盤(pán)下面只有一個(gè)MSDN的文件夾,其中有兩個(gè)文件*.tmp和*.log,這就是上文所說(shuō)的群集配置數據庫的檢測點(diǎn)和日志文件。我們試著(zhù)刪除這兩個(gè)文件,結果*.tmp可以刪除,*.log文件正在使用而無(wú)法刪除。刪除了*.tmp文件之后我們重新啟動(dòng)兩臺節點(diǎn)和集群。一切正常,進(jìn)入X盤(pán)看他的文件,發(fā)現被刪除的*.tmp文件又重新回到了里面,只是名字稍有些改變。這表明*.tmp文件是每次集群?jiǎn)?dòng)時(shí)自動(dòng)生成的一個(gè)文件,而集群?jiǎn)?dòng)以后,這個(gè)文件就不在被使用。接著(zhù)我們進(jìn)行了一個(gè)后來(lái)被證明
是毀滅性的實(shí)驗,我們在我的電腦管理里面的調整了磁盤(pán)管理,把X盤(pán)刪除了。結果可怕的事情發(fā)生了,在不到10秒鐘的時(shí)間內兩臺節點(diǎn)相繼報告機群服務(wù)發(fā)生錯誤將不能運行且終止服務(wù)。我們嘗試再次進(jìn)入磁盤(pán)管理,發(fā)現陣列的磁盤(pán)已經(jīng)變成了不可讀取。無(wú)奈之下我們重新啟動(dòng)所有設備,期望能發(fā)生超乎設想的好的結果,但是事實(shí)讓我們不得不失望。集群服務(wù)無(wú)法啟動(dòng),陣列磁盤(pán)不可讀取。在沒(méi)有任何辦法的情況下我們不得不重新配置集群。
聯(lián)系客服