在我們解釋什么是HACMP以前,我們先來(lái)定義一下高可用性的概念。
High availability
在當今復雜的環(huán)境下,成功實(shí)現IT應用的一個(gè)關(guān)鍵要素就是提供不間斷的應用服務(wù)。HA就是這樣一個(gè)可以通過(guò)消除計劃內/計劃外宕機事件從而向客戶(hù)應用提供不間斷服務(wù)的部件,它能達到消除從硬件到軟件的單點(diǎn)故障(SPOFs)。
一個(gè)高可用性解決方案可以保證方案中任何組件的失效(包括硬件、軟件或系統管理)都不會(huì )造成客戶(hù)無(wú)法訪(fǎng)問(wèn)應用和應用數據。
高可用性解決方案可以通過(guò)恰當的設計、計劃、硬件選擇、軟件配置以及細心控制改變管理方法來(lái)消除單點(diǎn)故障。
Downtime
停機時(shí)間是指應用程序不能為客戶(hù)端提供服務(wù)的時(shí)間。停機時(shí)間分為:
? 計劃內:
- 硬件升級
- 維修
- 軟件更新/升級
- 備份(離線(xiàn)備份)
- 測試(對群集確認必須進(jìn)行周期性測試)
- 發(fā)展
? 計劃外:
- 管理員過(guò)失
- 應用失效
- 硬件失效
- 其他不可抗力(天災)
IBM針對AIX的高可用性解決方案——HACMP給予飽經(jīng)考驗的IBM群集技術(shù),它包括以下兩個(gè)組件:
? 高可用性:該進(jìn)程保證應用在用戶(hù)復制和/或共享資源時(shí)是可用的。
? 群集多處理:該進(jìn)程提供在同一節點(diǎn)上多個(gè)應用共享或并發(fā)訪(fǎng)問(wèn)數據。
基于HACMP的高可用性解決方案提供自動(dòng)失效檢測、診斷、應用恢復和節點(diǎn)重新控制。在恰當的應用中,HACMP還可以在并行應用處理中提供對數據的并發(fā)訪(fǎng)問(wèn),從而提供更高的可擴展性。
標準的HACMP環(huán)境如圖1-1。
IBM HACMP最早可追溯至90年代。HACMP在1990年開(kāi)始為RS/6000機器上的應用提供高可用性解決方案。
我們不會(huì )提供關(guān)于更早版本的信息,原因在于這些版本要么已經(jīng)不被支持或者已經(jīng)不再使用,我們只提供近期一些版本的相關(guān)信息。
HACMP V
較早版本,引入了基于RSCT(Reliable Scalable Clustering Technology)技術(shù)的增強的可擴展版本,組、事件管理服務(wù)都從并行系統支持(PSSP)中引入。
HACMP V4.3.X
該版本引入了更多的支持,包括32節點(diǎn)、增強的C-SPOC、ATM網(wǎng)絡(luò )、HACMP 任務(wù)指南(圖形化的HACMP簡(jiǎn)單配置)、多腳本(安裝前、后)、FDDI MAC地址接管、監視和管理增強、節點(diǎn)到節點(diǎn)的遷移以及AIX快速連接支持。
HACMP V4.4.X
該版本中增加了Tivoli集成、應用監視、無(wú)退卻層疊、增強的C-SPOC、改良的遷移支持、集成HA-NFS功能和軟件副本文檔(pdf或者doc)。
HACMP V4.5
在線(xiàn)這個(gè)版本中要求AIX
HACMP V5.1
該版本在配置簡(jiǎn)單化和性能增強方面都有了重大改變,V5.1的主要特性如下:
? SMIT標準和擴展配置路徑
? 自動(dòng)配置發(fā)現
? 定制資源組
? 非IP網(wǎng)絡(luò )基于通過(guò)磁盤(pán)的心跳
? 快速磁盤(pán)接管
? 心跳通過(guò)IP aliases
? HAS不再保留,現在只有基于IBM RSCT的HACMP/ES
? 通過(guò)使用群集通訊進(jìn)程提高了安全性(消除了使用AIX r命令,也消除了對/.rhosts文件的依賴(lài))
? 為群集的定制和同步提高了性能
? 標準化HACMP術(shù)語(yǔ)
? 簡(jiǎn)單化配置和維護
? 增強的在線(xiàn)計劃工作表
? 強制要求varyon VG
? 自定義資源組
? 接管節點(diǎn)上服務(wù)IP/標簽心跳監視
? 心跳通過(guò)IP別名
? 心跳通過(guò)磁盤(pán)
? 不同的C-SPOC增強
? GPFS集成
? 快速接管
? 群集確認增強
? 改良的資源組管理
HACMP V5.2
從2004年7月開(kāi)始,新的HACMP V5.2在管理、配置簡(jiǎn)單化、自動(dòng)化和性能方面增加了不少內容:
? 2-節點(diǎn)配置助手,可以通過(guò)SMIT菜單或者Java™接口
? 文件收集
? 用戶(hù)密碼管理
? Classic資源組不再使用,取而代之的是自定義資源組
? 自動(dòng)測試進(jìn)程
? 自動(dòng)群集校驗
? 增強的OLPW可以導出已存在的HACMP群集的配置
? 事件管理被資源監視和AIX的一個(gè)控制子系統(RMC)所取代
? 增強的安全性
? 資源組依賴(lài)關(guān)系
? 自復原群集
注意:本書(shū)出版時(shí)HACMP V5.1和V5.2都已出現,但認證考試僅包括V5.1的主題
需要保護什么?從根本上講,在一個(gè)關(guān)鍵環(huán)境中IT方案就是要提供連續的服務(wù)和數據保護!HA就是完成不間斷服務(wù)這一目標的。高可用性基于硬件的可用性和軟件(操作系統及其組件)、應用程序和網(wǎng)絡(luò )組件的可用性。
實(shí)現一個(gè)高可用性解決方案,你需要:
? 冗余服務(wù)器
? 冗余網(wǎng)絡(luò )
? 冗余網(wǎng)絡(luò )接口卡
? 監視
? 故障檢測
? 故障診斷
? 自動(dòng)接管
? 自動(dòng)重新控制
實(shí)現HACMP的主要目標就是消除單點(diǎn)故障。
系統發(fā)現和處理軟硬件故障可以定義為兩種:
? 容錯系統
? 高可用性系統
容錯系統
它是提供冗余的設計為不間斷操作而不管故障的發(fā)生(除非天災造成整個(gè)站點(diǎn)癱瘓)。在這樣的系統中,所有的組件都是雙份的(不管是硬件還是軟件),CPU、內存、磁盤(pán)都有特殊的設計來(lái)提供不間斷服務(wù),甚至于一個(gè)子系統失效。
這樣的系統是非常昂貴和非常專(zhuān)業(yè)的。實(shí)現一個(gè)冗余系統需要大量的努力和對所有組件的高度定制。只有在要求0宕機的環(huán)境下,容錯系統設備和方案才有需求。
高可用性系統
配置為高可用性的系統是一組軟件、硬件的組合可以保證系統失效后可以在可接受的宕機時(shí)間內恢復。在這種系統中,軟件負責監測到環(huán)境故障后將應用交給另一個(gè)機器實(shí)現隊員機器的接管。因此,在這種環(huán)境下重要的是消除SPOF。例如,如果及其只有一個(gè)網(wǎng)絡(luò )連接,就需要提供第二塊網(wǎng)卡以備主網(wǎng)卡失效后接管。另一點(diǎn)就是通過(guò)將數據放在所有節點(diǎn)都可以訪(fǎng)問(wèn)的共享磁盤(pán)上并實(shí)現鏡像。
HACMP軟件提供一個(gè)框架以及一系列的工具來(lái)將應用程序集成到一個(gè)高可用性系統中。應用系統被集成到HACMP群集中需要公正的定制(非應用級別,而是HACMP和AIX平臺級別)。
HACMP是一個(gè)靈活的平臺,它允許集成AIX平臺的大多應用,在一個(gè)合理的代價(jià)下實(shí)現高可用性系統。
高可用性解決方案優(yōu)點(diǎn)如下:
? 標準化的組件
? 可以在已有的硬件上實(shí)現
? 可以和大多應用協(xié)同工作
? 支持大多數磁盤(pán)和網(wǎng)絡(luò )類(lèi)型
? 合理的價(jià)格實(shí)現優(yōu)秀的可用性
IBM針對p系列服務(wù)器的高可用性解決方案有些獨特的優(yōu)點(diǎn)。這些優(yōu)點(diǎn)包括:
? Proven解決方案(長(cháng)達14年的產(chǎn)品發(fā)展)
? 靈活性(事實(shí)上在單機AIX上運行的應用在HACMP中都被保護)
? 使用原來(lái)的硬件組件
? Proven客戶(hù)支持
考慮提供高可用性解決方案包括:
? 詳盡的設計和計劃
? 消除單點(diǎn)故障
? 選擇適當的硬件
? 正確執行(沒(méi)有捷徑)
? 嚴格的系統管理練習
? 文檔化操作步驟
? 全面測試
1.2. HACMP的概念
HACMP的基本概念可以作如下分類(lèi):
? 群集拓撲
包含基本的群集組件——節點(diǎn)、網(wǎng)絡(luò )、通訊接口、通訊設備、通訊適配器。
? 群集資源
被設為高可用性的實(shí)體(例如文件系統、裸設備、服務(wù)IP標簽、應用等)。所有資源被組織成資源組(RG),HACMP保持唯一實(shí)體——資源組——的高可用性。資源組可以被一個(gè)節點(diǎn)訪(fǎng)問(wèn)或者在并發(fā)應用中同時(shí)有多個(gè)節點(diǎn)訪(fǎng)問(wèn)。
? Fallover
在活動(dòng)節點(diǎn)出現故障時(shí),將資源組從活動(dòng)節點(diǎn)轉移到備份節點(diǎn)的動(dòng)作。
? Fallback
原來(lái)的活動(dòng)節點(diǎn)恢復時(shí),將資源組切換回原節點(diǎn)的動(dòng)作。這是將失效節點(diǎn)重新集成到集群的標準動(dòng)作。
要理解HACMP的正確功能并利用它,就必須知道一些術(shù)語(yǔ):
? 群集
為共享資源和相互通訊而通過(guò)網(wǎng)絡(luò )連接在一起的獨立主機(節點(diǎn))或者LPARs稱(chēng)為群集。HACMP負責定義在協(xié)同的系統中那個(gè)節點(diǎn)提供服務(wù)那個(gè)節點(diǎn)不提供服務(wù)。所有節點(diǎn)共同負責維護應用的功能可用(在群集節點(diǎn)失效時(shí))。
? 節點(diǎn)
在群集中的所有運行AIX和HACMP軟件的IBM p系列服務(wù)器(或者LPAR)都是節點(diǎn)。每個(gè)節點(diǎn)都有一個(gè)資源集(磁盤(pán)、文件系統、IP地址、應用)在該節點(diǎn)失效時(shí)可以被群集中其他節點(diǎn)接管。
? 資源
資源是在群集配置中可以從一個(gè)節點(diǎn)轉移到其他節點(diǎn)的邏輯組件。所有必須提供高可用性應用的資源被構成資源組(RG)。當節點(diǎn)失效時(shí),資源組中的組件被一同從一個(gè)節點(diǎn)移動(dòng)到另一個(gè)節點(diǎn)。一個(gè)群集可以有多個(gè)RG,從而提供節點(diǎn)的效率(也就是HACMP中的Multi-Processing)。
? 接管
在群集內部節點(diǎn)之間傳送資源的操作稱(chēng)為接管。如果一個(gè)節點(diǎn)發(fā)生硬件故障或AIX故障,它的資源應用會(huì )被移到另一個(gè)節點(diǎn)。
? 客戶(hù)
客戶(hù)就是可以通過(guò)局域網(wǎng)訪(fǎng)問(wèn)群集節點(diǎn)應用的一個(gè)系統??蛻?hù)通過(guò)運行客戶(hù)端程序連接到應用所在的服務(wù)器上。
1.3. HACMP/XD
AIX下的HACMP是基于軟件實(shí)現解決連續操作的問(wèn)題。它致力于恢復計算機、適配器、以及單一站點(diǎn)的網(wǎng)絡(luò )故障。標準HAGEO如圖1-2。
要實(shí)現異地容災應用,還需要有附加的軟件。HAGEO提供:
在不同的地理站點(diǎn)間實(shí)現群集
HAGEO將HACMP擴展到兩地的數據中心,它在站點(diǎn)級別防止了群集單點(diǎn)故障。遠程鏡像提供給每個(gè)站點(diǎn)一個(gè)關(guān)鍵數據的拷貝。異地容災的每個(gè)站點(diǎn)都可以不間斷地運行關(guān)鍵應用即使一個(gè)站點(diǎn)發(fā)生天災。
自動(dòng)失效監測和通告
HAGEO通過(guò)HACMP提供自動(dòng)監測站點(diǎn)或者地理網(wǎng)絡(luò )失效。它可以發(fā)起恢復進(jìn)程并向系統管理員報告他所發(fā)現的錯誤,同時(shí)接管相應應用。
自動(dòng)Fallover
HAGEO包含時(shí)間腳本來(lái)恢復站點(diǎn)會(huì )地理網(wǎng)絡(luò )故障。這些腳本都集成在標準的HACMP時(shí)間腳本中。和HACMP中一樣,你可以通過(guò)添加腳本來(lái)自定義配置行為。
災難快速恢復
HAGEO同樣在可操作站點(diǎn)間提供快速恢復數據和應用。遠程鏡像進(jìn)程確保當天災降臨時(shí)數據在第二個(gè)站點(diǎn)始終可用?;謴蜁r(shí)間一般需要數分鐘即可,這還不包括應用恢復的時(shí)間。
站點(diǎn)恢復時(shí)自動(dòng)重新同步數據
HAGEO用來(lái)重新在每個(gè)站點(diǎn)間同步的進(jìn)程是站點(diǎn)恢復進(jìn)程的一部分。重建站點(diǎn)的節點(diǎn)會(huì )自動(dòng)更新站點(diǎn)失效期間接受的數據。
可靠的數據完整性和一致性
HAGEIO的地理鏡像和地理消息組件確保如果站點(diǎn)失效,存活的站點(diǎn)的數據和失效站點(diǎn)的數據的一致性。當失效站點(diǎn)重新加入群集時(shí),HAGEO從可操作站點(diǎn)更新數據以確保數據的一致性。
靈活的、可升級的配置
HAGEO軟件支持大范圍的配置,允許按你的需求配置一個(gè)災難恢復解決方案。在一個(gè)HAGEO群集中最多可以有8個(gè)節點(diǎn),每個(gè)站點(diǎn)的節點(diǎn)數目可以靈活配置。既然遠程鏡像和他所支持的磁盤(pán)設備一樣是獨立的,HAGEO也是獨立于文件系統和數據庫的。因為鏡像是透明的,使用遠程鏡像的應用不需要做任何的改變。
本軟件有三大重要功能:
? 地理鏡像(遠程鏡像):
數據通過(guò)第一個(gè)站點(diǎn)進(jìn)入第二個(gè)站點(diǎn)的鏡像過(guò)程有一個(gè)邏輯設備和一個(gè)偽設備驅動(dòng)。TCP/IP被用作數據鏡像的傳送器。地理鏡像可以使用同步或異步模式,這取決于站點(diǎn)間的通訊帶寬以及應用的傳輸量(取決于數據的變化量)。
? 地理信息:
在兩個(gè)站點(diǎn)間使用地理鏡像傳輸數據時(shí)提供可靠的數據和消息。
? 地理拓撲:
在整個(gè)站點(diǎn)發(fā)生災難時(shí)提供集成化的地理鏡像工具和HACMP工具提供的故障自動(dòng)監測和恢復。
? 災難恢復:
當一個(gè)站點(diǎn)發(fā)生故障時(shí),其他存活站點(diǎn)的節點(diǎn)上的群集管理器會(huì )立刻監測到這一事件并切換腳色以保持地理鏡像應用的可用性。同樣,如果構成群集的主干網(wǎng)絡(luò )故障,站點(diǎn)中的群集管理器處于無(wú)人控制狀態(tài),那么群集管理器就會(huì )使自己宕機以確保數據不會(huì )有分歧。
可以配置HAGEO為HACMP支持的任何配置:包括備用、單方面接管、互相接管以及并發(fā)訪(fǎng)問(wèn)配置。
? 備用配置
備用配置是傳統的硬件冗余配置,只有當一個(gè)節點(diǎn)失效時(shí)其他節點(diǎn)才會(huì )啟用。在HAGEO中,這就轉化為有一個(gè)空閑站點(diǎn)。當然,它不可能完全空閑(要處理地理鏡像進(jìn)程)。但是在這個(gè)站點(diǎn)的節點(diǎn)不會(huì )執行應用。
? 接管配置:
在接管配置中所有節點(diǎn)都處理應用;不存在空閑站點(diǎn)。它包含:
- 站點(diǎn)內(本地)接管;
- 遠程單向接管;
- 遠程雙向接管。
? 并發(fā)配置:
在并發(fā)訪(fǎng)問(wèn)配置中,一個(gè)站點(diǎn)的所有節點(diǎn)對并發(fā)卷組進(jìn)行同時(shí)訪(fǎng)問(wèn)并擁有相同的磁盤(pán)資源,另外的站點(diǎn)也是同樣的配置。如果一個(gè)節點(diǎn)離開(kāi)站點(diǎn),資源的可用性不受影響,因為其他節點(diǎn)會(huì )將卷組varyon起來(lái)。如果一個(gè)站點(diǎn)故障,其他站點(diǎn)將向失效站點(diǎn)提供并發(fā)訪(fǎng)問(wèn)一個(gè)并發(fā)訪(fǎng)問(wèn)可以從群集中任何一個(gè)節點(diǎn)訪(fǎng)問(wèn)。HACMP 群集Lock Manager必須運行在群集的所有節點(diǎn)上。包括跨地理環(huán)境的節點(diǎn),并非所有的數據庫都可以并發(fā)訪(fǎng)問(wèn)。
這一特性最初在HACMP V4.5 PTF5和HACMP V5.1中引入,它提供自動(dòng)遠程站點(diǎn)fallove和自動(dòng)遠程拷貝應用數據,應用于所有站點(diǎn)使用IBM ESS和PPRC(Peer to Peer Remote Copy)功能提供存儲卷鏡像。
當主站點(diǎn)失效后,數據在第二站點(diǎn)依然可用(通過(guò)PPRC同步)。第二個(gè)站點(diǎn)必須激活數據拷貝以用來(lái)處理交易。
HACMP/XD PPRC集成特性提供自動(dòng)數據分割拷貝以保證主站點(diǎn)失效后重新在線(xiàn)時(shí)的可用性。更多信息請參閱SA22-7955。

第二章 計劃和設計
當計劃和設計高可用性群集時(shí),你必須跟隨客戶(hù)的需求。你應該對最為高可用性的硬件、網(wǎng)絡(luò )配置和應用有較好的理解;同時(shí),你還應具備在故障中控制應用的行為的能力。
理解應用在故障時(shí)的行為對于控制群集在同樣環(huán)境下起作用是至關(guān)重要的。
計劃和實(shí)現群集的必須信息還覆蓋應用程序、環(huán)境、硬件、網(wǎng)絡(luò )、存儲、支持和改變過(guò)程等環(huán)節。
本章將描述以下HACMP群集主題:
? 節點(diǎn)大小的考慮
? 群集硬件的計劃
? 軟件計劃
? 存儲計劃
? 災難恢復計劃
注意:計劃是實(shí)現群集的一半,但是,但開(kāi)始HACMP時(shí),我們不能認為正確的計劃就足夠了。如果計劃不正確,你會(huì )發(fā)現自己在隨后某一點(diǎn)上會(huì )陷入混亂,恢復這些混亂是痛苦的經(jīng)歷。因此,花些時(shí)間來(lái)對產(chǎn)品進(jìn)行計劃工作表對以后遷移或者發(fā)現問(wèn)題或者計劃文檔的價(jià)值都是無(wú)法估量的。
2.1. 計劃編制過(guò)程中需要考慮的事項
當編制一個(gè)高可用性群集計劃時(shí),你應該考慮節點(diǎn)、存儲、網(wǎng)絡(luò )等等的大小以保證應用正常運行所必需的資源——甚至是接管環(huán)境。
開(kāi)始實(shí)現群集之前,你必須知道需要多少個(gè)節點(diǎn)以及使用節點(diǎn)的類(lèi)型。節點(diǎn)類(lèi)型對于應用的資源需求是重要的。
群集節點(diǎn)的尺寸涵蓋如下方面內容:
? CPU(CPU的個(gè)數以及速度)
? 每個(gè)節點(diǎn)的內存數目
? 磁盤(pán)存儲(內部的)
? 通訊適配器和磁盤(pán)適配器的個(gè)數
? 節點(diǎn)的可靠性
節點(diǎn)數目的需求取決于設計為高可用性的應用的數目和期望的應用有效度。在群集中為每個(gè)應用使用一個(gè)以上的不同節點(diǎn)可以增加應用的可靠性。
注意:在HACMPV5.1群集下節點(diǎn)數目最大為32個(gè)。
HACMPV5.1支持多種節點(diǎn)類(lèi)型,從桌面系統到高端服務(wù)器,SP節點(diǎn)和LPAR同樣支持的很好。更多信息請參考SC23-4861-02。
節點(diǎn)共享資源取決于應用的需求。執行任務(wù)的節點(diǎn)并不和作為高可用性的應用發(fā)生直接關(guān)系,也不需要應用節點(diǎn)的共享資源,因此,他們應該被配置成另一個(gè)群集以易于實(shí)現和管理。
所有節點(diǎn)應提供足夠的資源(CPU、內存、適配器等等)以執行在熱備環(huán)境下設計的應用。
盡你所能在群集中增加附加的節點(diǎn)來(lái)提高群集的可用性,這同樣可以提供更高靈活性的節點(diǎn)切換、重建和維護操作。
我們建議您的群集節點(diǎn)使用同樣的硬件配置,特別是在相互備接管或者并發(fā)配置的群集中。同樣的硬件配置使你更容易實(shí)現資源分配和執行管理操作(軟件維護等等)。
在通常大多數用戶(hù)配置中,配置為高可用性的應用需要一個(gè)共享的存儲空間來(lái)存儲應用數據。共享的存儲空間既可以使用為并發(fā)訪(fǎng)問(wèn),也可以是在接管節點(diǎn)上對應用同樣可用(在熱備環(huán)境下)。
群集的存儲應該對針對每個(gè)應用的設計節點(diǎn)提供共享訪(fǎng)問(wèn)。HACMP支持的存儲技術(shù)包括SCSI、SSA、FibreChannel等等。
存儲必須依照應用的要求被配置成非共享的(專(zhuān)有的)或者共享的存儲。專(zhuān)有的存儲應該是內部磁盤(pán),它和接管活動(dòng)無(wú)關(guān)。
共享的存儲應能提供控制訪(fǎng)問(wèn)的機制,應考慮以下前提:
? 共享存儲上的數據應該在應用運行的任一點(diǎn)、任意時(shí)間被任一節點(diǎn)訪(fǎng)問(wèn)。在有些案例中,任意時(shí)刻只有一個(gè)節點(diǎn)運行應用(非并發(fā)的),但是在有些案例中數據必須提供并發(fā)的訪(fǎng)問(wèn)。
? 在非并發(fā)環(huán)境下,如果數據被錯誤的節點(diǎn)更新,就會(huì )產(chǎn)生數據被破壞的后果。
? 在并發(fā)環(huán)境下,應用應提供它自己的數據訪(fǎng)問(wèn)機制,因為在當前的軟件平臺下(AIX/HACMP)由存儲控制訪(fǎng)問(wèn)機制只是輔助手段。
當計劃一個(gè)HACMP群集時(shí),以下方面是必須考慮的:
? IP網(wǎng)絡(luò )的拓撲結構(路由、交換等等)
? IP網(wǎng)絡(luò )的性能(速度/帶寬、延遲、冗余等)
? ATM和/或X.25網(wǎng)絡(luò )配置
IP網(wǎng)絡(luò )用來(lái)提供客戶(hù)對群集中節點(diǎn)上應用的訪(fǎng)問(wèn)和在群集節點(diǎn)間交換心跳信息。在一個(gè)HACMP群集中,通過(guò)IP網(wǎng)絡(luò )和點(diǎn)到點(diǎn)(非IP網(wǎng)絡(luò ))進(jìn)行心跳信息交換。
HACMP被設計為通過(guò)基于TCP/IP的網(wǎng)絡(luò )、X.25、ATM網(wǎng)絡(luò )提供客戶(hù)端訪(fǎng)問(wèn)。
2.2. HACMP群集計劃
群集計劃可能是實(shí)現一個(gè)成功的群集配置的最重要的步驟。HACMP計劃應包括以下方面:
? 硬件計劃
- 節點(diǎn)
- 網(wǎng)絡(luò )
- 存儲
? 軟件計劃
- 操作系統版本
- HACMP版本
- 應用程序兼容性
? 測試和維護計劃
- 測試程序
- 改變管理
- 管理操作
硬件計劃
實(shí)現高可用性配置的目標是通過(guò)消除單點(diǎn)故障(硬件、軟件和網(wǎng)絡(luò ))、掩飾服務(wù)中斷(不管是計劃內的還是計劃外的)來(lái)實(shí)現高可用性服務(wù)。
節點(diǎn)計劃的要素是:
? 支持的節點(diǎn):機器類(lèi)型,特性,支持的適配器,電源支持(直流、交流或者雙電源等等)。
? 連接和線(xiàn)纜:線(xiàn)纜類(lèi)型、長(cháng)度、連接器、型號、通道路由、線(xiàn)纜容量和可用性。
HACMPV5.1支持IBMp系列(獨立主機和LPAR模式)、IBMSP節點(diǎn),還有現存的RS/6000服務(wù)器在一個(gè)群集中混合使用。節點(diǎn)必須滿(mǎn)足最小的硬件(內部?jì)却?、內部磁盤(pán)、可用的I/O插槽)需求和操作系統兼容性(AIX版本)。
考慮以下方面:
? 內部磁盤(pán)(磁盤(pán)數量、容量以及LVM是否鏡像?)
? 共享磁盤(pán)容量和存儲數據的保護方法(RAID和LVM鏡像)
? I/O插槽的限制以及可能產(chǎn)生單點(diǎn)故障的后果
? 客戶(hù)對群集的訪(fǎng)問(wèn)(網(wǎng)絡(luò )適配器)
? 其他局域網(wǎng)設備(交換機、路由器、網(wǎng)橋)
? I/O適配器和子系統的冗余
? 電源供應冗余
規劃群集網(wǎng)絡(luò )的目標就是為消除單點(diǎn)故障而使用的網(wǎng)絡(luò )的冗余度,需考慮以下方面:
? 網(wǎng)絡(luò ):節點(diǎn)連接到多個(gè)物理網(wǎng)絡(luò )上
? TCP/IP子系統失效:使用非IP網(wǎng)絡(luò )有助于解決此問(wèn)題。
? 網(wǎng)絡(luò )接口:在每個(gè)網(wǎng)絡(luò )上使用冗余網(wǎng)絡(luò )適配器(防止因為單個(gè)網(wǎng)絡(luò )接口失效引起資源接管)
規劃群集網(wǎng)絡(luò )配置時(shí),你必須選擇正確的節點(diǎn)連接方法:
? 群集網(wǎng)絡(luò )拓撲(交換機、路由器等等)
? 對每個(gè)節點(diǎn)到所有網(wǎng)絡(luò )的連接復合IP連接和非IP連接。
提供高可用性服務(wù)IP地址的方法:
? 通過(guò)IP別名接管
? 通過(guò)IP替換接管
要了解HACMP配置支持的節點(diǎn)和適配器完全列表,請參考SC-23-4861-02或IBM網(wǎng)站:http://www-1.ibm.com/servers/eserver/pseries/ha
從HACMPV5.1開(kāi)始,描述HACMP配置和操作的術(shù)語(yǔ)有了比較明顯的變化,變化的目的是為了簡(jiǎn)化使用和維護HACMP,同時(shí)統一IBM產(chǎn)品線(xiàn)中的術(shù)語(yǔ)。例如:在HACMP以前版本中,根據上下文關(guān)聯(lián),術(shù)語(yǔ)Adapter會(huì )有不同的意義,這會(huì )使配置更難和造成混亂。
IP標簽
術(shù)語(yǔ)IP標簽表示和一個(gè)指定IP地址關(guān)聯(lián)的名稱(chēng),也就是在群集節點(diǎn)中使用命名服務(wù)(DNS或者/etc/hosts)。它替換了主機名(容易和hostname命令混淆,它和IP沒(méi)有關(guān)聯(lián))。
在HACMPV5.1中,術(shù)語(yǔ)Adapter被替換成:
? 服務(wù)IP標簽/地址:一個(gè)服務(wù)提供的IP標簽/地址,它可能綁定在一個(gè)節點(diǎn)上或者多個(gè)節點(diǎn)共享來(lái)通過(guò)HACMP提供高可用性。
? 通訊接口:一個(gè)支持TCP/IP協(xié)議簇的物理接口。
? 通訊設備:在點(diǎn)到點(diǎn)非IP網(wǎng)絡(luò )中的一端的物理設備,例如/dev/tty1,/dev/tmssa1,/dev/tmscsi1,/dev/hdisk1。
? 通訊適配器:用來(lái)提供實(shí)現高可用性通訊鏈路的X.25適配器。
服務(wù)IP標簽/地址
服務(wù)IP地址是客戶(hù)端用來(lái)訪(fǎng)問(wèn)的IP地址。這個(gè)地址(和它所關(guān)聯(lián)的標簽)屬于資源組的一部分,可以被HACMP監視。
有兩種類(lèi)型的服務(wù)IP地址/標簽:
? 共享的:有多個(gè)節點(diǎn)共享并且是資源組的一部分,同一時(shí)間只能在一個(gè)節點(diǎn)上活動(dòng)。
? 節點(diǎn)范圍的:?jiǎn)蝹€(gè)節點(diǎn)使用的。通常它使用在并發(fā)資源組中。
HACMP啟動(dòng)并且服務(wù)IP地址所關(guān)聯(lián)的資源組出于在線(xiàn)狀態(tài)時(shí),服務(wù)IP地址才能可用。
通訊接口
HACMP中定義的通訊接口是如下的邏輯組:
? 邏輯網(wǎng)絡(luò )接口是AIX提供給物理網(wǎng)絡(luò )接口的名稱(chēng)(例如en0)
? 服務(wù)IP地址是應用(服務(wù))提供的用來(lái)讓客戶(hù)訪(fǎng)問(wèn)的IP地址。
? 服務(wù)IP標簽是映射服務(wù)IP地址的一個(gè)標簽。
一個(gè)通訊接口可以參考到一個(gè)基于IP的網(wǎng)絡(luò )和一個(gè)網(wǎng)絡(luò )適配器。物理的網(wǎng)絡(luò )適配器被HACMP組合成邏輯網(wǎng)絡(luò )。
每個(gè)網(wǎng)絡(luò )適配器都有能力提供多個(gè)IP地址。在群集中,HACMP會(huì )監視你所定義的IP地址(基本IP或者BootIP)并將服務(wù)IP地址設為高可用。
HACMP中通過(guò)通訊接口進(jìn)行心跳。HACMP使用RSCT子系統(使用UDP)的心跳功能監視它的網(wǎng)絡(luò )接口和IP地址。HACMP審查網(wǎng)絡(luò )拓撲并將它存入RSCT的ODM庫當中,不管哪個(gè)節點(diǎn)啟動(dòng)HACMP服務(wù),RSCT都能向HACMP提供失效通知。
通訊設備
HACMP同樣提供對點(diǎn)到點(diǎn)非IP網(wǎng)絡(luò )的監視。點(diǎn)到點(diǎn)網(wǎng)絡(luò )的兩端都是AIX設備(在/dev下定義的),這些就是通訊設備,它包括:RS-232串口連接、SCSI目標模式、SSA目標模式和磁盤(pán)心跳連接。
點(diǎn)到點(diǎn)網(wǎng)絡(luò )同樣被RSCT監視,它們的狀態(tài)信息會(huì )被HACMP用來(lái)區分節點(diǎn)失效和網(wǎng)絡(luò )失效。例如:在HACMP中可以使用通過(guò)硬盤(pán)的心跳(兩端都使用,名稱(chēng)為/dev/hdisk2)。
在兩個(gè)節點(diǎn)的群集網(wǎng)絡(luò )中推薦最少使用一個(gè)非IP網(wǎng)絡(luò )。
在使用磁盤(pán)作心跳時(shí),推薦至少在每?jì)蓚€(gè)節點(diǎn)(或者每個(gè)磁盤(pán)柜)間有一條連接。同一磁盤(pán)不能被使用在兩個(gè)點(diǎn)到點(diǎn)網(wǎng)絡(luò )中。
通訊適配器和鏈路
可以定義如下通訊鏈路作為HACMP的資源:
? 通過(guò)LAN適配器(ent*)的SNA配置
? 通過(guò)X.25適配器的SNA配置
? 自然X.25鏈路
HACMP把這些鏈路作為資源組的一部分來(lái)進(jìn)行管理,從而確保鏈路的高可用性。在發(fā)生網(wǎng)絡(luò )接口失效、X.25鏈路失效、節點(diǎn)失效等事件時(shí),高可用性通訊鏈路會(huì )轉移到該節點(diǎn)的另一個(gè)可用的適配器上、或者接管節點(diǎn)上。
IP別名
IP別名就是相對基本IP來(lái)講,對網(wǎng)絡(luò )接口配置的附加的IP地址。IP別名是AIX提供的功能并且在HACMP中支持的。AIX支持在一個(gè)通訊接口上有多個(gè)IP別名,每個(gè)IP別名屬于不同的子網(wǎng)。AIX同樣支持在一個(gè)通訊接口上的IP別名使用不同的子網(wǎng)掩碼,這個(gè)功能不被HACMP支持。
IP別名在HACMP中既可以作為服務(wù)IP,也可以作為非服務(wù)IP,象心跳配置。
網(wǎng)絡(luò )接口的職責
在IP網(wǎng)絡(luò )中,建議每個(gè)網(wǎng)絡(luò )、每個(gè)節點(diǎn)配置一個(gè)以上的通訊接口。根據HACMP群集的狀態(tài),通訊接口可以有不同的規則。
? 服務(wù)接口
服務(wù)接口就是配置了服務(wù)IP地址/標簽的通訊接口,根據每個(gè)網(wǎng)絡(luò )IP地址接管方法,服務(wù)IP可以添加到基本IP之上(IPATviaaliasing)或者替換通訊接口的基本(引導)IP。服務(wù)接口是用來(lái)提供對節點(diǎn)應用訪(fǎng)問(wèn)的,服務(wù)IP地址可以被HACMP通過(guò)RSCT心跳監視。
? 引導接口
引導接口是在AIX中定義的通訊接口的基本IP地址。如果通過(guò)IP別名心跳,HACMP就不會(huì )監視基本IP地址,但是通訊接口在引導時(shí)HACMP通過(guò)IP別名來(lái)監視它。沒(méi)有任何客戶(hù)流量通過(guò)引導接口;然而,如果一個(gè)服務(wù)接口失效,HACMP會(huì )將服務(wù)IP轉移到非服務(wù)接口上。如果節點(diǎn)失效,接管節點(diǎn)的林一個(gè)接口會(huì )配置服務(wù)IP地址以執行資源組接管。
注意:一個(gè)節點(diǎn)對每個(gè)網(wǎng)絡(luò )可以有0-7個(gè)非服務(wù)接口;在同一個(gè)網(wǎng)絡(luò )上使用多個(gè)非服務(wù)接口可以消除通訊接口的單點(diǎn)故障。
? 永久節點(diǎn)IP標簽
永久性節點(diǎn)IP標簽是一個(gè)被指定給群集中指定節點(diǎn)的IP別名。永久性節點(diǎn)標簽:
- 是綁定節點(diǎn)的
- 可以于網(wǎng)絡(luò )適配器上已有的服務(wù)/非服務(wù)IP標簽
- 優(yōu)點(diǎn)是不需要在節點(diǎn)上安裝額外的網(wǎng)絡(luò )適配器
- 不是任何資源組的一部分
指定一個(gè)節點(diǎn)綁定IP標簽提供了一個(gè)綁定節點(diǎn)的IP地址,它對管理功能相當有用,因為連接到永久性IP標簽會(huì )連接到特定的群集節點(diǎn),甚至在該節點(diǎn)沒(méi)有運行HACMP服務(wù)的情況下。
注意:在每節點(diǎn)、每網(wǎng)絡(luò )上配置一個(gè)永久性IP標簽是可能的。例如:如果你有一個(gè)節點(diǎn)連接到HACMP定義的兩個(gè)網(wǎng)絡(luò )上,那個(gè)節點(diǎn)就可以用兩個(gè)永久性IP標簽標識,每個(gè)網(wǎng)絡(luò )一個(gè)。
永久性IP標簽是在HACMP中定義的,在每個(gè)節點(diǎn)上HACMP第一次啟動(dòng)時(shí)它們都是可用的。一旦被配置,永久性IP標簽會(huì )一直可用甚至該節點(diǎn)沒(méi)有運行HACMP或者該節點(diǎn)被重啟動(dòng)。
永久性IP標簽可以在如下的基于IP的網(wǎng)絡(luò )中使用:
- 以太網(wǎng)
- 令牌環(huán)
- 光纖分布式數據接口
- ATM局域網(wǎng)仿真
局限性:永久性IP標簽不能在SP交換機、ATM傳統IP或者非IP網(wǎng)絡(luò )上配置。
永久性IP標簽的行為如下:
如果網(wǎng)絡(luò )適配器上的服務(wù)IP標簽配置失效,同時(shí)它還有一個(gè)永久性IP標簽配置在該網(wǎng)絡(luò )適配器上,這是,永久性IP標簽就會(huì )將自己連同服務(wù)IP標簽一同轉移到同一個(gè)非服務(wù)接口上。
如果群集指定節點(diǎn)的所有網(wǎng)絡(luò )適配器都失效,永久性IP標簽不再可用。一個(gè)永久性IP標簽總是在同一個(gè)網(wǎng)絡(luò )、同一個(gè)節點(diǎn)上;它不會(huì )再群集節點(diǎn)之間移動(dòng)。
更多信息請參考3.4配置群集拓撲。
為心跳使用的IP別名
這些IP地址是從私有地址池中取的,它們不可路由,被用來(lái)在不改變基本地址的情況下監視通訊接口。這一點(diǎn)在不希望改變節點(diǎn)基本IP地址的情況下十分有用,這些地址不遵守HACMP需求(它們在同一子網(wǎng),這樣網(wǎng)絡(luò )適配器就不能被監視)。
基于這個(gè)功能,HACMP提供了通過(guò)IP別名進(jìn)行心跳的使用。
在HACMP中,術(shù)語(yǔ)網(wǎng)絡(luò )是用來(lái)定義為提供客戶(hù)訪(fǎng)問(wèn)和群集中節點(diǎn)之間互相通訊的通訊接口和設備的邏輯實(shí)體的組合。HACMP中的網(wǎng)絡(luò )可以定義為IP網(wǎng)絡(luò )和非IP網(wǎng)絡(luò )。IP網(wǎng)絡(luò )和非IP網(wǎng)絡(luò )都用來(lái)在節點(diǎn)之間交換心跳(?;睿┬畔?,通過(guò)這種方法,HACMP來(lái)維護群集節點(diǎn)狀態(tài)信息和它們各自的通訊接口和設備。
HACMPV5.1支持的網(wǎng)絡(luò )類(lèi)型有:
? 以太網(wǎng)(ether)
? 令牌環(huán)(token)
? 光纖分布式數據接口(fddi)
? SP交換和SP交換2(hps)
? ATM(atm)
不支持的網(wǎng)絡(luò )有:
? 串口光通路轉換(SOCC)
? 串口線(xiàn)路IP(SLIP)
? 光通路交換(FCS)
? 802.3
? IBM高性能交換(HPS)
非IP網(wǎng)絡(luò )是在兩個(gè)群集節點(diǎn)間的點(diǎn)到點(diǎn)連接,通過(guò)HACMP來(lái)控制心跳流量和消息。這些網(wǎng)絡(luò )可以為HACMP群集提供IP網(wǎng)絡(luò )(或者是節點(diǎn)的TCP/IP子系統)失效時(shí)的附加保護。
以下是HACMP在非IP(基于設備)網(wǎng)絡(luò )中支持的設備:
? SCSI目標模式(tmscsi)
? SSA目標模式(tmssa)
? 磁盤(pán)心跳(diskhb)
? RS-232串口
注意:HACMP現在在AIX5LV5.1以上支持為IP地址接管的通訊接口的以太網(wǎng)聚合(以太網(wǎng)通道)。以太網(wǎng)通道不支持以下特性:
? 硬件地址接管
? PCI熱插拔
同樣,在當前版本中HACMP不支持AIX虛擬IP功能(VIPA)和IPV6。
實(shí)現群集的一個(gè)關(guān)鍵是資源組以及與之關(guān)聯(lián)的服務(wù)IP地址的行為。因為大多情況下HACMP是用來(lái)保護獨立主機、非并發(fā)應用的,所以必須選擇用來(lái)提供高可用性的服務(wù)IP地址的方法。
當一個(gè)應用啟動(dòng)或者它連同它的資源組一起轉移到另一個(gè)節點(diǎn)時(shí),服務(wù)IP標簽可以通過(guò)以下兩種途徑配置:
? 通過(guò)替換通訊接口的基本IP,又叫做IPATviaIP替換。
? 通過(guò)培植通訊接口使用現存IP中最上面的一個(gè),又稱(chēng)為IPATviaIP別名。
HACMPV5.1中默認的IPAT方法是通過(guò)別名,要改變默認行為,必須通過(guò)HACMP擴展配置菜單改變網(wǎng)絡(luò )屬性。
IP地址接管
IP地址接管是一個(gè)當初始化網(wǎng)絡(luò )適配器失敗后通過(guò)移動(dòng)服務(wù)IP標簽到另一節點(diǎn)的其他網(wǎng)絡(luò )適配器上來(lái)恢復服務(wù)的一種機制。IPAT確?;诜?wù)提供的服務(wù)IP標簽對客戶(hù)來(lái)看始終可用。
IPAT和服務(wù)IP標簽
我們可以這樣解釋IPAT的兩種方法和它們如何控制服務(wù)IP標簽:
? IPATviaIP別名
服務(wù)IP標簽/地址就是一個(gè)已有的通訊接口的別名,無(wú)須替換。HACMP使用ifconfig命令執行這個(gè)操作。
注意:在這種配置中,同一節點(diǎn)的所有的基本IP地址/標簽必須配置為不同的子網(wǎng)(服務(wù)IP地址/標簽也一樣)。這種方法同樣節省硬件,但是需要附加的子網(wǎng)。如圖Figure2-1。
HACMP支持不同方式(方式的數目取決于AIX別名網(wǎng)絡(luò )的容量)的IP地址接管。IPATviaIP別名在某些網(wǎng)絡(luò )上可以使用免費的ARP能力。IPATviaIP別名允許一個(gè)網(wǎng)絡(luò )適配器支持超過(guò)一個(gè)的服務(wù)標簽。也就是說(shuō),同一個(gè)節點(diǎn)在同一時(shí)間可以作為多個(gè)資源組的主機,數目取決于可用通訊接口的數目。
IPATviaIP別名相對IPATviaIP替換有以下優(yōu)點(diǎn):
- 速度快,因為替換IP地址比在同一接口上配置別名花費的時(shí)間要長(cháng)的多。
- 它允許在一個(gè)網(wǎng)絡(luò )適配器上共存多個(gè)服務(wù)標簽,你就可以在群集中使用較少的網(wǎng)絡(luò )適配器。
注意:在HACMPV5.1上,保持服務(wù)IP標簽的默認方法是IPATviaIP別名。
? IPATviaIP替換
在網(wǎng)絡(luò )接口上用服務(wù)IP標簽替換一個(gè)已存在的(基本/引導)IP。這種方法在同一時(shí)間、同一網(wǎng)絡(luò )接口上只能有一個(gè)服務(wù)IP標簽。
注意:在這種配置中,服務(wù)IP標簽必須和節點(diǎn)通訊接口的引導地址在同一子網(wǎng),然而備份通訊接口的基本IP地址必須在另外一個(gè)不同的子網(wǎng)。這種方法節省子網(wǎng),但是需要附加的硬件。如圖Figure2-2。
如果保持服務(wù)IP標簽的通訊接口失效,當使用IPATviaIP替換時(shí),HACMP將服務(wù)IP標簽轉移到同一網(wǎng)絡(luò )、同一節點(diǎn)的其他網(wǎng)絡(luò )適配器上,在這種情況下,資源組關(guān)聯(lián)不再有效。如果在同一節點(diǎn)上沒(méi)有可用接口,資源組和服務(wù)IP標簽會(huì )一同轉移到有可用通訊接口的其他節點(diǎn)上。
這種方法同樣可以實(shí)現配置HWAT(硬件地址接管),它是通過(guò)偽裝自己的MAC地址為本地管理地址LAA來(lái)確保ARP有效并且對客戶(hù)感覺(jué)沒(méi)有變化。
規劃網(wǎng)絡(luò )安全是避免無(wú)授權的存取集群節點(diǎn)的重要方法。
從HACMPV5.1開(kāi)始,引入了一個(gè)新的安全機制,在所有的相關(guān)的節點(diǎn)通信之間提供了一個(gè)通用的通信基礎(daemon)配置。
引入新的集群通信的daemon(clomdES)提供了增強的安全性也加速了相關(guān)的配置操作。
有三個(gè)層次的通信安全:
? 標準的
- 缺省的安全級別。
- 有集群通信daemon(clomdES)直接實(shí)現。
- 使用HACMP的odm類(lèi)和/usr/es/sbin/cluster/rhosts文件去探測合法的節點(diǎn)。
? 增強的安全性
- 在SP集群中使用。
- 提供了基于第三方kerberos提供的認證方法去增強認證。
? 虛擬私有網(wǎng)絡(luò )(VPN)
- 在AIX中配置VPN。
- 然后配置HACMP的所有內置節點(diǎn)使用VPN來(lái)連接通信的操作。
通過(guò)使用集群安全通信子系統,HACMP消除了需要/.rhosts或者Kerberos在每個(gè)節點(diǎn)上的配置。然而,/.rhosts仍然在支持一些應用操作的遠程通信機制時(shí)使用。
注意:不是所有的集群通信都是通過(guò)clomdES實(shí)現安全的,其他的daemons有他們自己的通信機制(不是基于r的命令):
? 集群管理(clstrmgrES)
? 集群鎖daemon(cllockES)
? 集群多對等擴展通信daemon(clsmuxpdES)
clcomdES用來(lái)作集群的同步,集群管理(C-SPOC)和動(dòng)態(tài)重配置等操作。
集群通信的后臺進(jìn)程,clomdES,通過(guò)最小特權的原則提供了安全的遠程命令執行和HACMP ODM配置文件的更新。因此,僅僅在/usr/es/sbin/cluster的程序可以被root執行,其他的全部都用nobody來(lái)運行,除了clcomdES,下面的程序也被使用:
? cl_rsh集群的遠程shell執行程序。
? clrexecroot用來(lái)作特殊的,危險的操作,例如改變/etc下的文件。
? cl_rcp用來(lái)拷貝aix的配置文件。
這些命令是固化在clomdES中并且不支持被用戶(hù)執行。
clcomdES(集群通信的后臺程序)有如下的特性:
? 從此集群的通信不再使用標準的aixr*命令,依賴(lài)文件/。rhosts已經(jīng)被移出,因此即使在標準的安全模式,集群的安全性也被增強了。
? 為其他節點(diǎn)的odm復制到本地提供可靠的緩存機制。節點(diǎn)同步命令執行時(shí)。
? 限制了在遠程節點(diǎn)上以root用戶(hù)運行的命令(僅僅/usr/es/sbin/HACMP下的)
? 本身被/etc/inittab啟動(dòng)并作為系統資源管理器被管理。
? 提供了自己的心跳機制,發(fā)現活動(dòng)的節點(diǎn)(甚至集群管理和RSCT沒(méi)有運行時(shí))
注意:clcomdES提供了執行例如clverify,godm,rsh和rexec等HACMP服務(wù)的一個(gè)透明的機制。
ClcomdES認證進(jìn)程確定進(jìn)入的連接基于檢查節點(diǎn)的下列文件:
? HACMP適配器ODM類(lèi)(IPlables定義在這個(gè)類(lèi)中)
? HACMP節點(diǎn)ODM類(lèi)(集群中節點(diǎn)的通信路徑使用的IP地址和標簽)
? /usr/sbin/HACMP/etc/rhosts文件
如果/usr/sbin/cluster/etc/rhosts文件不存在或者不包含(IP地址或者可理解的IP標簽)遠程初始化的節點(diǎn),那么接入的連接將被拒絕。
如果上述三者均為空,那么clcomdES認為HACMP是在第一次(就一次)始化配置階段接受連接,然后加入對等的peer的節點(diǎn)的IP地址到/usr/sbin/cluster/etc/rhosts文件。
如果連接的請求匹配一個(gè)上述定位中的標簽,然后clcomdES反向連接到請求的節點(diǎn)查詢(xún)對應的ip地址,如果iplabel和ip地址相匹配,那么認證將成功的完成。
注意:如果不能解析label在/usr/es/sbin/cluster/etc/rhosts文件,那么遠程節點(diǎn)所有的連接被拒絕。
圖片附件: 2-1.JPG (2006-3-29 15:55, 15.59 K)

圖片附件: 2-2.JPG (2006-3-29 15:55, 17.22 K)

2.3. HACMP心跳
和其他許多類(lèi)型的集群一樣,心跳用來(lái)檢測網(wǎng)絡(luò )接口,通信設備,IP標簽(服務(wù)的,非服務(wù)的,永久性的IP)以及節點(diǎn)本身的可用性。
從HACMP V5.1開(kāi)始,心跳是專(zhuān)有的,基于RSCT拓撲的服務(wù)(這樣,HACMP V5.1僅有的增強的可擴展性,經(jīng)典的通過(guò)網(wǎng)絡(luò )模塊的心跳,直接被集群管理后臺控制)心跳是通過(guò)集群中每?jì)蓚€(gè)節點(diǎn)間的每個(gè)通信設備傳遞和交換的信息(?;顢祿?/span>)。每一個(gè)集群中的節點(diǎn)定時(shí)的間隔發(fā)送心跳信號到其他節點(diǎn),并且預期的接受心跳信號從相應的節點(diǎn)。如果接受的信號中斷了,RSCT認可這一個(gè)錯誤并告訴HACMP,HACMP將執行合適的恢復動(dòng)作。
心跳信息可以通過(guò)兩種網(wǎng)絡(luò )傳送:
? TCP/IP網(wǎng)絡(luò )
? 點(diǎn)到點(diǎn)非IP網(wǎng)絡(luò )
為了避免HACMP集群的分離,HACMP必須能區分節點(diǎn)故障和TCP/IP網(wǎng)絡(luò )故障。TCP/IP網(wǎng)絡(luò )可以因為不完美的網(wǎng)絡(luò )元素(交換機,集線(xiàn)器和電纜等)而發(fā)生故障,當這種情況發(fā)生時(shí),集群中的節點(diǎn)不能通過(guò)IP發(fā)送心跳信號,所以每個(gè)節點(diǎn)考慮到對方節點(diǎn)故障而都去嘗試獲得資源,這將導致一個(gè)潛在數據問(wèn)題,特別是使用了并發(fā)的資源組時(shí)。
非IP網(wǎng)絡(luò )是在兩個(gè)節點(diǎn)間直接的點(diǎn)對點(diǎn)連接,不再使用IP進(jìn)行心跳信號的交換,也因此減少了IP網(wǎng)絡(luò )的故障帶來(lái)的問(wèn)題。假如這樣的網(wǎng)絡(luò )類(lèi)型使用了,那么當IP網(wǎng)絡(luò )故障時(shí),節點(diǎn)仍然可以交換信息,可以判定網(wǎng)絡(luò )故障而不會(huì )發(fā)生資源組的接管操作。
為了避免HACMP被分開(kāi),我們推薦配置冗余的網(wǎng)絡(luò )(IP網(wǎng)絡(luò )和非IP網(wǎng)絡(luò )),同時(shí)使用這兩種網(wǎng)絡(luò )。建議使用的兩個(gè)節點(diǎn)的群集參見(jiàn)Figure 2-3。
通過(guò)磁盤(pán)的心跳是HACMP V5.1的新特性,提供了對防止集群分割和單個(gè)非IP網(wǎng)絡(luò )的附加的保護,特別是當RS-232和tmssa、tmscsi等連接太復雜或無(wú)法實(shí)現時(shí)。
這種類(lèi)型的網(wǎng)絡(luò )可以使用許多類(lèi)型的共享磁盤(pán)存儲(光纖通道,SSA和SCSI等),磁盤(pán)用來(lái)交換KA信息的一段只是作為AIX增強并發(fā)卷組的一部分,它不是排外性的僅作為這個(gè)目的使用,它們仍然可以用來(lái)存貯應用共享的數據。
客戶(hù)需要使用目標模式的光纖通道連接,但是對于異構的FC環(huán)境(adapter,存儲子系統,SAN交換機),這將很難實(shí)施和支持。
使用共享磁盤(pán)來(lái)交換信息是更可靠的非IP網(wǎng)絡(luò ),并且不依賴(lài)于特定的硬件。此外,在一個(gè)SAN環(huán)境中,當使用光纖連接設備,非IP網(wǎng)絡(luò )的光纖的長(cháng)度僅僅是SAN的限制,因此允許非常長(cháng)的點(diǎn)對點(diǎn)的網(wǎng)絡(luò )。
當定義一個(gè)磁盤(pán)作為增強的并發(fā)卷組,這個(gè)磁盤(pán)的一部分(一部分扇區)將不能給lvm使用,將用來(lái)在兩個(gè)節點(diǎn)間交換信息。
使用基于磁盤(pán)的心跳的詳細說(shuō)明如下:
? 一個(gè)磁盤(pán)可以用來(lái)做兩個(gè)節點(diǎn)間的一個(gè)網(wǎng)絡(luò ),這個(gè)磁盤(pán)在兩個(gè)節點(diǎn)上使用相同的唯一的特定的標識的PVID。
? 推薦在一個(gè)存儲范圍內的一對節點(diǎn)間(或者一個(gè)磁盤(pán)柜)的一個(gè)磁盤(pán)配置磁盤(pán)心跳網(wǎng)絡(luò )。
? 該磁盤(pán)需要是增強并發(fā)卷組的一部分,雖然并不要求卷組激活或者是資源組的一部分。僅僅的限制是VG必須同時(shí)定義在兩個(gè)節點(diǎn)上。
注意:集群中并發(fā)卷組的鎖機制不再需要保留磁盤(pán)的一部分來(lái)通信,而是以RSCT組服務(wù)替代。
對于IP網(wǎng)絡(luò ),引入了一個(gè)新的心跳機制:通過(guò)IP別名的心跳。這使得集群不再需要或者可能再改變通信接口基本IP地址。
在IP別名上的心跳信號是配置在當HACMP服務(wù)啟動(dòng)時(shí)已經(jīng)存在的IP地址上的。用來(lái)做這個(gè)的IP地址子網(wǎng)必須和已存在的每一個(gè)IP子網(wǎng)都不相同,并且不被定義在(/etc/hosts,BIND等)名稱(chēng)解析中。這樣的配置不需要一個(gè)附加的可路由的子網(wǎng)。
作為基礎和引導IP地址交換心跳信息的替代,RSCT使用HACMP定義的IP別名去完成每一個(gè)通信接口的通信組(心跳環(huán))。
注意:當使用了IP別名的心跳,基本/引導IP地址不再被RSCT拓撲服務(wù)監控,將通過(guò)分配的IP別名去監控這些通信接口。
雖然有這些技術(shù),HACMP仍然需要所有接口可以和其他接口通信(可以看到節點(diǎn)的每一個(gè)MAC地址)。IP別名使用的子網(wǎng)掩碼和服務(wù)IP之一的掩碼一致。當定義用來(lái)做心跳的IP地址時(shí),你必須保證有足夠的子網(wǎng)可用并不會(huì )沖突。例如:在三個(gè)網(wǎng)卡每節點(diǎn)的三節點(diǎn)集群中,你需要三個(gè)非路由的子網(wǎng)。參考圖2-4和2-5。
假定每一個(gè)節點(diǎn)有三個(gè)網(wǎng)卡(en0,en1,en2),網(wǎng)絡(luò )掩碼是255.255.255.0,那么分配給每一個(gè)接口的別名如下表:
adapter/node node1 node2 node3
en0 172.16.100.1 172.16.100.2 172.16.100.3
en1 172.16.101.1 172.16.101.2 172.16.101.3
en2 172.16.102.1 172.16.102.2 172.16.102.3
通過(guò)IP別名實(shí)現得心跳的IP地址在集群同步時(shí)存儲在HACMP adapter ODM庫中。
在HACMP V5.1中,IP別名的心跳可以配置在建立基于IP的心跳環(huán),使用任何一種IPAT的類(lèi)型(IP別名和IP重置)。IPAT配置的類(lèi)型探測HACMP是怎樣操作服務(wù)IP地址/標簽的:
? IPAT via IP重置服務(wù)標簽在base/boot地址上,沒(méi)有心跳的別名。
? IPAT via IP別名的服務(wù)IP地址作為別名和基本IP一起在通信接口上,并且使用別名心跳。
IP別名的心跳定義為HACMP的一個(gè)網(wǎng)絡(luò )特性并且作為HACMP拓撲的一部分。要使用這個(gè)工具,用戶(hù)必須在HACMP的網(wǎng)絡(luò )定義中指定起始的地址。
要設置這個(gè)屬性,你必須使用擴展的smit菜單(clustertopology)。這可以在定義網(wǎng)絡(luò )時(shí)定義,也可以在稍后改變這個(gè)配置。
2.4. 共享存儲的配置
大部分的HACMP配置需要共享的存儲。IBM支持的多種主機存取磁盤(pán)子系統包括SCSI,SSA,ESS,FastT。
也有許多第三方的存儲設備可以使用,雖然許多沒(méi)有IBM的認證,請參考制造商的web。
HACMP支持的IBM存儲設備的列表,包括ESS,SSA等,也支持磁帶設備的存儲,不支持磁帶的并發(fā)。如下:
? IBM 7133 SSA Disk Subsystem Models D40 and T40 (up to 72.8 GB disk modules, andup to eight nodes per SSA loop)。
? IBM Enterprise Storage Server (ESS) Models E10, E20, F10, and F20 (supports up to eight nodes using SCSI and Fibre Channel interfaces via IBM FC/FICON, Feature Code: 3021, 3022, and 3023)。
? IBM 7133 SSA Disk Subsystem Models D40 and T40 (up to 72.8 GB disk modules, and up to eight nodes per SSA loop)。
? IBM Total Storage FAStT 200, 500, 600, 700, and 900 models。
HACMP同樣支持共享的磁帶設備(SCSI或者FC),但是磁帶設備不支持并發(fā)訪(fǎng)問(wèn)。如下:
? IBM 3583 Ultrium Scalable Tape Library Model L18, L32 and L72
? IBM 3584 Ultra™ Scalable Tape Library Model L32 and D32
? IBM Total Storage
? IBM Magstar® 3590 Tape Drive Model E11 and B11
? IBM 3581 Ultrium Tape Autoloader Model H17 and L17
? IBM 3580 Ultrium Tape Drive Model H11 and L11
更多的產(chǎn)品支持信息請登陸網(wǎng)站:
http://www-1.ibm.com/servers/eserver/pseries/ha
HACMP同樣支持其他非IBM的存儲(磁盤(pán)、磁帶)子系統,相關(guān)信息請登陸網(wǎng)站:
http://www.availant.com/
為HACMP規劃共享的LVM依賴(lài)于共享磁盤(pán)存取的方法和設備的類(lèi)型。共享LVM需要考慮這些元素:
? 數據保護的方法
? 存儲存取的方法
? 存儲硬件的冗余
注意:HACMP本身不支持存儲的保護,存儲的保護通過(guò)AIX的LVM鏡像和硬件RAID的實(shí)現。
在這一節中,我們提供了在存儲層保護數據的方法,也討論了LVM共享磁盤(pán)存取的模式。
? 非并發(fā)的
? 并發(fā)的(clvm——HACMP的并發(fā)邏輯卷管理)
? 增強并發(fā)模式(ECM,AIX V5.1以后新特性
在非并發(fā)存取的配置下,在同一時(shí)間只有一個(gè)節點(diǎn)可以存取共享的存儲。如果一個(gè)包含共享磁盤(pán)空間的資源組移動(dòng)到另一個(gè)節點(diǎn),那么新的節點(diǎn)會(huì )激活磁盤(pán),并檢查卷組,邏輯卷和文件系統的當前狀態(tài)。
在非并發(fā)的模式下,磁盤(pán)可以配置共享為:
? 裸物理卷
? 裸邏輯卷
? 文件系統
在并發(fā)存取模式下,存儲在磁盤(pán)上的數據同時(shí)對所有的節點(diǎn)可用。這種模式不支持文件系統(不管是JFS還是JFS2)。
快速磁盤(pán)切換
在HACMP V5.1中,開(kāi)發(fā)使用了一個(gè)新的AIX增強的并發(fā)LVM。在AIX
增強的并發(fā)卷組在資源組中的所有節點(diǎn)下被激活,HACMP去調整數據的存取控制。僅僅在激活資源組的節點(diǎn)上卷組激活在"并發(fā)的激活狀態(tài)"模式,其他節點(diǎn)將卷組激活在"被動(dòng)"模式。在被動(dòng)模式時(shí),在卷組上不允許有高級的操作。
注意:當使用了資源組的快速磁盤(pán)切換選項,非常重要的就是要有冗余的網(wǎng)絡(luò )和非IP網(wǎng)絡(luò )。這可以消除和避免數據的不一致性。
RAID和SSA并發(fā)模式
RAID并發(fā)模式的卷組是陳舊的定義,因為增強并發(fā)卷組模式提供了附加的能力,但是RAID并發(fā)卷組將繼續被支持一段時(shí)間。RAID和SSA并發(fā)卷組在HACMP V5.1中都被支持但有一些重要的限制:
? 并發(fā)資源組的增強卷組需要運行64位內核的節點(diǎn)支持
? SSA的并發(fā)模式不支持64位的內核
? SSA磁盤(pán)在32位內核模式仍然可以使用SSA并發(fā)模式。
? C-SPOC單元不能支持RAID并發(fā)卷組。你不得不轉換這些卷組到增強并發(fā)模式(否則,AIX視為非并發(fā)的卷組)
? 在AIX V5.1中,可能創(chuàng )建一個(gè)SSA并發(fā)卷組(32位),但在5.2中,不可能創(chuàng )建一個(gè)并發(fā)的HACMP,所有的新的卷組必須使用增強并發(fā)模式
LVM需求
這里敘述了lvm管理的概念。
強迫激活卷組
HACMP5。1提供了新的工具,去強制激活節點(diǎn)上的卷組。如果在故障切換的進(jìn)程中,正常的varyon命令不能激活卷組(lackofquorum),HACMP將確保在接管節點(diǎn)激活卷組前至少每一個(gè)Lv有一個(gè)有效的LPcopy是可用的。
強迫性的激活卷組可以讓你一直保持資源組中卷組的在線(xiàn)狀態(tài)并且有一個(gè)有效的數據copy。你僅僅可以在卷組包含鏡像的邏輯卷時(shí)使用這個(gè)選項。還要小心的注意到避免創(chuàng )建一個(gè)分開(kāi)的集群。
注意:你必須指定一個(gè)非常嚴格的lv分配策略來(lái)使用這個(gè)強制激活的選項。在這種方法下,LVM確定lv的copy總是在分開(kāi)的磁盤(pán)上,可以增加失效時(shí)強制激活的成功概率。
這個(gè)選項當一個(gè)vg的vgda丟失時(shí)的接管是很有用的。如果沒(méi)有使用這個(gè)選項,資源組將不能在接管的節點(diǎn)上激活,因而導致應用的不可用。
當使用了強制激活選項發(fā)生接管時(shí),HACMP首先嘗試正常的varyonvg。如果嘗試因缺少quorum失效,HACMP在嘗試強制卷組在線(xiàn)時(shí)首先檢查數據的完整性-確定所有數據在卷組中都至少有一個(gè)可用的copy。如果是這樣,他執行varyonvg-f,如果不能,卷組仍然離線(xiàn)并且資源組有一個(gè)錯誤的報告。



HACMP5。1支持下列存儲的拓撲:scsi,ssa和光纖通道(TastT和ESS磁盤(pán)子系統)。完整支持的外部存儲的列表可以在ibm網(wǎng)站找到。
HACMP支持下列的ibm磁盤(pán)技術(shù)在HACMP中作為外部共享磁盤(pán)使用。
IBM2105企業(yè)存儲服務(wù)器
ibm2105企業(yè)存儲服務(wù)器提供并發(fā)的連接和磁盤(pán)存儲共享在多種開(kāi)放的系統平臺上。除了ibm的p系列服務(wù)器機器,許多其他的平臺也被支持。
由于共享存儲環(huán)境得多平臺得支持,為了避免沖突,非常重要得就是配置適當得LUN標記和zone配置來(lái)提供安全得數據存取。ESS使用ibm得ssa磁盤(pán)技術(shù)。ESS提供了內建的可用性和數據保護。RAID技術(shù)用來(lái)保護數據,同時(shí),磁盤(pán)有故障前期分析特性預測將會(huì )出現故障。使數據保持可用。ESS事實(shí)上有所有的組件冗余避免內部組件損壞而導致故障,從而提供了保護。ess管理兩個(gè)節點(diǎn)的集群通過(guò)內部的高速總線(xiàn)連接到內部的存儲(ssa磁盤(pán)),每個(gè)節點(diǎn)上有精確等同的定義。因此,當內部節點(diǎn)失效,存儲對系統仍然有效(可用性)。
更多的信息參考ibm網(wǎng)站。
一個(gè)典型的使用ESS的HACMP集群的例子如圖2-6。
ibmFastT700和900中等存儲服務(wù)器
IBMFatsT900和700存儲服務(wù)器傳輸超越磁盤(pán)性能和突出的可靠性來(lái)為苛刻的應用程序提供良好的計算環(huán)境。
IBMFatsT系列存儲子系統是提供好的可測量的,高性能的和數據保護的中等解決方案。在FatsT架構中,雖然不是作為久經(jīng)考驗的ESS實(shí)現,仍然提供基于冗余組件(存儲控制器,電源支持和存儲連接器)的可靠性。
FastT700和900架構實(shí)現了在主機和存儲端的本地的光纖通道協(xié)議。他不再支持scsi,并且不專(zhuān)注于提供兩個(gè)控制器之間的高速度,但是提供了控制器的無(wú)間斷的錯誤切換和主機端的數據緩存。
需要完整的信息關(guān)于ibm的存儲解決方案,請訪(fǎng)問(wèn)ibm的網(wǎng)站。
典型的FatsT連接的HACMP如圖2-7。
IBM串行存儲架構磁盤(pán)子系統
SSA存儲架構提供一個(gè)更離散組件的解決方案,提供了減少單點(diǎn)故障的特性。
SSA存儲在HACMP環(huán)境通過(guò)冗余硬件提供了高可用的和電源,磁盤(pán)熱切換的特性(在線(xiàn)維護)。
SSA存儲也提供了RAID在hba(hostbusadapter)層。
注意:如果使用ssa的raid特性,那么HACMP只能連接兩個(gè)節點(diǎn)。
ibm的7133子系統能在HACMP中提供并發(fā)存取的配置。請參閱7133相關(guān)配置。如圖2-8。
2.5. 軟件規劃
在HACMP規劃的進(jìn)程中,很重要的一步就是選擇集群節點(diǎn)中軟件運行的層次。
節點(diǎn)軟件規劃的考慮因素有:
Ø 操作系統需求:AIX版本和推薦層次。
應用的兼容性:確保應用的所有需求適合并且在HACMP環(huán)境中支持。Ø
Ø 資源:使用資源的類(lèi)型(IP地址,存儲配置、必要的話(huà)還有NFS等)。
2.5.1. AIX級別和相關(guān)的需求
在安裝HACMP之前,你必須操作系統的需求級別。本紅皮書(shū)書(shū)寫(xiě)時(shí)的推薦層次如下表:
HACMP Version AIX OS Level AIX APARs RSCT Level
HACMP V5.1 5100-05 IY50579,IY48331 2.2.1.30或更高
HACMP V5.1 5200-02 IY48180,IY44290 2.3.1.0或更高
HACMP V5.2 5100-06 IY54018,IY53707,
IY54140,IY55017 2.2.1.30或更高
HACMP V5.2 5200-03 IY56213 2.3.3.0或更高
有關(guān)HACMP V5.1和V5.2的推薦維護級別的最新的信息請訪(fǎng)問(wèn)IBM網(wǎng)站:
http://www-912.ibm.com/eserver/support/fixes/fcgui.jsp
注意:
Ø 要在VPATH磁盤(pán)中使用C-SPOC,需要設備驅動(dòng)子系統(SDD)1.3.1.3或更高版本。
Ø 要使用HACMP在線(xiàn)規劃工作表,AIX
HACMPØ V5.1和V5.2支持在AIX
下列基本操作系統(BOS)組件需要在HACMP之前安裝:
Ø bos.adt.lib
bos.adt.libmØ
bos.adt.syscallsØ
Ø bos.net.tcp.client
bos.net.tcp.serverØ
bos.rte.SRCØ
Ø bos.rte.libc
bos.rte.libcfgØ
bos.rte.libcurØ
Ø bos.rte.libpathreads
bos.rte.odmØ
Ø bos.data
當使用增強并發(fā)資源管理時(shí),還需要下列組件:
bos.rte.lvm.5.1.0.25或更高(在AIX
bos.clvm.enhØ
完整推薦維護級別的列表,請參考IBM網(wǎng)站:
http://www-912.ibm.com/eserver/support/fixes/fcgui.jsp
2.5.2. 應用兼容性
HACMP是可伸縮的高可用的解決方案,事實(shí)上可以通過(guò)在獨立的AIX節點(diǎn)上使用HACMP群集運行應用以保護應用。
當開(kāi)始一個(gè)應用的規劃時(shí),需要考慮下面的方面:
Ø 應用在AIX系統的版本上的兼容性。
應用在實(shí)現高可用的存儲方法上的兼容性Ø
Ø 你必須知道所有應用和平臺相互依賴(lài)的東西,也就是說(shuō)應用程序所有的文件分布(永久性數據、臨時(shí)文件、套接字、可能的話(huà)還有管道)。
Ø 你必須提供一個(gè)無(wú)人值守的應用啟動(dòng)和停止的腳本。并且應用可以在重新啟動(dòng)時(shí)從錯誤中(例如:節點(diǎn)應用崩潰)恢復。
重要提示:不要加入在獨立節點(diǎn)上就不能正確執行的應用或者你不能確定應用依賴(lài)的文件等!!!
Ø 如果你計劃使用應用的監控,你應該提供應用的監控工具(方法,行為和腳本)。
Ø 應用客戶(hù)端的依賴(lài)(當服務(wù)器重啟時(shí)客戶(hù)端的行為)。
應用網(wǎng)絡(luò )的依賴(lài)(sockets、route等)。Ø
Ø 許可證的問(wèn)題,如果應用依賴(lài)于CPU ID,你應該考慮購買(mǎi)標準的在每個(gè)節點(diǎn)上,同時(shí),如果應用基于處理器個(gè)數,那么要確定,當錯誤切換時(shí),許可證不被破壞。
應用服務(wù)器
依照HACMP的定義,一個(gè)應用服務(wù)器是HACMP當激活資源組時(shí)啟動(dòng)應用和資源組離線(xiàn)時(shí)停止應用的腳本的集合。一旦應用啟動(dòng),HACMP能監視應用,并且當應用運行不正確時(shí)執行動(dòng)作。應用監控可以在進(jìn)程級,也可以使用定制的方法(例如,一個(gè)多處理的進(jìn)程數據庫引擎等)執行。
注意:應用監控在HACMP/ES 4.4中引入,是基于RSCT事件管理的定義。從HACMP 5.2開(kāi)始,事件管理被資源監控控制器(RMC)替代,兩者功能相同,但是RMC提供了更多的彈性。從HACMP 5.2開(kāi)始,同樣可能去監控應用的啟動(dòng)。
HACMP也提供了應用可用的分析工具,可以用來(lái)審計所有的應用可用性,評估集群的環(huán)境。
需要應用服務(wù)器和其他資源的信息,請參考3.5 資源組配置。
2.5.3. 規劃NFS配置
HACMP的一個(gè)典型的應用就是對客戶(hù)機和應用服務(wù)提供高可用的HA-NFS。這是很有用的,特別是集群運行一個(gè)相互接管的交叉掛接的NFS。從HACMP 4.4開(kāi)始,HA-NFS已經(jīng)整合到HACMP中,不再是一個(gè)單獨的產(chǎn)品。
使用NFS的一些注意事項:
Ø 對于要輸出為NFS的共享卷組來(lái)說(shuō),卷組的Major Number在所有服務(wù)文件系統的vg的所有集群節點(diǎn)上是一樣的。
Ø 在AIX中,當你使用mknfsexp命令輸出文件系統和目錄時(shí),/etc/exports文件將被創(chuàng )建和更新。也就是說(shuō),在HACMP中,輸出為NFS的文件系統和目錄必須在資源組配置中指定。
Ø 如果你需要這些文件系統的一些可選配置項,那么你就需要創(chuàng )建/usr/es/sbin/cluster/etc/exports文件。
Ø 對于所有輸出文件系統的資源組來(lái)說(shuō),"File system mounted before IP address configured"屬性必須置為"true"。
HACMP的腳本包括缺省的NFS行為。你需要去改變這些腳本去適合你的配置。Ø
Ø 在HACMP 5.1中,在附加的層疊(cascading)資源組中你可以在rotating和定制資源組中配置高可用的NFS。
注意:NFS鎖定功能限制為兩個(gè)節點(diǎn)的群集,這個(gè)功能提供了當主NFS服務(wù)失效時(shí)允許備份的進(jìn)程去恢復當前的NFS行為,保留NFS文件系統的鎖定和副本緩存(dupcache)。
2.5.4. 許可
許多的軟件供應商需要你的每一個(gè)應用在每一臺物理機器上或者在SMP機器上每個(gè)CPU有唯一的許可證。通常,許可證激活碼在軟件安裝時(shí)輸入。然而,在HACMP環(huán)境中的切換狀態(tài),如果應用在另一個(gè)節點(diǎn)重新啟動(dòng),你必須確定你在新的機器有必須的激活碼;否則,應用不能正確的啟動(dòng)。
應用也可能有唯一的節點(diǎn)綁定的許可證(每一個(gè)機器上有不同的許可證文件)。
一些應用限制限制集群中漂移的應用的許可證的數量。要避免這個(gè)問(wèn)題,你需要有足夠的許可證,這些應用可以同時(shí)在多個(gè)節點(diǎn)上執行,特別是在并發(fā)的應用中。
2.5.5. 客戶(hù)端連接
當資源組切換時(shí),應用在另一個(gè)節點(diǎn)上啟動(dòng),應用必須知道這個(gè)動(dòng)作。在某些情況下,應用客戶(hù)端使用本機ARP緩存去重新連接服務(wù)器。在這種情況下,有兩種可能的結果:
Ø 持有服務(wù)IP的網(wǎng)絡(luò )使用通過(guò)IP置換得IPAT實(shí)現了本地MAC地址的切換(因此,客戶(hù)端機器ARP緩存沒(méi)有被更新)。
Ø 當網(wǎng)絡(luò )或節點(diǎn)事件發(fā)生時(shí)HACMP使用clinfo程序調用/usr/es/sbin/cluster/etc/clinfo.rc腳本。缺省的,這個(gè)動(dòng)作更新系統的ARP緩存并且指定客戶(hù)端的ARP緩存反應網(wǎng)絡(luò )的改變。你可以定制這個(gè)腳本以進(jìn)一步滿(mǎn)足需求。
clients運行clinfo后臺守護進(jìn)程能在集群事件后快速的連接到集群。
注意:如果你使用IPAT via IP別名,確保你的客戶(hù)端支持支持ARP刷新功能。
如果HACMP節點(diǎn)客戶(hù)端在同一個(gè)子網(wǎng)上,客戶(hù)端不需要運行clinfo,你可以間接的在集群節點(diǎn)上通過(guò)ping客戶(hù)端來(lái)刷新客戶(hù)端的ARP緩存。
你可以在集群節點(diǎn)上通過(guò)添加你想要通知的客戶(hù)端的IPlabel和地址到clinfo。rc腳本中的PING_CLIENT_LIST變量。一旦集群事件發(fā)生,這個(gè)腳本就會(huì )運行下面的命令到PING_CLIENT_LIST中的每一個(gè)主機:
#ping -cl $host
當client在不同的子網(wǎng)時(shí),確保路由器的ARP緩存在發(fā)生IPAT事件時(shí)得到更新;否則,客戶(hù)端在重連時(shí)會(huì )有預期的延遲。
2.6. 操作系統空間需求
在HACMP 5.1中,包括集群校驗程序(clverify)和新的集群通信后臺(clcomdES)都需要/var文件系統下附加的空間。
要得到詳細的消息和附加的調試信息,在每個(gè)節點(diǎn)的/var下需要滿(mǎn)足:
Ø
- /var/HACMP/clcomd/clcomd.log
- /var/HACMP/clcomd/clcomddiag.log
Ø 在/var/HACMP/odmcache目錄下附加的(
Ø
在集群的每個(gè)節點(diǎn)中,效驗工具在需要/var下
/var/HACMP/clverify/current/<nodename>/*包含當前執行的效驗的日志。
/var/HACMP/clverify/pass/<nodename>/*包含最后通過(guò)的效驗的日志。
/var/HACMP/clverify/pass。prev/<nodename> /*包含倒數第二次通過(guò)效驗的日志。
/var/HACMP/clverify/fail/<nodename>/*包含最后一次失敗的效驗日志。
同時(shí),/var/HACMP/clverify/clverify.log和它的拷貝消耗1
2.7. 資源組的規劃
資源組是一個(gè)包含HACMP執行高可用的資源的一個(gè)邏輯實(shí)體。資源包括:
Ø 存儲空間(應用程序的代碼和數據)
- 文件系統
- 網(wǎng)絡(luò )文件系統
- 裸邏輯卷
- 裸物理磁盤(pán)
服務(wù)IP地址/標簽(客戶(hù)端連接應用時(shí)使用)Ø
應用服務(wù)器Ø
- 應用啟動(dòng)的腳本
- 應用停止的腳本
要通過(guò)HACMP實(shí)現高可用,每一個(gè)資源都必須包含在資源組中。
HACMP在集群事件發(fā)生改變時(shí)通過(guò)在節點(diǎn)間移動(dòng)資源組來(lái)確保集群資源的可用性。HACMP在下列狀態(tài)時(shí)控制資源組的行為:
Ø 集群?jiǎn)?dòng)
節點(diǎn)失效Ø
節點(diǎn)重組Ø
Ø 集群關(guān)閉
在上述的群集下,HACMP的資源組的行為定義在:
當節點(diǎn)(一個(gè)或者幾個(gè)節點(diǎn))在集群?jiǎn)?dòng)時(shí)需要獲取資源組;Ø
Ø 當擁有資源的節點(diǎn)失效時(shí)接管節點(diǎn)接管資源組時(shí);
Ø 不管資源組恢復到剛剛發(fā)生故障而恢復的節點(diǎn),還是當前擁有的節點(diǎn)。
集群中的節點(diǎn)優(yōu)先級關(guān)系決定了哪一個(gè)節點(diǎn)最初控制資源組并且當一個(gè)最初的節點(diǎn)在失效后重新加入集群接管對資源組的控制。
資源組接管關(guān)系定義為:
Ø 層疊式
輪轉式Ø
并發(fā)式Ø
Ø 定制式
層疊的,輪轉的和并發(fā)的資源組是在HACMP 5.1以前的類(lèi)型。因為定義這些類(lèi)型的難于理解,在HACMP V5.1中引進(jìn)了新的定制資源組。
這里僅僅有一個(gè)?;?/span>HACMP術(shù)語(yǔ)和讓HACMP的概念容易理解的步驟。從HACMP V5.2開(kāi)始,僅僅有定制資源組存在。
2.7.1. 層疊式資源組
層疊式資源組定義了一個(gè)所有可以控制資源組的節點(diǎn)列表并且每一個(gè)節點(diǎn)有一個(gè)托管資源組的優(yōu)先級。
一個(gè)層疊式資源組的行為如下:
Ø 在集群?jiǎn)?dòng)時(shí),層疊式資源組在缺省的節點(diǎn)上激活(資源組的最高優(yōu)先級的節點(diǎn)上)。
同時(shí),另一個(gè)稱(chēng)為“非活動(dòng)的接管”屬性的可以用來(lái)指定如果高優(yōu)先級的節點(diǎn)在集群?jiǎn)?dòng)時(shí)不可用的時(shí)候在低優(yōu)先級的節點(diǎn)上激活。
Ø 當一個(gè)節點(diǎn)失效時(shí),一個(gè)層疊式資源組在資源組優(yōu)先級列表中的下一個(gè)節點(diǎn)上激活。
同時(shí),可以指定"動(dòng)態(tài)節點(diǎn)優(yōu)先級"失效切換的進(jìn)程將根據動(dòng)態(tài)的屬性(高cpu空閑等)確定接管資源組的節點(diǎn)。
Ø 當失效節點(diǎn)重新接入集群,層疊式資源組將重新切換到缺省的節點(diǎn)上。
附加的,可以指定"層疊不需要回退",資源組將依然保持在接管節點(diǎn)上即使一個(gè)高優(yōu)先級的節點(diǎn)重新接入集群。
總結一下,層疊式資源組有下面的屬性:
Ø 非活動(dòng)性接管允許你精妙的定義主節點(diǎn)不可用時(shí)對資源組的接管;
Ø 當擁有資源組的節點(diǎn)失效時(shí),該資源組可以根據節點(diǎn)優(yōu)先級列表切換到下一個(gè)可用的結點(diǎn)。節點(diǎn)優(yōu)先級列表可以通過(guò)兩種方法配置:使用默認(RG配置時(shí)的節點(diǎn)列表)或者設置一個(gè)動(dòng)態(tài)節點(diǎn)優(yōu)先級(DNP)策略。
Ø 無(wú)后退層疊(CWOF)屬性改變了切換行為,使用CWOF屬性可以避免高優(yōu)先級節點(diǎn)恢復可用時(shí)不必要的RG切換(由客戶(hù)中斷引起的)。在這種模式下,可以在不影響客戶(hù)的時(shí)間手動(dòng)將RG移動(dòng)到它的主節點(diǎn)上。
2.7.2. 輪轉式資源組
對于一個(gè)輪轉式資源組來(lái)說(shuō),節點(diǎn)的優(yōu)先級列表僅僅用來(lái)決定哪一個(gè)節點(diǎn)來(lái)接管失效的節點(diǎn)。
在集群?jiǎn)?dòng)時(shí),在節點(diǎn)優(yōu)先級列表中第一個(gè)可用的節點(diǎn)將激活資源組;一旦在一個(gè)接管的節點(diǎn)上激活,它不會(huì )切換回高優(yōu)先級的節點(diǎn)即使高優(yōu)先級節點(diǎn)重新可用;在輪轉時(shí)資源組中不使用DNP(動(dòng)態(tài)的節點(diǎn)優(yōu)先級);當在同一個(gè)節點(diǎn)上配置多個(gè)輪轉的資源組時(shí),為了控制首選的資源組的定位,每一組都要從節點(diǎn)群中分配一個(gè)不同的高優(yōu)先級節點(diǎn)。當集群?jiǎn)?dòng)時(shí),每一個(gè)節點(diǎn)將嘗試去獲取它自己具有高優(yōu)先級的資源組;如果所有的輪轉資源組已啟動(dòng),新節點(diǎn)的加入僅能作為這些資源組的后備節點(diǎn);如果所有的資源組都沒(méi)有激活,新加入的節點(diǎn)將僅僅去獲得這些資源組的一個(gè),其他的資源組仍然保持非激活狀態(tài)。
無(wú)論如何,如果存在多個(gè)網(wǎng)絡(luò )可供資源組移動(dòng),一個(gè)節點(diǎn)可能獲得多個(gè)資源組,每一個(gè)網(wǎng)絡(luò )上只能有一個(gè)。
2.7.3. 并發(fā)的資源組
和名稱(chēng)一樣,一個(gè)并發(fā)的資源組可以在多個(gè)節點(diǎn)上同時(shí)激活,當集群?jiǎn)?dòng)時(shí),資源組將在列表的所有節點(diǎn)上激活,沒(méi)有順序。
對并發(fā)資源組來(lái)說(shuō),沒(méi)有節點(diǎn)間的優(yōu)先級,他們是平等的節點(diǎn),如果一個(gè)節點(diǎn)失效,其他的節點(diǎn)仍然一樣提供服務(wù),資源組不能被移出。
管理并發(fā)的存取應用的數據可能需要附加的并發(fā)軟件。
2.7.4. 定制資源組
為了簡(jiǎn)化資源組的管理和理解,HACMP V5.1引入了定制資源組的類(lèi)型。資源組指定的名稱(chēng)可能會(huì )使新的用戶(hù)(層疊,輪轉和并發(fā))混淆:
Ø 他們不能清晰的指出潛在的資源組的行為。
Ø 附加的資源組參數將進(jìn)一步使定義資源組變得復雜:無(wú)后退層疊和非活動(dòng)接管
同時(shí),在一些情況下,用戶(hù)需要組合一些行為,他們不是被標準的RG定義的:
Ø HACMP V5.1引入了定制的資源組
- 用戶(hù)必須明確的指定啟動(dòng)的需求,切換和回來(lái)的行為。
- RG啟動(dòng)和切回能通過(guò)用戶(hù)設定和FAllback計時(shí)器控制。
- RG接管也可以通過(guò)用戶(hù)的定義動(dòng)態(tài)節點(diǎn)優(yōu)先級影響。
Ø 局限性:(僅僅HACMP V5.1)
- 定制資源組僅支持IPAT-via-別名服務(wù)IP的標簽和地址。
- 沒(méi)有站點(diǎn)和復制資源(HACMP-XD)支持。
啟動(dòng)參數選擇
Online On Home NodeØ Only:在節點(diǎn)啟動(dòng)時(shí),RG將僅僅使得高優(yōu)先級的節點(diǎn)在線(xiàn),這個(gè)行為等價(jià)于層疊RG行為。
Online On FirstØ Available Node:在節點(diǎn)啟動(dòng)時(shí),RG將在第一個(gè)節點(diǎn)上激活,這個(gè)行為等價(jià)于輪轉式RG或者使用非活動(dòng)的接管的層疊式RG。如果配置了一個(gè)設定時(shí)間,它將影響RG的這個(gè)行為。
Ø Online On All Available Nodes:RG將在資源組的所有節點(diǎn)上激活。這等價(jià)于并發(fā)的RG行為。這個(gè)啟動(dòng)參數將不考慮某些fall-over和fall-back參數。
切換(fall over)參數選擇
切換至列表中的下一個(gè)優(yōu)先節點(diǎn):RG將切換到下一個(gè)可用的節點(diǎn)上。這個(gè)行為等價(jià)于層疊式RG和輪轉式RG。Ø
Ø 使用DNP切換:RG將基于DNP計算結果去切換,資源組必須指定DNP的優(yōu)先級。
Ø 使其離線(xiàn)(僅僅在錯誤的節點(diǎn)上):RG在錯誤時(shí)不發(fā)生切換,而是簡(jiǎn)單的置為離線(xiàn)。這個(gè)行為大部分的類(lèi)似于并發(fā)的資源組。
后退(fallback)參數選擇
Ø 退回高優(yōu)先級節點(diǎn):RG將在一個(gè)節點(diǎn)重新可用時(shí)切換倒高優(yōu)先級的節點(diǎn)上。這個(gè)行為等價(jià)于層疊的資源組的行為。一個(gè)fall-back計時(shí)器將影響這個(gè)行為。
Ø 從不后退:資源組將待在它在的地方,即使一個(gè)高優(yōu)先級的節點(diǎn)重新在線(xiàn)。這個(gè)行為類(lèi)似于輪轉式RG的行為。
2.7.5. 應用監控
作為資源組管理的一個(gè)附加方面,HACMP能通過(guò)下列兩種方法監控應用:
Ø 應用的進(jìn)程監控:探測死進(jìn)程,使用RSCT事件管理能力。
Ø 應用定制的監控:基于自定義的監控方法(程序或腳本)監視應用的健康狀態(tài)。
注意:你不能使用應用進(jìn)程監控一個(gè)shell腳本啟動(dòng)的應用,或者應用的進(jìn)程對應用來(lái)說(shuō)不能反映應用的健康狀態(tài)的應用。
要監控一個(gè)shell腳本的應用,你將不得不定制監控的方法(例如,Apache web server)。
當應用監控是激活狀態(tài)時(shí),HACMP的行為如下:
Ø 對應用監控進(jìn)程來(lái)說(shuō),一個(gè)通知集群管理器的內核的鉤子監控倒進(jìn)程已經(jīng)死掉的話(huà),集群開(kāi)始應用的恢復進(jìn)程。
當恢復的動(dòng)作執行時(shí),你必須提供一個(gè)方法清除和重新啟動(dòng)應用(定義的應用起停的腳本可能會(huì )用上)。
HACMP在發(fā)送警告信息或者移動(dòng)到另一個(gè)節點(diǎn)前會(huì )嘗試重新啟動(dòng)應用和等待應用穩定一段時(shí)間。
Ø -對于定制應用監控(定制的方法)除了應用清理和重新啟動(dòng)的方法,你還必須提供一個(gè)程序或者腳本用來(lái)執行一個(gè)周期的測試。
規劃和配置一個(gè)進(jìn)程的監控需要檢查下列方面:
Ø 檢查應用是否能被進(jìn)程監控。
指定和核查要監控的進(jìn)程的名稱(chēng),在配置應用監控時(shí)必須強制的使用準確的進(jìn)程名稱(chēng)。Ø
Ø 指定要監控的應用的實(shí)例數(進(jìn)程的數量)。缺省的值是一個(gè)實(shí)例。
Ø 指定開(kāi)始監控等待的時(shí)間(秒)。
注意:在很多情況下,這個(gè)值不能設為零。例如,在一個(gè)數據庫應用中,你希望延遲一些監控知道啟動(dòng)腳本和初始化數據庫完成。
Ø 重啟的計數,表示在執行其他動(dòng)作時(shí)嘗試去重啟應用的次數。
間斷(秒)。是應用在重新設置重啟計數前保持穩定的時(shí)間。Ø
Ø 重啟計數器歸零后應用依然不能運行的時(shí)候才去的動(dòng)作,默認選擇是通告,它作為通告集群失效的事件運行;可將選擇改為切換,在運行應用的節點(diǎn)失效時(shí)將應用和資源組切換至下一個(gè)高優(yōu)先級的節點(diǎn)上。
Ø 如果有需要,還有重啟動(dòng)的方法。(前提是重啟計數器不為零)
如果計劃安裝自定義的監視方法,還應檢查:
Ø 是否你有用來(lái)檢查制定應用的程序或腳本。
Ø 選舉間隔(以秒計):監視方法的運行頻率。如果監視(進(jìn)程)在選舉間隔內沒(méi)有響應,應用就會(huì )被認為失效,此時(shí)恢復進(jìn)程啟動(dòng)。
Ø 用戶(hù)自定義的監視(進(jìn)程)如果在選舉間隔內沒(méi)有返回,即表示該進(jìn)程應被殺掉。默認的Kill進(jìn)程信號是SIGKILL。
Ø 開(kāi)始監視前的等待時(shí)間(以秒計)。例如:在一個(gè)數據庫應用中,推薦監視應在啟動(dòng)腳本和數據庫初始化搜索后再運行(換句話(huà)說(shuō),應用被認為出錯后恢復進(jìn)程才能開(kāi)始初始化)。
Ø 重啟計數器:應用執行其他動(dòng)作前場(chǎng)是重新啟動(dòng)的次數。
保持計時(shí)器:應用在復位重啟計數器前應保持狀態(tài)的時(shí)間。Ø
Ø 應用在重啟計數器歸零后執行的動(dòng)作。
2.8. 規劃災難恢復
從HACMP V5.1開(kāi)始,HAGEO和GeoRM作為IBM HACMP/XD(擴展距離)特性被集成在HACMP中。
HAGEO軟件產(chǎn)品為構建災難冗余的計算機環(huán)境提供了一個(gè)靈活的、高可用性平臺。HAGEO組件可以通過(guò)TCP/IP點(diǎn)到點(diǎn)網(wǎng)絡(luò )不受距離限制的在兩個(gè)不同的地理站點(diǎn)間進(jìn)行數據鏡像。
HAGEO提供了自動(dòng)探測、通告和在失效中恢復整個(gè)地理站點(diǎn)。
本書(shū)中的容災策略?xún)H討論在兩個(gè)站點(diǎn)間進(jìn)行:原始站點(diǎn)和恢復或者備份站點(diǎn)。數據恢復策略應達到以下結果:
Ø 數據就緒級別:
- Level 0:沒(méi)有。容災中不提供。
- Level 1:定期備份。需要恢復的數據被備份并發(fā)送至另一個(gè)地方。
- Level 2:有準備的前向滾動(dòng)。作為周期性備份的附加,數據更新日志同樣被發(fā)送至另一個(gè)地方。在恢復站點(diǎn)恢復時(shí)只恢復最近記錄的數據。
- Level 3:前向滾動(dòng)或前向恢復。在恢復站點(diǎn)的磁盤(pán)上維護著(zhù)一份數據的影子拷貝,更新日志會(huì )被恢復工具接收到并且將其周期性的應用到影子拷貝中。
- Level 4:實(shí)時(shí)前向滾動(dòng)。和前向滾動(dòng)一樣,源站點(diǎn)記錄的更新在同一時(shí)間被傳輸并應用。這里實(shí)時(shí)的操作不會(huì )影響源站點(diǎn)的響應時(shí)間。
- Level 5:實(shí)時(shí)遠程更新。在發(fā)送交易響應前源站點(diǎn)和恢復站點(diǎn)的數據拷貝同時(shí)被更新。
站點(diǎn)互聯(lián)選項Ø
- Level 0:沒(méi)有。在站點(diǎn)間或數據傳輸。
- Level 1:手動(dòng)傳輸。不提供互聯(lián),需要傳輸的數據被手動(dòng)發(fā)送至另一個(gè)地方。
- Level 2:遠程磁帶。數據通過(guò)遠程磁帶進(jìn)行電子傳輸。急件和收據是自動(dòng)的,跟蹤既可以設為自動(dòng),也可以手動(dòng)。
- Level 3:遠程磁盤(pán)。數據通過(guò)遠程磁盤(pán)進(jìn)行電子傳輸。急件、收據和跟蹤都是自動(dòng)的。
恢復站點(diǎn)就緒Ø
- 冷站點(diǎn):通常冷站點(diǎn)是指在正確的架構下,極少或沒(méi)有數據處理設備的環(huán)境。該設備被作為恢復進(jìn)程的第一步來(lái)安裝。災難發(fā)生時(shí)、周期性備份和有準備的前向滾動(dòng)都可以將這個(gè)站點(diǎn)存儲的數據裝走。
- 溫暖站點(diǎn):它有數據處理設備安裝和操作,這個(gè)設備被用來(lái)處理在災難發(fā)生時(shí)其他的數據進(jìn)程任務(wù)。數據處理資源可以用來(lái)存儲數據,例如日志等。此站點(diǎn)的恢復(進(jìn)程)經(jīng)常做關(guān)閉和備份的工作。周期性備份和有準備的前向滾動(dòng)數據都可以在該站點(diǎn)存儲以便在災難中快速恢復。
- 熱站點(diǎn):有數據處理設備安裝和操作,包括頻繁或有規律的存儲以減少恢復時(shí)間。在前向滾動(dòng)和實(shí)時(shí)遠程更新中可以實(shí)現所有級別。
HAGEO軟件提供更高級別的災難恢復:
Ø Level 5;
Level 3;Ø
Ø 熱站點(diǎn)就緒。
此外,在HAGEO中,恢復站點(diǎn)同樣可以活動(dòng)的進(jìn)行數據處理和執行日常工作。實(shí)際上,每個(gè)站點(diǎn)都是其他站點(diǎn)的備份,因此它最小化了安裝成本。
HACMP對容災的貢獻
HACMP基本軟件提供了一個(gè)寬松的群集環(huán)境來(lái)防止在群集中個(gè)別系統組件(像處理器、網(wǎng)絡(luò )、網(wǎng)絡(luò )適配器)的SPOF。它確保了在一個(gè)站點(diǎn)內的計算機環(huán)境下的高可用性。
現在你已經(jīng)可以定義HACMP群集組件在一個(gè)站點(diǎn)內的系統組件和通過(guò)HACMP基本軟件功能保持在該站點(diǎn)中的系統組件的高可用性。更多信息請參考HAGEO拓撲下的HACMP/XD:規劃管理指南——SA22-7956。
圖2-9表示一個(gè)使用遠程鏡像(GeoRM)選項的地理集群。



聯(lián)系客服