第1頁(yè):軟件與硬件方面的技術(shù)優(yōu)勢
一、從IBM處理器起源和應用來(lái)看Power技術(shù)優(yōu)勢
大家知道,IBM目前共擁有四條處理器產(chǎn)品線(xiàn):POWER體系結構,PowerPC 系列的處理器,Star 系列以及 IBM 大型機上所采用的芯片。其中PowerPC 源自于 POWER 體系結構,在 1993 年首次引入。PowerPC 是 Apple、IBM 和摩托羅拉聯(lián)盟的產(chǎn)物,它基于 POWER 體系結構,但是與 POWER 又有很多的不同。
例如,PowerPC 是開(kāi)放的,它既支持高端的內存模型,也支持低端的內存模型,而 POWER 芯片是高端的。最初的 PowerPC 設計也著(zhù)重于浮點(diǎn)性能和多處理能力的研究。當然,它也包含了大部分 POWER 指令。很多應用程序都能在 PowerPC 上正常工作,這可能需要重新編譯以進(jìn)行一些轉換。嵌入式的PowerPC處理器也在那個(gè)時(shí)代開(kāi)始得到廣泛應用,不僅出現在激光打印機和汽車(chē)中,也出現在登陸火星的火星車(chē)上。
RS64 芯片首次于 1998 年面世,在 IBM 內部稱(chēng)之為 Star 系列,這是因為大部分代碼字節中都包含了單詞“star”或類(lèi)似的單詞(其中一個(gè)比較出名的例外是最初的 RS64,其代號是“Apache”)。Star 系列芯片源自于對 PowerPC 體系結構的修改,同時(shí)還從 POWER 產(chǎn)品線(xiàn)中繼承了很多特點(diǎn)。從一開(kāi)始起,這些芯片就只針對于一種應用進(jìn)行優(yōu)化:商業(yè)應用。這種專(zhuān)用化使其在 UNIX 服務(wù)器領(lǐng)域幾乎在 10 年的時(shí)間中都牢居霸主地位。
RS64 系列將諸如分支預測、浮點(diǎn)處理以及硬件預取之類(lèi)的問(wèn)題留給其兄弟 POWER3 芯片來(lái)解決,自己則專(zhuān)注于整數運算性能和大型復雜的片上、片外緩存的處理。RS64 系列從面世以來(lái)就一直是 64 位的,2000 年在 RS64 IV 中引入了多線(xiàn)程的設計。
RS64 可以在一臺機器內擴展到多達 24 個(gè)處理器,功耗則只需要每個(gè)處理器15 瓦即可,這一點(diǎn)與其兄弟 POWER 芯片有很大的區別。這些特性使 RS64 芯片非常適合一些系統,例如聯(lián)機事務(wù)處理(OLTP)、商業(yè)智能、企業(yè)資源計劃(ERP)以及其他一些大型的、功能強大的、具有多用戶(hù)和多任務(wù)而緩存命中率很低的系統,其中包括 Web 服務(wù)。RS64 芯片只裝備在 IBM 的 eServer iSeries(RS 系列)和 pSeries(AS 系列)服務(wù)器中。
因此在Power處理器的體系結構基礎上產(chǎn)生了PowerPC 系列和Star 系列的處理器,顯示出Power處理器的強大優(yōu)勢,說(shuō)明Power應用無(wú)所不在。
二、雙核和64位處理器應用的先鋒
IBM Power處理器從1990年誕生為Power1,接著(zhù)有Power2、Power3、Power4、Power5和即將發(fā)布的Power6產(chǎn)品。Power4、Power5等處理器基本上都是雙核。POWER4處理器芯片包含兩個(gè)微處理器核心、芯片和系統滲透功能,POWER4芯片是業(yè)界第一個(gè)雙內核處理器,雖然現在幾乎所有處理器廠(chǎng)家都開(kāi)始推出各自的雙內核產(chǎn)品,但POWER4芯片有一個(gè)重大的不同。
IBM并不是由于單處理器性能提高遇到瓶頸而被動(dòng)地設計和生產(chǎn)雙內核處理器,而是在處理器設計的階段就將系統設計納入設計目標,雙內核設計只是IBM公司實(shí)現高性能服務(wù)器系統的一個(gè)手段。每個(gè)POWER4處理器內核的性能和服務(wù)器系統的整體性能都隨著(zhù)處理器時(shí)鐘的提高而同步地得到提高,數年來(lái)一直保持了在業(yè)界的性能領(lǐng)先地位。這一成績(jì)充分證明了IBM在POWER4芯片上System On Chip設計策略的成功。
POWER4的每個(gè)處理器都有 2 個(gè) 64 位的 1GHz+ 的PowerPC 核心,這是第一個(gè)單板上具有多核心設計的服務(wù)器處理器,每個(gè)處理器都可以并行執行 200 條指令。64位處理器相比原來(lái)的32處理器的處理速度快,集成了內存控制器,執行效率高,POWER4+(也稱(chēng)為 POWER4-II)功能與之類(lèi)似,但是主頻更高,功耗更低,而且在硬件上保持了32位和64位的雙向兼容,使軟件盡可能地避開(kāi)故障。
三、開(kāi)放和支持Linux系統
Power.org將開(kāi)放標準引入了Power 架構技術(shù),這將會(huì )像Java 技術(shù)和Linux 對軟件世界的影響那樣,大大加速硬件世界的改變。開(kāi)放標準的出現為客戶(hù)帶來(lái)了更多的市場(chǎng)選擇,同時(shí)也降低了不同產(chǎn)品和技術(shù)整合的門(mén)檻。
Power 架構技術(shù)是當今業(yè)界擁有最廣泛和最多樣化市場(chǎng)的微處理器,它是所有三種下一代游戲機的數字心臟,也是世界上最高性能超級計算機的電子大腦。另外, Power 架構技術(shù)也是支持各種企業(yè)服務(wù)器、汽車(chē)系統(動(dòng)力系統、高級安全系統和信息通信系統)、無(wú)線(xiàn)和有線(xiàn)基礎架構以及企業(yè)路由和交換的領(lǐng)先平臺。
IBM推出 Power ISA v2.03 之后,半導體廠(chǎng)商可在自己的產(chǎn)品中實(shí)現比以前更多類(lèi)別的功能。從未來(lái)的發(fā)展看,軟件和系統開(kāi)發(fā)人員在為廣泛的市場(chǎng)和應用開(kāi)發(fā)基于 Power 架構技術(shù)的產(chǎn)品和平臺時(shí),可以獲得一個(gè)更加一致和兼容的框架。
Power.org 聯(lián)盟還發(fā)布第一個(gè)合作開(kāi)發(fā)的開(kāi)放平臺架構,該架構被稱(chēng)為 Power 架構平臺參考規范(Power Architecture Platform. Reference specification, PAPR)。 PAPR為針對特定應用快速開(kāi)發(fā)基于 Linux操作系統的標準 Power 架構平臺奠定了基礎。這一技術(shù)規范及相關(guān)的參考為 Power.org 成員及 Power 架構開(kāi)發(fā)團體優(yōu)化商品化 Linux 版本和應用的開(kāi)發(fā)提供了一個(gè)標準平臺。
用于 POWER 微處理器體系結構的 Linux 是 Linux 發(fā)展中的一個(gè)令人興奮的成就,并且指明了 Linux 以后的演化方向?,F在,用于POWER 的Linux 也為一個(gè)具有64 位RISC 體系結構的平臺帶來(lái)了便利。Linux 可以與AIX 或OS/400 在同一個(gè)POWER 系統上同時(shí)運行,帶來(lái)zSeries 用戶(hù)才可以享受到的同樣的雙重功能。
對軟件開(kāi)發(fā)人員和系統管理員來(lái)說(shuō),用于 POWER 的 Linux 意味著(zhù)可以用類(lèi)似的方法來(lái)在不同的平臺上進(jìn)行軟件開(kāi)發(fā)和系統管理,可能會(huì )使一個(gè)單一解決方案的應用領(lǐng)域擴展到全部計算平臺。通過(guò)使用 Linux,現在有可能開(kāi)發(fā)一個(gè)可以從 xSeries 擴展到 POWER 再到 zSeries 系統的解決方案。
四、IBM Power處理器充分發(fā)揮半導體技術(shù)的優(yōu)勢
在最近 10 年中,IBM 在半導體領(lǐng)域實(shí)現了一個(gè)又一個(gè)的突破:銅技術(shù),絕緣硅,硅鍺合金,應變硅和 low-k 絕緣體,這些新技術(shù)給它的服務(wù)器CPU發(fā)展奠定了扎實(shí)的基礎。IBM的Power結構體系為廣泛的處理器提供了技術(shù)基礎,包括IBM的高端服務(wù)器芯片,以及到為計算機,服務(wù)器,手持設備和網(wǎng)絡(luò )產(chǎn)品設計的PowerPC處理器。半導體業(yè)界一直有夢(mèng)想能使用銅作為介質(zhì),這樣可以獲得比鋁好 40% 以上的電流傳輸效率。
但是直到最近制造流程才實(shí)現了這個(gè)目標。IBM 的研究人員使用鎢來(lái)生產(chǎn)基于銅的芯片,其速度比鋁快 25 倍到 30 倍。采用了這種技術(shù),通常稱(chēng)之為 CMOS XS (其中 X 是一個(gè)數字),應用到IBM Power 3-II處理器上。low-k 絕緣體這種技術(shù)使用 SiLK 來(lái)防止銅線(xiàn)“串擾”,
硅鍺合金(SiGe)在二極管芯片制造中用來(lái)代替功耗更高的砷化鎵,SiGe 可以顯著(zhù)地改善操作頻率、電流、噪音和電源容量。 絕緣硅(SoI)在硅表面之間放上很薄的一層絕緣體,可以防止晶體管的“電子效應”,這樣可以實(shí)現更高的性能和更低的功耗。這些先進(jìn)技術(shù)在IBM Power4及以后的處理器已經(jīng)廣泛應用。
五、IBM Power處理器使用低功耗、高頻和并發(fā)多線(xiàn)程
Power處理器使用的應變硅這種技術(shù)對硅進(jìn)行拉伸,從而加速電子在芯片內的流動(dòng),不用進(jìn)行小型化就可以提高性能和降低功耗。如果與絕緣硅技術(shù)一起使用,應變硅技術(shù)可以更大程度地提高性能并降低功耗。POWER5芯片比POWER4芯片多集成了約一億個(gè)晶體管,所以同樣時(shí)鐘頻率時(shí)POWER5芯片具有較大的功耗。
但IBM在POWER5種提供了最先進(jìn)的功耗管理技術(shù),打開(kāi)動(dòng)態(tài)功耗管理器時(shí)POWER5的功耗會(huì )下降到與POWER4相當的程度。其先進(jìn)性在于,其它功耗管理技術(shù)都是通過(guò)在處理器負荷不重時(shí)降低芯片頻率/電壓,從而降低處理器性能而實(shí)現的。Power5依然采用多核心高頻設計,設計卻全面依賴(lài)自動(dòng)化工具和邏輯設計。
POWER5在性能提升方面是在在處理器內核中加入了對并發(fā)多線(xiàn)程的支持,這是業(yè)界首個(gè)雙內核雙線(xiàn)程的芯片。每個(gè)POWER5處理器支持兩個(gè)并發(fā)線(xiàn)程,顯著(zhù)提高了處理器執行單元的使用率。在操作系統和應用看來(lái),一個(gè)“雙核心”、“雙線(xiàn)程”的POWER5芯片可以提供四個(gè)邏輯處理器,并且對應用程序毫無(wú)特殊要求。并發(fā)多線(xiàn)程技術(shù)的價(jià)值在于,它更充分地利用了POWER5內核中的8個(gè)執行單元,減少了閑置、提高了效率,用較少的代價(jià)提供了更高的性能。
六、“Power定律”和虛擬化發(fā)揮IBM Power處理器的最大優(yōu)勢
“Power是未來(lái)Unix世界的必然方向”這個(gè)所謂“定律”的含義時(shí)說(shuō),Power作為業(yè)界成熟穩健的技術(shù)架構,在十余年的發(fā)展歷程中已歷經(jīng)5代重大升級,現在新的p5系統在系統效用、性能表現、靈活性和IT管理成本上的重大突破,成就了IBM在Unix領(lǐng)域的技術(shù)分水嶺,進(jìn)一步拉大了IBM與競爭對手間的差距。
Power等式:IBM對Power的最新解釋是,Power是Performance(可靠)、Optimization(優(yōu)化)、Wisdom(智能)、Efficiency(高效)和Reliability(可靠)的縮寫(xiě)。POWER架構處理器始終保持1-2年的領(lǐng)先性,現在的主流產(chǎn)品為POWER5,而回溯歷史上的POWER3、POWER4,無(wú)不是如期交付;展望未來(lái)的POWER6、POWER7,無(wú)不給用戶(hù)信心保證。作為一家技術(shù)領(lǐng)先的公司,IBM對于Power架構研發(fā)有著(zhù)持續巨大的投入,僅2004年4月以來(lái),已有超過(guò)1400余名研發(fā)人員加入了Power架構團隊。Power架構所采用的銅芯片、絕緣硅、多內核和并發(fā)多線(xiàn)程技術(shù)領(lǐng)先使得IBM Power處理器發(fā)揮更大優(yōu)勢。
通過(guò)IBM AIX操作系統對POWER處理器實(shí)現虛擬化技術(shù)管理,采用這種虛擬化的技術(shù)可以提高資源的利用率,也就是說(shuō)可以完全按照需求準確的分配資源;可以隨時(shí)部署新的操作系統的映像(邏輯分區),因為可以通過(guò)I/O的虛擬化和處理器的虛擬化實(shí)現這樣一個(gè)目標;通過(guò)虛擬化可以提高響應能力,比如在10毫秒甚至更快的速度內,就可以針對新的操作系統的映像規劃資源。
這樣就可以讓用戶(hù)及時(shí)的滿(mǎn)足預期的需求或者是超過(guò)預期的一些峰值的需求。使用虛擬化帶來(lái)的好處,用戶(hù)可以從IT的投資當中獲得收益的最大化。
作為用戶(hù)他們需要了解產(chǎn)品可以滿(mǎn)足他們怎樣的發(fā)展需求,作為技術(shù)人員他們需要對產(chǎn)品的特點(diǎn)及新技術(shù)有一個(gè)初步的了解,作為廠(chǎng)商他們需要讓更多用戶(hù)去了解并使用他們的產(chǎn)品。作為媒體則是一個(gè)廠(chǎng)商與用戶(hù)之間的橋梁?;仡橮ower架構的發(fā)展已經(jīng)經(jīng)歷了風(fēng)雨27載,而從第一顆Power處理器的誕生到現在也已經(jīng)過(guò)了18年。
第2頁(yè):制造工藝優(yōu)勢與未來(lái)展望
1.銅芯片(Copper),1997年9月――出于很多技術(shù)原因,大多數人認為在芯片中取代鋁線(xiàn)布線(xiàn)基本不可能。但IBM的工作小組克服了這些技術(shù)問(wèn)題,很快地將銅線(xiàn)投入到生產(chǎn)中,其結果使芯片性能立刻得到提高?,F在,IBM的開(kāi)創(chuàng )性技術(shù)仍然是行業(yè)的標準。
2.絕緣硅(SOI),1998年8月――絕緣硅(Silicon on Insulator)技術(shù)通過(guò)在現代芯片上絕緣隔離數以百萬(wàn)計的晶體管,從而實(shí)現了功耗的降低和性能的提高。在IBM開(kāi)發(fā)出這項技術(shù)前,半導體行業(yè)對絕緣硅技術(shù)的研究已經(jīng)進(jìn)行了15年。
3.應變硅(Strained Silicon),2001年6月――該項技術(shù)可以拉伸芯片內的材料,降低阻抗和加快電子流過(guò)晶體管的速度,從而提高性能和降低功耗。
4.雙內核微處理器(Dual-Core Microprocessors),2001年10月――全球第一個(gè)雙內核微處理器POWER4作為Regatta的一部分發(fā)布,Regatta是一款System p服務(wù)器,是當時(shí)世界上功能最強大的服務(wù)器。自此兩年多以后――對于技術(shù)行業(yè)這是一個(gè)漫長(cháng)的時(shí)間,我們的第一個(gè)競爭對手才將雙內核芯片投放市場(chǎng)。
5.浸沒(méi)式光刻(Immersion Lithography ),2004年12月――IBM宣布在全球首次采用這項新的制造技術(shù),即可以使芯片尺寸可以做得更小的技術(shù),來(lái)生產(chǎn)商用微處理器。
6.冷凍硅鍺芯片(Frozen SiGe Chip),2006年6月――上世紀90年代,IBM首次采用硅鍺(SiGe)取代了更加昂貴和不穩定的材料,制造出了尺寸更小、速度更快和成本更低的芯片,這使IBM開(kāi)始向經(jīng)營(yíng)無(wú)線(xiàn)產(chǎn)品,如移動(dòng)電話(huà)和路由器的公司銷(xiāo)售芯片。去年,IBM通過(guò)與NASA提供支持的Georgia科技公司合作,又突破了硅鍺技術(shù)的限制,向全球展示了第一款能夠在500GHz頻率以上工作的硅基芯片――通過(guò)將芯片冷凍到接近絕對零度來(lái)實(shí)現。
7.高電介質(zhì)(High-k),2007年1月――IBM宣布推出一種解決方案來(lái)解決業(yè)界最頭痛的問(wèn)題之一,即晶體管電流泄漏問(wèn)題。通過(guò)采用新的材料,IBM將制造出具有“高電介質(zhì)金屬門(mén)(High-k metal gates)”的芯片,從而使產(chǎn)品的性能更好、尺寸更小、能源效率更高。
8.嵌入式動(dòng)態(tài)隨機訪(fǎng)問(wèn)存儲器(eDRAM),2007年2月――通過(guò)在微處理器芯片上采用創(chuàng )新的新型快速動(dòng)態(tài)隨機訪(fǎng)問(wèn)存儲器(DRAM)取代靜態(tài)存儲器(SRAM),IBM能夠實(shí)現三倍以上容量的嵌入式內存,并使性能得到極大提高。
9.三維芯片堆疊(3-D Chip Stacking),2007年4月――IBM宣布采用“穿透硅通道(through-silicon vias)”技術(shù)制造三維芯片,穿透硅通道使半導體可以垂直疊放,而原來(lái)只能接近水平依次排放,這樣就可以將關(guān)鍵線(xiàn)路路徑的長(cháng)度縮短最高達1000倍。
10.Airgap,2007年5月――使用“自組裝”納米技術(shù),IBM在Power架構的微處理器內數英里長(cháng)的線(xiàn)路之間創(chuàng )造出一種真空狀態(tài),這樣就減少了不必要的電容,提高了性能和能源效率。小熊在線(xiàn)www.beareyes.com.cn
在2004年5月IBM公司推出了最新研發(fā)的POWER 5處理器,它是一款新一代的64位微處理器,適用于64位計算系統,同時(shí)還向下兼容32位系統。它除了在性能方面得到明顯提高外,在可擴展性、靈活性和可靠性方面也有所加強。POWER5芯片具有27,600萬(wàn)個(gè)晶體管,比最初的POWER4芯片(具有17,400萬(wàn)個(gè)晶體管)多10,000萬(wàn)個(gè)。芯片面積為389平方毫米,包括2313個(gè)信號I/O和3057個(gè)電源I/O。
基于Power 4及Power 4+的設計,POWER 5增加了并發(fā)多線(xiàn)程能力(SMT),可以將一個(gè)處理器轉變?yōu)閮蓚€(gè)處理器,從而允許一個(gè)芯片同時(shí)運行兩個(gè)應用,由此大大降低了完成一項任務(wù)所需要的時(shí)間。一個(gè)POWER5系統最終將支持多達64個(gè)處理器,這樣從軟件運行角度來(lái)看,就好像是128個(gè)處理器在工作。
POWER5的設計是IBM系統設計師、芯片架構設計師、軟件工程師和技術(shù)人員緊密協(xié)作的成果。對于功耗而言,POWER5在不影響性能的前提下使用動(dòng)態(tài)電源管理來(lái)顯著(zhù)降低最大功耗。功耗由兩部分組成:交換功耗和泄漏功耗,這兩項功耗在POWER5中均得到了認真的調整,從而保證了在新的芯片中功耗降為最低。POWER5微處理器將采用130納米結點(diǎn)CMOS工藝制造,同時(shí)采用絕緣硅器件和銅線(xiàn)布線(xiàn)技術(shù)。
就芯片技術(shù)而言,Power 5將達到大型機的95%或97%。而且,Power 5幾乎能夠檢測和恢復系統所有錯誤,其性能估計可達到前一代產(chǎn)品--Power 4的4倍。另外,Power 5還提供了IBM的Fast Path新技術(shù),即在出現問(wèn)題時(shí),一個(gè)微處理器可快速接管問(wèn)題微處理器所運行的軟件任務(wù)和其控制的網(wǎng)絡(luò )、硬盤(pán)等硬件設備。小熊在線(xiàn)www.beareyes.com.cn
來(lái)源:服務(wù)器在線(xiàn)
IBM POWER 6處理器緣何背道而馳
編者按:于5月24日正式發(fā)布的IBM POWER 6處理器給人們帶來(lái)了許多“意料之外”,如它與業(yè)界趨勢背道而馳,注重提升主頻而非增加內核;又如它性能比前一代產(chǎn)品提升一倍但功耗卻與后者持平;再如它一反常規,率先被用于IBM p系列服務(wù)器而非i系列……這些變化到底因何所致,本文將做詳細分析。
CNET科技資訊網(wǎng)6月5日
北京報道 就在越來(lái)越多的廠(chǎng)商熱衷?xún)群藬盗扛傎?,推崇多核的時(shí)候,IBM卻在剛剛推出的POWER 6處理器上延續了雙核設計;就在人們已經(jīng)不再“熱捧”高主頻,因為它會(huì )讓處理器散熱困難、功耗過(guò)高時(shí),IBM卻推出業(yè)界最快的處理器——POWER 6,主頻達到4.7GHz,并且在功耗上與上一代產(chǎn)品持平。POWER 6這些“背道而馳”的做法,帶給業(yè)界的是一片嘩然,帶給用戶(hù)的是更多的期許,而帶給IBM自己的,不知道是“籌碼”,還是“風(fēng)險”。
為何提速度不增內核
其實(shí)了解IBM的人都知道,它的處理器多核化步伐比競爭對手走得都要快,早在2001年第二季度,它就推出了世界上第一款雙核處理器——POWER 4。但是為什么在業(yè)界普遍推崇多核的今天,IBM卻駐足雙核,逆勢而為呢?
據IBM POWER系統項目管理副總裁Erich K. Baier介紹,伴隨芯片主頻的提升,散熱問(wèn)題會(huì )變得越來(lái)越嚴重,一方面這將消耗更多的電能,另一方面,散熱問(wèn)題也會(huì )限制芯片的制造材質(zhì)。由此推斷,在IBM看來(lái),別的競爭對手之所以主攻多核,是因為他們已經(jīng)無(wú)法再繼續提高單一處理器的主頻了。
但IBM推出的POWER 6,一方面在功耗控制方面采用了獨特的技術(shù),另一方面在制造環(huán)節上采用了65納米絕緣硅(SOI)及10層金屬互連工藝,這兩方面因素讓IBM在提高單一處理器主頻時(shí)能夠做到無(wú)后顧之憂(yōu),使得POWER 6的主頻能夠達到目前業(yè)界的最快——4.7GHz,而與上一代POWER處理器相比,POWER 6卻在功耗不變的情況下,將性能提升了1倍。
IBM System i系列全球首席科學(xué)家Frank G.Soltis博士也告訴記者,其實(shí)IBM處理器技術(shù)的獨到之處不在于內核的數量而在于帶寬,此次POWER 6的帶寬就達到了300GB/s,可以在大約60秒內下載整個(gè)iTunes目錄。Erich還表示:“很多競爭對手都把主要精力放在如何提升處理器的性能上,卻忽略了整個(gè)服務(wù)器系統向處理器傳遞數據的能力,這樣很難發(fā)揮處理器的速度優(yōu)勢?!?div style="height:15px;">
這讓記者聯(lián)想到了英特爾的酷睿架構處理器,這款處理器雖然性能強勁,但是由于帶寬不足,目前只能發(fā)揮約70%的性能,而明年英特爾在新一代Nehalem架構處理器平臺上,將導入點(diǎn)到點(diǎn)的串行高帶寬直連總線(xiàn)以取代現有的并行前端總線(xiàn),以充分釋放其性能潛力。
雖然POWER 6延續了雙核的設計,但這并不表示IBM對多核不積極,據介紹,IBM與東芝、索尼共同開(kāi)發(fā)的Cell處理器就是目前最受業(yè)界矚目的一款多核、而且是異構多核處理器,它已經(jīng)在包括索尼PS3游戲機、IBM刀片服務(wù)器在內的多種產(chǎn)品上得到成功應用。
擎起性能的“殺手锏”
據Frank博士介紹,POWER 6處理器在實(shí)驗室的主頻已達到6-7GHz,IBM只是根據市場(chǎng)應用情況,目前率先推出4.7GHz主頻的型號而已,這一頻率已是POWER 5主頻2.2GHz的2倍多。
對于POWER 6為何能在性能上達到上一代產(chǎn)品2倍的問(wèn)題,Frank博士表示,IBM在這款處理器中采用了一種可提高芯片性能的新方法,它主要是通過(guò)在保持指令隊列階段(在一個(gè)時(shí)鐘周期內必須完成大量的操作)的數目不變的情況下使得每個(gè)階段更快速,同時(shí)去除不必要的工作,并盡可能多的進(jìn)行并行操作,這樣,執行時(shí)間就能削減一半。
記者在上文中提到的POWER 6在總線(xiàn)帶寬上的優(yōu)勢,也是其性能獲得提升的一個(gè)保證。為了與300GB/s的帶寬保持同步,POWER 6還配備了高達8MB的二級緩存。據了解,POWER 6還添加了能夠加速許多多媒體計算任務(wù)的全新指令集,可通過(guò)對多個(gè)數據元素執行同一條指令,來(lái)提高運行多媒體和高性能計算任務(wù)時(shí)的數據處理效率。
除了這些新添的特性外,POWER 6高性能表現的基礎還是在于它雙核+單核同時(shí)雙線(xiàn)程的設計,這實(shí)際上符合了未來(lái)處理器融合CMP(芯片多線(xiàn)程)和SMT(同時(shí)多線(xiàn)程)技術(shù)的設計思想。
談到這一設計思想,就不能不提Sun公司的UltraSPARC T1處理器,它采用的CMT(芯片多線(xiàn)程)技術(shù)實(shí)際上也是CMP+SMT的產(chǎn)物,不過(guò)該處理器可集成8個(gè)內核,每個(gè)內核同時(shí)擁有4線(xiàn)程處理能力,這使得它擁有最高達32個(gè)線(xiàn)程的并行處理能力。
對于競爭對手對更多線(xiàn)程處理能力的追求,IBM有不同看法,Frank博士稱(chēng),多線(xiàn)程技術(shù)雖可提高同一時(shí)間內并行處理任務(wù)的效率和能力,但是卻需要軟件開(kāi)發(fā)商提供相關(guān)軟件的支持。以IBM AS400來(lái)說(shuō),早在1995年就實(shí)現了雙線(xiàn)程,但是IBM當時(shí)在改造支持雙線(xiàn)程的系統軟件上花了很多功夫。
由此看來(lái),目前多線(xiàn)程技術(shù)的推出可能容易,但是軟件廠(chǎng)商、客戶(hù)自行開(kāi)發(fā)相關(guān)應用卻很難,在Frank博士看來(lái),這可能需要5-10年。而與此相反,目前很多企業(yè)的應用卻還非常需要單線(xiàn)程技術(shù)。
值得一提的是,為了滿(mǎn)足部分高端用戶(hù)對更高性能的需求,IBM還將推出封裝4顆POWER 6處理器芯片及大容量三級緩存的MCM(多處理器模塊)作為POWER 6的高端型號。
如何做到功耗不變
Frank博士告訴記者,芯片性能和功耗一直是成正比關(guān)系的,而POWER 6在時(shí)鐘頻率增加1倍的情況下,能夠做到功耗不變,秘訣在何處呢?
我們發(fā)現,POWER 6將那些不支持低電壓工作的電路隔離到自己的供電線(xiàn)路上,這樣就降低了芯片其余部分的功耗;另外,POWER 6上的電壓/頻率是可調的,這一功能通過(guò)一個(gè)控制系統來(lái)實(shí)現,而電壓/頻率究竟應該是多少的決策權在用戶(hù)手中,他們可以決定系統需要耗費多少電能。
此外,POWER 6還采用其他一些技術(shù)來(lái)節省電力,比如在沒(méi)有工作負載時(shí),處理器時(shí)鐘可以動(dòng)態(tài)關(guān)閉,而需要執行指令時(shí)可立即開(kāi)啟,當檢測到服務(wù)器溫度過(guò)高時(shí),POWER 6芯片可降低指令執行的速度,以保證其在用戶(hù)定義的可接受范圍內工作。
這一優(yōu)勢還能讓IBM刀片服務(wù)器受益。據記者了解,在以往IBM的刀片服務(wù)器產(chǎn)品上,是不能采用POWER 5或者POWER 5+處理器的,因為它們的功耗過(guò)高,正因為如此,IBM的刀片服務(wù)器才會(huì )擁有自己的特殊處理器——POWER PC。
而今,由于POWER 6的設計使它在低電壓下也能運行,并且可以控制功耗,如此一來(lái),POWER 6除了可用于IBM的System i和p系列服務(wù)器,還可用在它的刀片服務(wù)器產(chǎn)品線(xiàn)上。
p570創(chuàng )25項基準測試紀錄
POWER 6處理器的性能究竟如何,我們可以從IBM率先采用POWER 6的服務(wù)器產(chǎn)品——System p570身上找到答案。
System p570囊括了四大UNIX基準測試速度記錄。這四項性能基準測試包括:SPECint2006——衡量業(yè)務(wù)應用中常用的整數計算吞吐量,p570是市場(chǎng)上相關(guān)產(chǎn)品最好性能的2.3倍;SPECfp2006——衡量科學(xué)應用所需要的浮點(diǎn)計算吞吐量,p570是市場(chǎng)上相關(guān)產(chǎn)品最好性能的2.3倍;SPECjbb2005——衡量每秒業(yè)務(wù)運行的Java性能,p570是市場(chǎng)上相關(guān)產(chǎn)品最好性能的2倍;TPC-C——衡量交易處理能力。據了解,System p570在一系列業(yè)務(wù)和技術(shù)應用性能基準測試中擁有25項記錄。
就p570的實(shí)際應用表現來(lái)說(shuō),由于POWER 6是業(yè)
界首款在硬件上支持十進(jìn)制浮點(diǎn)運算的處理器,而此前涉及十進(jìn)制和浮點(diǎn)十進(jìn)制的計算都是由軟件完成,p570通過(guò)POWER 6獲得的內置十進(jìn)制浮點(diǎn)運算能力帶來(lái)的最大好處,就在于讓企業(yè)運行比較復雜的稅收、金融和ERP程序時(shí)可以獲得更高的效率。
p570的另一大優(yōu)勢,就是為客戶(hù)提供了在保持連續可用性的條件下,將正在運行的虛擬機從一臺實(shí)際UNIX服務(wù)器遷移到另外一臺服務(wù)器上的能力。憑借POWER 6的實(shí)時(shí)分區遷移功能(Live Partition Mobility),該項技術(shù)(目前正處于測試階段,計劃于今年底正式推出)將使客戶(hù)能夠在不中斷操作的情況下遷移運行中的虛擬分區,而其他競爭產(chǎn)品則需要對UNIX系統和軟件堆棧進(jìn)行中斷性重啟。
IBM的擴張“陰謀”
借助POWER 6,IBM打算使用組合拳進(jìn)攻對手,很多看似無(wú)意的舉措背后,早就有著(zhù)深思熟慮。
在POWER 6的發(fā)布會(huì )上,與POWER 6同時(shí)出現的是p570服務(wù)器,可謂賺盡風(fēng)頭。而在以往,POWER芯片都會(huì )在IBM的i系列產(chǎn)品上率先推出,正因為如此,i系列一直給用戶(hù)一種技術(shù)領(lǐng)先的感覺(jué)。那么為什么這次POWER 6卻把i系列放在后面,轉而優(yōu)先照顧p系列呢?
當記者把這個(gè)問(wèn)題拋給IBM System i系列服務(wù)器亞太區總經(jīng)理韓忠恒時(shí),他表示,因為p系列更需要POWER 6。i系列產(chǎn)品需要的不是性能多么強的處理器,而是更好的應用,i系列的用戶(hù)看重的是產(chǎn)品的解決方案,而并不關(guān)注是否用了POWER 6。
在記者看來(lái),IBM優(yōu)先選擇p570,還在于p系列定位在主流的行業(yè)市場(chǎng)段上,而p570則在p系列服務(wù)器中占據著(zhù)最大的市場(chǎng)份額和營(yíng)業(yè)額,更加重要的是,IBM的競爭對手在這一市場(chǎng)段同樣擁有較高的市場(chǎng)份額,選擇在p570上采用POWER 6,也是在向競爭對手宣戰。而且,銷(xiāo)售情況一直較好的、采用POWER 5+的p570也不會(huì )因為POWER 6的到來(lái)而消失,兩類(lèi)產(chǎn)品將在市場(chǎng)上并行前進(jìn),以雙拳攻擊對手。
多數業(yè)內人士一直都不懷疑IBM有能力鞏固現有的用戶(hù),但他們對IBM去爭取新的用戶(hù)轉向IBM平臺則缺乏足夠的信心,畢竟在Unix陣營(yíng),IBM的競爭對手還有Sun與富士通主導的SPARC陣營(yíng),以及英特爾、惠普、SGI、NEC等廠(chǎng)商組成的安騰陣營(yíng)。
對此,Erich表示,針對競爭對手,IBM已推出了用戶(hù)遷移計劃,打算通過(guò)遷移工廠(chǎng)(Migration Factory)和大集中工廠(chǎng)(Consolidation Factory)來(lái)幫助用戶(hù)從現有平臺遷移到IBM平臺上,據他介紹,去年IBM的遷移工廠(chǎng)已經(jīng)遷移了430個(gè)客戶(hù),其中超過(guò)80%是從惠普、Sun的平臺上遷移過(guò)來(lái)的。
而最讓人震驚的是,IBM除希望通過(guò)遷移計劃把競爭對手的用戶(hù)“搶”過(guò)來(lái)外,它還在推進(jìn)另一個(gè)計劃。據Frank博士透露,IBM希望開(kāi)發(fā)一個(gè)能夠兼容不同處理器的插槽,有了這樣一個(gè)標準化的插槽,處理器類(lèi)型的差別將完全變得微不足道,不過(guò)英特爾已經(jīng)對這一計劃說(shuō)“不”。Frank博士稱(chēng),IBM這一計劃現在已經(jīng)得到了AMD的支持,他認為這將對POWER 7的設計思路帶來(lái)影響。
競爭對手從容面對
對于POWER 6的發(fā)布,它的競爭對手們并沒(méi)有給予任何激烈的回應,如果說(shuō)POWER 6能給他們帶來(lái)什么意外的話(huà),那就是這款處理器的發(fā)布時(shí)間要比他們預期的時(shí)間晚了許多。
作為IBM在RISC+UNIX服務(wù)器市場(chǎng)上目前最主要的競爭對手,Sun在IBM發(fā)布POWER 6的同一周也在中國推出了它與富士通合作研發(fā)、采用UltraSPARC T1及富士通SPARC 64-VI處理器的SPARC Enterprise系列服務(wù)器新品,創(chuàng )下了SPARC服務(wù)器系統的性能新高,而且其中還有數款機型融入了可與大型機比肩的RAS (可靠性、可用性和可服務(wù)性)特性。談及POWER 6時(shí),SUN方面僅表示,從技術(shù)上來(lái)說(shuō),每家廠(chǎng)商都有一些自己獨有的優(yōu)勢,關(guān)鍵是看這些優(yōu)勢在哪個(gè)領(lǐng)域能發(fā)揮得更好。
據記者了解,面對POWER 6的攻勢,SUN用來(lái)應戰的武器應是面向高端市場(chǎng)、借助CMT技術(shù)可實(shí)現32線(xiàn)程并行處理的ROCK處理器,該處理器目前已進(jìn)入Tapeout (完成設計交付制造) 階段,將于2008年上市。
POWER 6必須面對的另一個(gè)競爭對手,就是英特爾的安騰。對于POWER 6,英特爾方面未做任何評論。不過(guò),在記者日前參加英特爾服務(wù)器處理器信息溝通會(huì )時(shí),英特爾向記者展示了市場(chǎng)調研機構IDC對安騰服務(wù)器的市場(chǎng)追蹤數據。IDC的數據稱(chēng)去年安騰服務(wù)器系統在全球的銷(xiāo)售收入同比增長(cháng)了70.5%,而且在中國市場(chǎng)上,安騰服務(wù)器銷(xiāo)售收入的增長(cháng)速度也遠遠超過(guò)了基于POWER處理器的服務(wù)器。
英特爾給安騰的市場(chǎng)定位是要爭奪高端UNIX服務(wù)器市場(chǎng),為了達到這一目標,安騰處理器保持了非常高的產(chǎn)品更新速度,根據英特爾的產(chǎn)品路線(xiàn)圖,它從今年起至2011年,幾乎每?jì)赡昃蜁?huì )推出一代新品,而且,計劃在2008-2009年推出的代號為T(mén)ukwila的安騰處理器中將開(kāi)始導入點(diǎn)到點(diǎn)高速串行總線(xiàn),以解決處理器平臺數據帶寬不足的問(wèn)題,此外,英特爾還計劃在此期間與合作伙伴攜手將安騰系統的可靠性提升到接近大型機的99.99999%,并將其性能再提升6倍左右。
不可忽視的用戶(hù)慣性
在記者看來(lái),IBM要想成功讓更多用戶(hù)從競爭對手的平臺遷移到自己的平臺上,面臨的挑戰還不僅僅是這些競爭對手新產(chǎn)品的狙擊,如何克服用戶(hù)的慣性也是關(guān)鍵所在。
就像用慣了POWER服務(wù)器+AIX操作系統產(chǎn)品組合的用戶(hù)很難接受X86服務(wù)器+Windows/Linux這一組合一樣,如果讓習慣使用后一種組合的用戶(hù)遷移到前一種組合上去,難度也非常大,這就是用戶(hù)的慣性。
要讓用戶(hù)克服這種慣性,僅僅幫助他們遷移了硬件平臺和應用還遠遠不夠,相關(guān)人員的培訓、技術(shù)支持和服務(wù)也必須做到位。英特爾在推
廣安騰時(shí)曾經(jīng)與這種慣性進(jìn)行了數年的較量,如今換成IBM,也同樣不可能一蹴而就。
如果IBM希望達到爭奪更多新用戶(hù)的目標,僅僅秀出POWER 6及其服務(wù)器系統的性能指標還是不夠的,它還需要在推進(jìn)技術(shù)的開(kāi)放性和拓展合作伙伴方面多下功夫。
文/張曉楠 袁超
POWER 大事記
POWER 架構發(fā)展史
1980 1990 1991 1993 1994 19951996 1997 1998 1999 2000 20012002 2003 2004 2005 20061980
IBM 發(fā)布了第一臺基于 RISC(精簡(jiǎn)指令集計算機)架構的原型機。早在上世紀 70年代初,基于 IBM 科學(xué)家 John Cocke 的發(fā)明,RISC 的理念大大簡(jiǎn)化了計算機操作指令,加快系統運行速度,使得計算機性能得到大幅度提升。如今,RISC 架構已經(jīng)廣泛應用于眾多工作站和 UNIX 服務(wù)器系統中,并被看作是未來(lái)主流的計算架構。
返回頁(yè)首1990
IBM 推出基于 RISC 系統、運行 AIX V3 的新產(chǎn)品線(xiàn) RS/6000(現在稱(chēng)為 IBM eServer p 系列)。該系統架構后來(lái)被稱(chēng)為 POWER(POWER1),意為增強 RISC 性能優(yōu)化(Performance Optimization With Enhanced RISC)架構。
返回頁(yè)首1991
IBM 和蘋(píng)果、摩托羅拉公司達成一系列合作協(xié)議,內容包括:推出支持蘋(píng)果 Macintosh 個(gè)人電腦與 IBM 網(wǎng)絡(luò )相連的全新產(chǎn)品;推出面向 PC 機和低成本工作站的 RISC 架構 PowerPC 處理器;形成一個(gè)開(kāi)放的系統環(huán)境,保證 IBM AIX 和蘋(píng)果 Macintosh 軟件程序在兩家公司設計的 RISC 系統中都能運行。此外,開(kāi)放的系統環(huán)境包括其他一些技術(shù)協(xié)議。
返回頁(yè)首1993
IBM 推出可升級的 POWER 并行系統,這是第一款采用 RS/6000 技術(shù),基于微處理器的超級計算機。在該系統中,IBM 首次應用多處理器技術(shù),可將復雜密集的任務(wù)進(jìn)行分解,大大加快了計算機的運算速度,開(kāi)創(chuàng )了業(yè)界先河。
IBM 和摩托羅拉公司推出 PowerPC 601 處理器,該處理器是與蘋(píng)果共同開(kāi)發(fā)的。PowerPC 上集成 280 多萬(wàn)個(gè)晶體管,主頻為 50 MHz。
IBM 發(fā)布了 66 MHz 的 POWER2 處理器,首先應用于 RS/6000 系統。
返回頁(yè)首1994
IBM 推出可升級的 POWER 并行系統 2 (Scalable POWERparallel,SP2)。美國康乃爾理論研究中心配備了 SP2 超級計算機,運行速度高達 1360億次/秒。歐洲粒子物理學(xué)實(shí)驗室(CERN)采用一款64節點(diǎn)、運行 AIX 系統的 IBM SP2,速度位于歐洲前列。
IBM 成功研發(fā)出新一代 PowerPC 604 處理器,其強大的處理性能在批量生產(chǎn)的處理器產(chǎn)品中處于領(lǐng)先地位。IBM 技術(shù)人員還推出了業(yè)內最快的“無(wú)損”數據壓縮芯片,每秒鐘能處理 40 MB 數據。7 月,IBM 交付第一百萬(wàn)個(gè) PowerPC 601 處理器。
IBM 發(fā)布首個(gè)基于 Power 架構的嵌入式控制器 PowerPC 403GA。
返回頁(yè)首1995
PowerPC64 位 RISC 處理器開(kāi)始應用于 IBM AS/400 操作系統中。
8 月,蘋(píng)果公司推出首款基于 Power 架構的筆記本電腦 PowerBook 500,它采用 IBM 的 PowerPC 603e 處理器 。
返回頁(yè)首1996
IBM 推出全新的 32 位 POWER2 超級芯片(P2SC),主頻達 135 MHz ,首先應用于 RS/6000 系統?;?POWER2 架構的 P2SC 采用了高密度 CMOS 技術(shù),單個(gè)芯片上集成 1500 萬(wàn)個(gè)晶體管。
返回頁(yè)首1997
IBM“深藍”超級計算機在經(jīng)過(guò)多局較量后,擊敗了國際象棋冠軍 Garry Kasparov?!吧钏{”是一款 32 節點(diǎn)的 IBM RS/6000 SP 計算機,處理器采用 32 位 P2SC,運行 AIX 操作系統。在比賽期間,“深藍”的平均運算速度為每秒 1 億 2600 萬(wàn)步。目前,這臺超級計算機被安放在美國華盛頓特區的史密森國家博物館內。 IBM 為美國國家宇航局提供一款 32 位的 PowerPC 微處理器,其運算速度可達每秒 3500 萬(wàn)次,主要用于火星探測計劃。經(jīng)過(guò)洛克希德馬丁實(shí)驗室改造后,最終形成可抗輻射的 RAD 6000 芯片,植入火星登陸車(chē) Sojourner Rover 內部的計算機系統中。
返回頁(yè)首1998
由 IBM 和美國勞倫斯利弗莫爾國家實(shí)驗室共同研發(fā)的“藍色太平洋”超級計算機問(wèn)世。這臺計算機采用 PowerPC 604 處理器,主頻高達 332 MHz,系統包含 176 個(gè)節點(diǎn),最高運算速度為每秒 3.9 萬(wàn)億次(比一般臺式電腦快 1.5 萬(wàn)倍),存儲容量超過(guò) 2.6 TB (是普通 PC 機的 8 萬(wàn)倍)?!八{色太平洋”一秒鐘內的計算量相當于一個(gè)人使用計算器連續計算 6 萬(wàn) 3 千年的總和。
IBM 推出世界上第一組基于銅的微處理器 PowerPC 740/750,工作頻率為 400 MHz。由于使用了銅芯片技術(shù),處理性能提高了近 1/3。
全新 64 位 POWER3 處理器將 POWER2 架構(P2SC) 與 PowerPC 架構相結合,并對技術(shù)應用進(jìn)行了優(yōu)化。POWER3 的最高運算速度可達每秒 200 萬(wàn)次,比“深藍”所采用的 POWER2 超級芯片快出一倍多。
IBM 公布了首個(gè)基于 Power 的嵌入式系統芯片(SoC)內核。不久之后,PowerPC 405 內核也將同其他 IP 相結合,形成嵌入式 SoC 微處理器和基于 Power 的特定應用集成電路(ASIC)解決方案。
返回頁(yè)首1999
IBM 研究院投資 1 億美金開(kāi)發(fā)一種新型的 Power 架構超級計算機。這種名為“藍色基因”的計算機峰值速度超過(guò) 1 Peta FLOP,比當時(shí)最快的超級計算機高出 500 倍。它將被用來(lái)模擬復雜蛋白質(zhì)的折疊。
自正式推出銅芯片一年后,IBM 交付了第一百萬(wàn)個(gè)銅技術(shù) PowerPC 芯片。
6 月,IBM 發(fā)布了第一個(gè)基于 405 內核的系統芯片 PowerPC 405GP。下半年,IBM 即推出了再下一代嵌入式 PowerPC 內核。
IBM 與任天堂公司共同宣布了一項價(jià)值 10 億美元的技術(shù)協(xié)議,IBM 將為任天堂的下一代家庭游戲機 GAMECUBE 提供增強版 PowerPC 芯片。新產(chǎn)品性能將超出任何其他家庭游戲系統,為玩家呈現更佳的圖像效果和更逼真的動(dòng)作畫(huà)面。
返回頁(yè)首2000
IBM 宣布將高速 PowerPC 處理器與電視機頂盒(STB)組件一起整合到一個(gè)“單芯片系統”上,從而在系統性能、價(jià)格和設計等方面為機頂盒廠(chǎng)商帶來(lái)競爭優(yōu)勢。該單芯片系統擁有眾多的先進(jìn)應用,并能幫助三星等公司靈活應對不斷變化的客戶(hù)需求。
IBM 將 RS/6000 更名為 IBM eServer p 系列。
返回頁(yè)首2001
IBM 新一代超機計算機“ASCI White”在美國勞倫斯利弗莫爾國家實(shí)驗室投入使用,運算速度高達每秒 12.3 萬(wàn)億次,主要用于模擬核爆炸試驗。作為美國國家核安全管理局 (NNSA)提高戰略運算能力計劃(ASCI)的組成部分,該系統強大的運算能力可以在不到 1 分鐘時(shí)間內處理地球上每個(gè)人發(fā)出的一次互聯(lián)網(wǎng)操作請求。
在經(jīng)過(guò) 5 年潛心研發(fā)后,IBM 推出世界上最強大的 UNIX 服務(wù)器— eServer p690(“Regatta”)。新系統基于先進(jìn)的 POWER 4 處理器,集成了多項主機技術(shù)。由多臺 p690 服務(wù)器連接而成的超級計算機擁有 1000 多個(gè) POWER 4 處理器,能夠完成最為復雜的運算任務(wù)。
索尼、東芝和 IBM 宣布合作,共同開(kāi)發(fā)一種用于寬帶設備的高級芯片架構,這款代號為“CELL”的芯片將采用業(yè)界最先進(jìn)的芯片研發(fā)和制造技術(shù)。應用該產(chǎn)品的設備性能將超過(guò) IBM“深藍”超級計算機,并能以更低的功耗實(shí)現超高速寬帶上網(wǎng)。
返回頁(yè)首2002
IBM 推出 64 位 PowerPC 970 處理器, 這款高性能產(chǎn)品可應用于普通臺式機、入門(mén)級服務(wù)器等多種環(huán)境中。64 位的 PowerPC 970 芯片基于 POWER 4 服務(wù)器架構,采用獨特的單指令多數據流(SIMD)單元,擁有超強處理性能。此外,它還采用了“Elastic I/O”內部總線(xiàn)結構,這是業(yè)界最快的處理器總線(xiàn)之一。
IBM 推出速度更快的 POWER4+ 。截至 2003 年,POWER4+ 已經(jīng)應用于全部 pSeries 產(chǎn)品線(xiàn)。
IBM 推出 32 路 eServer iSeries 890 服務(wù)器,其處理性能為 i840 的兩倍,采用 1.3 GHz POWER 4 處理器,單個(gè)芯片上集成了 1 億 7400 萬(wàn)個(gè)晶體管。
IBM 推出嵌入式 PowerPC 440GP 和 PowerPC 440GX 處理器,主要運行嵌入式網(wǎng)絡(luò )和存儲應用。PowerPC 440GX 擁有 TCP/IP 負載加速功能,在全部的 5 項 EEMBC 基準測試中得分均高于任何其它的“單芯片系統”處理器。
返回頁(yè)首2003
IBM 宣布一個(gè)有關(guān) 32 位嵌入式 PowerPC 內核的公開(kāi)授權計劃。
IBM 和蘋(píng)果公司聯(lián)手推出世界上第一款 64 位臺式機處理器—PowerPC G5,工作頻率達 2.0 GHz。蘋(píng)果公司稱(chēng)新的 Power Mac G5 電腦是“世界上最快的個(gè)人電腦”。
IBM 宣布推出劃時(shí)代的“Blue Gene/L”原型機。這款超級計算機尺寸僅相當于 30 英寸彩電大小,它的問(wèn)世將為科學(xué)界和 IT 業(yè)發(fā)展帶來(lái)深遠影響。最終版“Blue Gene/L”超級計算機將于 2005 年誕生,占地面積相當于半個(gè)網(wǎng)球場(chǎng),總共包含 65536 個(gè)節點(diǎn)(PowerPC)和 64 個(gè)機架,預計其峰值速度將達到360Tera Flops。
IBM 宣布 eServer pSeries 630 將采用 POWER4+ 處理器。等到 eServer pSeriesp615 發(fā)布后,POWER4+ 已經(jīng)應用于全部 pSeries 產(chǎn)品線(xiàn)。
IBM 推出首款采用 64 位 PowerPC 技術(shù)的刀片服務(wù)器 BladeCenter JS20,擴大了客戶(hù)的選擇范圍,提高投資回報率,實(shí)現快速經(jīng)濟的計算性能擴展。
IBM 推出全新的 PowerPC 750GX。與 PowerPC 750 相比,新產(chǎn)品的二級緩存擴大了一倍,由原先的 512KB 變?yōu)?1MB。
返回頁(yè)首2004
IBM 宣布開(kāi)發(fā)出一種制造低功耗、高性能微處理器的新方法,首次把絕緣硅(SOI)、應變硅和銅制程三種技術(shù)工藝結合在一起。64 位 PowerPC 970FX 成為首款采用新技術(shù)生產(chǎn)的處理器產(chǎn)品,并在業(yè)內評選中榮獲大獎。
IBM 交付第 4000 臺 eServer p690 服務(wù)器,該產(chǎn)品基于 POWER 架構,是世界上最受歡迎的 UNIX 服務(wù)器。
IBM 發(fā)布“Power Everywhere”戰略,圍繞 POWER 架構開(kāi)展一系列合作計劃,并建立 POWER 技術(shù)創(chuàng )新社區。從全球最強大的企業(yè)系統、超級計算機到普通游戲機、嵌入式設備,POWER 架構已經(jīng)廣泛應用于各類(lèi)產(chǎn)品中。
索尼公司宣布取得 IBM Power 處理器架構授權。索尼表示,POWER 產(chǎn)品豐富的功能和低功耗、高性能的特點(diǎn)將使其成為客戶(hù)設備的首選。
IBM 推出業(yè)界首款基于 Power 架構的刀片服務(wù)器—eServer BladeCenter JS20。
IBM 在全球范圍內建立 Power 架構中心,為客戶(hù)設計 POWER 系統提供支持。
IBM 推出一項創(chuàng )新的軟件技術(shù),幫助客戶(hù)開(kāi)發(fā)先進(jìn)的 Power 架構處理器,并對設計流程進(jìn)行整合,以實(shí)現更快速、更經(jīng)濟的研發(fā)目標。
IBM 正式發(fā)布新的 eServer i5 服務(wù)器,這是世界上第一臺采用 POWER5 處理器的服務(wù)器產(chǎn)品。具有劃時(shí)代意義的 POWER5 是 IBM 有史以來(lái)最強大的 64 位處理器。
IBM 推出基于 POWER 5 處理器的 OpenPower 720 服務(wù)器,相對于 HP 和 Sun 的入門(mén)級 UNIX 和 Linux 系統而言,這款 Linux 專(zhuān)用服務(wù)器有著(zhù)明顯的價(jià)格優(yōu)勢。
IBM 在其 developerWorks 網(wǎng)站上(
www.ibm.com/developerWorks) 開(kāi)辟了 Power 架構技術(shù)專(zhuān)區,為眾多基于 POWER 平臺的芯片設計人員、驗證工程師、嵌入式系統及軟件研發(fā)人員提供豐富的技術(shù)資源。
IBM 推出基于POWER 架構的 TotalStorage DS6000 和 DS8000 存儲系統。
IBM 推出三款全新的 POWER 5 服務(wù)器,樹(shù)立起高端計算領(lǐng)域的新標準。其中,IBM eServer p5 595、eServer i5 595 擁有強大的處理性能和虛擬能力,而 32 路的 IBM eServer p5 590 和 eServer pSeries p690 相比,速度高出 45%,價(jià)格則降低 45%。
在網(wǎng)絡(luò )設備市場(chǎng)上,Power 架構服務(wù)器占據了三分之二的市場(chǎng)份額。
自 2004 年 4 月以來(lái),已有超過(guò) 1400 名研發(fā)人員加入了 Power 架構團隊。
IBM“Blue Gene/L”超越日本 NEC 公司的地球模擬器,成為世界上速度最快的超級計算機。在Linpack基準測試中,IBM“Blue Gene/L”系統的性能達到360Tera Flops,刷新了地球模擬器在 2002 年創(chuàng )造的 35.86 Tflop 的世界記錄。
在全球排名前 10 位的超級計算機中,共有 5 臺采用了 Power 架構,比第二位高出一倍。
IBM 預發(fā)布新的高密度 POWER 5 服務(wù)器系統— IBM eServer p5 575。該產(chǎn)品可以通過(guò)簡(jiǎn)單的集群方式組成高性能超級計算機,為未來(lái)超級計算機的發(fā)展指明了方向。
IBM 宣布,基于 POWER 5 處理器、運行 DB2 通用數據庫的 IBM eServer 服務(wù)器在 TPC-C 基準測試中突破了每分鐘 300 萬(wàn)次的處理極限,創(chuàng )造了新的世界紀錄。
返回頁(yè)首2005
10 月,IBM 發(fā)布 System p5 產(chǎn)品線(xiàn),采用基于POWER5處理器的增強版——POWER5+處理器,并提供一系列更優(yōu)化功能。產(chǎn)品一經(jīng)推出,就打破 15 項計算領(lǐng)域的世界紀錄。
新的POWER5+處理器被稱(chēng)為“片上服務(wù)器”(server on a chip),它包括 2 個(gè)處理器,一個(gè)高帶寬系統交換器,一個(gè)更大高速緩存和 I/O 界面。最新的 POWER5+有 1.5 和 1.9 GHz 兩個(gè)主頻選擇,最大 72 MB 板上高速緩存,支持邏輯分區技術(shù),可使 System p5 為用戶(hù)提供更強大性能,而占用面積更小。
發(fā)布 QCM 技術(shù),即四處理器內核模塊。
返回頁(yè)首2006
2 月,發(fā)布破多項記錄的 System p5 中端產(chǎn)品,最大限度滿(mǎn)足用戶(hù)對產(chǎn)品不同定位的需求。截至本次發(fā)布,System p5 產(chǎn)品所取得的世界記錄已經(jīng)達到 70 余項,其動(dòng)力主要來(lái)自以全新 2.2 GHz POWER5+處理器為代表的 POWER 處理器,和顯著(zhù)提高計算密度的 QCM(4 內核處理器模塊)處理器封裝技術(shù),后者可使產(chǎn)品在緊湊空間中成倍增加了計算能力。
返回頁(yè)首采用 POWER5 虛擬技術(shù)進(jìn)行服務(wù)器整合
隨著(zhù)用戶(hù)不斷要求降低 IT 基礎架構運行成本,服務(wù)器整合的重要性被提到了前所未有的高度。服務(wù)器整合指通過(guò)減少分散的基礎設備的數量來(lái)簡(jiǎn)化和優(yōu)化 IT 環(huán)境。服務(wù)器整合將首先從應用環(huán)境開(kāi)始,包括應用服務(wù)器和數據庫服務(wù)器,并相應的對涉及的物理服務(wù)器、網(wǎng)絡(luò )和存儲進(jìn)行優(yōu)化。服務(wù)器整合的優(yōu)點(diǎn)本文不再贅述,而將重點(diǎn)放在基于 POWER5 的 p5 服務(wù)器進(jìn)行服務(wù)器整合的實(shí)踐和效果上。
服務(wù)器整合已經(jīng)變得更加容易,原因在于新一代服務(wù)器硬件和邏輯分區可以整合分散在多個(gè)小系統上的應用,并集中到一臺大服務(wù)器上。新近推出的 IBM eServer p5 家族產(chǎn)品傳承了自大型主機上的虛擬引擎技術(shù),該技術(shù)可提取硬件上的物理屬性,通過(guò)整合實(shí)現更靈活更經(jīng)濟的系統運行模式。
IBM 先進(jìn)的 POWER 虛擬技術(shù)
一直以來(lái),IBM 都是虛擬化技術(shù)的倡導者和領(lǐng)航者。隨著(zhù) eServer p5 服務(wù)器的發(fā)布,其上所附帶的虛擬功能進(jìn)一步擴大了 IBM 在該領(lǐng)域的領(lǐng)先優(yōu)勢。IBM 的 POWER 虛擬技術(shù)包括微分區和虛擬 I/O(磁盤(pán)和通信適配器的虛擬),下面將著(zhù)重探討微分區的實(shí)踐。
微分區能實(shí)現在一臺服務(wù)器上運行比物理處理器數量更多的分區,該功能成為 eServer p5 服務(wù)器上最富有革命性的新亮點(diǎn)。圖一展示了分區技術(shù)的演進(jìn),其中最左邊是傳統的對稱(chēng)多處理器系統的結構圖,由一個(gè)操作系統管理整個(gè)系統的計算資源。圖一中間部分展示了邏輯分區(LPAR)的結構圖,它于 2001 年在 p 系列 690 服務(wù)器和 AIX 5L 操作系統平臺上首次公布。在邏輯分區的支持下,一個(gè)系統內可獨立的運行多個(gè)分區,每個(gè)分區運行獨立的操作系統。在這一環(huán)境下,邏輯分區的 CPU“顆?!保℅ranularity)是和物理處理器一樣大的,也就是說(shuō),每顆物理處理器的計算力不能被切割,只能對處理器進(jìn)行捆綁,這樣,也就不可能劃分出比物理處理器數量更多的分區。2003 年,IBM 推出了 AIX 5L V5.2 操作系統,進(jìn)一步擴展了這一代邏輯分區功能,可實(shí)現在聯(lián)機狀態(tài)下對邏輯分區中的計算資源進(jìn)行調度,即所謂動(dòng)態(tài)邏輯分區(DLPAR),但 CPU“顆?!辈](méi)有進(jìn)一步減小。今天,eServer p5 服務(wù)器上最新的微分區技術(shù)打破了分區上 CPU“顆?!笔芪锢硖幚砥鲾盗康南拗?,系統可以創(chuàng )建和運行比物理處理器數量更多的分區(如圖一最右邊),進(jìn)一步提升了系統的靈活性。
為了測試 eServer p5 進(jìn)行服務(wù)器整合的效果,并以測試數據說(shuō)明整合對整個(gè) IT 基礎架構簡(jiǎn)化所起到的作用,我們搭建了一個(gè)分離的 IT 環(huán)境來(lái)模擬用戶(hù)原有的基礎架構,然后在此基礎上進(jìn)行服務(wù)器整合實(shí)踐和測試,并得出測試結論。
系統整合規劃
在進(jìn)行系統整合之前,我們需要對整合做出全程規劃。
先介紹一下我們所模擬的原有用戶(hù)環(huán)境:原有 5 臺服務(wù)器,每臺均為 IBM RS/6000 44P-270,配置 375MHz 處理器,4MB L2 緩存,7GB 系統內存,每臺服務(wù)器連接一臺 IBM 串行磁盤(pán)系統 D40。每臺服務(wù)器運行同樣的軟件堆棧:AIX 5L V5.2 操作系統,WebSphere WAS5.0,和數據庫 DB2 Universal Database V8.1 FP4。應用服務(wù)器上的應用軟件基于 J2EE 代碼,運行多種類(lèi)型的交易,負載輕重程度不同。
制定系統整合規劃首先要確定遺留服務(wù)器上原有應用對處理器、內存和 I/O 的需求。我們通過(guò)測試應用環(huán)境,確定了服務(wù)器峰值 CPU 利用率。如果從一個(gè)長(cháng)期角度來(lái)看,大多數服務(wù)器上 CPU 的利用率差異很大,但一般來(lái)說(shuō),峰值多出現在一天的某個(gè)時(shí)段。本次,我們以峰值使用情況作為系統整合規劃的基準,但其實(shí)這么做也是保守的,因為在即將實(shí)施的 5 個(gè)系統分區完全有可能在同一時(shí)間沖擊峰值。不過(guò),考慮到峰值確保了即使在最困難的環(huán)境下,服務(wù)調度的質(zhì)量也能得到保證。本例取現有服務(wù)器運行峰值的 1.33 倍為新系統計劃值。
我們計劃將 44P-270 所附帶的 SSA 磁盤(pán)子系統移植到整合平臺上,因為測試顯示原有磁盤(pán)系統的性能足夠滿(mǎn)足新環(huán)境。這簡(jiǎn)化了客戶(hù)移植過(guò)程,并能在新舊環(huán)境對比時(shí)結果更直觀(guān)可靠。
系統整合規劃中對原服務(wù)器和用于整合的 eServer p5 服務(wù)器的比對和規劃基于
IBM 服務(wù)器 rPerf 測試值列表(英文) 。44P-270 系統的 rPerf 測試值為 3.59,考慮到服務(wù)器的利用率在 60%左右,所以用于整合的服務(wù)器的 rPerf 測試值要高于 14.3(每臺 3.59rPerf 測試值×60%利用率×5 臺×1.33 增長(cháng)空間=14.3rPerf 測試值)。根據該值,最適合原有環(huán)境的服務(wù)器是配置四顆 1.65GHz POWER5 處理器的 eServer p5 570,其 rPerf 測試值為 19.66。該配置 p5 570 的 rPerf 測試值比需求略高,不過(guò)也為以后的成長(cháng)留了一定的空間。這樣的空間一方面避免 rPerf 測試值與實(shí)際情況的差異,另一方面也為微分區功能留有余地,畢竟在高系統負荷下,并發(fā)執行多個(gè)分區也會(huì )占用系統資源,具體占用量視系統利用率和應用特征而不同。
雖然原有系統每臺配置了 7GB 的內存,但實(shí)際中有比較多的富余,這在系統整合工作中經(jīng)常遇到。為新系統中 5 個(gè)分區配置的內存數量為 16GB,這樣每個(gè)分區 3GB 內存,對于新環(huán)境十分充足。
測試負載描述
性能測試應用是用來(lái)測試 p5 570 和原服務(wù)器所組成的 2 層測試環(huán)境的性能表現。第一層包括用來(lái)驅動(dòng)“系統在測”(System Under Test)的設備,第二層包括 WebSphere 應用服務(wù)器和 DB2 數據庫服務(wù)器,均運行 32 位內核的 AIX 5L。因為應用服務(wù)器和數據庫服務(wù)器在同一操作系統中運行,所以之間不需要外部的通信連接。
測試環(huán)境使用了典型的請求和響應模式,模擬的用戶(hù)通過(guò) Web 瀏覽器提出請求,服務(wù)器處理請求并向用戶(hù)發(fā)回反饋。應用基于 Java2 平臺,并使用企業(yè)版技術(shù)(J2EE)。圖 2 描述了整個(gè)流程。Enterprise Java Beans(EJBs)執行 IBM 應用服務(wù)器和 DB2 數據庫服務(wù)器,經(jīng)由 EJBs,負載通過(guò) Web 層接入應用。此環(huán)境還利用了 Java Messaging service(JMS)和 Message Queue(MQ)基礎架構來(lái)提高其復雜性和真實(shí)度。負載運行了多種交易類(lèi)型,既有大 CPU 負載的運算,又有小負載的。
測試環(huán)境描述
測試環(huán)境包括一個(gè)基準平臺(見(jiàn)圖 3 右側)和一個(gè)目標平臺,每個(gè)平臺都包括一個(gè)服務(wù)器(SUT)和一個(gè)驅動(dòng)器。原有服務(wù)器平臺包括的服務(wù)器驅動(dòng)器都是 44P-270 系統,運行 32 位內核的 AIX 5L V5.2,均配置 4 路 375MHz 處理器和一個(gè) 10/100Mbps 網(wǎng)卡。原有服務(wù)器通過(guò)一塊 SSA 適配器連接外部存儲。系統整合平臺包括一臺 IBM eServer p5 570 服務(wù)器,運行 1.65GHz POWER5 處理器,并虛擬出 5 個(gè)微分區。為對應原來(lái)的服務(wù)器系統及測試目的,由相同的 44P-270 系統驅動(dòng)每個(gè)分區。每個(gè)分區運行 32 位內核的 AIX 5L V5.3,并分配了 0.8 個(gè) POWER5 處理器,分區對 CPU 的占用被鎖定。每分區包括一個(gè) SCSI 適配器、一個(gè) SSA 適配器和一個(gè) 10/100Mbps 網(wǎng)卡,3GB 物理內存。用一個(gè) Cisco100Mbps 全雙工網(wǎng)絡(luò )交換機組網(wǎng),服務(wù)器和客戶(hù)端通過(guò)它進(jìn)行通訊。
每個(gè)分區和對應原有系統使用一個(gè) 9GB SCSI 硬盤(pán)用于 AIX 5L 鏡像,16×9GB SSA 磁盤(pán)系統配置成 2 個(gè)環(huán)路(loop),運行數據庫、DB2 日志、基于 Web 的 Java 的應用和數據分析倉庫。寫(xiě)密集型數據庫日志放在第二個(gè)環(huán)路中,確保得到最好的性能表現。
5 個(gè)分區和原有系統都采用相同的應用堆棧,并裝有 JDK 1.4、WAS 5.1GM、MQ 和 DB2 V8+FixPack 4,同時(shí)安裝了 DB2 JDBC 驅動(dòng)器,來(lái)運行性能工作負荷。
評價(jià)整合效果—第一部分
下面我們將詳細介紹系統的測試結果,從而展示在客戶(hù)負載不斷提高的情況下,實(shí)施微分區的服務(wù)器系統與原有服務(wù)器系統的性能差異。測試中,通過(guò)逼近原有服務(wù)器的峰值模擬不斷增加的客戶(hù),隨著(zhù)驅動(dòng)工作負載的客戶(hù)數量的增加,負載開(kāi)始傾斜。測試開(kāi)始時(shí),以 25 次/秒運行驅動(dòng)一個(gè)服務(wù)器分區,其他 4 個(gè)分區運行 AIX 5L 但沒(méi)有活動(dòng)工作負載。然后,3 個(gè)分區空閑,2 個(gè)分區加上 25 次/秒運行的負荷。隨后,加載分區數量不斷增加,最后 5 個(gè)分區都加上了負載。
圖 4 顯示隨著(zhù)加載分區數量的不斷增加,吞吐量的增加呈線(xiàn)性增長(cháng)。
為評價(jià)系統提供服務(wù)的質(zhì)量,我們對每種交易類(lèi)型的響應時(shí)間進(jìn)行了監測。因活動(dòng)分區數與交易響應時(shí)間呈線(xiàn)性,我們將分析重點(diǎn)集中在中等強度的工作負荷交易上。圖 5 顯示了隨著(zhù)加載分區數量的增加響應的變化情況。圖形說(shuō)明平均響應時(shí)間并未隨分區負載增加而顯著(zhù)提高,第 90 個(gè)百分點(diǎn)的響應時(shí)間也與傳統服務(wù)器環(huán)境中隨 CPU 利用率增加的情況類(lèi)似。
實(shí)際上響應時(shí)間對于這樣的工作負載來(lái)說(shuō),受微分區的影響非常小。管理程序的分派機制足夠精細,能讓分區迅速響應且效率很高,不會(huì )對分區吞吐量有顯著(zhù)影響。
圖 6 比較了在相同運行情況下,分區服務(wù)器與原有服務(wù)器的響應時(shí)間。在持續不斷的相同工作負荷下,每個(gè)活動(dòng)分區的響應時(shí)間和吞吐量類(lèi)似或好于原有服務(wù)器。這是因為 p5 570 有更強大的處理器,在 CPU 密集型的計算中更有效。
圖 7 顯示在所有測試中,所驅動(dòng)的工作負荷都非常平緩。同時(shí),與原有服務(wù)器的比較在所測量的工作負荷上非常精確。
數據還說(shuō)明當原有服務(wù)器接近峰值時(shí),分區服務(wù)器的升高始終低于原有服務(wù)器負載的升高。此外,性能的接近顯示當初根據原有服務(wù)器的使用情況規劃所需服務(wù)器的配置十分準確。在該工作負荷水平下,eServer p5 服務(wù)器上的 5 個(gè)活動(dòng)分區正好能取代原來(lái)的設備。
評價(jià)整合效果—第二部分
下一個(gè)數據顯示了在更高吞吐量下,分區服務(wù)器處理工作符合的能力。在工作負荷過(guò)載的情況下,該配置的分區服務(wù)器仍然能夠提供相當理想的計算服務(wù)表現。
在圖 8 的比較中,我們測試了加載的 5 個(gè)分區,并做了兩種情況的比較。第一種情況,每個(gè)分區加載了 25 次/秒運行,第二種情況則加載了 33 次/秒運行。圖 8 對比了在中等交易強度下,平均和第 90 個(gè)百分點(diǎn)的響應時(shí)間。在 33 次/秒運行負荷下,分區服務(wù)器系統利用率達到 90%。服務(wù)器利用率越高,響應時(shí)間越受影響,這一事實(shí)與測試中響應時(shí)間增加相關(guān)。不過(guò)測試證明,即使在如此高的利用率下,分區服務(wù)器的響應低于規劃的標準。
結論
結論有三點(diǎn):
第一,在一臺 p5 570 上所虛擬的 5 個(gè)分區的性能與 5 臺不堪重負的 44P-270 旗鼓相當。配置 IBM 虛擬引擎系統技術(shù)的 eServer p5 服務(wù)器具有相當的可擴展性和精細度,能有效的發(fā)揮 4 顆 POWER5 處理器的效能,在要求苛刻的 Web 應用服務(wù)環(huán)境中,比原有服務(wù)器上 20 顆 POWER3 處理器表現更好。
第二,eServer p5 虛擬技術(shù)所實(shí)現的分區服務(wù)器與 5 臺按應用分配的原有服務(wù)器表現相當。微分區不會(huì )約束典型工作負載的響應。
第三,分區或未分區設備的計算性能可直接進(jìn)行換算,證明利用微分區進(jìn)行服務(wù)器整合簡(jiǎn)便易行。