Google成功的技術(shù)秘訣:購買(mǎi)廉價(jià)計算機
Google成功的搜索引擎幕后的技術(shù)英雄非常簡(jiǎn)單:解決PC崩潰問(wèn)題。
美國加利福尼亞州伯林格姆當地時(shí)間本周三,Google負責技術(shù)和運營(yíng)的副總裁Urs Hoelzle在EclipseCon會(huì )議上透露了Google數據中心運行的一些秘密。許多人都認為,Google在運行數據中心方面的經(jīng)驗比其搜索算法更寶貴。
Google能夠以數以百萬(wàn)美元計,而不是數以千萬(wàn)美元計的資金構筑其計算基礎設施的秘密是:購買(mǎi)相對廉價(jià)的計算機。通過(guò)研究硬件成本,Google 的技術(shù)人員發(fā)現,購買(mǎi)一些高端服務(wù)器的成本要遠高于數十臺更簡(jiǎn)單的“大眾化”服務(wù)器。這種策略的難題就在于使這些硬件協(xié)調地運行,確保一臺計算機的故障不會(huì )影響任務(wù)的執行,例如返回搜索結果或顯示廣告。
Hoelzle說(shuō),我們考慮到了家用PC。家用PC因軟件和硬件缺陷而造成的崩潰每3年才會(huì )發(fā)生一次。他說(shuō),如果擁有數千臺PC,每天有一臺PC崩潰是很正常的。因此,最好是能夠以自動(dòng)的方式解決這一問(wèn)題,否則服務(wù)肯定會(huì )出現問(wèn)題。
Google已經(jīng)開(kāi)發(fā)了大量的軟件工具,來(lái)完成計算設備的安裝。它開(kāi)發(fā)了被稱(chēng)為 “Google文件系統”的文件系統,能夠處理64MB大小的數據塊。更為重要的是,它能夠應付隨時(shí)可能發(fā)生的磁盤(pán)或網(wǎng)絡(luò )故障。Hoelzle說(shuō),我們開(kāi)發(fā)了容錯軟件。如果有應付故障的措施,PC就完全可以擔負提供互聯(lián)網(wǎng)服務(wù)的重任。Google數以千計的PC服務(wù)器運行一種基于Red Hat版本的簡(jiǎn)化版Linux,該版本只是針對Google專(zhuān)門(mén)修改的操作系統內核。
Google還設計了一種能夠處理海量數據、迅速響應查詢(xún)的系統,它將整個(gè)Web劃分為數以百萬(wàn)計的Google的技術(shù)人員稱(chēng)之為shard的小塊兒。Google創(chuàng )建了一個(gè)出現在Web上的詞匯的索引,但它還有大量的文檔服務(wù)器存儲收集的網(wǎng)頁(yè)。
據Hoelzle稱(chēng),Google另一個(gè)重要的技術(shù)創(chuàng )新是,使在數以千計的服務(wù)器上運行的軟件的開(kāi)發(fā)非常簡(jiǎn)單。通常情況下,開(kāi)發(fā)在并行服務(wù)器上運行的應用軟件需要專(zhuān)門(mén)的編程工具和技能。名為MapReduce的這款編程工具對于 Google降低成本是非常重要的。Hoelzle說(shuō),成本是購買(mǎi)設備的成本和編寫(xiě)軟件的編程時(shí)間之和。從去年開(kāi)始,Google已經(jīng)開(kāi)始大面積使用 MapReduce編程工具。
Google還開(kāi)發(fā)了批量任務(wù)調度軟件。名為Global Work Queue的這款軟件能夠將計算工作分解成許多更小的任務(wù),并將它們分配給各臺計算機完成。
Hoelzle表示,盡管考慮了故障問(wèn)題,但這還不能解決所有問(wèn)題。在演講中,它展示了用于應對Google數據中心發(fā)生的緊急事件的6輛救火車(chē)的照片。
在接受CNET News.com采訪(fǎng)時(shí),Hoelzle表示,電力成本是Google的數據中心設計中的另一個(gè)重要因素。他說(shuō),不包括人力成本在內的運行成本直接與電力成本相關(guān)。電力是降低數據中心運行成本的一個(gè)因素,我們不但要降低設備采購費用,還需要降低運行成本。
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請
點(diǎn)擊舉報。