Google真正的競爭力是什么?是搜索引擎? 是Gmail, Gmap, G-whatever? 當然,Google是靠搜索引擎起家的。它在這方面的品牌優(yōu)勢是目前誰(shuí)也比不了的。但這真的是Google的優(yōu)勢么?為什么一個(gè)百度在中國就能比它更受歡迎呢? 老實(shí)說(shuō), 做網(wǎng)站誰(shuí)不會(huì )啊, 尤其是放個(gè)文本框, 敲進(jìn)去什么馬上就能再回來(lái)一頁(yè),誰(shuí)都會(huì )學(xué)。后臺的技術(shù)也不見(jiàn)得有多深奧,所以百度能夠提供和Google一樣的服務(wù)和速度。
那么Google的競爭力到底在哪里呢? Google在北美已經(jīng)買(mǎi)了一個(gè)遍布美國的光纖骨干網(wǎng), Google的視頻服務(wù)也正在測試之中,Google到底想干什么呢?Google的核心到底是什么呢,它超越于一般網(wǎng)站的地方到底在何處?
一家之言,我覺(jué)得答案就是Cluster, Google自己的Cluster。Cluster可以翻譯成集群式計算機。它是由多個(gè)PC組成的分布式的計算機系統。這些PC的所有的內存構成了這個(gè)分布式計算機的內存。所有的硬盤(pán)構成了找個(gè)分布式計算機的存儲空間。把這些廉價(jià)PC機集合在一起, 讓它們有機的工作, 在外面看來(lái)就象一臺超級計算機Cluster的關(guān)鍵技術(shù)就是Cluster的軟件。而Google正是在Cluster的軟件技術(shù)方面無(wú)人能及。
讓十臺,二十臺甚至一百臺PC機協(xié)同工作已經(jīng)不是什么難的技術(shù)了,國內也有研究所在做這方面的工作。Cluster的軟件最關(guān)鍵的指標就是可擴展性(Scalability), 五百臺在一起能不能正常工作,一千臺呢, 兩千臺呢?這其中涉及到的如何利用分布式的CPU, 內存和硬盤(pán)資源, 學(xué)問(wèn)可就大了。Google使用基于Linux的Cluster已經(jīng)不是秘密了。外接對Google Cluster到底有多大一直有所猜測,但Goolge從來(lái)不公布它有關(guān)自己Cluster 的信息。Google的新聞發(fā)言人在被問(wèn)及此事的時(shí)候,只是大概的說(shuō)Google的Cluster大概有一萬(wàn)個(gè)節點(diǎn)。也就是說(shuō)由一萬(wàn)臺PC組成的分布式計算系統。這已經(jīng)是一個(gè)很驚人的數字了?!「匾氖?, 超大規模計算機是非常昂貴的產(chǎn)品,而基于Linux的Cluster的出現是超級計算機的性?xún)r(jià)比大大降低了。有了強有力的Cluster軟件,只需把能找到的PC往上堆就行了。
然而有人根據Google發(fā)布的一些關(guān)于它系統的數字進(jìn)行分析,發(fā)現Google 很有可能在隱瞞它的Cluster的真正大小?!≌嬲腉oogle Cluster的大小,可能在十萬(wàn)個(gè)節點(diǎn)左右,而且還在增加之中!這是一個(gè)非常驚人的數字,能夠讓這么多節點(diǎn)協(xié)同工作,對Cluster軟件的要求非常的高。這個(gè)系統就像一個(gè)超大規模的蟻穴一樣,所有的節點(diǎn)都在分工合作。這個(gè)系統是永遠也不會(huì )down機的,在任意一個(gè)給定的時(shí)刻,肯定會(huì )有一定數量的PC機是損壞的,但它們能夠被及時(shí)的更換。你見(jiàn)到過(guò)Google的主頁(yè)有down機的時(shí)候么, 速度慢的時(shí)候也很少, 這是全世界幾億使用者的共同經(jīng)驗!
有了這樣一個(gè)超大規模的計算機系統,超大規模的計算能力,超大規模的存儲系統,是可以做很多事情的?!∽⒁獾紾mail 的空間一直在增加了么?這證明了Goolge對于海量?jì)却娴墓芾砟芰υ诓粩嘣黾樱ㄖ徊贿^(guò)是不斷往上摞PC罷了:))?!∮羞@樣一個(gè)超大規模的分布式系統,節點(diǎn)分布在全國各地,這個(gè)系統對于互聯(lián)網(wǎng)內容的輸送能力就顯而易見(jiàn)了。那么還缺什么呢, 當然是一個(gè)可以覆蓋全國的IP骨干網(wǎng)。這也就是為什么Google, 一個(gè)網(wǎng)站公司, 要買(mǎi)一個(gè)遍布美國的光纖骨干網(wǎng)的原因。
制造超過(guò)上萬(wàn)節點(diǎn)的分布式計算機系統,全世界只有兩家公司掌握了這個(gè)技術(shù), 一個(gè)是Google, 一個(gè)是Akamai, Akamai是做Content Delivery的, 也就是把網(wǎng)站的內容更快的送到用戶(hù)的手中,Akamai使用它的分布式計算機系統來(lái)為網(wǎng)站發(fā)布內容, AOL, CNN等都是它的客戶(hù)。Google正在全美高速興建它的數據中心,現在已經(jīng)有了40到50個(gè),未來(lái)會(huì )發(fā)展到上百個(gè),而這些數據中心也是它超大規模分布式系統的一部分。
這個(gè)龐大的Cluster并沒(méi)有一個(gè)中央處理器,在地理位置上也是遍及全美各地Google的數據中心,每個(gè)節點(diǎn)都是這個(gè)系統的一部分,一臺廉價(jià)的PC機,在安裝了cluster軟件后,立即融入到這個(gè)系統之中。掌握了建立以廉價(jià)PC為節點(diǎn)的超大規模Cluster 的構造技術(shù),這才是Google 真正的競爭力。。。 |