手邊有一份 2005 Winter TopTen Award Winners的報告,包含了一些關(guān)于世界上排名前幾位的 VLDB 的信息。VLDB,超大數據庫,其實(shí)叫做"狂大數據庫"倒是也很貼切。
如果不區分操作系統環(huán)境,Yahoo! 力拔數據倉庫一項的頭籌,單個(gè)數據庫數據大小接近 100T 。采用的是 Oracle 數據庫,部署在 Unix 上, 存儲是 EMC 的設備。這是 2005年的數據,雅虎現在每日接近 40 億 PV,這個(gè)數據倉庫現在應該遠超 100T 了吧。 電信巨頭 AT&T 的數據倉庫屈居亞軍。Amazon 的兩個(gè)數據倉庫也不小,數據量多達 24773 GB,是用 Oracle RAC 實(shí)現的,部署在 Linux 操作系統上。
OLTP Top 10
我比較關(guān)心 OLTP 數據庫的情況。下面這個(gè)圖表是包括所有操作系統環(huán)境的 OLTP 數據庫情況。前 10 名中只有兩個(gè)采用了集群,而且都是集中式集群(Centralized/Cluster)。其余8個(gè)席位都采用了 SMP 架構,而且大多是集中式(Centralized)。分布式超大 OLTP 的成功案例看來(lái)并不多(只有 1 例,另外有一例是Federated)。讓 Fenng 稍微有些驚訝的是 SQL Server 占了三個(gè)席位,數據量最大接近 8T 。整個(gè)表看來(lái),數據庫類(lèi)別、所用的軟件平臺還真的比較平均。并非我想象的完全是 DB2/Oracle+Unix 的格局。
Unix 上 OLTP TOP 10
下表是使用 Unix 操作系統 OLTP TOP 10。好家伙,幾乎清一色的 Oracle。DB2 不見(jiàn)蹤影,只有 Sybase ASE 還算爭氣,占了一個(gè)席位。 9 個(gè) Unix 平臺上的 Oracle OLTP DB,只有兩個(gè)使用了 RAC ,其他都是 Centralized/SMP。
到現在為止,都還沒(méi)有看到互聯(lián)網(wǎng)站點(diǎn)的身影。

Linux 上 OLTP Top
終于有互聯(lián)網(wǎng)公司出現了。仍然全部是 Oracle 數據庫。而且, 四個(gè)中的三個(gè)都是通過(guò) RAC 來(lái)實(shí)現的。

從上面的數據可以作如下總結:
1) Linux 上 Oracle 通過(guò) RAC 可以提高擴展能力;
2) 但是,Oracle RAC 的擴展性并非那么好;
如果從峰值處理能力(Peak Workload)的角度上看,Oracle 就不那么風(fēng)光了。DB2 與 CA 的 CA-Datacom 瓜分了 10個(gè) 席位。操作系統平臺都是 z/OS。 排在第一的是 UPS 的數據庫系統,每個(gè)小時(shí)處理 1,134,034,718 條 SQL 語(yǔ)句。很強悍。
或許有個(gè)的朋友看過(guò)我介紹的 eBay 的數據量,可能比較納悶,為何整個(gè)報告中沒(méi)有 eBay 數據庫上榜? Fenng 猜測是 eBay SOA 化之后,單個(gè)的數據庫就并不大了,這樣也避免了風(fēng)險。
(這份報告的 PDF 下載)

