欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
Yahoo舊將工程師 欲用Hadoop山寨Google_LinuxEden-Linux伊甸...

Yahoo舊將工程師 欲用Hadoop山寨Google

  
關(guān)注Linuxeden官方微博 Apache Hadoop,是一個(gè)模仿Google MapReduce架構的開(kāi)源軟件,雖然還沒(méi)有最后正式發(fā)布,但是已經(jīng)非常有影響力了。

僅僅一年的時(shí)間,Hadoop就發(fā)布了一個(gè)真正開(kāi)源的穩定版本,但是這個(gè)版本還不能稱(chēng)為1.0,只能稱(chēng)為0.20.0。盡管如此,Hadoop已經(jīng)成為eHarmony情人頻道、LinkedIn求職頻道、Fox互動(dòng)媒體社區網(wǎng)站等很多大網(wǎng)站的搜索引擎了。另外默多克傳媒、MySpace、Photobucket以及Rotten Tomatoes也都表示Hadoop為他們提供了很大的幫助。

在最近的一次采訪(fǎng)中,Hadoop創(chuàng )始人之一Doug Cutting表示自己都對Hadoop的發(fā)展速度感到吃驚。他說(shuō):“從Nutch(Hadoop的前身)開(kāi)始探索網(wǎng)絡(luò )搜索以來(lái),....我一直在尋找和挑戰突破”。還說(shuō);“那時(shí)候并沒(méi)有認為我們已經(jīng)超出了現在大規模網(wǎng)站的索引環(huán)境”。

但是在第一個(gè)穩定版本發(fā)布一年之后的幾個(gè)月里,也就是去年的ApacheCon會(huì )議上,關(guān)于Hadoop 1.0以及2010年的方向的討論變得不可思議。

該項目正朝著(zhù)一個(gè)在無(wú)需打破用戶(hù)習慣、無(wú)需重新安裝軟件或損失數據的情況下就可以升級的目標前進(jìn)。使用Hadoop,用戶(hù)在不需要徹底重建數據中心的情況下對系統進(jìn)行升級。

Yahoo將Hadoop項目?jì)?yōu)先級降低

Cutting說(shuō),他的前雇主,也就是Yahoo,這個(gè)擁有眾多支持者的企業(yè)一直都是Hadoop的唯一支持者。但是現在遇到了一些挑戰,因為Yahoo已經(jīng)開(kāi)始將重點(diǎn)傾斜向一些其他的項目了。搜索的另一個(gè)要求就是安全性,只有在安全的搜索保護下,人們才可以建設大規模私人信息集群,并且保證不讓其他人找到他們的信息。雖然安全也是Hadoop目標之一,但是Yahoo更希望能夠快速推出可用的產(chǎn)品。Cutting說(shuō),Hadoop 1.0可能沒(méi)有太大的改進(jìn),但是我們有很大的希望。

有趣的轉折

最初階段,Yahoo發(fā)起并推動(dòng)了Hadoop項目,并為該項目提供了很大的幫助。但是在2000年之后,隨著(zhù)Google公司的發(fā)展,Yahoo清楚的看到Hadoop不應該僅僅是一個(gè)網(wǎng)絡(luò )搜索引擎,更應該是一個(gè)能夠為分布式數據提供各種服務(wù)的運算架構。該架構是基于Google分布式文件系統(GFS)以及MapReduce之上。在GFS和MapReduce之前,也就是2002年的時(shí)候,Cutting已經(jīng)創(chuàng )建了Nutch這個(gè)很完善的搜索引擎,但是后來(lái)開(kāi)始遇到困難。Cutting說(shuō),當時(shí)的工作內容已經(jīng)涉及到整個(gè)互聯(lián)網(wǎng),對10億個(gè)網(wǎng)頁(yè)進(jìn)行操作是一個(gè)很痛苦的事情。

從Nutch到Hadoop

Hadoop模仿GFS和MapReduce,將大量的數據分割成小的數據塊,以達到聯(lián)合數千個(gè)服務(wù)器快速搜索的目的,并且提供單一的訪(fǎng)問(wèn)點(diǎn)。Cutting說(shuō),現在已經(jīng)能過(guò)搭建起基于20多臺服務(wù)器的演示案例,并在之上做一些實(shí)際的工作。但是不會(huì )達到所說(shuō)的數千個(gè)服務(wù)器程度,因為那么多服務(wù)器,在可靠性方面現在還確實(shí)沒(méi)有辦法保證。

就在Yahoo參與和支持Nutch,并為該項目提供工程師和設備的時(shí)候,Yahoo軟件開(kāi)發(fā)副總裁Eric Baldeschwieler發(fā)現了該項目的另一個(gè)用途,也就是迅速分析和處理位于多個(gè)網(wǎng)絡(luò )服務(wù)器上的數據。于是Cutting從Nutch中將分布計算部分單獨分離為Hadoop項目。

Cutting說(shuō)Yahoo的研發(fā)人員希望從廣告以及web服務(wù)器獲取大量數據。如果你問(wèn)一個(gè)Yahoo的研發(fā)人員如何提高廣告的相關(guān)性,他們會(huì )說(shuō)首先把數據收集到一起,然后找到這些數據的早期用戶(hù),這些人就是喜歡相關(guān)廣告的人。但是,如何分析網(wǎng)頁(yè)內容幾周內所發(fā)生的變化,這種變化每個(gè)小時(shí)都存在,并且會(huì )導致分散廣告點(diǎn)擊流量,以及如何在很短的時(shí)間內處理上TB的數據。這些都是要處理的大問(wèn)題在Yahoo將注意力放在安全問(wèn)題上的時(shí)候,Cutting繼續為Hadoop項目尋找突破點(diǎn)。他希望有其他的非Java程序員能夠參與進(jìn)來(lái),參與的方式可以通過(guò)Avro項目。

Java之外

Avro是一種數據交換格式,目標是保證在應用程序升級或修改之后依然能對數據進(jìn)行訪(fǎng)問(wèn)。當然目標也包括Python、C、以及C++等其他程序語(yǔ)言能夠支持Hadoop、MapReduce 和 HDFS。

在2009年8月,Cutting加入了Cloudera公司,該公司的業(yè)務(wù)是銷(xiāo)售流行開(kāi)源技術(shù)和服務(wù)。雖然Hadoop已經(jīng)應用在很多大型網(wǎng)站上,但是Cutting還是覺(jué)得Hadoop適合建立20個(gè)點(diǎn)左右的集群,這種集群應該比通過(guò)數據庫處理堆積如山的數據更容易。Cloudera的客戶(hù)包括NetFlix 和三星公司。

如果不希望在自己的企業(yè)里使用Hadoop,那么也可以像Amazon和Rackspace一樣,采用Hadoop提供云服務(wù)。雖然這樣做有點(diǎn)難,但是已經(jīng)有很好的支持工具了。Cutting還保證Hadoop的目標就是隱藏復雜的細節,對外提供簡(jiǎn)單的接口。

雖然現在Cutting還沒(méi)有確切的計劃,但是不會(huì )拖延Hadoop的推出

本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
《Hadoop基礎教程》之初識Hadoop
Hadoop十歲!Doug Cutting眼中大數據技術(shù)的未來(lái)
數說(shuō)(之四)·大話(huà)大數據技術(shù)之Hadoop(上)
Hadoop有什么用
獨家|一文讀懂Hadoop(一):綜述
大數據時(shí)代:大數據概念
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久