2013-05-06 16:15 來(lái)源:參考消息網(wǎng)
參考消息網(wǎng)5月6日報道 美國《外交》雜志5-6月一期刊登題為《大數據的興起》的文章,作者是英國《經(jīng)濟學(xué)家》雜志數據編輯肯尼思·內爾·丘基爾和牛津大學(xué)互聯(lián)網(wǎng)研究院互聯(lián)網(wǎng)管理與法規教授維克托·梅耶—舍恩伯格。文章稱(chēng),每個(gè)人都知道互聯(lián)網(wǎng)改變了企業(yè)經(jīng)營(yíng)、政府運作以及人們生活的方式。但是一種新的、不那么明顯的技術(shù)趨勢卻有著(zhù)同樣巨大的變革能力,那就是“大數據”。大數據的趨勢發(fā)端于下面這個(gè)事實(shí):如今到處傳播的信息比以往任何時(shí)候都多出了許多,而且這一趨勢正在應用于非同尋常的新用途。大數據與互聯(lián)網(wǎng)截然不同,雖然互聯(lián)網(wǎng)使數據的收集和共享方便了很多。大數據的意義并不僅僅是通信:其本質(zhì)是我們可以從大量的信息中學(xué)習到從較少量的信息中無(wú)法獲取的東西。
將改變人類(lèi)思考方式
文章指出,早在公元前3世紀,亞歷山大圖書(shū)館被認為收藏了全部的人類(lèi)知識。而如果把當今全世界的信息平分給每一個(gè)活著(zhù)的人,那么每個(gè)人擁有的信息量將足足超過(guò)當年亞歷山大圖書(shū)館全部藏書(shū)的320倍。如果把所有這些信息刻到光盤(pán)上并且分5摞疊起來(lái)的話(huà),那么這些光盤(pán)可以一直堆到月球。
這種數據爆炸是相對新鮮的現象。僅僅在2000年的時(shí)候,全世界全部的存儲信息中還只有1/4是數字化的,其余的都保存在紙張、膠片和其他模擬介質(zhì)上。但是由于數字數據數量的增長(cháng)十分迅速——幾乎每三年就翻一番,這種情形很快發(fā)生了逆轉。如今,在所有存儲信息中只有不到2%是非數字化的。
鑒于如此懸殊的比例,人們免不了在理解大數據的時(shí)候僅僅從數量上進(jìn)行考慮。然而這將會(huì )產(chǎn)生誤導。大數據的另一個(gè)特征是它能夠用數據來(lái)表現世界的眾多層面,而這些層面以往從來(lái)都沒(méi)有被量化過(guò)——這種特征可以被稱(chēng)為“數據化”。例如,位置信息的數據化最早是由于經(jīng)緯度的發(fā)明,而最近又有了GPS。當計算機對幾個(gè)世紀內的書(shū)籍進(jìn)行取樣時(shí),文字便成了被處理的數據。甚至連友誼和愛(ài)好也被數據化了——例如通過(guò)臉譜網(wǎng)。
借助于廉價(jià)的電腦內存、高性能處理器、智能算法、聰明軟件以及從基本統計學(xué)中借鑒來(lái)的數學(xué)知識,這樣的一類(lèi)數據正在被應用于難以置信的新用途中。這種新方法并不是試圖“教會(huì )”計算機去從事駕駛或翻譯這樣的事情,而是要向計算機輸入足夠多的信息,從而使它們能夠推斷概率,例如交通指示綠燈亮、紅燈不亮的概率,或者是在特定語(yǔ)境下“l(fā)ight”一詞意為“光”而不是“輕”的概率。
以這種方式對大量數據加以利用,要求人們在三個(gè)方面徹底改變對數據的態(tài)度。第一是收集和使用大量數據,而不是像統計學(xué)家們在過(guò)去100多年里所做的那樣,只滿(mǎn)足于少量的數據或樣本。第二是拋棄人們對有條理和純凈的數據的偏愛(ài),轉而接受雜亂無(wú)章——在越來(lái)越多的情形下,少許的不精確是可以容忍的。第三,在許多場(chǎng)合,人們需要放棄對事情原委的追究,而代之以對相關(guān)性的接納。利用大數據,而不是試圖弄懂發(fā)動(dòng)機拋錨或藥物副作用消失的確切原因,研究人員可以收集和分析大量有關(guān)此類(lèi)事件的信息及一切相關(guān)素材,找出可能有助于預測未來(lái)事件發(fā)生的規律。大數據有助于回答是什么、而不是為什么的問(wèn)題——通常有這樣的回答就足夠了。
文章指出,互聯(lián)網(wǎng)重塑了人類(lèi)交流的方式。大數據則不同:它標志著(zhù)社會(huì )處理信息方式的變化。隨著(zhù)時(shí)間的推移,大數據可能會(huì )改變人們思考世界的方式。隨著(zhù)人們利用越來(lái)越多的數據來(lái)理解事情和作出決定,人們很可能會(huì )發(fā)現生活的許多層面是隨機的、而不是確定的。
從因果關(guān)系到相關(guān)性
文章指出,人們看待數據的方式的兩個(gè)變化——從局部變?yōu)槿恳约皬募儍糇優(yōu)榱鑱y——催生了第三個(gè)變化:從因果關(guān)系到相關(guān)性。這代表著(zhù)告別總是試圖了解世界運轉方式背后深層原因的態(tài)度,而走向僅僅需要弄清現象之間的聯(lián)系以及利用這些信息來(lái)解決問(wèn)題。
加拿大的研究人員正在開(kāi)發(fā)一種大數據手段,以便能在明顯癥狀出現之前發(fā)現早產(chǎn)嬰兒體內的感染。通過(guò)把包括心率、血壓、呼吸和血氧水平等16種生命體征轉化成每秒1000多個(gè)數據點(diǎn)的信息流,他們已經(jīng)能夠找到極其輕微的變化與較為嚴重的問(wèn)題之間的相關(guān)性。最終,這項技術(shù)將使醫生能夠提前采取行動(dòng),從而拯救生命。
大數據所產(chǎn)生的影響將遠遠超出醫學(xué)和消費品的范疇:它將深遠地改變政府的運作方式和政治的性質(zhì)。在推動(dòng)經(jīng)濟增長(cháng)、提供公共服務(wù)或進(jìn)行戰爭等方面,那些能夠有效利用大數據的人將擁有勝過(guò)別人的巨大優(yōu)勢。迄今為止,最令人興奮的成果出現在市級,在這個(gè)級別上獲取數據和利用這些信息進(jìn)行實(shí)驗要容易一些。紐約市長(cháng)邁克爾·布隆伯格(他本人就是靠著(zhù)數據行業(yè)發(fā)家的)率先進(jìn)行了一項努力:該市正在利用大數據改善公共服務(wù)和降低成本。其中一個(gè)例子就是新的火災預防策略。
非法在屋內打隔斷的建筑物著(zhù)火的可能性比其他建筑物高很多。紐約市每年接到2.5萬(wàn)宗有關(guān)房屋住得過(guò)于擁擠的投訴,但市里只有200名處理投訴的巡視員。市長(cháng)辦公室一個(gè)分析專(zhuān)家小組覺(jué)得大數據可以幫助解決這一需求與資源的落差。該小組建立了一個(gè)市內全部90萬(wàn)座建筑物的數據庫,并在其中加入市里19個(gè)部門(mén)所收集到的數據:欠稅扣押記錄、水電使用異常、繳費拖欠、服務(wù)切斷、救護車(chē)使用、當地犯罪率、鼠患投訴,諸如此類(lèi)。接下來(lái),他們將這一數據庫與過(guò)去5年中按嚴重程度排列的建筑物著(zhù)火記錄進(jìn)行比較,希望找出相關(guān)性。果然,建筑物類(lèi)型和建造年份是與火災相關(guān)的因素。不過(guò),一個(gè)沒(méi)怎么預料到的結果是,獲得外磚墻施工許可的建筑物與較低的嚴重火災發(fā)生率之間存在相關(guān)性。
文章稱(chēng),利用所有這些數據,該小組建立了一個(gè)可以幫助他們確定哪些住房擁擠投訴需要緊急處理的系統。他們所記錄的建筑物的各種特征數據都不是導致火災的原因,但這些數據與火災隱患的增加或降低存在相關(guān)性。這種知識被證明是極具價(jià)值的:過(guò)去房屋巡視員出現場(chǎng)時(shí)簽發(fā)房屋騰空令的比例只有13%,在采用新辦法之后,這個(gè)比例上升到了70%——效率大大提高了。
大數據的挑戰和局限
文章指出,大數據也正在幫助提高民主政府的透明度。一個(gè)建立在“開(kāi)放數據”概念上的運動(dòng)已經(jīng)形成,其訴求超出了目前在發(fā)達民主國家已經(jīng)十分常見(jiàn)的信息自由法。這一運動(dòng)的支持者呼吁政府把手上浩如煙海的普通數據向公眾開(kāi)放。
與此同時(shí),在政府推動(dòng)使用大數據的同時(shí),它們還需要保護公眾免受不正當市場(chǎng)壟斷的侵害。管理大數據的法規甚至可能成為國家間的角斗場(chǎng)。出于對反托拉斯和保護隱私的關(guān)切,歐洲各國政府已經(jīng)在嚴查谷歌公司。臉譜網(wǎng)可能會(huì )成為世界各地類(lèi)似行動(dòng)的打擊目標,因為它持有太多的個(gè)人數據。外交官們應該準備好圍繞是否像對待自由貿易那樣對待信息流動(dòng)展開(kāi)交鋒。
文章認為,大數據勢必將改變人們生活、工作和思考的方式。建立在強調因果關(guān)系基礎上的世界觀(guān)正在受到推崇相關(guān)性的挑戰。知識的占有曾經(jīng)意味著(zhù)對歷史的了解,而現在卻意味著(zhù)預言未來(lái)的能力。解決大數據所帶來(lái)的挑戰將不是易事。
在決策越來(lái)越多地受到數據支配的世界里,人、直覺(jué)或是不顧事實(shí)的蠻干還有什么用武之地呢?如果每個(gè)人都求助于數據,都利用大數據工具的話(huà),那么不可預測性——例如人類(lèi)的本能、冒險、意外甚至失誤——也許將會(huì )成為差異的關(guān)鍵。如果真是這樣的話(huà),那么需要專(zhuān)門(mén)為人為因素辟出一席之地——即為直覺(jué)、常識、運氣留出空間,以確保它們不會(huì )被數據和機器生成的答案擠走。
這將對社會(huì )進(jìn)步的觀(guān)念產(chǎn)生重要影響。大數據使我們可以更快地進(jìn)行實(shí)驗,對更多的線(xiàn)索展開(kāi)探索。這些優(yōu)勢應該會(huì )導致更多創(chuàng )新的產(chǎn)生。但在有些時(shí)候,發(fā)明的火花迸發(fā)是數據所無(wú)法表現的。倘若亨利·福特當初求助于大數據算法系統來(lái)研究顧客希望得到的東西,算法系統得到的答案會(huì )是“更快的馬匹”,也就不會(huì )有福特著(zhù)名的汽車(chē)生產(chǎn)線(xiàn)了。在大數據的世界里,需要培養的恰恰是與人類(lèi)關(guān)系最密切的特性——創(chuàng )造力、直覺(jué)和上進(jìn)心,因為人的聰明才智才是進(jìn)步的源泉。
文章稱(chēng),大數據是一種資源和一種工具。它的目的是告知,而不是解釋?zhuān)凰庠诖龠M(jìn)理解,但仍然會(huì )導致誤解——關(guān)鍵在于人們對它的掌握程度。人們必須以一種不僅欣賞其力量,而且承認其局限的態(tài)度來(lái)接納這種技術(shù)。
聯(lián)系客服