譯者:maltose(很二的糖),最喜歡的女性地球人是Angelina Jolie,最喜歡的機器人是阿拉蕾,最喜歡的機器寵物是哆啦A夢(mèng),最喜歡的外星種族是那美克星人,最喜歡的超級英雄是鋼鐵俠,Sheldon Cooper是我對現實(shí)世界的男生所有美好幻想的集合體,如果你想和我交朋友,可以fellow我的twitter。原文鏈接:http://songshuhui.net/archives/4405.html
容易讓人上癮的在線(xiàn)游戲在不知不覺(jué)中叩擊著(zhù)你的大腦潛能,與此同時(shí),它還可以解決那些讓最強大的計算機也甘拜下風(fēng)的難題。路易斯•特尼爾報告。
阿瑞思泰德斯是個(gè)普通的13歲男孩。放學(xué)后打籃球,學(xué)習單簧管,到了晚上就坐到電腦前玩游戲。有個(gè)游戲讓他特別著(zhù)迷,也讓他在同齡人中顯得與眾不同。每天,他都會(huì )用“奶酪”這個(gè)昵稱(chēng)登錄www.fold.it, 他玩的這個(gè)游戲需要彎曲、拉伸和扭動(dòng)一個(gè)有些像大樹(shù)根系那樣的3維結構。通過(guò)調節這些扭動(dòng)的綠色小管兒的長(cháng)度,他要設法將它們的體積最小化。這看上去不過(guò)就是個(gè)有點(diǎn)奇怪的游戲——頂多就有些類(lèi)似3維俄羅斯方塊——但實(shí)際上,脫去游戲這層鮮艷的外衣,它蘊含著(zhù)當今生物學(xué)家們面臨的最大難題之一:蛋白質(zhì)是如何折疊的?
而阿瑞思泰德斯擺弄的那個(gè)3維結構就是通過(guò)電腦所呈現的真實(shí)蛋白, 比如膠原蛋白分子。不需要知道分子生物學(xué)最基本的知識,他一樣能夠幫助解決現代科學(xué)里最棘手的難題之一。這個(gè)游戲的發(fā)明者,西雅圖華盛頓大學(xué)的戴維•貝克(David Baker)說(shuō)道:“在無(wú)數多種可能的情況下,要用計算機準確預知一個(gè)長(cháng)蛋白質(zhì)鏈是如何用最簡(jiǎn)潔緊湊的方式折疊,是一個(gè)相當困難的問(wèn)題。
隨著(zhù)蛋白質(zhì)肽鏈長(cháng)度的增加,它可能的折疊方式也指數式地增加。即便是最簡(jiǎn)單的鏈條,也需要讓一臺標準臺式計算機花上幾個(gè)世紀的時(shí)間去預測最佳折疊方式。而有了60 000名像阿瑞思泰德斯一樣的業(yè)余玩家,僅僅運作了六個(gè)月的Foldit游戲,就得到幾十種蛋白的折疊方式了。
Foldit的成功在于它給一個(gè)老觀(guān)點(diǎn)賦予了聰明的新創(chuàng )意。在過(guò)去的十年里,“分布式計算”工程風(fēng)起云涌,許多大的計算問(wèn)題被分成小塊,通過(guò)互聯(lián)網(wǎng)分發(fā)給全球數以百萬(wàn)計的臺式電腦,并行地進(jìn)行數字運算。這些略帶冒險性質(zhì)的嘗試中最有歷史也最流行的一項就是“地外文明搜索”計劃的一部分。SETI@home利用空閑的計算機對來(lái)自位于波多黎各的阿雷西博射電天文望遠鏡收集到的數據進(jìn)行分析,以尋求外星生命存在的線(xiàn)索。分布式計算如今已運用于多個(gè)領(lǐng)域,包括蛋白質(zhì)折疊,密碼暴力破解和氣候預測。
大腦召集令
但即使一百萬(wàn)臺計算機也不是萬(wàn)能的。在英國伯明翰大學(xué)研究人工智能的亞倫•斯洛曼(Aaron Sloman)認為,“盡管在某些問(wèn)題上,計算機速度迅速準確,在很多任務(wù)上,比如視覺(jué)處理、空間推理或者問(wèn)題求解上,他們遠遠無(wú)法超越人腦。”現在看來(lái),分布式計算的觀(guān)念正在改變。研究者們不再只是利用那些閑置的機器,他們正在設法利用這些“閑置”計算機的主人們大腦的處理能力。
這些源源不斷的智力資源看上去不會(huì )枯竭。紐約大學(xué)的克雷•舍基(Clay Shirky)計算過(guò),僅僅在美國,每個(gè)周末,人們把1億個(gè)小時(shí)都花在觀(guān)看電視廣告上——而這等同于創(chuàng )造編寫(xiě)250萬(wàn)個(gè)維基百科詞條的時(shí)間。如果將這些閑置的智力中的一小部分用于簡(jiǎn)單的在線(xiàn)任務(wù),為科研提供幫助,那貢獻將是巨大的。
NASA的Clickworkers網(wǎng)站則是最早向在線(xiàn)人群求助的嘗試之一。這個(gè)在2000年啟動(dòng)的項目,需要志愿者們標記由19世紀70年代 Viking探測器拍攝到的照片上,火星表面的環(huán)形山的位置和大小。最近,志愿者們已經(jīng)在火星偵查衛星傳回的超高分辨率圖片上,將不同的地形分門(mén)別類(lèi)。將來(lái),等到Dawn太空船探索位于火星與木星之間的小行星帶上的兩顆最大的天體——灶神星和谷神星的時(shí)候,NASA還打算將這些人力資源運用到其傳回的照片上。
Clickworkers方法有個(gè)大問(wèn)題,說(shuō)到底,它是一個(gè)沒(méi)什么樂(lè )趣可言的孤立操作。除了那種為一項重要事業(yè)而做出貢獻的榮譽(yù)感,看不出來(lái)有什么因素可以吸引賦閑在家的志愿者們。這也是所有涉及到人類(lèi)協(xié)作的關(guān)鍵問(wèn)題:怎么才能讓那些志愿者樂(lè )此不疲?
賓州匹茲堡卡內基大學(xué)的計算機科學(xué)家路易斯•佛南(Luis von Ahn)給出了答案。從2002年起,他就開(kāi)始推進(jìn)對那些志愿者資源,也叫“人體計算機”的利用, 其形式遠遠超越了Clickworkers所進(jìn)行的早期嘗試。
他的秘訣就在于將復雜的問(wèn)題轉化成簡(jiǎn)單又吸引人的游戲。
他的第一個(gè)游戲叫做ESP,他設計的這個(gè)游戲列出了一系列單詞,游戲者需要將它們同數據庫中一系列圖片對應起來(lái),游戲目的是幫助訓練人工智能系統。為了做到這一點(diǎn),游戲將匿名玩家配對,并給他們同樣的圖片。玩家必需試著(zhù)在最快的時(shí)間里猜出他們的搭檔會(huì )用什么詞語(yǔ)來(lái)形容圖片中的物體,并通過(guò)這種方式得分。
現在這個(gè)游戲在“有目的的游戲( Game with a Purpose)”網(wǎng)站開(kāi)放(www.gwap.com),目前該網(wǎng)站已經(jīng)有120 000名用戶(hù),也取得了一些重要的成績(jì)。例如,ESP就給5千萬(wàn)張圖片標記了單詞,去年得到Google認可,用來(lái)幫助改進(jìn)它的圖片搜索引擎。“人們喜歡這個(gè)游戲,和自己素未謀面的人合作讓他們感覺(jué)到了前所未有的默契”,佛南說(shuō)道。
他最近在做的項目是ReCAPTCHA。ReCAPTCHA利用人腦識別被扭曲圖像的能力。在將手抄本數字化時(shí),ReCAPTCHA技術(shù)可以被用于識別那些無(wú)法被光學(xué)文字識別技術(shù)識別的文字。呈現給參與者的除了未被識別的文字,還有一個(gè)已知單詞,這樣就可以區分參與者究竟是計算機還是人類(lèi)。如果正確識別了兩個(gè)單詞,那參與者就證明了自己是真人,從而可以進(jìn)一步在線(xiàn)注冊,協(xié)助完成古籍的數字化和保護工作?,F在被用于像Facebook和Twitter這樣的網(wǎng)站來(lái)確認新用戶(hù)為人類(lèi),以防止黑客運用程序自動(dòng)獲得數以百計的賬號,從而非法地散播垃圾郵件。
這個(gè)系統已經(jīng)成功轉錄了超過(guò)10億個(gè)單詞,現在正被用于將《紐約時(shí)報》130年的存檔數字化。在未來(lái),佛南希望用同樣的方法來(lái)建立歷史音頻記錄的副本。

【圖:利用人腦識別被扭曲圖像】
然而,利用人來(lái)處理圖像并不是一個(gè)十全十美的方法。運行“星系動(dòng)物園”的科學(xué)家們發(fā)現,這其中也會(huì )出現一些意料不到的結果。這個(gè)項目在2007年啟動(dòng),集結了160 000名志愿者的力量,以幫助鑒別斯隆數位巡天計劃收集到的圖片上的一百萬(wàn)個(gè)星系。志愿者們被要求將星系按漩渦星系或橢圓星系進(jìn)行分類(lèi),并記錄漩渦星系的旋轉方向。不需要專(zhuān)家指導,新手們很快就可以投身到這個(gè)項目中。
“星系動(dòng)物園”的研究員想知道,在螺旋形星系的旋轉方向上是否存在任何傾向。早先的研究發(fā)現星系順時(shí)針或逆時(shí)針旋轉的差別取決于你所看的天空的位置,這體現了在較大尺度上,宇宙的組織具有不可知性。然而,“星系動(dòng)物園”的志愿者給出的海量數據顯示在可觀(guān)測的宇宙空間里沒(méi)有這種趨向。
但是“星系動(dòng)物園”這個(gè)項目還真的發(fā)現了當人們在給相同星系進(jìn)行分類(lèi)時(shí)的一個(gè)有趣的傾向。不知為何,人們在給漩渦星系歸類(lèi)的時(shí)候,更喜歡將其旋轉方向歸為逆時(shí)針而非順時(shí)針,雖然研究者認為從大體上看這不會(huì )對結果造成不良影響;這個(gè)傾向實(shí)在是太微妙了,只是因為“星系動(dòng)物園”的志愿者數量太龐大了才顯現出來(lái)。
不過(guò),這也突顯了人類(lèi)處理的一個(gè)顧慮——研究者如何才能保證人類(lèi)心理上的無(wú)意識的嗜好或怪癖不會(huì )影響到自己的研究結果?而“星系動(dòng)物園”中,人們出現傾向的原因尚不得知。“我個(gè)人認為,這可能僅僅因為‘逆時(shí)針’這個(gè)選項的按鈕處于中間,” 負責管理“星系動(dòng)物園”研究結果的凱特•蘭德(Kate Land)說(shuō)道。
“星系動(dòng)物園”還誕生了另一個(gè)出人意料的結果。去年,荷蘭學(xué)派教師漢尼·范阿克爾(Hanny van Arkel)在一張圖片中發(fā)現了一個(gè)奇怪的天體。這個(gè)物體看起來(lái)像一小束明亮的綠光,其中沒(méi)有恒星,也不像任意一個(gè)已知的天文現象。如果不是范阿克爾眼尖,這樣一種新物體很有可能不會(huì )被發(fā)現。“人腦非常擅長(cháng)辨別與眾不同的東西,而這種本領(lǐng)很難被作為搜索參數而編程到自動(dòng)化的視覺(jué)歸類(lèi)系統中去。”
“星系動(dòng)物園”很大程度上依靠的是天文愛(ài)好者,而佛南的reCAPTCHAs計劃則讓網(wǎng)絡(luò )用戶(hù)們除了解決謎題之外別無(wú)選擇,這種新一代的項目想要使普通民眾將他們的純粹用于娛樂(lè )的閑暇時(shí)光貢獻給出來(lái)。Foldit就是這類(lèi)項目中的佼佼者。
Foldit衍生于一項名為Rosetta@home分布式計算項目,該項目也是由貝克運作的。與SETI@home項目的運作方式相同,Rosetta@home利用世界各地空閑的計算機來(lái)查找蛋白質(zhì)的所有可能的折疊結構以找出其中最緊湊的一種。利用該項目的結論,在過(guò)去的一年里,貝克的研究小組在《自然》和《科學(xué)》雜志上發(fā)表了一系列有關(guān)蛋白質(zhì)結構的預測和構思的論文。但是,貝克和他的小組發(fā)現Rosetta@home所得到的結果必須經(jīng)過(guò)人工處理,才能作科研之用。如今,貝克想看看Foldit的用戶(hù)是如何參與游戲以改進(jìn)Rosetta@home電腦程序的。
維杰辛•潘德(Vijay Pande)是斯坦福大學(xué)另一個(gè)致力于模擬蛋白折疊的分布式計算的研究者,他的程序名為Folding@home,他擔心志愿者給出結果的質(zhì)量遠遠達不到計算機所能給出的結果。“折疊蛋白質(zhì)就像要學(xué)好下棋,不過(guò)有更多的棋子和更為復雜的規則,因此需要謹慎對待更加大量的可能性組合,”,他認為人們不可能利用好所有的自由度。潘德相信Foldit是一個(gè)讓那些不是科學(xué)家的人了解蛋白質(zhì)復雜程度的好方法,他說(shuō)如果人們的最終結果要是和計算機給出的一樣好,他會(huì )大吃一驚。
貝克當然不會(huì )同意。蛋白質(zhì)的無(wú)數種折疊的方式正好是計算機所無(wú)法理解的,他說(shuō)道。像阿瑞思泰德斯這樣的玩家證明了有技術(shù)的人類(lèi)是如何準確地將蛋白質(zhì)進(jìn)行準確折疊。游戲進(jìn)行幾個(gè)月之后,阿瑞思泰德斯從全球60000名玩家中脫穎而出,名列前十,并被邀請加入Foldit的高級組。他展示出了對微妙的力學(xué)問(wèn)題的如此直觀(guān)的理解,一位Foldit研究員將他稱(chēng)作“Foldit學(xué)者”,最近他飛往西雅圖,告訴他們自己是如何解決蛋白質(zhì)難題的。
針對不同人和不同的計算方法的準確度在年末將被展示出來(lái),被稱(chēng)為“蛋白質(zhì)結構預測技巧的關(guān)鍵性評估”的比賽結果屆時(shí)將宣布。比賽將通過(guò)實(shí)驗確定的蛋白結構與不同小組使用計算機或人工預測的蛋白質(zhì)結構進(jìn)行對比。對Foldit的初步分析顯示,其結果的前景很好。“我們已經(jīng)從這些能與大型計算機相媲美的志愿者中找到了解決方法,有時(shí)這些志愿者甚至超過(guò)大型計算機,” Foldit的主要研究員,來(lái)自華盛頓大學(xué)的佐蘭•波波維克(Zoran Popovi´c)說(shuō)道,“我預期,一旦我們將工具精煉,使它更像游戲和人類(lèi)解謎的過(guò)程,人們將能做得更好。”
本月開(kāi)始,Foldit將衍生出一個(gè)新游戲,這個(gè)游戲本質(zhì)上是對玩家的挑戰,需要他們從零做起,去設計新的蛋白質(zhì)。玩家可以改變支鏈,這樣能有效地創(chuàng )造人工蛋白質(zhì),而其中最好的一些會(huì )被合成并測試,波波維克說(shuō)道。在12月,一種新的游戲將被推出,目的是生長(cháng)和構建可以結合病毒的合成蛋白。這最終將有助于生產(chǎn)新藥物和疫苗。“我想這就是人類(lèi)要比計算機有優(yōu)勢的地方,” 貝克說(shuō)道。
正如SETI@home的備受歡迎帶動(dòng)了分布式計算的應用,其他領(lǐng)域的科學(xué)也很有可能會(huì )模仿Foldit。舍基甚至看得更遠:“在未來(lái),將會(huì )發(fā)起很多人類(lèi)處理項目,我們會(huì )看到自身的大腦閑置周期有著(zhù)無(wú)與倫比的競爭力,”他說(shuō)。誰(shuí)說(shuō)科技會(huì )讓我們變得越來(lái)越閑,真是大錯特錯。
當個(gè)自由自在的“科學(xué)家”
忘了俄羅斯方塊和紙牌游戲吧,將你的閑暇時(shí)光投入到科研項目中來(lái)
有目的的游戲
幫助完善計算機的圖像識別和人工智能系統。www.gwap.com
谷歌圖片標簽
“有目的的游戲”的衍生項目,通過(guò)與陌生的搭檔在最快時(shí)間內標記物體來(lái)幫助改進(jìn)圖片搜索引擎。www.images.google.com/imagelabeler
FOLDIT
嘗試各種方法折疊或設計蛋白質(zhì)結構,幫助生物學(xué)家設計新一代藥物。www.foldit.com
星系動(dòng)物園
將數百萬(wàn)張不同星系的圖片進(jìn)行分類(lèi),以幫助解決一些宇宙學(xué)中的重大問(wèn)題。www.galaxyzoo.org/

