我們的世界觀(guān)和因其導致的行為往往是由一個(gè)簡(jiǎn)單的定理促成的,在150多年前,這個(gè)定理由一位性格內向的英國數學(xué)家和神學(xué)家托馬斯·貝葉斯(Thomas Bayes)悄悄設計,直到他去世后才將其發(fā)表。
貝葉斯定理最著(zhù)名的運用之一是在二戰期間被用來(lái)破解納粹的恩尼格碼密碼。如今,該定理更是廣泛深入的被運用在科學(xué)、技術(shù)、醫學(xué)等領(lǐng)域。
但什么是貝葉斯定理?它又是如何運作的呢?
貝葉斯定理
托馬斯·貝葉斯的洞察力非常簡(jiǎn)明。一個(gè)假設是真實(shí)的概率取決于兩個(gè)標準:
根據當前的知識(“先驗”),判斷它的合理程度;
評估它與新的證據的契合程度。
然而,在貝葉斯去世后的100多年里,科學(xué)家通常僅通過(guò)對新的證據來(lái)評估他們提出的假設。這是我們大多數人在科學(xué)課上受到的傳統的假設-檢驗(頻率論者)方法的教育。 當一個(gè)不合理的解釋與一個(gè)新的證據完美契合時(shí),貝葉斯定理和頻率論者的方法之間的區別尤為明顯。
讓我們先來(lái)制造一個(gè)假設:
“月亮是用奶酪做的!”
△一個(gè)不合理的假設。(圖片來(lái)源:Mike Lee)
接著(zhù),我們仰望星空,并收集相關(guān)的新證據,并發(fā)現月亮的顏色是奶酪黃。在傳統的假設-檢驗框架中,我們會(huì )得出新的證據與我們天馬行空的假設相符的結論,從而增加了我們對該假設的信心。
△傳統的假設-檢驗方法(頻繁方法)只考慮一個(gè)假設與新證據的適合程度。(圖片來(lái)源:Mike Lee)
但如果使用貝葉斯定理,就會(huì )得到更加謹慎的結論。我們會(huì )意識到雖然這個(gè)假設符合新的證據,但這個(gè)想法從一開(kāi)始便極其荒唐,它違背了我們對宇宙學(xué)和礦物學(xué)所熟識的一切知識。因此,月球是奶酪的綜合概率(即這兩項評估的乘積)依舊是很低的。
△貝葉斯推理考慮了假設符合現有知識的程度以及它符合新證據的程度。為了簡(jiǎn)單起見(jiàn),公式中省略了歸一化常數。(圖片來(lái)源:Mike Lee)
當然,這只是一個(gè)極端的例子。沒(méi)有哪位正經(jīng)科學(xué)家會(huì )試圖檢驗這樣一個(gè)荒誕的假設。 但是,全球科學(xué)家們總在不斷評估大量的假設,而其中一些假設是相當牽強的。
例如,2010年有一項研究最初表明:
“持有溫和政治觀(guān)點(diǎn)的人可以看到更多的灰色?!?/span>
后來(lái)這個(gè)假設在進(jìn)一步檢驗后被駁回,研究人員認識到這是不可信的。然而幾乎可以肯定的是,有許多類(lèi)似的研究已被草率的接受。
生活中的貝葉斯方法
運用先前的經(jīng)驗和記憶中積累的知識、和意識中提煉出的新證據,我們對日常事物的概率進(jìn)行分配和生活進(jìn)行管理。
舉一個(gè)生活中的簡(jiǎn)單事件:接聽(tīng)手機。通常在工作時(shí)你將它放在辦公桌上,而在家里時(shí)把它放在在充電器上?,F在你在家里的小花園里澆花,聽(tīng)到屋內電話(huà)聲響起。新的數據會(huì )告訴你它處于室內任何地方,但你仍會(huì )直接走向充電器。因為你將的先前對手機位置的認知(通常在辦公桌上或家中的充電器上)與新的證據(房屋的某處)相結合,從而確定了它的位置。
如果手機不在充電器上,那么你會(huì )喚起先前你在某些放置過(guò)手機的位置的認知來(lái)縮小搜索范圍。 你會(huì )忽略房子里大部分的地方,如冰箱、襪子抽屜等等,因為這些地方在你先前所積累的認知中被認定為極不可能的位置,你會(huì )在最終找到電話(huà)之前思考最可能的地方。
而在這個(gè)找電話(huà)的過(guò)程中,你便正在使用貝葉斯定理。
認知和證據
貝葉斯推理的一個(gè)特征是:當數據較弱時(shí),那么先前對事物的認知是最重要的。這個(gè)原則一直被我們直覺(jué)性地使用。
例如,你在酒吧玩飛鏢,附近的陌生人說(shuō)他(她)是專(zhuān)業(yè)的飛鏢選手,那么一開(kāi)始你很可能會(huì )假設這個(gè)人在開(kāi)玩笑。
你對這個(gè)陌生人一無(wú)所知,但你知道遇到一個(gè)真正的專(zhuān)業(yè)飛鏢選手的幾率很小。比如在澳大利亞,專(zhuān)業(yè)的飛鏢選手只有大約15名。假如他扔了一只飛鏢正中靶心,你可能還是不會(huì )相信他的說(shuō)法,因為這可能只是走運的成分。但如果他連續十次都擊中靶心,你會(huì )更傾向于接受他是專(zhuān)業(yè)人士的說(shuō)法。因為隨著(zhù)新證據的積累,你之前的認知被超越。貝葉斯定理再次起到作用。
一個(gè)統管它們的理論
現在,貝葉斯推理支撐著(zhù)廣泛的人類(lèi)調查領(lǐng)域,從癌癥篩查到全球變暖,從遺傳學(xué)到貨幣政策等等等等。
例如,貝葉斯推理是風(fēng)險評估和保險行業(yè)的基礎。每次颶風(fēng)或洪水襲擊一個(gè)地區時(shí),保險費都會(huì )飛漲。為什么?
△ 颶風(fēng)Debbie席卷澳大利亞昆洲,帶來(lái)的強降雨將居民房屋包圍在洪水中。(圖片來(lái)源:Dan Peled/AAP Image)
量化風(fēng)險是一件非常復雜的事情,而且目前的條件不足以對未來(lái)可能發(fā)生的災難提供足夠多的信息。因此,保險公司會(huì )根據現時(shí)情況并結合過(guò)往發(fā)生的情況來(lái)估算風(fēng)險。每當自然災害發(fā)生一次時(shí),他們就對該地區的信息進(jìn)行更新,預計未來(lái)索賠的可能性將更大,因此提高保險費。
在醫學(xué)診斷中,貝葉斯推理也同樣發(fā)揮著(zhù)重要作用。一個(gè)癥狀(新證據)可以是多種可能的疾?。僭O)的結果,但不同的疾病對于不同的人來(lái)說(shuō)具有不同的先驗概率。而在線(xiàn)醫療工具無(wú)法將個(gè)人的先驗概率恰當的考慮在內,這也正是在線(xiàn)醫療的主要問(wèn)題。它們對你的個(gè)人歷史知之甚少,因此會(huì )忽略一系列可能的疾病。
貝葉斯定理再次告訴我們:向一位了解你之前病史的醫生求診,能獲得更高效合理的診斷。
阿蘭·圖靈和恩尼格碼
貝葉斯方法能讓我們從模糊的數據中提取準確的信息,從無(wú)限可能性的范圍中找出更有針對性的解決方案。
這也是阿蘭·圖靈當年破解德國恩尼格碼的核心,它加速了二戰的結束,挽救了數百萬(wàn)人的生命,對全世界都意義非凡。若是要在無(wú)數的潛在翻譯下進(jìn)行搜索是不可能破譯一組加密的德文信息的,尤其是恩尼格碼通過(guò)不同的轉子設置每天變化。
圖靈關(guān)鍵的貝葉斯洞察力是一些特定信息比其他信息更有可能,這些可能的解決方案都是基于以前的成功破譯的信息和符合邏輯的期望。例如,德國的U型潛艇的信息可能包含與天氣或盟軍航運相關(guān)的短語(yǔ)。
類(lèi)似這樣的先驗信息極大地縮小了可能需要評估的翻譯數量,使得圖靈的密碼破譯機能以超過(guò)日常變化的速度快速破解恩尼格碼。
△
△密碼學(xué)家用來(lái)破解德語(yǔ)恩尼格碼的解碼機“炸彈”的重建的復制品。(圖片來(lái)源:Ted Coles/Wikimedia)
聯(lián)系客服