點(diǎn)擊標題下「大數據文摘」可快捷關(guān)注
翻譯:袁晶/校對:孫強(轉載請保留)
摘自時(shí)代周刊, 原文鏈接:
http://time.com/3302251/9-ugly-truths-big-data-ok-cupid-book/
Christian Rudder 是 Dataclysm 一書(shū)的作者, OkCupid的創(chuàng )始人之一。他深入研究數字,揭示愛(ài)、性別、種族和文化的一些內在關(guān)系。
(譯者注:OkCupid在線(xiàn)約會(huì )網(wǎng)站,居國外同類(lèi)網(wǎng)站榜首)
序
大數據先生:象往常一樣你在酒吧喝過(guò)兩杯酒之后遇到一個(gè)新朋友, 于是又加上一杯。你靠近這位大數據朋友, 比平時(shí)更專(zhuān)注地聽(tīng)他講?!皵底肿阚E?!薄靶畔r(shí)代?!蹦泓c(diǎn)頭微笑,即使你并不明白?!案淖兪澜??!薄拔磥?lái)?!蹦阈念I(lǐng)神會(huì )的樣子,即便沒(méi)有真正聽(tīng)懂,你也偽裝得很好。
早晨醒來(lái),你對大數據僅殘存些模糊的記憶,諸如它的標記線(xiàn)和些許流行語(yǔ)。你對這些詞的的理解也是隱約而模糊。
如果你仍在為理解這位大數據朋友而努力,大數據還有你不曾見(jiàn)過(guò)的另一面——它不再是承諾利用海量數字來(lái)優(yōu)化,貨幣化或者系統化我們生活中的每一個(gè)部分,給我們帶來(lái)好處的那個(gè)大數據朋友。這個(gè)大數據先生會(huì )戳破畫(huà)皮,告訴我們一些并不希望知道的東西。就如同Christian Rudder在他的新書(shū)《數據變革:我們是誰(shuí)(當我們認為沒(méi)有人在注意我們的時(shí)候)》(Dataclysm: Who We Are (When We Think No One’s Looking),)中所展示的那樣,這也許同樣值得追求。在我們提升人類(lèi)的體驗之前,我們首先應該理解它。
Rudder,OkCupid的創(chuàng )始人之一,哈佛畢業(yè)的數據科學(xué)家,分析過(guò)數以百萬(wàn)計的數據記錄并利用相關(guān)研究來(lái)理解我們如何搜尋和尋求愛(ài)情。但Rudder工作的魅力之處并不是那些發(fā)現多么讓人震驚。相反,他深刻揭示了那些我們大多數人不愿去想的問(wèn)題:對于黑人女性和亞裔男性的種族歧視,或者“同性戀(Gay)”一詞是如何成為“我的丈夫是否是(My husband is)…”這一搜索條的No 1的谷歌搜索建議的。
這里有9個(gè)關(guān)于性和約會(huì )的啟示,是Rudder借助大數據在Dataclysm 這本書(shū)里闡述的。
1. 直男認為女性有一個(gè)保值期。
盡管女性?xún)A向于尋求與她們同一年齡階段的男性,但OkCupid數據顯示,所有年齡的男性迄今都在尋找二十出頭的女性。雖然男性通常會(huì )將女性的年齡要求設置為三十歲甚至更大,但事實(shí)上他們極少聯(lián)系29歲以上的女人。
2. 直女表達性欲的可能性遠遠低于其它人口類(lèi)型。
在OkCupid網(wǎng)站,6.1%的直男都很明確地是在尋找一夜情。對男同性戀者來(lái)說(shuō),這一概率為6.9%,女同性戀者為6.9%。而對于直女,則僅有0.8%。
3. “大部分人過(guò)著(zhù)默默而絕望的生活,帶著(zhù)只在心中唱響的歌謠,走進(jìn)墳墓?!保∕ost men lead lives of quiet desperation and go to the grave with the song still in them.--Thoreau)”
像任何優(yōu)秀的數據科學(xué)家一樣,Rudder運用文學(xué),在這里是梭羅(Thoreau,譯者注:18世紀美國作家,《瓦爾登湖》的作者),來(lái)解釋人們的生活狀態(tài)。Rudder援引了一名Google工程師的描述,這位工程師發(fā)現搜索“男同性戀的描寫(xiě)”(他實(shí)際的意思是同性戀色情)在每個(gè)州發(fā)生的概率為5%,社會(huì )科學(xué)家們估計同性戀占世界人口的比重也差不多是這個(gè)比例。所以如果一個(gè)民意調查顯示,一個(gè)州有1%的人口是同性戀,那么另外的4%可能仍然存在,只是沒(méi)有表現出來(lái)。(譯者注:4%,一個(gè)沉默而又壓抑的人群)
4. 搜索“我丈夫是否是同性戀?”一般都發(fā)生在那些同性婚姻極少能被人們所接受的州。
這里有一個(gè)搜索數據測試,您可以自行查看:在谷歌上鍵入“我的丈夫是否?(My husband is)”并看看谷歌推薦結果。Rudder指出,這一搜索是在南卡羅來(lái)納州和路易斯安那州最為常見(jiàn),這兩個(gè)州同性婚姻率的支持率同樣都是最低的。
5. 根據Rudder的研究,對女性而言,亞洲男人是最不中意的種族…
OkCupid上,用戶(hù)可以對彼此以1至5的分數打分。亞洲女性更有可能給亞洲男性以更高的評分,而其他種族的女性——黑種人,拉丁裔,白種人——給亞洲男性的評分介于1和2之間,低于她們通常評價(jià)男人的分值。黑種人和拉丁裔同樣面臨來(lái)自各自不同種族的歧視,而白人男性的評級在所有種族的女性中享有的評分都比較高。
(編者注:作為中國男人,我們是否應該對此嗤之以鼻?。。。?/span>
6. 同時(shí)對于男性而言,黑人女性是最不中意的種族群體。
幾乎是一樣的情形。亞裔、拉丁裔和白種人常常給黑人女性1到1.5分甚至更低,而黑人女性給于黑人男性的評分則與所有種族的女性給于黑人男性的評分更加一致。但亞裔和拉丁裔女性通常會(huì )獲得來(lái)自所有男性的較高評價(jià),甚至高于白人女性。
7. 發(fā)送復制粘貼信息的用戶(hù)能更為有效地獲得回應。
OkCupid追蹤用戶(hù)在消息中輸入多少字符以及他們實(shí)際上發(fā)出了多少封電郵。(對于大多數用戶(hù)來(lái)說(shuō),每發(fā)送一個(gè)字符需要鍵入三個(gè)字符。) 在做這項分析時(shí),Rudder發(fā)現高達20%的用戶(hù)設法利用5個(gè)或者更少的組合鍵發(fā)送成千上萬(wàn)個(gè)文字,像是Ctrl+C,Ctrl+V,回車(chē)。更深層次的挖掘顯示,盡管從頭創(chuàng )建的信息表現會(huì )優(yōu)25%,但復制粘貼信息就單位努力而言,收到了更多的回復。(譯者注:不要擔心別人笑話(huà)你抄情書(shū))
8. 你的Facebook點(diǎn)贊顯示能夠顯露你的性別,種族,性取向和政治觀(guān)點(diǎn)。
英國的一組研究人員發(fā)現,單就基于每個(gè)人的Facebook點(diǎn)贊,他們便能夠以88%的準確率識別出一個(gè)用戶(hù)是男同還是直男;女同還是直女的識別準確率為75%;相應地,白人還是黑人,95%;男人還是女人,93%;民主黨還是共和黨,85%。
9. 相對而言,佛蒙特州不怎么淋浴。
Rudder放送了一些沉重的信息供大家思考,所以最后一條談個(gè)稍微輕松的話(huà)題:一般來(lái)說(shuō),根據他的研究,在較為炎熱的州,人們淋浴多;而較為寒冷的州,人們淋浴則較少。不過(guò),東北地區洗浴相對頻繁。但佛蒙特州是個(gè)例外。Rudder也不知道為什么。你覺(jué)得呢?
Rudder還有一些非愛(ài)情領(lǐng)域的額外收獲…
——在7月里一個(gè)尋常的早晨,米特·羅姆尼在幾分鐘內便獲得了20000個(gè)Twitter關(guān)注者。
Rudder更進(jìn)一步深入研究了社交媒體數據,顯示羅姆尼2012年7月22日上午8時(shí)獲得了18860個(gè)新的關(guān)注者。當天并沒(méi)有什么特別有趣的事發(fā)生,關(guān)注者的激增大約200倍于他之前和過(guò)后得到新關(guān)注者的增幅。秘密何在?可能是購買(mǎi)了僵尸粉。羅姆尼并不是唯一這樣做的政治家——這是一種慣常的做法,Rudder 說(shuō),因為我們試圖強化我們的“個(gè)人品牌”。
——奧巴馬的當選和就職引發(fā)了谷歌搜索“n-gger”的一個(gè)高峰。
根據谷歌搜索數據,在2008年11月奧巴馬當選時(shí),“n-gger”的搜索量在2008年11月奧巴馬當選時(shí)增加了一倍還多,隨后在一個(gè)月內迅速下降。當奧巴馬在2009年1月宣誓就職時(shí),它同樣飆升,然后迅速下降。我們并沒(méi)有所謂的有組織的種族國家對話(huà),Rudder暗示,這只是全國范圍內自發(fā)的民眾行為。
聯(lián)系客服