從交通、安全、氣象到身邊的快遞、廣告、電子商務(wù),大數據已經(jīng)成為任何一座城市都離不開(kāi)的基礎設施。其實(shí),在科學(xué)研究領(lǐng)域,大數據也產(chǎn)生了很大影響,心理學(xué)的研究也因其發(fā)生了改變。
目前,心理學(xué)教科書(shū)普遍認為,第一個(gè)專(zhuān)門(mén)用于收集數據的心理學(xué)實(shí)驗室是心理學(xué)家馮特于1879年在萊比錫大學(xué)建立的。從那時(shí)起,心理學(xué)研究者都在“苦苦”地收集心理學(xué)的實(shí)證數據,以支持自己的心理學(xué)觀(guān)點(diǎn)。
心理學(xué)家想要分析的人類(lèi)行為的數據并不是那么容易獲取到的,這里面涉及諸多困難。心理學(xué)領(lǐng)域曾一度“數據為王”,掌握稀缺的數據就站在了心理學(xué)的前沿。比如,對于較早獲得腦功能成像技術(shù)的心理學(xué)研究者來(lái)說(shuō),腦功能成像數據使他們在腦神經(jīng)這個(gè)心理學(xué)研究方向上取得領(lǐng)導地位。如今,科學(xué)家們又站在了大數據的“風(fēng)口”,大數據能給心理學(xué)帶來(lái)什么呢?
數據之“大”
大數據的可用性在許多領(lǐng)域越來(lái)越普遍,但是,何為大數據?尚未有很清楚和很?chē)栏竦亩x。
我們可以通過(guò)三個(gè)關(guān)鍵特征來(lái)定位大數據。第一個(gè)特征是數量。大數據的數據集比其他數據集大得多,以致可能導致存儲和分析問(wèn)題。第二個(gè)特征是速度。這意味著(zhù)數據以高速率出現或必須在短時(shí)間內處理(例如,實(shí)時(shí)和交互式處理)。第三個(gè)特征是多樣性。它可能是結構化的,也可能是非結構化的,包括文本、圖片、視頻和數字等。這三個(gè)特征對數據的處理能力都有很高要求,這也是為什么“大數據”概念在今天越來(lái)越凸顯,它依賴(lài)于數據處理硬件和軟件的發(fā)展。
除了上述特征,還有一個(gè)大數據的非限定性特征,即準確性。這是從數據的質(zhì)量或真實(shí)性進(jìn)行的定義。大多數大數據都具備這個(gè)特征。這些數據可能涉及人的真實(shí)生活的方方面面,讓人無(wú)以遁形。這就是為何大數據時(shí)代的我們感到越來(lái)越難以保護自身隱私,人的生理、心理和行為都會(huì )有意無(wú)意地被記錄下來(lái),成為大數據的一部分。
心理大數據在哪里
如果說(shuō)人為控制的小型實(shí)驗室在過(guò)去長(cháng)期主導了人類(lèi)心理學(xué)的研究,那么今天的社交媒體和其他個(gè)人相關(guān)的數據端口則提供了一個(gè)活躍的超大型實(shí)驗室。這些端口每天都在記錄著(zhù)世界各地數十億人的語(yǔ)言、圖片和行為。
與心理學(xué)相關(guān)的大數據可以包括社交媒體數據,健康/生理跟蹤器數據、地理定位數據、動(dòng)態(tài)公共記錄、旅行路線(xiàn)數據、網(wǎng)購和消費數據,行為和遺傳數據。
人們在社交媒體,例如臉書(shū)、微博和微信上產(chǎn)生的語(yǔ)言數據給研究者提供了前所未有的研究機會(huì ),因為其數據量極大,而且還具有實(shí)時(shí)性、互動(dòng)性和關(guān)聯(lián)性等特點(diǎn)。社交媒體上人們的個(gè)性化表達行為,比如頭像和個(gè)人資料等,都提供了個(gè)體的身份信息。社交媒體上個(gè)體發(fā)布的動(dòng)態(tài)和位置定位等,又提供了實(shí)時(shí)的個(gè)體行為軌跡及其與其他社會(huì )性或地理性信息的關(guān)系。這無(wú)疑是一個(gè)豐富的人類(lèi)行為樣本的數據源。
此外,人們佩戴的運動(dòng)手環(huán)等收集生理數據的器件也會(huì )上傳大到活動(dòng)路線(xiàn)小到心率的生理數據到云端。生物醫學(xué)機構也會(huì )記錄人們的遺傳和健康數據。這些數據源一旦打通,那么社會(huì )中每個(gè)個(gè)體的行為和生理信息將聯(lián)合提供一個(gè)詳細的對個(gè)人的描述。借助自然語(yǔ)言處理的技術(shù),心理學(xué)家可以訪(fǎng)問(wèn)、獲取和量化原始的語(yǔ)言數據以備描述人的心理和預測人的行為。
心理大數據的發(fā)現
大數據尤其擅長(cháng)回答人們可能不愿意在調查中回答的問(wèn)題。心理學(xué)研究者可以從中窺見(jiàn)更加真實(shí)的信息。
比如,在性取向方面,之前的研究發(fā)現不同地區的男性所報告的同性戀比例存在很大差異。在美國,相比于密西西比州,羅德島的男性在調查中更多地報告自己是同性戀。有解釋說(shuō),這可能是由于羅德島的文化氛圍對性取向問(wèn)題更加寬容,而密西西比州更加保守,因此更多男同性戀搬到了態(tài)度包容的州定居。
一位名為斯蒂芬斯·大衛德威茨的學(xué)者用臉書(shū)數據嘗試驗證這個(gè)解釋。他根據臉書(shū)的個(gè)人資料,將自我認定為同性戀的男性的出生地和他們遷居的目的地建立聯(lián)系,發(fā)現從不太寬容到更寬容的地方有一定趨勢,但仍未能解釋調查中看到的巨大地區差異。
為此,他又用谷歌的數據來(lái)跟蹤人們的搜索軌跡,并取得他們進(jìn)行搜索時(shí)的位置信息。結果發(fā)現,男性對色情內容的搜索中有大約5%是男同性戀色情內容,而且在每個(gè)州都大致如此,并沒(méi)有明顯的地區差異。這說(shuō)明,不同地區的男同性戀者可能并沒(méi)有比例差別,文化因素對男同性戀者的居住地選擇也并非想象中那么大??赡苓@主要還是由于不同地區的男性在自我表露上的深度不同。
心理大數據也可用于解決無(wú)法以其他方式回答的研究問(wèn)題。比如,夢(mèng)的神秘不只在于它的內容和形式,也在于它難以觀(guān)察和研究。經(jīng)典的精神分析學(xué)派創(chuàng )始人弗洛伊德認為夢(mèng)是通往人的潛意識的途徑,因而對夢(mèng)進(jìn)行了“復雜”的解析。但是,大數據提供了另一種探索它的途徑,顯得更加“簡(jiǎn)單”和直接。
比如,弗洛伊德認為,夢(mèng)可能象征性地揭示無(wú)意識的性欲。夢(mèng)中的香蕉或黃瓜可能是陰莖的替身。我們很難反駁這樣的理論,因為弗洛伊德所討論的欲望是無(wú)意識的。這意味著(zhù),即使人們在意識層面談?wù)撍麄兊膲?mèng),但根據定義,他們卻無(wú)法知道夢(mèng)的真正意義。
有些手機應用提供與夢(mèng)相關(guān)的服務(wù),從而記錄了很多用戶(hù)的每天夢(mèng)境信息。為了從大數據來(lái)研究,斯蒂芬斯·大衛德威茨從這些手機應用取得人們的夢(mèng)的內容數據,并與這些人的其他生活數據建立關(guān)聯(lián),統計哪些因素最能預測夢(mèng)中食物出現的頻率。結果與弗洛伊德的理論預測并不相符,最能預測某種食物的出現頻率的是個(gè)體在日常生活中食用該食物的頻率。
因此,似乎并非對性的欲望造成香蕉和黃瓜出現在夢(mèng)里,而是它們本身就常常出現在我們生活中。比如,夢(mèng)中最常出現的蔬菜中,黃瓜是排在第七位的,而在日常生活中,黃瓜也是第七大最受歡迎的蔬菜。
在這項研究中,弗洛伊德關(guān)于夢(mèng)的心理動(dòng)力學(xué)理論并不被大數據所支持。換句話(huà)說(shuō),日有所思夜有所夢(mèng)。心理學(xué)研究者多姆霍夫提出的認知神經(jīng)夢(mèng)境理論認為,大部分夢(mèng)的內容都是對日常事件的真實(shí)反映。這是因為白天意識清醒狀態(tài)下活躍的腦區在睡夢(mèng)中仍然保持一定活性。
盡管未來(lái)會(huì )出現很多“大數據+心理學(xué)”的研究,比如“大數據+夢(mèng)的研究”或“大數據+性的研究”。但是,在可以預見(jiàn)的范圍內,它不會(huì )取代傳統的科學(xué)心理學(xué)研究方式,比如實(shí)驗室研究或問(wèn)卷調查研究。因為許多心理和行為的因果關(guān)系和預測控制的探索還是需要實(shí)驗室研究。但是,心理大數據的出現確實(shí)成為了解人們行為的重要工具。
聯(lián)系客服