
如果一個(gè)人的想法可以通過(guò)社交網(wǎng)絡(luò )影響到他的朋友、朋友的朋友、朋友的朋友的朋友,而他們之間可能是互不相識的陌生人,那么他們每個(gè)人的思想是否有交叉?一個(gè)人的思想會(huì )在多大范圍影響他人?影響的程度如何?
這些問(wèn)題的答案,或許都可以從物理學(xué)的理論中找尋到。
近日,一篇題為《局部算法可識別和量化大規模社交網(wǎng)絡(luò )的最優(yōu)傳播者》的文章發(fā)表在《美國國家科學(xué)院院刊》(PNAS)上。
研究人員提出了一種名為PBGA的計算機算法,如果將此算法應用在大型社交網(wǎng)絡(luò )中,可以精確并快速地量化某一用戶(hù)在整個(gè)網(wǎng)絡(luò )中的影響力。
當物理理論遇到計算機編程
PBGA算法的全稱(chēng)是Percolation-Based Greedy Algorithm,中文翻譯為“基于滲流相變的貪心算法”?!柏澬乃惴ā迸c“滲流相變”分別是計算機領(lǐng)域與物理學(xué)科中的兩個(gè)概念。
“貪心算法”是計算機學(xué)科中一個(gè)經(jīng)典算法。這種算法在對問(wèn)題求解時(shí),總是作出在當前看來(lái)是最好的選擇,即不從整體最優(yōu)上加以考慮,它所做出的是在某種意義上的局部最優(yōu)解。
而“滲流”的概念在物理學(xué)中是解釋流體在多孔介質(zhì)內的運動(dòng)規律。
“滲流本質(zhì)上就是傳播。就好比蓄滿(mǎn)水的大壩,當大壩上出現裂縫時(shí),水會(huì )從各個(gè)細小的裂縫中流出,當細小的裂縫足夠多也足夠密集后,會(huì )形成大的洞口,水也會(huì )匯集在一起流出。就好比一個(gè)人發(fā)了一條消息,然后由朋友們轉發(fā),最終形成網(wǎng)絡(luò )影響力?!闭撐牡耐ㄓ嵶髡?、中山大學(xué)數據科學(xué)與計算機學(xué)院副教授胡延慶在接受《中國科學(xué)報》記者采訪(fǎng)時(shí)解釋道。
其實(shí),社交網(wǎng)絡(luò )系統、神經(jīng)網(wǎng)絡(luò )系統等與傳統統計物理研究對象相比有些不一樣,其系統內元素之間的作用關(guān)系與作用強度不由物理距離唯一確定。所以物理學(xué)概念似乎與社交網(wǎng)絡(luò )風(fēng)牛馬不相及。
但在2002年,密歇根大學(xué)的Mark Newman教授提出了網(wǎng)絡(luò )中的信息傳播過(guò)程可以與物理學(xué)中的“滲流相變”相對應的觀(guān)點(diǎn)。
但如何利用“滲流相變”中的概念來(lái)幫助設計高效的優(yōu)化傳播算法,跨領(lǐng)域交叉后又會(huì )碰撞出怎樣的火花,Newman并沒(méi)有給出答案。
“我們用3年的時(shí)間與新加坡馮凌研究員、西南交大紀圣塨博士等合作,研究出了基于‘滲流相變’理論的PBGA算法?!闭撐牧硪晃蛔髡?、中科院理論物理所副研究員金瑜亮告訴《中國科學(xué)報》記者。
在傳播半徑內計算網(wǎng)絡(luò )影響力
PBGA算法的出現顛覆了以前受限于網(wǎng)絡(luò )規模和查找量級的傳統算法。
“舉個(gè)簡(jiǎn)單例子,如果傳統算法要計算某個(gè)人在擁有幾千或幾萬(wàn)個(gè)用戶(hù)的校園網(wǎng)中傳播影響力需要1個(gè)小時(shí),那么當計算其在擁有幾億用戶(hù)微博上的時(shí)候可能就需要1萬(wàn)個(gè)小時(shí)。而且隨著(zhù)網(wǎng)絡(luò )規模越大,所需時(shí)間越長(cháng)?!苯痂ち帘硎?,“而PBGA算法則不受網(wǎng)絡(luò )規模的影響,不論是校園網(wǎng)還是像類(lèi)似微博和Facebook等大型社交網(wǎng)站,PBGA算法所需時(shí)間都差不多?!?/p>
論文中,研究人員也在微博、Facebook、QQ、Twitter等局域社交網(wǎng)絡(luò )進(jìn)行了實(shí)測,結果表明PBGA算法的時(shí)間復雜度確實(shí)和網(wǎng)絡(luò )規?;緹o(wú)關(guān)。
基于簡(jiǎn)單外推估算,對于全球的Facebook網(wǎng)絡(luò ),PBGA算法比經(jīng)典貪心算法(NGA)將快約100億倍。
事實(shí)上,隨著(zhù)互聯(lián)網(wǎng)的發(fā)展,社交網(wǎng)絡(luò )幾乎成為人們交流必不可少的一部分。
但大型的社交網(wǎng)絡(luò )使用人數較多,且數據時(shí)刻都在變化,“所以原則上我們很難基于整個(gè)網(wǎng)絡(luò )數據提出算法?!苯痂ち琳f(shuō),“但是我們可以根據某一個(gè)人所發(fā)消息后,他的朋友閱讀和轉發(fā)量以及朋友的朋友閱讀和轉發(fā)量,即某人的傳播半徑內的信息,來(lái)評估其對整個(gè)網(wǎng)絡(luò )的影響力?!?/p>
研究人員發(fā)現在實(shí)際網(wǎng)絡(luò )中的傳播半徑往往在三層左右(即朋友的朋友的朋友)。
那么,了解某個(gè)人的網(wǎng)絡(luò )影響力有何好處呢?
胡延慶向記者舉了一個(gè)直觀(guān)的例子:比如電商平臺上的小商家并沒(méi)有過(guò)多資金做廣告,但是為了推銷(xiāo)自己的產(chǎn)品,他可以通過(guò)PBGA算法尋找微博或者微信朋友中哪些人的影響力最大,即消息的轉發(fā)量和閱讀量最高。然后,他將推銷(xiāo)信息發(fā)送給這些人,再由這些人進(jìn)行轉發(fā),同樣可以達到廣而告之的目的。
而作為一種更廣泛的應用,PBGA算法可以在應用層面計算與傳播有關(guān)的內容,“比如如果它應用在流感的傳播中,可以幫助我們尋找傳播能力比較強的感染者進(jìn)行阻斷?!?/p>
物理學(xué)理論更廣闊的應用
物理學(xué)與計算機的關(guān)系源遠流長(cháng),除了滲流理論,計算機的“模擬退火算法”也來(lái)源于物理學(xué)的理論。
它是一種基于概率的算法,其出發(fā)點(diǎn)是物理中玻璃物質(zhì)的退火過(guò)程。由于該算法具有較好的全局優(yōu)化性能,現在已經(jīng)在工程中得到了廣泛應用。
而物理學(xué)除了與計算機科學(xué)“糾纏不休”,有時(shí)與社會(huì )學(xué)也會(huì )產(chǎn)生關(guān)系。金瑜亮表示,在這次論文中他們就提出從物理學(xué)和數學(xué)角度思考社會(huì )學(xué)的問(wèn)題,“論文中提到的‘傳播半徑’的概念或許可以解釋社會(huì )學(xué)中的‘三度理論’”。
2007年,美國哈佛大學(xué)教授Nicholas A. Christakis和加州大學(xué)圣地亞哥分校教授James H. Fowler提出,人們在社交網(wǎng)絡(luò )上的很多社會(huì )學(xué)屬性遵循了“三度影響力原則”,也就是說(shuō)人們的行為、態(tài)度、情緒都會(huì )在我們所在的社會(huì )網(wǎng)絡(luò )中三度分隔之內泛起漣漪,即一個(gè)人可以影響他的朋友(一度)、朋友的朋友(二度)和朋友的朋友的朋友(三度)。
同時(shí),每個(gè)人也受到這三度分隔之內的人的影響。如果超過(guò)三度分隔,這種影響力就基本可以忽略。
“在互聯(lián)網(wǎng)中,每個(gè)人都會(huì )受到來(lái)自微博或微信朋友圈的影響,但這種影響是局部的還是全局性的,這點(diǎn)需要思考。而且人的意志和思考能力在這個(gè)社交網(wǎng)絡(luò )盛行的時(shí)代是否還具有獨立性,也值得思考?!苯痂ち帘硎?。
《中國科學(xué)報》 (2018-07-20第3版 科普,《誰(shuí)是社交網(wǎng)絡(luò )最優(yōu)傳播者》)

聯(lián)系客服