最近,幾個(gè)新的社交軟件出現,那么,很多人使用中發(fā)現,哎呀,為什么我沒(méi)有把通訊錄上傳,他們仍然可以知道我的好友!甚至很多不再通訊錄上的微信好友,也被當作可能認識的人推薦給自己了!
一時(shí)各種猜測。
那么,首先,微信是不會(huì )透露任何關(guān)系鏈給第三方的。
分幾種情況吧。
第一,通過(guò)直接關(guān)系的通訊錄獲取
你沒(méi)有上傳通訊錄,但對方上傳了通訊錄,你在對方通訊錄里。
所以系統標記為,你們很可能認識。這個(gè)最容易理解。
第二,通過(guò)間接關(guān)系的通訊錄獲取
你和對方都沒(méi)上傳通訊錄,但存在第三個(gè)人上傳了通訊錄,并且同時(shí)包含你和對方。
比如說(shuō),A和B都沒(méi)有上傳通訊錄,但C上傳了,C的通訊錄里同時(shí)有A和B。
那這個(gè)是不是很扯啊,很可能八桿子打不著(zhù)的關(guān)系對不對。
可是如果D上傳的通訊錄里也同時(shí)包含A和B,E上傳的通訊錄也是。
現在想想,如果設計一個(gè)閾值,存在多個(gè)人提交的通訊錄里同時(shí)包含了某兩個(gè)人,這兩個(gè)人可能認識的概率是不是就很大了?
再說(shuō),人家系統推薦寫(xiě)的就是可能認識的人,就算不認識,用戶(hù)也不會(huì )多想的。
第三,通過(guò)轉發(fā)和訪(fǎng)問(wèn)行為獲取
這是前幾天在朋友圈看到一個(gè)方案,是個(gè)圖片,追了一下水印,來(lái)自于微博的 "Barret李靖",是阿里的員工,但這個(gè)是不是原始出處我不清楚,如果還有其他出處煩請告知,方案一看就很靠譜,我用自己的理解描述一下。
你在頭條看到一篇文章覺(jué)得有意思,分享到微信,那么分享這個(gè)鏈接就帶了你頭條的用戶(hù)標記。微信上你的朋友打開(kāi)這篇文章的時(shí)候,他可能也是頭條用戶(hù),那么打開(kāi)時(shí)頭條會(huì )獲取他之前訪(fǎng)問(wèn)的cookie,這樣就知道他是誰(shuí),同時(shí)鏈接的參數也知道你是誰(shuí),那么頭條就認為你和他應該是可能認識的。
通過(guò)分享朋友圈的點(diǎn)擊瀏覽行為,基于分享者的URL特征和點(diǎn)擊者的Cookie信息,可以快速建立可能認識的人際關(guān)聯(lián)。
第四,抓取公開(kāi)數據
比如微博,單向關(guān)注不能代表認識,但是如果是互相關(guān)注呢?那是不是彼此認識的概率就很高了?
而互相關(guān)注的數據是可以通過(guò)爬蟲(chóng)抓下來(lái)的。
類(lèi)似這樣的還有,比如QQ空間的評論,我記得是公開(kāi)的吧,比如linkedin的社交關(guān)系。
還有歷史上一些同學(xué)錄產(chǎn)品,或者人才網(wǎng)站上的工作簡(jiǎn)歷,如果你和某人同一時(shí)期在某個(gè)公司某個(gè)部門(mén)就職,或者某個(gè)學(xué)校某個(gè)專(zhuān)業(yè)就學(xué),系統是不是認為你們或許可能認識。
很多產(chǎn)品要求你綁定微博啊,綁定微信啊,綁定QQ啊,綁定這個(gè)那個(gè)啊,然后他們通過(guò)公開(kāi)數據的關(guān)聯(lián)關(guān)系,就把其他很多信息的關(guān)聯(lián)就建立起來(lái)了。
我記得前兩年有個(gè)讀者,基于公開(kāi)數據來(lái)推斷我的好友信息,結果發(fā)給我了,怎么說(shuō)呢,讓人有點(diǎn)害怕的那種。
第五,購買(mǎi)地下數據
應該是2013年吧,7000萬(wàn)QQ群數據泄露,這個(gè)數據在地下市場(chǎng)一直有流轉,很容易得到。如果某兩個(gè)用戶(hù)同在一個(gè)群,也許無(wú)法得出他們的關(guān)系,但是如果同時(shí)在多個(gè)群呢?是不是認識的可能性會(huì )很高?
除了QQ群數據泄露外,還有哪些與社交有關(guān)的數據泄露呢?
開(kāi)房數據泄露是不是也有很多起了,同一間房開(kāi)房的除了情侶關(guān)系,同事關(guān)系也不少,畢竟很多小公司出差兩人一間也常見(jiàn)。家庭關(guān)系,很多家庭旅游為了省錢(qián)是不是也經(jīng)常親戚擠在一間。旅游伙伴關(guān)系,此外還有商務(wù)會(huì )議接待,有時(shí)候也會(huì )把一些商業(yè)伙伴安排在一起。這是不是也都是社交關(guān)系。
其他的還有沒(méi)有?別問(wèn)我,我不知道,但地下市場(chǎng)數據庫的強大經(jīng)常是超乎想象的。
大部分會(huì )覺(jué)得,一個(gè)正規企業(yè)做事情不會(huì )用黑產(chǎn)數據吧,來(lái),說(shuō)個(gè)我知道的,前幾年小額貸,網(wǎng)上保險等行業(yè),為了拓展業(yè)務(wù)買(mǎi)第三方線(xiàn)下數據還少么,第三方線(xiàn)下數據哪來(lái)的?哪個(gè)是干凈的?你真以為巨頭就不會(huì )買(mǎi)?
另外,巨頭找第三方做爬蟲(chóng)抓競品數據的反正我知道有不少案例了。這是另一個(gè)話(huà)題了。
總之,互聯(lián)網(wǎng)無(wú)密可守,社交數據有很多種可能泄露,防不勝防,可能他們還有其他手段,我所能知道的可能也只是冰山一角。如果你不想與世隔絕,這事,就現實(shí)而言,也沒(méi)有更好的規避方法。
聯(lián)系客服