大數據的法律屬性及分類(lèi)意義
作者:溫昱,吉林大學(xué)法學(xué)院2016級博士研究生。
來(lái)源:《甘肅社會(huì )科學(xué)》2018年第6期。原刊責任編輯:楊文德,感謝編輯部供稿!
提 要:大數據法律屬性及分類(lèi)的界定是大數據法學(xué)研究的基礎。大數據是資源、應用和方法的集合體,要充分理解大數據不同面相的法律屬性需要對大數據有多層次的認識。波普爾“三個(gè)世界”理論提供了一種檢視大數據的多元化整體視角。大數據具有“三位一體”的特點(diǎn),既存在于物理世界(世界1)、意識經(jīng)驗世界(世界2),亦存在于客觀(guān)知識世界(世界3)。大 數據具有客觀(guān)性與自主性特征。大數據能夠從人類(lèi)世界的三個(gè)斷面被解構并統合為世界1中的數據集合與世界3中的客觀(guān)知識。以是否經(jīng)過(guò)世界2加工為標準,大數據可歸類(lèi)為作為數據集合的個(gè)人數據與作為客觀(guān)知識的派生數據。對于個(gè)人數據,基于其數據集合的客觀(guān)實(shí)在性而產(chǎn)生的可識別性特征,應對其進(jìn)行“人格一財產(chǎn)”雙重性質(zhì)的權利設置。個(gè)人數據人格性是其財產(chǎn)性的基礎,對個(gè)人數據的法律保護需以對其人格性的保護為出發(fā)點(diǎn)。作為客觀(guān)知識的派生數據,其為人的智慧活動(dòng)結果,因其經(jīng)過(guò)在世界2中的加工而帶有主體相關(guān)性,對其法律保護的核心應當聚焦于不同主體世界2中獨有的加工或發(fā)現。
關(guān)鍵詞:大數據;個(gè)人數據;派生數據;數據集合;客觀(guān)知識;三個(gè)世界”理論
一、問(wèn)題的提出:大數據法學(xué)研究基礎理論不足
大數據是指數據存儲量超過(guò)具有收集、存儲、管理和分析數據功能的傳統數據庫軟件的數據集合。 一般認為,大數據具有4V特征:海量數據規模(Volume) ,快速的數據流轉和動(dòng)態(tài)數據體系(Velocity) , 多樣數據類(lèi)型(Variety )和巨大數據價(jià)值(Value )。 物聯(lián)網(wǎng)、云計算技術(shù)的高速發(fā)展以及智能手機、智能可穿戴設備等無(wú)處不在的終端與傳感器,從體量上不 斷增長(cháng)大數據的規模;不斷發(fā)展并且功能越發(fā)強大的算法,從內涵上不斷推進(jìn)大數據技術(shù)的進(jìn)步;各行各業(yè)均開(kāi)始運用大數據進(jìn)行分析與預測,從外延上不斷擴大大數據的應用范圍。大數據日益成為“人們獲得新的認知、創(chuàng )造新的價(jià)值的源泉;大數據還是改變市場(chǎng)、組織機構,以及政府與公民關(guān)系的方法”。我 國巨大的人口基數以及經(jīng)濟規模,具有形成大數據產(chǎn)業(yè)的天然優(yōu)勢。根據相關(guān)調研測算,2016年我國大 數據核心產(chǎn)業(yè)的市場(chǎng)規模達到168億元,2017—2018年維持40%左右的高速增長(cháng)。2020年我國數據總量 預計達到8060EB,占全球數據總量的18%。
我國大數據及相關(guān)產(chǎn)業(yè)迅猛發(fā)展的態(tài)勢催生了 對相關(guān)法律制度和順應時(shí)代變革的具有創(chuàng )新性、前瞻性的法學(xué)理論的亟待需求。有學(xué)者指出“我國政府在全球率先開(kāi)創(chuàng )了大數據交易的先河……而數據是什么?急需立法予以明確以確定數據權屬和規范交易秩序?!碧貏e是對“大數據是什么,即大數據的法律屬性及分類(lèi)”這個(gè)問(wèn)題,我國目前還未形成統一的立法定論?!吨腥A人民共和國民法總則(草案)》第 108條規定:“民事主體依法享有知識產(chǎn)權。知識產(chǎn)權是指權利人依法就下列客體所享有的權利:…… (八)數據信息;……”可知《草案》對“數據信息” 未加區分就籠統將之規定為知識產(chǎn)權的一種客體。 《中華人民共和國民法總則》第111條規定:自然人的個(gè)人信息受法律保護”第127條規定:“法律對數據和網(wǎng)絡(luò )虛擬財產(chǎn)的保護有規定的,依照其規定”。 可見(jiàn)大數據法律屬性問(wèn)題復雜、理論分歧大,《民法總則》對此不得已做了開(kāi)窗式授權規定,沒(méi)有形成立法定論。
現實(shí)不會(huì )因為立法供給不足、理論不統一放緩發(fā)展腳步,大數據飛速發(fā)展同時(shí)孕育了巨大風(fēng)險與不安全性?!靶煊裼癜浮本褪谴髷祿尚再|(zhì)不清導致個(gè)人數據法律保護不力所引發(fā)的悲劇。大數據立法的前提是大數據法律屬性及分類(lèi)的明晰。在此基礎上,方可論及數據權利類(lèi)型、數據權利主體等學(xué)界熱議的問(wèn)題。目前國內法學(xué)界對大數據法律屬性的研究,或只關(guān)注于大數據某一方面的特征,并未對大數據的法律性質(zhì)有一個(gè)整體說(shuō)明及分類(lèi);抑或是外部視角下對大數據的解構,未從大數據本體出發(fā)探討大數據的法律性質(zhì)問(wèn)題。筆者認為,大數據不僅僅是巨大的數據集合,也是一種最新的科技手段,同時(shí)也表征一種全新的思維方式。認識大數據要把握“資源、技術(shù)、應用”三個(gè)層次……大數據是新資源、新工具和新應用的綜合體。理解大數據的法律屬性,需要一種多元論整體視角。
有鑒于此,本文引入波普爾的“三個(gè)世界”理論為研究模型,以三元論角度解析大數據的法律屬性及其分類(lèi),以期獲得些許有益啟發(fā)。
二、大數據法律屬性分析工具:波普爾“三個(gè)世 界”理論
(一)“三個(gè)世界”的劃分與聯(lián)系
“三個(gè)世界”理論認為,“對人而言,可以區分出 下列三個(gè)世界或宇宙:第一,物理客體或物理狀態(tài)的 世界;第二,意識狀態(tài)或精神狀態(tài)的世界,或行為的動(dòng)作意向的世界;第三,思想的客觀(guān)內容的世界,尤其是科學(xué)思想、詩(shī)的思想和藝術(shù)作品”。波普爾指出 “我們可以稱(chēng)物理世界為‘世界1 '稱(chēng)我們的意識經(jīng)驗世界為‘世界2’,稱(chēng)書(shū)、圖書(shū)館、計算機存儲器以及 諸如此類(lèi)事物的邏輯內容為‘世界3 ’”。世界1以物理形式存在,是歷史的、在先的;以客觀(guān)知識形式存 在的世界3,則是邏輯的,是對世界1認識的上向演進(jìn)成果。連接二者的則是以個(gè)人或群體的主觀(guān)經(jīng)驗、心理狀態(tài)為內涵的世界2。
“三個(gè)世界”理論突破了傳統的心物對立二分 法,以三元論劃分方法解構了人類(lèi)生活的世界——在“心” “物”之外存在著(zhù)一個(gè)獨立的世界3,即客觀(guān)知識 的世界——賦予世界3本體論地位,以強調客觀(guān)知識與“心”“物”同等的重要性。波普爾在《客觀(guān)知識》一書(shū)中闡釋:“按照這種多元論哲學(xué),世界至少包括三個(gè)在本體論上涇渭分明的次世界;或者如我所說(shuō),存在著(zhù)三個(gè)世界。第一世界是物理世界或者物理狀態(tài)的 世界;第二世界是心靈世界或心靈狀態(tài)的世界;第三 世界是智性之物的世界,即客觀(guān)意義上的觀(guān)念的世 界——它是可能的思想客體的世界:自在的理論及其邏輯關(guān)系、自在的論證、自在的問(wèn)題情境等的世界?!辈ㄆ諣枌⑽覀兩娴氖澜鐒澐殖鋈齻€(gè)相 互聯(lián)系又彼此區別的子集,世界2在其中發(fā)揮著(zhù)橋梁作用,“第一世界與第三世界之間以第二世界為中介”。三個(gè)世界之間因此形成了系統性有機循 環(huán)。以人的思維活動(dòng)為例,人的思維活動(dòng)本身發(fā)生于 世界2之中;但人的思維活動(dòng)要以人腦為器官,其生物化學(xué)反應過(guò)程發(fā)生于世界1中的人腦內部;而思維 活動(dòng)所得成果則屬于世界3。所以人的思維活動(dòng)是 三個(gè)世界合力作用結果。三個(gè)世界之間:世界1與世界2能相互作用,世界2與世界3能相互作用?!暗诙澜缂粗饔^(guān)經(jīng)驗或個(gè)人經(jīng)驗的世界跟其他兩個(gè)世界中的任何一個(gè)發(fā)生相互作用。第一世界和第三世 界不能相互作用,除非通過(guò)第二世界即主觀(guān)經(jīng)驗或個(gè)人經(jīng)驗世界的干預”。
(二)世界3的意義與特征
世界3概念提出客觀(guān)知識世界獨立于外部客觀(guān)物理世界和內部主觀(guān)精神世界而存在?!笆澜?是客觀(guān)知識的世界,它是一種編碼知識,人類(lèi)將這種編碼通過(guò)各種方式表達出來(lái),世界3即是被表達出來(lái)的人 類(lèi)精神內容的集合體,是獨屬于人類(lèi)的世界?!笔?界3是人類(lèi)動(dòng)物活動(dòng)的自然產(chǎn)物、是突現進(jìn)化的結果,同生物的進(jìn)化十分類(lèi)似。世界1中存在“量子階梯”,從物質(zhì)的最小單位夸克到原子、分子、生物大分子、細胞,一直到生態(tài)和社會(huì )。循自然界的“量子階梯”繼續向上就進(jìn)入人類(lèi)社會(huì )。世界1中物質(zhì)間 上下向因果關(guān)系是世界3中知識之間上下流動(dòng)的依據。下層的知識可以向上層流動(dòng),例如自然科學(xué)向人 文科學(xué)的滲透;下層知識是上層知識的基礎,上層知識對下層知識進(jìn)行選擇和引導?!笆澜?中知識的松 散性是由世界1中涉及面的廣泛、變化以及世界2主體研究視角的多方位所致?!?/p>
世界3的定位是人類(lèi)活動(dòng)的產(chǎn)物同時(shí)又是世界自我進(jìn)化鏈條中最新的一環(huán)。世界3具有兩個(gè)重要的屬性:自主性與客觀(guān)實(shí)在性。
自主性是世界3的核心?!笆澜?是人類(lèi)的產(chǎn) 物,但它也像其他動(dòng)物的產(chǎn)物一樣,反過(guò)來(lái)又創(chuàng )造它自己的自主性領(lǐng)域。世界3自始就有一定程度的自主性:新的問(wèn)題導致新的創(chuàng )造物或構造物……并且,每一個(gè)這樣的步驟都將創(chuàng )造出新的預想不到的事實(shí), 新的預想不到的問(wèn)題?!笔澜?的自主性表現為客觀(guān)知識自主進(jìn)化的過(guò)程??陀^(guān)知識不依賴(lài)于人是 否發(fā)現它,它總是客觀(guān)地存在,并且自主地超越它的 創(chuàng )造者的初衷??陀^(guān)知識無(wú)需借助人力即可實(shí)現自 我創(chuàng )生、自我組織、自我演化。例如自然數列是人類(lèi) 的作品,但其也創(chuàng )造了自身自主的問(wèn)題:奇數和偶數 之間的區分雖非人創(chuàng ),卻為人類(lèi)活動(dòng)預期外不可避免的結果?!八鼈兘^不是由我們創(chuàng )造的;寧可說(shuō)它們是由我們發(fā)現的;而且在這個(gè)意義上,它們是被發(fā)現以 前就未被發(fā)現地存在著(zhù)”。
世界3的另一個(gè)最顯著(zhù)特征是客觀(guān)實(shí)在性。世 界3表現為抽象并且沒(méi)有實(shí)體的客觀(guān)知識,如文學(xué)、藝術(shù)、科學(xué)理論,經(jīng)濟交往中的商業(yè)模式等。但世界3并非虛構,而是“現實(shí)的”存在著(zhù)。就像鳥(niǎo)籠即使沒(méi)有鳥(niǎo)仍然是鳥(niǎo)籠,記載于書(shū)本或者電子存儲介質(zhì)的知識不會(huì )因為沒(méi)有被讀到就不存在。知識不會(huì )因為是否能夠被讀到、是否能夠被真正掌握這樣的或然性事件,就喪失其客觀(guān)實(shí)在性?!耙且槐緯?shū)屬于客觀(guān)知識的第三世界,它就應該在原則上或者實(shí)際上能夠 被某些人把握?!笔澜?中客觀(guān)實(shí)在性標志著(zhù)其中知識可以被掌握、被理解的可能性。
三、大數據多重面相的法律屬性分析
波普爾“三個(gè)世界”理論,作為一種對于世界本體有較強解釋力的哲學(xué)范式,為我們從整體的角度認識大數據的法律性質(zhì)及其分類(lèi)提供了非常理想的視域。
(一)大數據法律屬性的厘定
以“三個(gè)世界”理論檢視大數據本身,其脫胎于世界1中真實(shí)存在的人、事、物;不同認識主體接收到這些客觀(guān)存在“信息”并以自己的意志和經(jīng)驗進(jìn)行甄別、分類(lèi)等信息化處理,則是發(fā)生在世界2中;作為最終產(chǎn)品成型的大數據,則是對物理世界的數據化表達成果,存在于世界3中。所以,大數據是在世界1中產(chǎn)生,在世界2中凝練,在世界3中形成的客觀(guān)知識??梢?jiàn),大數據存在于“三個(gè)世界”中,呈現出“三位一 體”的面相。就大數據最基本、最傳統的定義——種超大規模的數據集合、一種重要性越發(fā)凸顯的生產(chǎn)要素而言,其屬于世界1。例如有學(xué)人量化了產(chǎn)生于2014年 1月1日到2015年12月15日之間的12435889份上 網(wǎng)裁判文書(shū),統計出其數據量1.5TB,并認為就數量 級而言達到了進(jìn)行大數據分析的一般規模。就“與其說(shuō)大數據是一種海量的數據狀態(tài)及其相應的數據處理技術(shù),不如說(shuō)它是一種思維方式”而言,它屬于世界2。就大數據是一種全新的理論,是關(guān)乎研究范式、商業(yè)模式的客觀(guān)知識而言,其又歸屬于世界 3。已故圖靈獎得主吉姆·格雷將大數據從第三范式 (計算科學(xué))中分離出來(lái)單獨作為一種科研范式,稱(chēng)為“第四范式”。三個(gè)世界是一個(gè)閉合的循環(huán)系統, 彼此間相互聯(lián)系、相互作用。世界1中個(gè)體的存在可以數據方式表征出來(lái),世界3的大數據正是人類(lèi)對數據化存在方式的知識成果。世界3的大數據是客觀(guān)知識世界在本體論意義的擴充,是對物質(zhì)世界的全新認識成果,體現了人類(lèi)對整個(gè)世界認識能力的發(fā)展。對世界2來(lái)說(shuō),正如人通過(guò)世界2對世界3的型塑作用,世界3對人也有影響作用。這種雙向建構的過(guò)程中,世界3里建構的本體論意義上的大數據,必然會(huì )有助于世界2內部形成大數據的思維方式。因而才會(huì )有學(xué)者慨嘆:“人、機、物三元世界的高度融合引發(fā)了數據規模的爆炸式增長(cháng)和數據模式的高度復雜化,世界已進(jìn)入網(wǎng)絡(luò )化的大數據(Big Data)時(shí)代?!?nbsp;所以,對大數據法律屬性的認識以及由此生發(fā)的 大數據法律保護相關(guān)理論,需持一種三分法的整體視角,而非僅管窺于大數據某個(gè)單一面相。三個(gè)世界的相互關(guān)系如下圖所示:
圖1
我國法學(xué)界傳統的對大數據法律屬性的表述僅 僅停留于該圖的右半部分,局限于大數據世界1的面相。幾無(wú)論及大數據的世界3面相,也未看到大數據 三重面相之間的關(guān)系以及作用機制。
“三個(gè)世界”理論、世界3理念在網(wǎng)絡(luò )技術(shù)高速發(fā) 展的背景下獲得了最恰當的現實(shí)注解?!白曰ヂ?lián)網(wǎng)開(kāi)始普及以來(lái),作為‘客觀(guān)知識’的‘網(wǎng)絡(luò )虛擬世界’,為波普爾的‘客觀(guān)知識’世界理論提供了注腳?!贝髷祿r(shí)代的到來(lái),云計算、移動(dòng)技術(shù)越發(fā)成熟,使得知識載體的虛擬性、動(dòng)態(tài)性、即時(shí)性程度越來(lái)越高,網(wǎng)絡(luò )世界也越發(fā)呈現出其歸屬于世界3的本來(lái)面貌。今天 的網(wǎng)絡(luò ),作為一種技術(shù)設計出來(lái)的全球性的知識存儲的容器與交互性的知識互動(dòng)的平臺,則以一種十分具象的方式敞亮了世界3的獨立存在。大數據是世界3中客觀(guān)知識發(fā)展進(jìn)化的最新形式。因而,大數據亦體現著(zhù)自主性與客觀(guān)實(shí)在性。
大數據的自主性即雖是人造,但一經(jīng)出現就在很大程度上是自主的。大數據本身蘊含著(zhù)被人認識到的或者迄今沒(méi)有人意識到的問(wèn)題和推論。人們可以發(fā)現、但無(wú)法窮盡它們。這些問(wèn)題和推論是隨著(zhù)大數據被人制造出后,大數據自主創(chuàng )造的、但在大數據產(chǎn)生時(shí)未曾被設想到的。最典型的例子是谷歌利用大數據技術(shù)找到了當季5000萬(wàn)條美國人最頻繁檢索的詞條與美國疾控中心在203—2008年間季節性流感傳播時(shí)期的數據之間的關(guān)聯(lián),并以此成功提前預測出了 2009年美國出現的新的流感病毒。大數據是 脫胎于世界1的人造物,其作為世界3的對象是物質(zhì)化或具體化于世界1之中的,并作用于世界1。正如錢(qián)學(xué)森所言,(世界3)是人類(lèi)實(shí)踐累積的知識信息世界,這當然是當前人和他人實(shí)踐的創(chuàng )造物。
依據波普爾的理論,大數據是世界1投射在世界 3中的一種全新的表現形式,亦具有客觀(guān)實(shí)在特性。這種客觀(guān)實(shí)在性最直觀(guān)的體現就是新聞客戶(hù)端以我們的閱讀習慣而發(fā)送的特定新聞、購物網(wǎng)站基于我們的瀏覽記錄而形成的“猜你喜歡”的購物推薦列表、 超市大數據顯示啤酒和尿布擺放在一起時(shí)啤酒銷(xiāo)量會(huì )大幅度提升。
因此,大數據“三位一體”的面相不僅表現為世界1中的數據集合,也是世界2中的數據化思維,也是世界3的客觀(guān)知識?!叭齻€(gè)世界”理論中,世界2主要起到的是連接世界1與世界3的中介作用,其強調了世界2的認識功能、而弱化了世界2在三個(gè)世界內 部循環(huán)中加工“最終產(chǎn)品”的作用。也就是說(shuō)波普爾 將原來(lái)被我們誤認為是“主觀(guān)知識”而存放在世界2 中的一部分“客觀(guān)知識”搬回了世界3中的合適位置。這么說(shuō)并不等同于說(shuō)世界2沒(méi)有任何作用,恰恰相反,從世界1到世界3,再從世界3到世界1,世界2 是唯一的通路也是唯一的生產(chǎn)線(xiàn),只不過(guò)通過(guò)世界2 加工的產(chǎn)品最終落在了世界3中。所以,我們在分析大數據的法律屬性時(shí),要注重大數據既是數據集合也是客觀(guān)知識——在世界1與世界3中的不同面相及特點(diǎn)。
(二)作為數據集合的個(gè)人數據
個(gè)人數據表現為世界1中的數據集合。個(gè)人數據的利用可以直接產(chǎn)生經(jīng)濟效益,是一種重要性愈發(fā)凸顯的生產(chǎn)資料。因而個(gè)人數據成為大數據行業(yè)的第一推動(dòng)力。
1. 個(gè)人數據可識別性的客觀(guān)實(shí)在性基礎
Graham Greenleaf統計,截至2015年,全球共有 109個(gè)國家和地區制定了個(gè)人數據保護相關(guān)法律法規。各個(gè)國家、地區對個(gè)人數據的稱(chēng)謂不盡相同。歐盟稱(chēng)之為“個(gè)人數據(Personal Date )”是指任何指向一個(gè)已識別或可識別的自然人的信息。該可識別 的自然人能夠被直接或者間接的識別。美國具有獨特的個(gè)人數據保護模式,聯(lián)邦政府層面的《個(gè)人身份信息保護指南》規定“個(gè)人信息(Personal Information)”包括任何可以識別個(gè)人或提供識別個(gè)人線(xiàn)索的信息。日本謂之“個(gè)人信息(Personal Information)”,規定個(gè)人信息是指能夠識別特定個(gè)人的信息。 既包括姓名等公開(kāi)確定的信息,也包括能夠與其他信息相比照并能夠通過(guò)比照確定特定個(gè)人的信息。我國香港特別行政區則用“個(gè)人資料(隱私)”,指任何可以直接或間接與一名在世人士(資料當事人)有關(guān)的資料、可確定該人士身份的資料以及能夠被處理、查閱的切實(shí)可行的資料。各國各地區法律法 規對于個(gè)人數據稱(chēng)謂盡管有不同,但定義核心無(wú)一例外強調個(gè)人數據的可識別性,因而“個(gè)人數據”、“個(gè)人信息” 、“個(gè)人資料”無(wú)實(shí)質(zhì)性區別,可做同一理解。
我國《網(wǎng)絡(luò )安全法》界定個(gè)人信息為“以電子或 者其他方式記錄的能夠單獨或者與其他信息結合識別自然人個(gè)人身份的各種信息”。工信部《電信和互聯(lián)網(wǎng)用戶(hù)個(gè)人信息保護規定》規定個(gè)人信息為“能夠單獨或者與其他信息結合識別用戶(hù)的信息”?!秱€(gè)人信息保護法(專(zhuān)家意見(jiàn)稿)》亦做類(lèi)似解釋??梢?jiàn)我國大陸地區相關(guān)法律法規對個(gè)人數據的定義與其他國家、地區規定如出一轍,均強調可識別性,通過(guò)該數據能夠直接或間接識別出特定自然人。
綜上,個(gè)人數據最重要的特征為可識別性??勺R別性是個(gè)人數據與某自然人之間存在的一種客觀(guān)可能性——通過(guò)個(gè)人數據辨識出特定自然人的可能性。 個(gè)人數據是人社會(huì )活動(dòng)或生理特征的記錄,是有關(guān)個(gè)人真實(shí)存在的反映,不是憑主觀(guān)智慧創(chuàng )造的。個(gè)人數據是世界1中自然人的行為、體征、社會(huì )關(guān)系被數據化處理后于世界3中形成的產(chǎn)品,是世界1中特定主體在世界3中的投影。大數據的客觀(guān)實(shí)在性標志著(zhù)被理解、被讀取的可能性,其也是個(gè)人數據可被識別 的基礎。個(gè)人數據具有大數據本身的客觀(guān)實(shí)在性。所以,個(gè)人數據的可識別性本質(zhì)上來(lái)說(shuō)是根源于其客 觀(guān)實(shí)在性的一種可能性。根據這種識別的可能性,可識別性分為直接識別的可能與間接識別的可能。為與相關(guān)條文用語(yǔ)保持一致,我們用直接的可識別性與間接的可識別性表示之。直接的可識別性是指通過(guò)某一單一個(gè)人數據就能直接確認出某人,例如身份證號碼、DNA信息、一定情況下的姓名;間接的可識別性是指單個(gè)個(gè)人數據雖然不能辨認出某人,但同其他 數據結合就可以直接指向某個(gè)特定自然人,如地址、 性別、職業(yè)等。
需要重點(diǎn)說(shuō)明的是,識別的可能性是直觀(guān)的可能,即未被加工的可能。個(gè)人數據的可識別性根源于其客觀(guān)實(shí)在性,之所以可以被識別是因為世界1中每一個(gè)自然人都是獨特的個(gè)體,都具有不同特性。世界1中存在的不同特性是先驗的、在先的,而不是世界2 中人為創(chuàng )造、主觀(guān)加工出來(lái)的。個(gè)人數據僅僅是通過(guò)世界2轉化為數據形式的個(gè)人的客觀(guān)、真實(shí)的特征,是以一種電子化編碼形式存在的對特定個(gè)人的數據 化表現形式。個(gè)人數據是對特定自然人忠實(shí)、真實(shí)記錄。所以,通過(guò)數據關(guān)聯(lián)、深度挖掘等需要投入較多時(shí)間、經(jīng)濟、技術(shù)成本的方法而指向某特定自然人的 數據并不是個(gè)人數據,經(jīng)過(guò)世界2加工、處理而非僅僅經(jīng)轉化的數據本身附著(zhù)有世界2的加工痕跡,并不能直觀(guān)地表現出個(gè)人數據被識別的可能性?!稓W盟數 據保護指令》對個(gè)人數據的界定,一是強調了數據可識別的可能性(Likelihood),二是強調了數據可識別的合理性(Reasonableness),一個(gè)需要付出不成比例的費用,或者需要克服很多困難才能識別的數據不能稱(chēng)其為個(gè)人數據。個(gè)人數據只有忠實(shí)于被記錄的個(gè)人、準確反映出其存在于世界1的客觀(guān)特征,才有價(jià)值。這也是對間接識別的個(gè)人數據范圍進(jìn)行嚴格限制的根本原因。
2. 個(gè)人數據的內在張力
個(gè)人數據本質(zhì)為一種數據集合,根源于世界1 的客觀(guān)實(shí)在性,其不僅可以識別出特定的自然人,甚至基于技術(shù)手段可以數據化的還原特定自然人。美國學(xué)者稱(chēng)其為“數字化人格(computer persona) ”理論:“數字行為在一段時(shí)間內積累到一定程度,就能夠構成與實(shí)際人格相似的數字人格即以在交易中體現出來(lái)的數據為基礎的個(gè)人的公共形象,被用來(lái)作 為該個(gè)人的代號?!奔夹g(shù)進(jìn)步以及移動(dòng)智能設備普及,使得每個(gè)人的客觀(guān)存在都可以在瞬間以數據的形式被記錄、收集、整理與儲存。這些個(gè)人數據組合而成的就是特定自然人的數據化人格拼圖。個(gè)人數據的可識別性及由此形成的數據化人格拼圖,使 得日常生活中個(gè)人的行為偏好或社會(huì )關(guān)系、生理特 征都可以被數據化處理以及商業(yè)化利用。并且隨著(zhù)數據挖掘技術(shù)的進(jìn)步,數據之間關(guān)聯(lián)性越來(lái)越強,大數據分析技術(shù)水平的提高進(jìn)一步使個(gè)人數據的商業(yè)價(jià)值得到了充分放大,使其具備了財產(chǎn)屬性。個(gè)人數據越來(lái)越成為熱門(mén)商品,成為商家追逐的對象。這樣一來(lái),個(gè)人數據保護中蘊含的人格利益與信息自由流通和應用中蘊含的巨大經(jīng)濟利益之間就形成了巨大的張力。這種矛盾和利益沖突在大數據時(shí)代 被進(jìn)一步激化。
譬如2018年初轟動(dòng)全國的“支付寶年度賬單”事件中,被網(wǎng)友熱議的《芝麻服務(wù)協(xié)議》默認勾選同意的內容有:采集您的信息包括但不限于您的個(gè)人信息、行為信息、交易信息、資產(chǎn)信息、設備信息等。您已經(jīng)認識到您(作為個(gè)人用戶(hù))的收入、存款、有價(jià)證券、商業(yè)保險、不動(dòng)產(chǎn)的信息和納稅數額信息對于您而言是相當私密而重要的”。上述個(gè)人信息、行為信息、資產(chǎn)信息、信用信息等,均是世界1中個(gè)人產(chǎn)生的數據集合,均為個(gè)人數據。所以這些信息具有極強的識別性,通過(guò)上述各類(lèi)信息,可以單獨直接或者組合而間接鎖定某特定自然人。因而這些數據具備人格性特征。對這些數據的控制和掌握,極大程度上等同于對個(gè)人的全面了解,無(wú)論體征、財產(chǎn)狀況、行為習慣乃至性癖,都以數據形式暴露在數據控制者面前。 然而,由于個(gè)人數據中蘊含的巨大商業(yè)價(jià)值,正如此次事件中有網(wǎng)友評論,“芝麻信用用小字默認勾選并無(wú)法回頭查看的方式,可能是想得到更多人的授權”,越多的個(gè)人數據,意味著(zhù)掌握越大的商業(yè)價(jià)值和可變現機會(huì )。
3. 個(gè)人數據法律保護的邏輯理路
以“三個(gè)世界”理論省視個(gè)人數據保護中人格利益與經(jīng)濟利益的矛盾,有張力也有統一,矛盾非不可調和。個(gè)人數據兼具人格性與財產(chǎn)性的雙重價(jià)值面向,一方面人格性在倫理學(xué)意義是對人本身價(jià)值的肯定,即人具有其尊嚴,人不能作為其他人達到目的的 手段。進(jìn)而每個(gè)人都有權要求其他任何人尊重他的人格,不侵害他的私人領(lǐng)域。另一方面,如果一 種法律關(guān)系、一種權利能夠以金錢(qián)價(jià)值來(lái)出讓或者轉變?yōu)榻疱X(qián)時(shí),也屬于財產(chǎn)。但是人格性與財產(chǎn)性并非個(gè)人數據的兩種平行的法律特征,二者是遞進(jìn)關(guān)系,即人格性是財產(chǎn)性的基礎。為方便說(shuō)明其中邏輯關(guān)系,見(jiàn)下圖。
圖2
個(gè)人數據本質(zhì)是來(lái)自世界1的數據集合,具有客 觀(guān)實(shí)在性?!叭齻€(gè)世界”理論視角下,客觀(guān)實(shí)在性是一種可以被人理解、被人把握的可能。個(gè)人數據的識別性正是基于此種可能。世界2的中介作用只是使個(gè)人數據如實(shí)地再現了世界1中的獨特個(gè)性,并未有任何對數據的加工、整理(圖中虛線(xiàn)部分)??梢灾赶蛱囟ㄗ匀蝗说淖R別性使得個(gè)人數據具備了可以完成數據化人格拼圖的可能性,因而個(gè)人數據具備人格屬性。人格權商品化趨向使得個(gè)人數據的人格屬性發(fā)展出了經(jīng)濟價(jià)值,孕育出了個(gè)人數據的財產(chǎn)性。所以按照內在邏輯順序,個(gè)人數據的財產(chǎn)性是以人格性為基礎形成的。因此,筆者認為對個(gè)人數據的法律保護,無(wú)論是將其納入傳統法律框架內作為人格權的特殊形式,或是為之確立一種新型的雙重面向權利,都應以個(gè)人數據的人格價(jià)值面向為立基點(diǎn)。
(三)作為客觀(guān)知識的派生數據
1.派生數據的主體相關(guān)性大數據除了在世界1中以數據集合面相存在之外,還有世界3中的客觀(guān)知識面相。二者區分標準就在于是否經(jīng)過(guò)世界2中的加工?!叭齻€(gè)世界”理 論中,波普爾特別強調世界2的作用,“認為在人類(lèi) 的水平上,可稱(chēng)為世界2的那些東西,越來(lái)越變成世 界1和世界3的中間環(huán)節:我們在世界1中的一切 活動(dòng)都受到我們的世界2對世界3的了解程度的影響。這就說(shuō)明,為什么如果不理解世界3就不可能 理解人類(lèi)心靈和人類(lèi)本身”。作為客觀(guān)知識 的大數據,即派生數據,是在世界1中出現,在世界 2中加工,在世界3中形成。世界2中的工作過(guò)程,簡(jiǎn)言之就是把接收到的來(lái)自世界1的物質(zhì)信息按照 特定主體的特定目標加工為特定的結構化數據。這些對于特定認識主體來(lái)說(shuō)簡(jiǎn)約有序的結構化數據就以客觀(guān)知識的面相產(chǎn)生并存放在世界3之中。如下圖所示。
世界2的加工是大數據生成的必經(jīng)過(guò)程,也是現作為客觀(guān)知識的大數據的必由之路。世界2包括 個(gè)人智慧、主觀(guān)經(jīng)驗、科學(xué)文化水平、意識狀態(tài)等屬于個(gè)人獨有的內涵。所以不同的世界2必然對應著(zhù)不同的世界3,經(jīng)由不同世界2加工產(chǎn)生的數據也各有不同?!拔覀兠總€(gè)人都在為世界3的成長(cháng)做貢獻…… 我們大家都想掌握這個(gè)世界,我們沒(méi)有一個(gè)人能脫離它而存在?!币莆帐澜?必經(jīng)由世界2。個(gè)人的世界2沉浸于他人的世界2之中,彼此間必然發(fā)生直接或由世界1、的相互影響,并由此形成為人類(lèi)所有的世界2……既有個(gè)人的世界2,也有人類(lèi)的世界 2。主體不同,世界2不同,導致世界3亦有區別。 所以不同主體創(chuàng )造或發(fā)現的大數據也千差萬(wàn)別。電 腦作為大腦的延伸,極大地擴展了世界2加工作用的廣度、深度。技術(shù)手段使得不同主體之間世界2的差 別愈發(fā)巨大。世界2輔以先進(jìn)的技術(shù)工具可以更大限度的發(fā)現、開(kāi)發(fā)大數據,更深度的挖掘大數據中的 “金礦”,以及更好的控制和利用大數據。試想一般 個(gè)人與谷歌、阿里巴巴等數據巨頭相比,二者不僅擁有的數據規模天壤之別,數據深度挖掘和數據間關(guān)聯(lián)開(kāi)發(fā)的能力也是泥云之判,所以一般個(gè)人的世界2與公司形式的人類(lèi)集合體所擁有的世界2相比差異巨大。
一千個(gè)讀者心里有一千個(gè)哈姆雷特,大數據帶有很強的主體相關(guān)性,表現為對同一客觀(guān)存在,因主體不同會(huì )導致不同世界2的加工結果往往南橘北枳。同一世界1,由于世界2的不同也可以發(fā)掘出不同組合形式的各種數據。大數據的主體相關(guān)性更直白講來(lái)是世界2的相關(guān)性,這會(huì )導致世界1與世界2對應 關(guān)系分離,即大數據在世界1中的原生主體與大數據在世界2中的加工主體有很大可能并非同一。最典型的例子莫過(guò)于消費者登錄購物網(wǎng)站所進(jìn)行的瀏覽、對比、購買(mǎi)行為必然會(huì )留下數據痕跡,購物網(wǎng)站通過(guò)數據痕跡分析,得出消費者的購物喜好、時(shí)間偏好、購物習慣等,進(jìn)而對每個(gè)消費者進(jìn)行特定的相應商品推送等服務(wù)。消費者作為其消費相關(guān)大數據的原生主體,其僅僅是在客觀(guān)上留下了種種消費事宜的數據信息,而購物網(wǎng)站則對這些消費者的數據痕跡進(jìn)行了加工、整合、分析,從而得到了其網(wǎng)站消費者諸種情況的派生數據。
2.派生數據法律保護的核心
在我國“被遺忘權第一案”中,針對任某某提出將在百度搜索界面中輸入其姓名得到的六個(gè)關(guān)鍵詞予以屏蔽并要求百度對其名譽(yù)權的損害給予相應賠償,一、二審法院均認為,搜索引擎的“相關(guān)搜索”功能,是為用戶(hù)當前搜索的檢索詞提供特定相關(guān)性的檢索詞推薦,這些相關(guān)檢索詞是根據過(guò)去其他用戶(hù)的搜索習慣和與當前檢索詞之間的關(guān)聯(lián)度計算而產(chǎn)生的,是隨著(zhù)網(wǎng)民輸入檢索詞的內容和頻率變化而實(shí)時(shí)自動(dòng)更新變化的,并非百度刻意為之。一審法院依法駁回原告全部訴訟請求,二審維持原判。任某提出的六個(gè)關(guān)鍵詞,是廣大網(wǎng)民的搜索記錄與當前檢索詞之間關(guān)聯(lián)經(jīng)百度的世界2加工、計算得出的最終產(chǎn)品,其是在記錄廣大網(wǎng)民搜索習慣的原始數據上經(jīng)由百度擁有的世界2加工形成的派生數據,本質(zhì)是數據集合上向形成的客觀(guān)知識。因而這六個(gè)關(guān)鍵詞具有作 為客觀(guān)知識的派生數據所具有的客觀(guān)實(shí)在性與自主性,所以其只是如實(shí)地記錄了廣大網(wǎng)民的相關(guān)搜索狀 況以及客觀(guān)反映出關(guān)鍵詞與網(wǎng)民搜索習慣之間的關(guān) 聯(lián)程度。百度只是發(fā)現了二者之間的關(guān)聯(lián)而非人為的創(chuàng )造了這些關(guān)鍵詞。
經(jīng)世界2加工而成的大數據,有學(xué)者稱(chēng)其為“衍生數據”并釋義為原生數據被記錄、存儲后,經(jīng)過(guò)算法加工、計算、聚合而成的數據。亦有學(xué)者將之稱(chēng)為“數據資產(chǎn)”,是指通過(guò)被初始數據的集合、利用、加工、交易形成的各類(lèi)數據資產(chǎn)。說(shuō)法不同,但無(wú)一例外強調了大數據被加工、整理的過(guò)程。加工、整理的工廠(chǎng)就是世界2?!把苌鷶祿被颉皵祿Y產(chǎn)”是在世界1中產(chǎn)生,在世界2中加工或發(fā)現,最終在世界3 中成型的客觀(guān)知識。大數據與人類(lèi)智慧活動(dòng)息息相關(guān),甚至可以說(shuō)其是人類(lèi)智慧活動(dòng)的產(chǎn)物。因此,對作為客觀(guān)知識的大數據的法律保護,根本上來(lái)說(shuō)是對世界2中加工作用的保護,進(jìn)一步講是對人的智慧勞動(dòng)成果的捍衛。因而這種保護便具有了知識產(chǎn)權保護色彩。
知識產(chǎn)權保護對象為蘊含人的創(chuàng )造力并具有一定價(jià)值的信息。有學(xué)者據此認為大數據的外在形式電子數據就是信息的表達或同型結構,是知識產(chǎn)權客體的形式。大數據的本質(zhì)為信息,而信息是知識產(chǎn)權的客體。筆者對此并不贊同。知識產(chǎn)權所保護的是因為發(fā)明創(chuàng )作者對某些有價(jià)值的信息進(jìn)行了科學(xué)的遴選、有序的組合,并首創(chuàng )性地提出了新的構思及其表達,即產(chǎn)生了結構性智力成果。簡(jiǎn)言之,知識產(chǎn)權的客體是創(chuàng )新性信息組合方案與結構,而非信息本身。若對作為客觀(guān)知識的派生數據以知識產(chǎn)權保護,其保護對象應是不同主體世界2中獨特的智慧勞動(dòng)。
有學(xué)者認為派生數據建立在整理、加工基礎上, 從性質(zhì)上接近物權,但是其以一定的價(jià)值添附創(chuàng )造為基礎,又與工業(yè)產(chǎn)權有相似性。亦有學(xué)者提出了所有權進(jìn)入到認識層面的觀(guān)點(diǎn)。諸種觀(guān)點(diǎn),在明晰了大數據的客觀(guān)知識本質(zhì)后有待于進(jìn)一步的研究。
四、結語(yǔ)
大數據時(shí)代的突然而至,引發(fā)了整個(gè)人類(lèi)世界的全方位變革,其所帶來(lái)的影響甚至被人稱(chēng)為正在進(jìn)行的一次新的啟蒙運動(dòng)。大數據產(chǎn)業(yè)冉冉升起,大數據經(jīng)濟占比越來(lái)越高,這些都使得各行各業(yè)對于大數據的研究?jì)叭怀蔀橐婚T(mén)顯學(xué),法學(xué)無(wú)法免俗也不能免俗。大數據技術(shù)已經(jīng)在愈發(fā)廣泛的領(lǐng)域具備了極強的實(shí)用性,產(chǎn)生了顛覆性的影響,所以法律就應當嚴肅對待之。在喧囂背景下,學(xué)者更應當注重對有關(guān)大數據法律問(wèn)題的基礎理論研究。工欲善其事必先利其器。波普爾“三個(gè)世界”理論在大數據的時(shí)代背景下重新煥發(fā)了其理論與實(shí)踐光彩。借助“三個(gè)世界”理論框架,我們可以全面、立體地理解大數據三位一 體的面相以及不同的法律屬性。數據集合意義上的個(gè)人數據與客觀(guān)知識意義上的派生數據從產(chǎn)生、法律屬性以及相應法律保護的立場(chǎng)均不相同。在理解大 數據不同面相以及各自的法律屬性之后,才能決定實(shí) 踐中對其采取怎樣的法律保護手段、規制方式。這也是波普爾理論中三個(gè)世界之間相互作用、相互影響的循環(huán)在大數據中的體現?!叭齻€(gè)世界”理論視角下認識看待大數據,其世界3的面相也啟示我們重視大數 據科學(xué)技術(shù)發(fā)展對法律領(lǐng)域的影響,同時(shí)尊重科技是 第一生產(chǎn)力的鐵律。世界2作為知識加工廠(chǎng)的中介作用,也啟發(fā)我們在大數據的研究及運用中應當堅持“以人為本”,重視人的作用。
聯(lián)系客服