這也是個(gè)談濫了的題目。
然而感覺(jué)有必要整理、匯總一下。
促使感到有必要整理一下的原因見(jiàn)文末。
Taxonomy沒(méi)有必要多談,屬于“圈子里”的小眾學(xué)問(wèn),有大量的成熟研究。圖書(shū)館學(xué)家們很有話(huà)語(yǔ)權。
Ontology計算機專(zhuān)家正在搞,特別是語(yǔ)義Web的那些家伙們,歐洲最為瘋狂,目前有數十億歐元的項目在做。
Folksonomy為什么生命力如此旺盛?讓“專(zhuān)業(yè)人士”頗費思量。
網(wǎng)頁(yè)、圖片、書(shū)簽、音樂(lè )/視頻片段乃至其他任何“細粒度”的信息資源需要標識,并用“元數據”進(jìn)行描述,是基本需求。
這種細粒度的資源姑且稱(chēng)為“微資源(micro-resource)”。由于微內容(microcontent)已經(jīng)有特殊含義,一般指由某種微格式(microformat)編碼的內容,或者最起碼已經(jīng)具有id,能夠獨立管理的內容。
而對微資源的這種操作需求往往在現在的Web(Web1.0)上沒(méi)有很好的方式或者工具能夠滿(mǎn)足。數字圖書(shū)館的微觀(guān)結構包含作為微資源的數字對象,如Kahn/Welinsky結構(handle-metadata-data/link)即是一種微資源結構。Warwick Framework也是。
以下對微資源的功能需求進(jìn)行簡(jiǎn)單總結:
- 微資源的產(chǎn)生(例如:做網(wǎng)絡(luò )書(shū)簽?);
- 微資源需要標識(permanent id?);
- 微資源需要描述(metadata);
- 微資源需要重組(聚合);
- 微資源的重用;
- 微資源的呈現(tag cloud?);
- 微資源的管理和利用需要工具(flickr/del.icio.us/blinklist/365key…)。
可以看出,我把folksonomy的產(chǎn)生和應用與微資源的產(chǎn)生和應用是緊緊聯(lián)系在一起的。
那么,從專(zhuān)業(yè)角度考察,folksonomy有哪些發(fā)展方向呢?
考察folksonomy:
- Folksonomy由tag組成。
- Tag在folksonomy中是微資源的指代物。
- 通過(guò)檢出tag而檢出微資源。
- Tag是平面的。
- Tag是隨意的。
- Tag云圖反映了tag的權重。
Tag的發(fā)展方向(有些目前已經(jīng)有了,但還不完善):
- Tag可以排序(除了目前的字順和權重,還有多種形式,包括動(dòng)態(tài)形式,如結合相關(guān)反饋、合作過(guò)濾、點(diǎn)擊次數、甚至類(lèi)pagerank等);
- Tag可以層級化(層次關(guān)系,例如del.icio.us目前支持的tag類(lèi)目);
- Tag可以聚類(lèi)(反映了資源之間的關(guān)系;經(jīng)常在一起的tag具有較為密切的關(guān)系,等等);
- Tag可以規范化(同義詞、反義詞歸并指代;用代屬分參關(guān)系標注等)。
這些發(fā)展,與應用的成本/邊際效用/方便性有關(guān)。
這些發(fā)展,到了一定程度,就不是folksonomy了。
Folksonomy并非絕對“自由”,并非沒(méi)有體系,只是做標注(tagging)的人沒(méi)有意識到(自己的體系)而已。
Folksonomy的一個(gè)極端形式是Topic Maps (ISO13250);
Topic Maps可以看成一種Ontology。
Taxonomy是一類(lèi)概念體系分類(lèi)方法的總稱(chēng),不具有嚴格的規定。但也可以看成一種不完整的Ontology。
對應于極端自由的Folksonomy,極端規范的、形式化的概念體系是Ontology。
Tom Gruber說(shuō):
Ontologies are enabling technology for the Semantic Web. They are a means for people to state what they mean by formal terms used in data that they might generate or consume. Folksonomies are an emergent phenomenon of the social web. They are created as people associate terms with content that they generate or consume. Recently the two ideas have been put into opposition, as if they were right and left poles of a political spectrum.
Tom Gruber又說(shuō):其實(shí)半形式化就夠了,就能夠起到很大的作用,Ontology的絕對形式化是做不到的。(大意如此)
半形式化的Folksonomy能夠對微資源的語(yǔ)義標注(annotation)帶來(lái)革命性的影響。
“半”到什么程度很難說(shuō)。
或許一點(diǎn)點(diǎn)就夠了,就可能起到很大作用。
例如同義詞(一個(gè)詞的不同寫(xiě)法:web2/web20/web2.0/web 2.0)的自動(dòng)后臺歸并?
要知道A little semantics goes a long way.
根本的:需要工具支持,需要2.0應用的支持。
前一陣(《圖書(shū)館雜志》2月號)發(fā)了一篇講taxonomy的,很好。今天審到一篇投稿,講folksonomy的,也很好,leon已經(jīng)跟王主編說(shuō)了,快發(fā)。
這些投稿其實(shí)都沒(méi)有本文看得深,看得透(嘿嘿,文章是自己的好,;-),吹一個(gè))。
然而本文的許多觀(guān)點(diǎn)需要實(shí)驗佐證。實(shí)驗需要語(yǔ)料,需要樣本,需要系統,需要代碼、需要比較數據。
圖書(shū)館學(xué)屬于人文科學(xué),可以拍腦袋,因而不需要。
而計算機科學(xué)的論文需要。
這就是科學(xué)和學(xué)科的差別。

