這是jiangwei在我的webnote上的留言:
國內并非沒(méi)有人研究tag技術(shù),以《Tags,無(wú)序,分類(lèi)和家族相似》這篇文章為例,我用計算機自動(dòng)提煉的tag如下:信息分類(lèi) 檢索語(yǔ)言 分類(lèi)檢索 Tag 維特根施坦 標簽△ 關(guān)鍵字△ 邏輯△ 家族△ 本質(zhì) 實(shí)證主義△ ,覺(jué)得計算機提煉得如何?特別指出的是:信息分類(lèi)是原文中沒(méi)有的詞語(yǔ),這個(gè)tag是計算機自動(dòng)抽象概括出來(lái)的主題。
這是我的回復:
電腦提煉的只能算關(guān)鍵字或主題詞,不是tag。比如同樣是你提到的那篇文章,如果是人來(lái)給它設置tag,可能會(huì )是:tagsresearch, opinion, folksonomy, etc.
tag表現的是普通人的思維而不是機器的思維,它要求的不是精確,而是方便自己找到。
我之前也說(shuō)過(guò),“很多人習慣性地把tag理解成關(guān)鍵字,實(shí)際上tag不是關(guān)鍵字。”比如機器就沒(méi)有辦法提取一張照片的關(guān)鍵字,但人可以給它設定一個(gè)或多個(gè)tag。
zheng也談到過(guò)tag與關(guān)鍵字的問(wèn)題:
標簽和關(guān)鍵詞比起來(lái),除了更近乎個(gè)人的知識體系之外,在功能上也強大的多。標簽和目錄在功能上一致,而關(guān)鍵詞卻不同于目錄,因此也不同于標簽。
但是在信息的索引找尋上,標簽和關(guān)鍵詞卻有相通的地方。關(guān)鍵詞標注內容的主題,而標簽則是在對內容的個(gè)人理解上的私人標注,未必針對的是主題,比如我可能關(guān)注的是時(shí)間,或者是內容中某個(gè)和通篇主題無(wú)關(guān)的觀(guān)點(diǎn)。因此標簽的設定要比關(guān)鍵詞自由的多,也要方便得多,就好像我把東西到處亂放,但我總能找到我需要的東西。因為那是我自己地盤(pán)的坐標。標簽就是自己關(guān)注/存儲內容的坐標。
比如中網(wǎng)的老板萬(wàn)平國的辦公桌上總是亂七八糟,東西堆得像座山,但他總能找到他想找的東西,不管是一本書(shū),還是一封信,因為他已經(jīng)在腦子里為那個(gè)東西貼上了標簽,他知道那東西在哪兒。但別人把他的桌子收拾干凈以后,他卻發(fā)現,很多東西找不到了。
zheng還認為,“就算是有著(zhù)悠久歷史的分類(lèi)法下的信息,它所能展現的,遠遠落后于信息本身所產(chǎn)生的,因為它有著(zhù)嚴重的時(shí)滯。”
人的思維常常是無(wú)序的,跳躍的,同時(shí)也是活躍的;但嚴格的分類(lèi)法把這種無(wú)序的狀態(tài)進(jìn)行規整化以后,同時(shí)也損失了這種無(wú)序所承載的信息量。關(guān)鍵字技術(shù)當然是有用的,基于文章的語(yǔ)義分析未來(lái)可能產(chǎn)生大量有價(jià)值的應用。但,人并不總是需要精確。就像你愛(ài)上了一個(gè)姑娘,并不是因為她完全符合你事先確定的那些規格,其中一定有很多不可言說(shuō)的成分。
tag是人產(chǎn)生的,又是通過(guò)機器實(shí)現的,所以它天然地帶有人和機器的雙重性格。它無(wú)法替代關(guān)鍵字和主題詞,但同時(shí),機械的關(guān)鍵字和主題詞也無(wú)法替代tag。
Update 1: 剛剛又在MSN上跟jiangwei聊了幾句,他在政府部門(mén)從事語(yǔ)義挖掘方面的工作。像很多人一樣,他或許也認為tag這種民間分類(lèi)的價(jià)值被高估了。不過(guò)我的看法是,語(yǔ)言學(xué)和圖書(shū)館學(xué)關(guān)注的中心是物,是無(wú)生命的文本,而民間分類(lèi)關(guān)注的中心是人,tag是一種人類(lèi)活動(dòng),而不完全是一種分類(lèi)方法。
Update 2: xuer對tag與關(guān)鍵字的評論,是我見(jiàn)過(guò)的最形象的評論:
Tag與關(guān)鍵字之別不僅僅是人機之別,說(shuō)到底還是人與人的主客觀(guān)念之別,都是人的東西,機器只是一種反映,無(wú)非:Tag是以主觀(guān)之,關(guān)鍵字是以客觀(guān)之;Tag是我的,關(guān)鍵字是別人的;Tag用“心”,關(guān)鍵字用“聰明”;Tag是樂(lè ),關(guān)鍵字是音;Tag是曲,關(guān)鍵字是詞;Tag是詩(shī)歌,關(guān)鍵字是文字;Tag是情緒的,關(guān)鍵字是理智的;Tag是自由的,關(guān)鍵字是必然的;Tag是可愛(ài)的,關(guān)鍵字是可信的; Tag是“燈”,關(guān)鍵字是“鏡子”……竊以為二者在幫助我們認識自我和認識世界時(shí)相輔相成,相得益彰,是不二的!
事實(shí)上,上次在讀ooof對Isaac的訪(fǎng)談中提到的google策略與語(yǔ)義網(wǎng)策略時(shí)已隱約有這方面的感受。
聯(lián)系客服