機器人的"Blog Network”和Most Popular頻道機器人的“Blog Network”
呂欣欣說(shuō)“
有很多東西比“錢(qián)”更精彩”。
他的blog后面列出了自己手動(dòng)生成的主題閱讀列表:
Blognetwork系列其他文章:
1、
Icebin的困惑2、
關(guān)于Blognetwork的一些數字3、
誰(shuí)來(lái)支持中文Blognetwork的發(fā)展 4、
誰(shuí)來(lái)經(jīng)營(yíng)Blognetwork 其他的延展閱讀:
施于人:
icebin為什么要困惑詹臏:
關(guān)于blogbeta,postshow,ofblog與blog network 虹:
BlogMedia與廣告 誰(shuí)來(lái)經(jīng)營(yíng)Blognetwork博客士:
Blog的商業(yè)體現需要包工頭 老冒:
blogging network: 如何維持統一和持久的品牌價(jià)值?Icebin:
也談Blog媒體其實(shí)延展閱讀這類(lèi)東西或者“中文博客在討論什么”這塊,可以用機器自行計算出來(lái),不需要有什么“關(guān)鍵詞”來(lái)作為第一推動(dòng)力,就可以計算出來(lái)熱點(diǎn)。
這么出來(lái)的東西,不就是機器人的“Blog Network”嗎?
just see this photo:
http://www.flickr.com/photos/zhengyun/293060731/[ “內容引擎”能夠通過(guò)對數萬(wàn)乃至數十萬(wàn)篇博文進(jìn)行分析后,自動(dòng)算出許多組博文,每一組博文都有很高的內聚性。我們可以認為這一組博文代表了一個(gè)中文世界的熱點(diǎn)討論。
百度、Google是通過(guò)用戶(hù)搜索輸入的關(guān)鍵詞來(lái)判斷中文世界的熱點(diǎn)。而我們通過(guò)分析博客們寫(xiě)作的數十萬(wàn)篇博文來(lái)尋找熱點(diǎn)的。通過(guò)這種主題自動(dòng)發(fā)現技術(shù),可以很容易知道最近中文世界人們在討論什么、在關(guān)注什么。而不需要任何人為的輸入關(guān)鍵詞來(lái)做第一推動(dòng)力。
譬如說(shuō),如下所示的熱點(diǎn)組:
-----------主題245------------------
核心文檔:(index=11646507.xml)新快報:韓國人發(fā)明漢字
index=11645945.xml title=如何拯救我們的文化?
index=11645979.xml title=看看韓國對中國犯的七宗罪(隨時(shí)更新)
index=11647900.xml title=漢字真是韓國人發(fā)明的又能怎樣(圖)
index=11651176.xml title=韓國人為什么敢意淫漢字?
index=11654537.xml title=韓國人瘋了宣稱(chēng)“漢字是古代韓國人發(fā)明的”!
-----------主題246------------------
核心文檔:(index=11646015.xml)財經(jīng)新聞報道的創(chuàng )新
index=11645987.xml title=財經(jīng)新聞與“利益”視角――財經(jīng)報道心得點(diǎn)滴談
index=11646003.xml title=我們怎么寫(xiě)財經(jīng)新聞
index=11646009.xml title=美國華人記者看中國財經(jīng)報紙――《華爾街日報》成長(cháng)的啟示
index=11646031.xml title=國外財經(jīng)媒體的啟示:大眾化還是專(zhuān)業(yè)化
index=11646037.xml title=需要財經(jīng)大視野――新形勢下經(jīng)濟報道的新特點(diǎn)分析
可以表明人們在討論兩個(gè)熱點(diǎn):“韓國人是否發(fā)明了漢字的爭論”和“財經(jīng)新聞如何制作的分析”。
目前,這種計算將會(huì )每天計算一次。未來(lái)希望能夠半天計算一次,這就對爬蟲(chóng)速度以及熱點(diǎn)計算速度提出了很高的要求。
]
["上面的熱點(diǎn)討論是系統每隔四小時(shí)自動(dòng)生成的中文博客世界的熱點(diǎn)討論之一。內容引擎可以自行計算出熱點(diǎn),當然也可以允許用戶(hù)輸入中心詞或者中心文章來(lái)個(gè)性化計算熱點(diǎn)。"]
"想知道在最近三小時(shí)內中文博客們在熱烈討論什么嗎?"
那就看我們的“Most Popular”頻道吧。
Technorati.com依靠url鏈接來(lái)計算最流行的熱點(diǎn)排行榜(Most Popular:
http://www.technorati.com/pop/),在中國不可能完全根據鏈接計算熱點(diǎn),只能靠語(yǔ)義。
早先的swordi這篇blog也談到了類(lèi)似的意思不過(guò)提到的這些都是人手動(dòng)作的專(zhuān)題并且人有意識提取在先。其實(shí)機器可以自己去發(fā)現去整理。
{
中文網(wǎng)志年會(huì )歸來(lái)的Blog回響:編輯2.0的時(shí)代已經(jīng)來(lái)臨http://swordi.com/2006/11/04/editor20-cnbloggercon-blog-media/看起來(lái)Technorati.com在中國大陸是無(wú)法訪(fǎng)問(wèn)了:( 國內的Souyo.com有些差強人意,收錄Post的速度滯后很?chē)乐?,在杭州參?a target="_blank" >中文網(wǎng)志年會(huì )的第二天訪(fǎng)問(wèn)
Souyo.com開(kāi)設的中文網(wǎng)志年會(huì )的專(zhuān)題頁(yè)面,發(fā)現沒(méi)有新鮮的內容。
今年有許多人在做手工編輯的網(wǎng)志年會(huì )內容聚合,例如博客報的Blogsir就不斷在Update這個(gè)《
2006中文網(wǎng)志年會(huì )后續報道列表總匯》,雖然不是完整收錄,但是手工編輯挑選,也算是彌補了一個(gè)Technorati缺席,Souyo滯后的遺憾。
這個(gè)簡(jiǎn)單的體驗,也說(shuō)明Blog的發(fā)展在2006-2007將邁向一個(gè)新的階段,在許多人近期的討論、交流以及貼子上也可以看到端倪,那就是Blog內容的聚合、整理、再編輯、再發(fā)布。Douban.com的阿北在年會(huì )說(shuō)Douban.com將推出"Blogger推薦",
i.Blogbeta.com和
Bokeebao.com這一類(lèi)型的Blog媒體開(kāi)始越來(lái)越多。而B(niǎo)logbus這個(gè)專(zhuān)業(yè)的BSP也在近期推出了"頻道"這個(gè)新功能,讓Blogger舉薦post,聚合成頻道,Royal在《
Blogbus轉身》這篇貼子里對這件事情做了如下的評論:
BSP從blog內容的存儲到內容的再組織再利用,似乎是順理成章的事,BlogBus這次轉身,軌跡也不難想象……
小容相信編輯2.0的時(shí)代已經(jīng)來(lái)臨。在2007年,中文Blogosphere將有更多的自己寫(xiě)內容的Blogger開(kāi)始變成編輯,他們將專(zhuān)注于小而窄的領(lǐng)域,在RSS聚合工具等Blog內容聚合工具的幫助下,及時(shí)地用Blog的形式報道信息,整理和聚合話(huà)題。這些Blogger與1.0的新聞門(mén)戶(hù)網(wǎng)站的編輯相比,更嫻熟于掌握Blog工具的使用、Blog的傳播、Blog的內容挖掘。