今天剛從dream4ever.org知道feed43.com,體驗了一把,感覺(jué)不錯,參照了原作者alon的教程,與各位分享。
沒(méi)用過(guò)RSS的不知道它的好,但是喜歡的網(wǎng)站不支持RSS訂閱怎么辦?用feed43.com就可以了,把web頁(yè)面轉換成RSS feed。
轉換成RSS可以方便的通過(guò)RSS訂閱通知我一個(gè)原本不支持RSS的站點(diǎn),更方便更快捷。
這里我以http://www.buzzc.com/blogs/作為例子
登陸feed43.com ,選擇Create your own feed進(jìn)入
Step 1. Specify source page address (URL)
選擇你想轉換的Web頁(yè)面地址,然后Reload后生成頁(yè)面代碼
Address: http://www.eve-online.com.cn/news/index.htm
Encoding: UTF-8
注意:在輸入Address后點(diǎn)Reload按鈕,如果下面的Page Source不顯示亂碼,那么Encoding不指定也可以。一般默認為gb2312,自己可以通過(guò)察看欲轉換頁(yè)面的源代碼的開(kāi)頭處,<meta ... charset=gb2312">
Step 2. Define extraction rules
定義模板規則,然后Extract后生成抓到的數據
Global Search Pattern: {%}
Item (repeatable) Search Pattern*: <liclass="newsitem-s"><h3><ahref='{%}'>{%}</a></h3><pclass="postbyline">{%}</p>{%}[<ahref='{%}'>全文</a>]</li>
重點(diǎn)在于Search Pattern的填寫(xiě),可以觀(guān)察上面生成的頁(yè)面代碼找到規律,我們發(fā)現每一條標題的代碼都是類(lèi)似如下的。
<liclass="newsitem-s"><h3><ahref='地址'>標題</a></h3><pclass="postbyline">內容[<a href='地址'>全文</a>]</li>
只要把內容部分用{%}替代即可。 Extract后生成的數據如下:
Item 1
{%1} = http://feeds.feedburner.com/PlayinWithIt?m=1380
{%2} = 出租車(chē)司機倪亞四
{%3} = 發(fā)表于 3 小時(shí) 之前
{%4} = 你愿不愿意相信 ...
{%5} = http://feeds.feedburner.com/PlayinWithIt?m=1380
Item 2
...
我們可以看到模板中定義的{%}會(huì )自動(dòng)換成{%1}{%2}{%3}
Step 3. Define output format
利用上面生成的{%1}{%2}{%3}...來(lái)定義輸出的格式
RSS feed properties
Feed Title: buzzc.com-BLOG
Feed Link: http://www.buzzc.com/blogs/
Feed Description: 匯集最熱門(mén)blogs
RSS item properties
Item Title Template*: {%2}-{%3}
Item Link Template*: {%1}
Item Content Template*: {%4}
這里我們把{%2}設定為標題,{%1}設定為鏈接,{%3}設定為時(shí)間,{%4}設定為內容,點(diǎn)擊Preview預覽。
Step 4. Get your RSS feed
最后生成RSS Feed地址:http://feed43.com/8111237031053827.xml,然后就可以用各類(lèi)RSS閱讀器(例如GreatNews)訂閱訪(fǎng)問(wèn)了。
最后對其進(jìn)行處理,需要為注冊用戶(hù):
Change file name of this feed to make it more user-friendly--修改RSS Feed的地址名稱(chēng);
Change feed edit password [?]--設定密碼
Make this feed private [?]--在個(gè)人欄目里顯示 Feed43默認不需要注冊即可制作feed并使用。
聯(lián)系客服