欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
推薦系統:協(xié)同過(guò)濾 之 Item

推薦系統:協(xié)同過(guò)濾 之 Item-based Collaborative Filtering

說(shuō)起 Item-based collaborative filtering,還有一段有意思的爭論,是關(guān)于它的起源的。

GroupLens 研究小組的 Sarwar 教授等人,于2001年5月在香港召開(kāi)的第 10 屆 WWW 大會(huì )上,發(fā)表了題為《Item-based Collaborative Filtering Recommendation Algorithms》的 paper[1]?,F在看來(lái),這篇 paper 在 Item-based Collaborative Filtering 方面是影響最廣的,被引用的次數也最多,基本上見(jiàn) Item-based 必見(jiàn)此文。在 2000 的時(shí)候,同是上文作者之一的 Karypis 曾經(jīng)完成了《Evaluation of Item-based Top-N Recommendation Algorithms》,但它僅作為明尼蘇達計算機系的一篇 Technical Report 進(jìn)行了發(fā)表,可以看作是 paper[1] 的工作基礎。

但實(shí)際上,早在 1998 年,Amazon 就已經(jīng)開(kāi)發(fā)出了自己的 Item-based 推薦系統,并投入了使用。同年,當時(shí) Amazon 推薦系統的設計師、現在 Findory 的創(chuàng )始人 Greg,連同 Jacobi 和 Benson,使用“Collaborative Recommendations Using Item-to-Item Similarity Mappings”的名字對該項技術(shù)申請了專(zhuān)利。但該專(zhuān)利直到 2001 年才正式通過(guò)!并且在 Sarwar 等人的 paper[1] 里,并沒(méi)有標明引用了此專(zhuān)利的內容。Greg 在自己的 blog 上專(zhuān)門(mén)撰文說(shuō)明了此事 [1] [2],并得到了 Economist 編輯 Tom Standage 的承認。在 2003 年,Greg 發(fā)表了題為《Amazon.com Recommendations: Item-to-Item Collaborative Filtering》的 paper,對 1998 年的專(zhuān)利內容進(jìn)行了詳細的說(shuō)明。

這是一段挺有意思的事情。但更能引起我興趣的,是這項已經(jīng)被實(shí)踐證明確實(shí)行之有效的技術(shù)——Item-based (or item-to-item) collaborative filtering !

Item-based 方法也有一個(gè)基本的假設:能夠引起用戶(hù)興趣的項,必定與其之前評分高的項相似。這個(gè)假設也是與我們日常生活中的行為相一致的,基本上喜歡《長(cháng)尾理論》的人,都會(huì )去看《世界是平的》,不知道你怎么想,反正豆瓣就是這么認為的。

同 User-based 方法類(lèi)似,Item-based 方法需要同樣的三個(gè)步驟:1)得到User-item的評分數據;2)針對項的最近鄰搜索,即對項進(jìn)行相似度計算;3)產(chǎn)生推薦。但相對于 User-based 方法,Item-based 方法最大的改進(jìn)是提高了協(xié)同過(guò)濾方法的擴展性及性能。

從上一篇中可以看到,在 User-based 方法中,隨著(zhù)用戶(hù)數量的不斷增多,在大數量級的用戶(hù)范圍內進(jìn)行“最近鄰搜索”會(huì )成為整個(gè)算法的瓶頸。Item-based 方法通過(guò)計算項之間的相似性來(lái)代替用戶(hù)之間的相似性。對于項來(lái)講,它們之間的相似性要穩定很多,因此可以離線(xiàn)完成工作量最大的相似性計算步驟,從而大大降低了在線(xiàn)計算量,提高推薦效率。

在 Item-based 方法中,要對 A 和 B 進(jìn)行項相似性計算,通常分為兩步:1)找出同時(shí)對 A 和 B 打過(guò)分的組合;2)對這些組合進(jìn)行相似度計算,常用的算法包括:皮爾森相關(guān)系數、余弦相似性、調整余弦相似性和條件概率等。

在 paper[1] 里,Sarwar 教授通過(guò)試驗得到 Item-based 方法的推薦效果要略好于 User-based 方法的結倫。但其實(shí)這也并不盡然。在 2003 年,Mild 教授從批判的角度重新審視了各種推薦算法,指出基于 Item-based 方法并不一定好,算法準確度與采用的實(shí)驗數據數據有關(guān),大多數情況下還是 User-based 方法好。我個(gè)人倒是認為,其實(shí)沒(méi)有絕對的好壞之分,而應該根據問(wèn)題的不同和數據集的特點(diǎn),選擇最合適的方法。

上面所說(shuō)的偏重于學(xué)術(shù)界一些,算法的出發(fā)點(diǎn)還是基于打分,多數使用的是 MovieLens 的數據。工業(yè)界實(shí)際使用的多是在基本 Item-based 方法基礎上的變形,例如基于關(guān)聯(lián)規則的方法,這些方法最大的變化就是在計算項的相似度方面做文章。其實(shí)正如 Greg 曾經(jīng)說(shuō)過(guò)的,協(xié)同過(guò)濾最大的特點(diǎn)是“以數據為先”的,只當有了大量的數據積累,才可能找到最有效的、最適宜的方法。
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
Coursera機器學(xué)習筆記(十六)
推薦系統的循序進(jìn)階讀物(從入門(mén)到精通)
基于實(shí)時(shí)行為的推薦技術(shù)會(huì )超越亞馬遜嗎? | ThinkTAG ?
推薦算法設計綜述
25篇綜述入門(mén)推薦系統
四、【轉】基于知識圖譜的推薦系統(KGRS)綜述
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久