數(shù)據(jù)中心最新文章

一種改進的缺失數(shù)據(jù)協(xié)同過濾推薦算法

協(xié)同過濾推薦算法是推薦系統(tǒng)研究的熱點,近年來,在亞馬遜、淘寶等商業(yè)系統(tǒng)中獲得應用。在實際應用過程中,協(xié)同過濾推薦面臨數(shù)據(jù)稀疏和準確性低的問題。作為推薦基礎的用戶產(chǎn)品(項目)矩陣通常非常稀疏(存在大量缺失數(shù)據(jù)),從而導致推薦結(jié)果不準確。文章試圖在缺失數(shù)據(jù)情況下提高協(xié)同過濾推薦的準確性,聚焦以下兩個方面:(1)用戶相似度、產(chǎn)品(項目)相似度計算;(2)缺失數(shù)據(jù)預測。首先,用增強的皮爾森相關系數(shù)算法,通過增加參數(shù),對相似度進行修正,提高用戶、產(chǎn)品(項目)相似度計算的準確率。接著,提出一種同時考慮了用戶和產(chǎn)品(項目)特征的缺失數(shù)據(jù)預測算法。算法中,對用戶和產(chǎn)品(項目)分別設置相似度閾值,只有當用戶或產(chǎn)品(項目)相似度達到閾值時,才進行缺失數(shù)據(jù)預測。預測過程中,同時使用用戶和產(chǎn)品(項目)相似度信息,以提高準確度。在模型基礎上,用淘寶移動客戶端的數(shù)據(jù)集進行了驗證,實驗結(jié)果表明所提算法比其他推薦算法要優(yōu)異,對數(shù)據(jù)稀疏性的魯棒性要高。

發(fā)表于:9/26/2016