引用格式:劉超慧,韓傳福,陳天成,等.融合懲罰因子和時(shí)間權(quán)重的協(xié)同過濾推薦算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(5):17-21.
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和移動(dòng)終端設(shè)備的普及,以用戶為核心的信息生產(chǎn)模型造成了信息的爆炸式增長(zhǎng),公眾很難在海量信息中迅速、準(zhǔn)確地找到所需的信息,面臨著嚴(yán)峻的“信息過載”問題。以推薦系統(tǒng)為代表的信息過濾技術(shù),是解決“信息過載”問題的常用方法。推薦系統(tǒng)依據(jù)用戶的歷史行為和數(shù)據(jù),通過建立模型來挖掘用戶需求和潛在興趣,進(jìn)而從海量信息中為用戶篩選所需的信息[1]。
協(xié)同過濾算法是眾多推薦算法中使用最廣泛、最有效的算法之一,已成功應(yīng)用于許多商業(yè)推薦系統(tǒng),但其仍存在著一些亟待解決的問題,例如冷啟動(dòng)、數(shù)據(jù)稀疏和馬太效應(yīng)。對(duì)此許多學(xué)者進(jìn)行了卓有成效的研究工作。于洪等人提出基于時(shí)間窗口的時(shí)間數(shù)據(jù)權(quán)重,將用戶興趣分為長(zhǎng)期和短期兩類,更好地反映出了用戶興趣變化規(guī)律,提高了推薦精度[2];趙文濤等人提出基于時(shí)間的Logistic權(quán)重函數(shù)與用戶特征屬性進(jìn)行加權(quán)的新的相似度度量模型[3];蘭艷等人利用衰減因子建立非線性時(shí)間加權(quán)函數(shù),賦予評(píng)分不同的時(shí)間權(quán)重,提高了推薦的準(zhǔn)確性[4]。上述文獻(xiàn)雖然考慮了用戶興趣隨時(shí)間的變化,卻未注意到熱門物品對(duì)用戶評(píng)分的影響,對(duì)推薦精度有一定的影響。
謝修娟等人引入物品流行度與位置信息,提高了推薦結(jié)果的多樣性[5];孫紅等人通過添加物品熱門懲罰因子,優(yōu)化了皮爾遜相似度計(jì)算,提高了推薦質(zhì)量[6];AHM H J等人通過研究物品熱門程度的影響,使用啟發(fā)式算法對(duì)用戶相似性度量進(jìn)行優(yōu)化,緩解了傳統(tǒng)協(xié)同過濾算法的冷啟動(dòng)問題[7];焦富森等人考慮物品質(zhì)量和用戶評(píng)分傾向性對(duì)用戶打分的影響,提高推薦效果[8]。這些算法雖彌補(bǔ)了傳統(tǒng)算法過分考慮熱門物品對(duì)評(píng)分的影響,卻未考慮用戶興趣隨時(shí)間遷移的情況,無(wú)法動(dòng)態(tài)追蹤用戶的興趣變化。
本文在基于皮爾遜相似度的基礎(chǔ)上進(jìn)行改進(jìn)實(shí)驗(yàn),提出了一種融合物品熱門懲罰因子和時(shí)間權(quán)重的相似度計(jì)算方法,彌補(bǔ)了傳統(tǒng)算法的缺陷。在Movies100k數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果顯示融合后的算法可以有效追蹤用戶興趣的變化和降低熱門物品對(duì)用戶評(píng)分的影響,提高推薦精度。
本文詳細(xì)內(nèi)容請(qǐng)下載: http://ihrv.cn/resource/share/2000003098
作者信息:劉超慧,韓傳福,陳天成,孔先進(jìn)(鄭州航空工業(yè)管理學(xué)院 智能工程學(xué)院,河南 鄭州 450046)