《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 設(shè)計(jì)應(yīng)用 > 融合懲罰因子和時(shí)間權(quán)重的協(xié)同過(guò)濾推薦算法
融合懲罰因子和時(shí)間權(quán)重的協(xié)同過(guò)濾推薦算法
《信息技術(shù)與網(wǎng)絡(luò)安全》2020年第5期
劉超慧,韓傳福,陳天成,孔先進(jìn)
鄭州航空工業(yè)管理學(xué)院 智能工程學(xué)院,河南 鄭州 450046
摘要: 協(xié)同過(guò)濾算法是一種經(jīng)典的推薦算法,思想是依據(jù)近鄰用戶或者相似物品對(duì)目標(biāo)進(jìn)行推薦,常被應(yīng)用在各類推薦系統(tǒng)中。但傳統(tǒng)算法過(guò)分考慮熱門物品對(duì)評(píng)分的影響,而忽略了冷門物品對(duì)用戶興趣特征度量的貢獻(xiàn),也未考慮用戶興趣動(dòng)態(tài)變化的問(wèn)題。對(duì)此,提出一種新的相似度改進(jìn)算法,改進(jìn)后的協(xié)同過(guò)濾算法將物品熱門懲罰因子和時(shí)間數(shù)據(jù)權(quán)重進(jìn)行加權(quán)計(jì)算,優(yōu)化了用戶相似度計(jì)算方法,形成了一種新的相似性度量模型。利用MovieLens電影推薦數(shù)據(jù)集驗(yàn)證改進(jìn)后的算法,實(shí)驗(yàn)結(jié)果表明,該算法將推薦平均絕對(duì)誤差(MAE)與傳統(tǒng)算法相比降低了13.2%,推薦質(zhì)量有了明顯提升。
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A DOI: 10.19358/j.issn.20965133.2020.05.004
引用格式:劉超慧,韓傳福,陳天成,等.融合懲罰因子和時(shí)間權(quán)重的協(xié)同過(guò)濾推薦算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2020,39(5):17-21.
Abstract:
Key words :

隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和移動(dòng)終端設(shè)備的普及,以用戶為核心的信息生產(chǎn)模型造成了信息的爆炸式增長(zhǎng),公眾很難在海量信息中迅速、準(zhǔn)確地找到所需的信息,面臨著嚴(yán)峻的“信息過(guò)載”問(wèn)題。以推薦系統(tǒng)為代表的信息過(guò)濾技術(shù),是解決“信息過(guò)載”問(wèn)題的常用方法。推薦系統(tǒng)依據(jù)用戶的歷史行為和數(shù)據(jù),通過(guò)建立模型來(lái)挖掘用戶需求和潛在興趣,進(jìn)而從海量信息中為用戶篩選所需的信息[1]。

協(xié)同過(guò)濾算法是眾多推薦算法中使用最廣泛、最有效的算法之一,已成功應(yīng)用于許多商業(yè)推薦系統(tǒng),但其仍存在著一些亟待解決的問(wèn)題,例如冷啟動(dòng)、數(shù)據(jù)稀疏和馬太效應(yīng)。對(duì)此許多學(xué)者進(jìn)行了卓有成效的研究工作。于洪等人提出基于時(shí)間窗口的時(shí)間數(shù)據(jù)權(quán)重,將用戶興趣分為長(zhǎng)期和短期兩類,更好地反映出了用戶興趣變化規(guī)律,提高了推薦精度[2];趙文濤等人提出基于時(shí)間的Logistic權(quán)重函數(shù)與用戶特征屬性進(jìn)行加權(quán)的新的相似度度量模型[3];蘭艷等人利用衰減因子建立非線性時(shí)間加權(quán)函數(shù),賦予評(píng)分不同的時(shí)間權(quán)重,提高了推薦的準(zhǔn)確性[4]。上述文獻(xiàn)雖然考慮了用戶興趣隨時(shí)間的變化,卻未注意到熱門物品對(duì)用戶評(píng)分的影響,對(duì)推薦精度有一定的影響。

謝修娟等人引入物品流行度與位置信息,提高了推薦結(jié)果的多樣性[5];孫紅等人通過(guò)添加物品熱門懲罰因子,優(yōu)化了皮爾遜相似度計(jì)算,提高了推薦質(zhì)量[6];AHM H J等人通過(guò)研究物品熱門程度的影響,使用啟發(fā)式算法對(duì)用戶相似性度量進(jìn)行優(yōu)化,緩解了傳統(tǒng)協(xié)同過(guò)濾算法的冷啟動(dòng)問(wèn)題[7];焦富森等人考慮物品質(zhì)量和用戶評(píng)分傾向性對(duì)用戶打分的影響,提高推薦效果[8]。這些算法雖彌補(bǔ)了傳統(tǒng)算法過(guò)分考慮熱門物品對(duì)評(píng)分的影響,卻未考慮用戶興趣隨時(shí)間遷移的情況,無(wú)法動(dòng)態(tài)追蹤用戶的興趣變化。

本文在基于皮爾遜相似度的基礎(chǔ)上進(jìn)行改進(jìn)實(shí)驗(yàn),提出了一種融合物品熱門懲罰因子和時(shí)間權(quán)重的相似度計(jì)算方法,彌補(bǔ)了傳統(tǒng)算法的缺陷。在Movies100k數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果顯示融合后的算法可以有效追蹤用戶興趣的變化和降低熱門物品對(duì)用戶評(píng)分的影響,提高推薦精度。


本文詳細(xì)內(nèi)容請(qǐng)下載http://ihrv.cn/resource/share/2000003098


作者信息:劉超慧,韓傳福,陳天成,孔先進(jìn)(鄭州航空工業(yè)管理學(xué)院 智能工程學(xué)院,河南 鄭州 450046)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。