文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2021.11.006
引用格式: 洪志理,賴俊,曹雷,等. 融合用戶興趣建模的智能推薦算法研究[J].信息技術(shù)與網(wǎng)絡(luò)安全,2021,40(11):37-48.
0 引言
推薦系統(tǒng)[1],作為大數(shù)據(jù)時(shí)代方便人們?cè)邶嫶蟮目蛇x項(xiàng)目中快速準(zhǔn)確定位到自己感興趣物品的工具,基本思想是通過構(gòu)建模型從用戶的歷史數(shù)據(jù)中提取用戶和物品的特征,利用訓(xùn)練好的模型對(duì)用戶有針對(duì)地推薦物品。
近年來隨著強(qiáng)化學(xué)習(xí)的快速發(fā)展,將強(qiáng)化學(xué)習(xí)應(yīng)用于推薦系統(tǒng)的研究越來越受到關(guān)注,首次將深度強(qiáng)化學(xué)習(xí)應(yīng)用于推薦系統(tǒng)的探索模型是DRN[2],為深度強(qiáng)化學(xué)習(xí)在推薦系統(tǒng)中的應(yīng)用構(gòu)建了基本框架,圖1所示為基于深度強(qiáng)化學(xué)習(xí)的推薦系統(tǒng)框圖。
目前基于深度強(qiáng)化學(xué)習(xí)的推薦系統(tǒng)研究已有諸多研究成果,如童向榮[3]等人將DQN應(yīng)用于以社交網(wǎng)絡(luò)為基礎(chǔ)的信任推薦系統(tǒng)中,應(yīng)用于智能體學(xué)習(xí)用戶之間信任度的動(dòng)態(tài)表示,并基于這種信任值來為用戶做推薦;劉帥帥[4]將DDQN應(yīng)用于電影推薦中來解決推薦精確度低、速度慢以及冷啟動(dòng)等問題;Munemasa[5]等人將DDPG算法應(yīng)用于店鋪推薦,來解決用戶數(shù)據(jù)稀疏問題;Zhao[6]等人將Actor-Critic算法應(yīng)用于列表式推薦,來解決傳統(tǒng)推薦模型只能將推薦過程建模為靜態(tài)過程的問題。上述研究成果以及未在此羅列的眾多研究均是利用強(qiáng)化學(xué)習(xí)本身的性質(zhì)來解決推薦問題,很少?gòu)耐扑]角度出發(fā)考慮問題。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003846
作者信息:
洪志理,賴 俊,曹 雷,陳希亮
(陸軍工程大學(xué) 指揮控制工程學(xué)院,江蘇 南京210007)