文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.19358/j.issn.2097-1788.2023.10.003
引用格式:宋雨倫,李大中,張絲雨,等.基于混合偏好分析的聯(lián)邦推薦框架[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(10):16-22.
0 引言
由于互聯(lián)網(wǎng)在規(guī)模和覆蓋等層面的高速發(fā)展,信息過載使得用戶找到對(duì)自己有用的信息變得困難,從而使得信息利用效率降低;同時(shí)讓商家無法找到真正的目標(biāo)群體[1],且盲目擬合數(shù)據(jù)而不考慮固有偏差將導(dǎo)致許多嚴(yán)重問題,例如線下評(píng)估和線上指標(biāo)之間的差異,損害用戶的滿意度等[2]。所以,如何提高推薦算法的精確性、可解釋性、多樣性等以獲得信息更高的使用效率和用戶更多的信任都是推薦系統(tǒng)研究的重點(diǎn)。
近年來,我國高度重視數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展,同時(shí)統(tǒng)籌發(fā)展與安全,相繼出臺(tái)了多部相關(guān)法律法規(guī),保障網(wǎng)絡(luò)空間數(shù)據(jù)流通的安全及合規(guī)。聯(lián)邦學(xué)習(xí)技術(shù)有助于解決多方數(shù)據(jù)合作中面臨的兩大挑戰(zhàn):一是數(shù)據(jù)安全難以得到保障,隱私數(shù)據(jù)泄露問題亟待解決;二是由于網(wǎng)絡(luò)安全隔離和行業(yè)隱私,不同行業(yè)、部門之間存在數(shù)據(jù)壁壘,導(dǎo)致數(shù)據(jù)形成“孤島”無法安全共享[3]。
本文在保障數(shù)據(jù)使用安全合規(guī)的前提下,結(jié)合聯(lián)邦建模技術(shù),提出了一種混合個(gè)體及群體偏好分析的聯(lián)邦推薦框架。本文主要貢獻(xiàn)如下:
(1)本文提出考慮組合因素的同一屬性間偏好度分析和結(jié)合信息熵的不同屬性間在意度分析方法,通過糾正與真實(shí)興趣屬性具有強(qiáng)關(guān)聯(lián)性的非興趣屬性影響,初步解決了算法的過擬合問題,增強(qiáng)了算法的可解釋性。
(2)本文提出了一種混合偏好分析的聯(lián)邦推薦框架(Mixed Preference Analysis Federated Recommendation Framework, MPAFRF),通過基于聯(lián)邦的相似興趣用戶分群模塊找到用戶所在興趣群,結(jié)合個(gè)體和群體超參權(quán)重組合、個(gè)體偏好分?jǐn)?shù)集合、個(gè)體所在群體偏好分?jǐn)?shù)集合進(jìn)行資源推薦,緩解了推薦系統(tǒng)存在的過度專業(yè)化問題,提高了算法在特定任務(wù)上的表現(xiàn)。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000005733
作者信息:
宋雨倫,李大中,張絲雨,莊媛,崔玲龍,王功舉,閆龍
(聯(lián)通數(shù)字科技有限公司數(shù)據(jù)智能事業(yè)部,北京100013)