一種應(yīng)用于機(jī)器學(xué)習(xí)的惡意網(wǎng)頁(yè)特征提取方法
所屬分類:技術(shù)論文
上傳者:aetmagazine
文檔大小:768 K
標(biāo)簽: 機(jī)器學(xué)習(xí) 惡意網(wǎng)頁(yè)檢測(cè) 哈希壓縮
所需積分:0分積分不夠怎么辦?
文檔介紹:基于機(jī)器學(xué)習(xí)的惡意網(wǎng)頁(yè)檢測(cè)技術(shù)進(jìn)行研究。目前流行的“特征碼”“白名單”等方式,僅能夠檢測(cè)已知的惡意網(wǎng)頁(yè);機(jī)器學(xué)習(xí)方法,能夠檢測(cè)出未知的惡意網(wǎng)頁(yè),但在處理網(wǎng)頁(yè)特征時(shí)要面臨數(shù)據(jù)量大、復(fù)雜和繁瑣的問(wèn)題。提出一種哈希壓縮的方法,用于處理網(wǎng)頁(yè)的特征數(shù)據(jù)。該方法在保證檢測(cè)模型的漏報(bào)率和誤報(bào)率下可實(shí)現(xiàn)將150萬(wàn)的特征映射在2萬(wàn)的特征空間內(nèi),對(duì)提取出的特征數(shù)據(jù)運(yùn)用K折交叉驗(yàn)證法訓(xùn)練多個(gè)傳統(tǒng)機(jī)器學(xué)習(xí)模型和集成學(xué)習(xí)模型。并通過(guò)評(píng)估模型的檢測(cè)效果,篩選出表現(xiàn)最好的分類檢測(cè)模型。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。