基于特征集聚和卷積神經(jīng)網(wǎng)絡(luò)的惡意PDF文檔檢測方法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大?。?span>616 K
標(biāo)簽: 惡意PDF文檔 特征集聚 靜態(tài)檢測
所需積分:0分積分不夠怎么辦?
文檔介紹: 針對現(xiàn)有惡意PDF文檔檢測方法存在特征維度高、數(shù)據(jù)集樣本少導(dǎo)致模型欠擬合等問題,提出了一種基于特征集聚和卷積神經(jīng)網(wǎng)絡(luò)的惡意PDF文檔檢測方法。該方法以詞袋模型為基礎(chǔ),從PDF文檔中提取常規(guī)特征和結(jié)構(gòu)特征。然后以合并后特征簇最小方差為目標(biāo),使用Ward最小方差聚類方法實(shí)現(xiàn)特征集聚。最后,將聚合特征送入卷積神經(jīng)網(wǎng)絡(luò)分類模型進(jìn)行訓(xùn)練。根據(jù)不同聚合特征數(shù)下模型性能的好壞,確定最優(yōu)的聚合特征數(shù)。實(shí)驗(yàn)結(jié)果表明,該方法降低了特征維度,提升了模型的召回率,緩解了模型的欠擬合問題??v向比較來看,在不同的良性樣本和惡意樣本比例下,遍歷得到最優(yōu)的聚合特征數(shù),召回率平均提升了53%,F(xiàn)-score平均提升了0.44,運(yùn)行時間平均縮短了27%;與PJScan、PDFrate、Luxor 3種檢測工具橫向相比,檢測的綜合性能平均提升了5%。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。