基于Boosting集成學習的風險URL檢測研究
所屬分類:技術論文
上傳者:wwei
文檔大?。?span>3172 K
標簽: Web攻擊 集成學習 正則化
所需積分:0分積分不夠怎么辦?
文檔介紹:隨著互聯(lián)網(wǎng)的不斷發(fā)展,網(wǎng)站數(shù)量不斷增長,URL作為訪問網(wǎng)站的唯一入口,成為Web攻擊的重點對象。傳統(tǒng)的URL檢測方式主要是針對惡意URL,主要方法是基于特征值和黑白名單,容易產(chǎn)生漏報,且對于復雜URL的檢測能力不足。為解決上述問題,基于集成學習中的Boosting思想,提出一種針對業(yè)務訪問的風險URL檢測的混合模型。該模型前期將URL作為字符串,使用自然語言處理技術對其進行分詞及向量化,然后采用分步建模法的思想,首先利用GBDT算法構建二分類模型,判斷URL是否存在風險,接著將風險URL原始字符串輸入到多分類模型中,利用XGBoost算法對其進行多分類判定,明確風險URL的具體風險類型,為安全分析人員提供參考。在模型構建過程中不斷進行參數(shù)調優(yōu),并采用AUC值和F1值分別對二分類模型和多分類模型進行評估,評估結果顯示二分類模型的AUC值為98.91%,多分類模型的F1值為0.993,效果較好。將其應用到實際環(huán)境中,與現(xiàn)有檢測手段進行對比,發(fā)現(xiàn)模型的檢出率高于現(xiàn)有WAF和APT安全設備,其檢測結果彌補了現(xiàn)有檢測手段的漏報。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。