《電子技術應用》
您所在的位置:首頁 > 通信与网络 > 设计应用 > 基于双层注意力机制的恶意URL检测
基于双层注意力机制的恶意URL检测
网络安全与数据治理 2期
赵云泽,蒋牧秋,董 伟,冯 志
(1.华北计算机系统工程研究所,北京100083;2.哈尔滨工业大学威海校区 经济管理学院,山东 威海264209)
摘要: 随着信息化技术的不断发展,网络空间中存在的威胁也在不断变化。其中,基于恶意URL的攻击手段层出不穷。针对恶意URL识别与检测问题进行了深入探究,设计并实现了具有双层注意力机制的Bi-LSTM网络模型对恶意URL进行识别和检测,并将其命名为A2Bi-LSTM。该模型分别在字符级别及单词级别对恶意URL中包含的可疑内容进行注意力权值的计算,进一步提升了恶意URL的识别精度。实验结果表明,A2Bi-LSTM对恶意URL的识别准确率达到97%,相较于传统检测模型有着更好的检测效果,能够有效应对此类攻击威胁,有助于网络空间安全体系的构建。
中圖分類號: TP393
文獻標識碼: A
DOI: 10.19358/j.issn.2097-1788.2023.02.001
引用格式: 趙云澤,蔣牧秋,董偉,等. 基于雙層注意力機制的惡意URL檢測[J].網(wǎng)絡安全與數(shù)據(jù)治理,2023,42(2):3-8.
Malicious URL detection based on double attention mechanism
Zhao Yunze1,Jiang Muqiu2,Dong Wei1,Feng Zhi1
(1.National Computer System Engineering Research Institute of China,Beijing 100083,China; 2.School of Economics and Management,Harbin Institute of Technology,Weihai 264209,China)
Abstract: With the continuous development of information technology, threats in cyberspace are also changing. Among them, attacks based on malicious URLs keep intruding. In this paper, the problem of malicious URL identification and detection is deeply explored, and a Bi-LSTM network model with a two-layer attention mechanism is designed and implemented to identify and detect malicious URLs, which is named A2Bi-LSTM. This model calculates the attention weight value of suspicious content contained in malicious URLs at the character level and word level, which further improves the recognition accuracy of malicious URLs. The experimental results show that the identification accuracy of A2Bi-LSTM for malicious URLs reaches 97%, which is better than the traditional detection model, and it can effectively deal with such threats as well as help the construction of cyberspace security system.
Key words : malicious URLs;attention mechanism;cyber security;deep learning

0 引言

  隨著信息化技術的急速發(fā)展和普及,當前社會各行業(yè)的信息化建設和數(shù)字化轉(zhuǎn)型面臨著嚴峻網(wǎng)絡安全挑戰(zhàn)。針對企業(yè)、政府、金融業(yè)等行業(yè)的網(wǎng)絡攻擊行為日益增多,尤其在高級持續(xù)性威脅(Advanced Persistent Threats,APT)逐步成為網(wǎng)絡威脅主要方式的今天,傳統(tǒng)的入侵檢測系統(tǒng)、防火墻等防御手段已經(jīng)難以抵御高等級、高隱蔽性、有組織的網(wǎng)絡攻擊行為。在MITRE公司所發(fā)布的對抗戰(zhàn)術、技術和常識(Adversarial Tactics,Techniques and Common Knowledge,ATT&CK)網(wǎng)絡攻擊行為知識庫[1]的闡述下,由惡意URL為基礎的釣魚攻擊、水坑攻擊、中間人攻擊等手段成為實施APT攻擊的初始必要手段,因此,針對惡意URL檢測與識別的研究成為網(wǎng)絡安全行業(yè)關注的重點。

  統(tǒng)一資源定位器(Uniform Resource Locator,URL)是一種互聯(lián)網(wǎng)標記形式,用以向互聯(lián)網(wǎng)用戶指明其資源位置和訪問方式,是Internet地址中的標準資源。Webroot在2019年發(fā)布的威脅報告指出,即便是在安全域名上也發(fā)現(xiàn)了超過40%的惡意URL,相較于2018年,網(wǎng)絡釣魚攻擊事件的比例上升36%,釣魚網(wǎng)站的數(shù)量也增加了220%。根據(jù)卡巴斯基安全公司2020年的數(shù)據(jù)統(tǒng)計得知,全球用戶計算機遭受至少一次網(wǎng)絡惡意攻擊事件的比例為10.08%,其中包含至少1.72億條URL被網(wǎng)絡安全設備標記為惡意URL,數(shù)量極其龐大??梢钥闯觯瑦阂釻RL已經(jīng)成為網(wǎng)絡犯罪的主要基石,因此,構(gòu)建快速、精準、可泛化的惡意URL檢測模型成為保障網(wǎng)絡安全的關鍵點。




本文詳細內(nèi)容請下載:http://ihrv.cn/resource/share/2000005206




作者信息:

趙云澤1,蔣牧秋2,董  偉1,馮  志1

(1.華北計算機系統(tǒng)工程研究所,北京100083;2.哈爾濱工業(yè)大學威海校區(qū) 經(jīng)濟管理學院,山東 威海264209)


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉(zhuǎn)載。