中文引用格式: 馬琰,蘇馬婧,姚旺君,等. 基于聚類的HTTP/HTTPS協(xié)議資產(chǎn)發(fā)現(xiàn)[J]. 電子技術(shù)應(yīng)用,2025,51(11):98-106.
英文引用格式: Ma Yan,Su Majing,Yao Wangjun,et al. HTTP/HTTPS protocol asset discovery based on clustering[J]. Application of Electronic Technique,2025,51(11):98-106.
引言
在數(shù)字化轉(zhuǎn)型的推動下,網(wǎng)絡(luò)資產(chǎn)的種類和數(shù)量呈指數(shù)級增長,網(wǎng)絡(luò)安全面臨日益復(fù)雜的挑戰(zhàn)。網(wǎng)絡(luò)資產(chǎn)不僅包括傳統(tǒng)的網(wǎng)絡(luò)設(shè)備(如網(wǎng)絡(luò)攝像頭、防火墻),還擴展至各種內(nèi)容管理系統(tǒng)和網(wǎng)絡(luò)服務(wù)。當(dāng)前,網(wǎng)絡(luò)資產(chǎn)識別主要依賴基于靜態(tài)指紋規(guī)則匹配的方法,這種方法雖然在已知類型資產(chǎn)的識別中表現(xiàn)良好,但其局限性同樣明顯:首先,指紋規(guī)則構(gòu)建和維護依賴于專家經(jīng)驗和大量人力資源投入;其次,基于靜態(tài)指紋庫的方法在面對新型設(shè)備時響應(yīng)速度緩慢,導(dǎo)致對未知類型資產(chǎn)的識別率顯著降低。這些缺陷限制了當(dāng)前基于指紋規(guī)則匹配的資產(chǎn)識別技術(shù)的有效性和適應(yīng)性。
為解決上述問題,本文創(chuàng)新性地提出了一種針對HTTP/HTTPS協(xié)議網(wǎng)絡(luò)資產(chǎn)的發(fā)現(xiàn)方法,通過自動化規(guī)則生成器對主動探測所采集到的HTTP/HTTPS協(xié)議數(shù)據(jù)進行指紋規(guī)則生成和數(shù)據(jù)過濾,配合無監(jiān)督聚類方法實現(xiàn)對網(wǎng)絡(luò)資產(chǎn)數(shù)據(jù)按共同特征進行劃分,以實現(xiàn)協(xié)議的自動發(fā)現(xiàn),此方法可以發(fā)現(xiàn)未知資產(chǎn),提高標注效率。本文提出的自動化規(guī)則生成器基于層次化分組策略,逐步對數(shù)據(jù)集進行細化,提煉具有高區(qū)分度的特征字段并構(gòu)建可以進行粗分類的指紋規(guī)則,以過濾掉無共性資產(chǎn)特征的數(shù)據(jù)。針對HTTP/HTTPS響應(yīng)頭部字段的多樣性,本文對大規(guī)模探測結(jié)果數(shù)據(jù)集進行了統(tǒng)計分析并結(jié)合專家經(jīng)驗,篩選出了21個響應(yīng)頭部字段用于生成自動化過濾規(guī)則,設(shè)計了自動化規(guī)則生成器;在此基礎(chǔ)上,對經(jīng)預(yù)過濾后的數(shù)據(jù),設(shè)計了面向HTTP/HTTPS響應(yīng)體信息的多特征融合資產(chǎn)聚類算法,該算法采用Word2Vec[1]進行特征編碼,將處理后的數(shù)據(jù)轉(zhuǎn)化為特征向量,結(jié)合特征融合技術(shù)與DBSCAN[2]聚類技術(shù),在多維特征空間中進行高效聚類以實現(xiàn)對潛在資產(chǎn)的發(fā)現(xiàn)。最后,本文通過實驗驗證了所提方法的有效性。此方法不僅提高了HTTP/HTTPS協(xié)議資產(chǎn)發(fā)現(xiàn)的效率,還能夠有效發(fā)現(xiàn)未知資產(chǎn),進而提高指紋標注和規(guī)則提取的效率。
本文詳細內(nèi)容請下載:
http://ihrv.cn/resource/share/2000006847
作者信息:
馬琰1,2,蘇馬婧1,2,姚旺君1,2,權(quán)曉文3,劉紅1,2
(1.中國信息安全研究院有限公司,北京 102200;
2.華北計算機系統(tǒng)工程研究所,北京 100083;
3.遠江盛邦(北京)網(wǎng)絡(luò)安全科技股份有限公司,北京 100084)

