《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 一種協(xié)同表征學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的工控協(xié)議模糊測(cè)試方法
一種協(xié)同表征學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的工控協(xié)議模糊測(cè)試方法
網(wǎng)絡(luò)安全與數(shù)據(jù)治理
何戡1,2,王植1,2,史洪巖1,2,連蓮1,2,孫逸菲1,2,寧博偉2,3,宗學(xué)軍1,2
1.沈陽(yáng)化工大學(xué)信息工程學(xué)院;2.遼寧省石油化工行業(yè)信息安全重點(diǎn)實(shí)驗(yàn)室;3.沈陽(yáng)工業(yè)大學(xué)人工智能學(xué)院
摘要: 針對(duì)工業(yè)控制協(xié)議中復(fù)雜格式與字段依賴難以建模,傳統(tǒng)模糊測(cè)試在測(cè)試用例接收率與樣本多樣性方面存在不足,提出一種協(xié)同表征學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的工控協(xié)議模糊測(cè)試方法。該方法結(jié)合深度可分離卷積的高效特征提取能力與多頭自注意力機(jī)制的全局依賴建模優(yōu)勢(shì),構(gòu)建多尺度特征提取器,捕捉局部與全局特征。引入強(qiáng)化學(xué)習(xí)優(yōu)化策略,增強(qiáng)潛在空間表達(dá)能力。提出通用ICP(Industrial Control Protocols)模糊測(cè)試框架RLCAFuzzer,并在典型能源企業(yè)工業(yè)場(chǎng)景的攻防演練靶場(chǎng)上對(duì)3種常見工控協(xié)議(Modbus/TCP,Ethernet/IP,S7 comm)進(jìn)行實(shí)驗(yàn)驗(yàn)證。結(jié)果表明該框架的TCAR指標(biāo)顯著提高,并展現(xiàn)出更強(qiáng)異常觸發(fā)能力,驗(yàn)證了其在工控協(xié)議漏洞挖掘中的有效性與先進(jìn)性。
中圖分類號(hào):TP393;TP309文獻(xiàn)標(biāo)識(shí)碼:ADOI:10.19358/j.issn.2097-1788.2025.12.002引用格式:何戡,王植,史洪巖,等. 一種協(xié)同表征學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的工控協(xié)議模糊測(cè)試方法[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2025,44(12):6-15.
A fuzz testing method for industrial control protocols based on representation learning and reinforcement learning
He Kan 1,2, Wang Zhi1,2,Shi Hongyan1,2,Lian Lian1,2,Sun Yifei1,2,Ning Bowei2,3,Zong Xuejun1,2
1. College of Information Engineering, Shenyang University of Chemical Technology; 2. Key Laboratory of Information Security for Petrochemical Industry in Liaoning Province; 3. School of Artificial Intelligence,Shenyang University of Technology
Abstract: Given the difficulty in modeling the complex formats and field dependencies of industrial control protocols, traditional fuzz testing suffers from shortcomings in test case acceptance rate and sample diversity. This paper proposes a fuzz testing method for industrial control protocols that combines multiscale representation learning with reinforcement learning. This method combines the efficient feature extraction capabilities of depthwise separable convolutions with the global dependency modeling advantages of a multihead selfattention mechanism to design a multiscale feature extractor that captures both local and global features. A reinforcement learning optimization strategy is introduced to enhance the latent space representation capability. A general ICP (Industrial Control Protocols) fuzz testing framework, RLCAFuzzer, is designed and validated experimentally against three common industrial control protocols (Modbus/TCP, Ethernet/IP, and S7 comm) in a typical energy enterprise attack and defense scenario. Results demonstrate a significant improvement in the TCAR metric and enhanced anomaly triggering capability, demonstrating its effectiveness and advancement in industrial control protocol vulnerability detection.
Key words : fuzz testing;industrial control protocols;vulnerability detection;variational autoencoder;Transforme

引言

工業(yè)控制系統(tǒng)(Industrial Control System,ICS)是由計(jì)算機(jī)設(shè)備和工業(yè)控制元件組成的自動(dòng)控制系統(tǒng),廣泛應(yīng)用于水處理、化工、制造和其他關(guān)鍵領(lǐng)域[1],通過(guò)實(shí)時(shí)監(jiān)控和控制工業(yè)過(guò)程,保障了社會(huì)生產(chǎn)的高效與安全。然而,隨著“互聯(lián)網(wǎng)+”的提出,工業(yè)物聯(lián)網(wǎng)(IIoT)[2]與工業(yè)控制系統(tǒng)緊密結(jié)合[3],催生了智能工業(yè)生態(tài)系統(tǒng)的發(fā)展。工業(yè)控制系統(tǒng)變得互聯(lián)互通[4],且正逐步向智能化和網(wǎng)絡(luò)化方向演進(jìn),傳統(tǒng)的封閉式網(wǎng)絡(luò)結(jié)構(gòu)逐漸被開放式網(wǎng)絡(luò)所取代[5]。工業(yè)控制協(xié)議作為信息化系統(tǒng)各部分之間溝通的橋梁[6],是信息安全傳輸?shù)闹匾U?,其安全性至關(guān)重要[7]。然而工控協(xié)議在設(shè)計(jì)之初專注于功能性,追求協(xié)議的簡(jiǎn)潔性和高性能,并未充分考慮安全性問(wèn)題,在使用中便頻繁暴露出安全漏洞[8]。漏洞挖掘指綜合應(yīng)用各種技術(shù)工具,最大限度地識(shí)別軟件程序、網(wǎng)絡(luò)協(xié)議等系統(tǒng)中潛在安全漏洞的過(guò)程[9]。傳統(tǒng)的漏洞挖掘方法通常依賴于靜態(tài)代碼分析或已知協(xié)議的逆向分析[10]。這些方法需要豐富的先驗(yàn)知識(shí),并且對(duì)工控系統(tǒng)特有的復(fù)雜協(xié)議結(jié)構(gòu)缺乏針對(duì)性。近年來(lái)模糊測(cè)試(Fuzz Testing)[11]作為一種通用的漏洞挖掘方法[12],受到了廣泛關(guān)注。模糊測(cè)試的基本流程通常包括數(shù)據(jù)預(yù)處理、測(cè)試用例生成、測(cè)試執(zhí)行、異常監(jiān)測(cè)與漏洞分析等環(huán)節(jié)。模糊測(cè)試前需要收集目標(biāo)系統(tǒng)的歷史通信流量或已知協(xié)議數(shù)據(jù),以構(gòu)建初始測(cè)試樣本并提取關(guān)鍵特征。隨后,測(cè)試用例生成模塊依據(jù)不同策略構(gòu)造大量測(cè)試數(shù)據(jù),這些數(shù)據(jù)可以通過(guò)變異已有輸入(如隨機(jī)修改、插入或刪除字節(jié))或基于規(guī)則從零生成[13],以最大程度覆蓋潛在攻擊面。然而,在模糊測(cè)試的實(shí)施過(guò)程中,通常需要依據(jù)特定的規(guī)范設(shè)計(jì)和生成測(cè)試數(shù)據(jù),這一過(guò)程帶來(lái)了諸多限制[14]。為突破這些限制,研究者們開始探索將深度學(xué)習(xí)[15]引入模糊測(cè)試,以優(yōu)化測(cè)試用例生成和協(xié)議格式學(xué)習(xí)。例如,Wang等人[16]提出基于Transformer的協(xié)議相似性變異方法,通過(guò)語(yǔ)義建模提升測(cè)試用例接收率以增強(qiáng)異常觸發(fā)能力,但其性能依賴訓(xùn)練數(shù)據(jù)質(zhì)量,跨協(xié)議泛化能力不足。Wanyan等人[17]基于非關(guān)鍵字段變異融合信息熵的獨(dú)特性來(lái)提升樣本多樣性,但其依賴協(xié)議先驗(yàn)解析,難以適應(yīng)未知或私有協(xié)議。Yu等人[18]提出CovGAN方法(CGFuzzer),利用生成對(duì)抗網(wǎng)絡(luò)提升覆蓋率,但GAN模型在高維空間中易出現(xiàn)模式崩潰,導(dǎo)致生成分布集中。Lv等人[19]提出BLSTMDCNNFuzz,提高了模糊測(cè)試的自動(dòng)化程度,但需大量標(biāo)注樣本,計(jì)算成本高,不適用于資源受限的場(chǎng)景。Zhao等人[20]提出的SeqFuzzer提高了測(cè)試效率和對(duì)狀態(tài)協(xié)議的適應(yīng)性,但生成階段缺乏分布約束,難以兼顧覆蓋率與多樣性。Zhao等人[21]提出的AMSFuzz通過(guò)自適應(yīng)調(diào)度優(yōu)化變異算子選擇,提高路徑探索能力,但仍受傳統(tǒng)變異策略框架限制,對(duì)高維輸入泛化不足,且依賴初始種子質(zhì)量,難以實(shí)現(xiàn)真正的自主生成與多樣性控制。綜上,本文提出一種協(xié)同多尺度表征學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的工控協(xié)議模糊測(cè)試方法。利用深度可分離卷積高效提取協(xié)議報(bào)文的多層次特征,并通過(guò)多頭注意力機(jī)制融合局部字段與全局依賴信息;引入潛在空間優(yōu)化策略,動(dòng)態(tài)調(diào)整潛在空間的結(jié)構(gòu)與分布,顯著提升測(cè)試用例的多樣性。在典型能源企業(yè)工業(yè)場(chǎng)景的攻防演練靶場(chǎng)上進(jìn)行實(shí)驗(yàn)以驗(yàn)證模型的有效性。實(shí)驗(yàn)結(jié)果表明,本文方法具備較強(qiáng)的異常觸發(fā)能力,能夠生成多樣性且符合標(biāo)準(zhǔn)的測(cè)試用例,具備更強(qiáng)的漏洞挖掘能力。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://ihrv.cn/resource/share/2000006894


作者信息:

何戡1,2,王植1,2,史洪巖1,2,連蓮1,2,

孫逸菲1,2,寧博偉2,3,宗學(xué)軍1,2

(1.沈陽(yáng)化工大學(xué)信息工程學(xué)院,遼寧沈陽(yáng)110142;

2.遼寧省石油化工行業(yè)信息安全重點(diǎn)實(shí)驗(yàn)室,

遼寧沈陽(yáng)110142;3.沈陽(yáng)工業(yè)大學(xué)人工智能學(xué)院,遼寧沈陽(yáng)110870)


官方訂閱.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。