123,123,123

一种协同表征学习与强化学习的工控协议模糊测试方法

网络安全与数据治理

何戡1,2，王植1,2，史洪岩1,2，连莲1,2，孙逸菲1,2，宁博伟2,3，宗学军1,2

1.沈阳化工大学信息工程学院；2.辽宁省石油化工行业信息安全重点实验室；3.沈阳工业大学人工智能学院

摘要： 针对工业控制协议中复杂格式与字段依赖难以建模，传统模糊测试在测试用例接收率与样本多样性方面存在不足，提出一种协同表征学习与强化学习的工控协议模糊测试方法。该方法结合深度可分离卷积的高效特征提取能力与多头自注意力机制的全局依赖建模优势，构建多尺度特征提取器，捕捉局部与全局特征。引入强化学习优化策略，增强潜在空间表达能力。提出通用ICP(Industrial Control Protocols)模糊测试框架RLCAFuzzer，并在典型能源企业工业场景的攻防演练靶场上对3种常见工控协议(Modbus/TCP，Ethernet/IP，S7 comm)进行实验验证。结果表明该框架的TCAR指标显著提高，并展现出更强异常触发能力，验证了其在工控协议漏洞挖掘中的有效性与先进性。

關(guān)鍵詞： 模糊测试工业控制协议漏洞挖掘变分自编码器 Transformer

中圖分類號(hào)：TP393；TP309文獻(xiàn)標(biāo)識(shí)碼：ADOI:10.19358/j.issn.2097-1788.2025.12.002引用格式：何戡，王植，史洪巖，等. 一種協(xié)同表征學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的工控協(xié)議模糊測(cè)試方法［J］.網(wǎng)絡(luò)安全與數(shù)據(jù)治理，2025，44（12）：6-15.

A fuzz testing method for industrial control protocols based on representation learning and reinforcement learning

He Kan 1,2, Wang Zhi1,2,Shi Hongyan1,2,Lian Lian1,2,Sun Yifei1,2,Ning Bowei2,3,Zong Xuejun1,2

1. College of Information Engineering, Shenyang University of Chemical Technology; 2. Key Laboratory of Information Security for Petrochemical Industry in Liaoning Province; 3. School of Artificial Intelligence，Shenyang University of Technology

Abstract： Given the difficulty in modeling the complex formats and field dependencies of industrial control protocols, traditional fuzz testing suffers from shortcomings in test case acceptance rate and sample diversity. This paper proposes a fuzz testing method for industrial control protocols that combines multiscale representation learning with reinforcement learning. This method combines the efficient feature extraction capabilities of depthwise separable convolutions with the global dependency modeling advantages of a multihead selfattention mechanism to design a multiscale feature extractor that captures both local and global features. A reinforcement learning optimization strategy is introduced to enhance the latent space representation capability. A general ICP (Industrial Control Protocols) fuzz testing framework, RLCAFuzzer, is designed and validated experimentally against three common industrial control protocols (Modbus/TCP, Ethernet/IP, and S7 comm) in a typical energy enterprise attack and defense scenario. Results demonstrate a significant improvement in the TCAR metric and enhanced anomaly triggering capability, demonstrating its effectiveness and advancement in industrial control protocol vulnerability detection.

Key words : fuzz testing;industrial control protocols;vulnerability detection;variational autoencoder;Transforme

引言

工業(yè)控制系統(tǒng)(Industrial Control System,ICS)是由計(jì)算機(jī)設(shè)備和工業(yè)控制元件組成的自動(dòng)控制系統(tǒng)，廣泛應(yīng)用于水處理、化工、制造和其他關(guān)鍵領(lǐng)域［1］，通過實(shí)時(shí)監(jiān)控和控制工業(yè)過程，保障了社會(huì)生產(chǎn)的高效與安全。然而，隨著“互聯(lián)網(wǎng)+”的提出，工業(yè)物聯(lián)網(wǎng)(IIoT)［2］與工業(yè)控制系統(tǒng)緊密結(jié)合［3］，催生了智能工業(yè)生態(tài)系統(tǒng)的發(fā)展。工業(yè)控制系統(tǒng)變得互聯(lián)互通［4］，且正逐步向智能化和網(wǎng)絡(luò)化方向演進(jìn)，傳統(tǒng)的封閉式網(wǎng)絡(luò)結(jié)構(gòu)逐漸被開放式網(wǎng)絡(luò)所取代［5］。工業(yè)控制協(xié)議作為信息化系統(tǒng)各部分之間溝通的橋梁［6］，是信息安全傳輸?shù)闹匾Ｕ?，其安全性至關(guān)重要［7］。然而工控協(xié)議在設(shè)計(jì)之初專注于功能性，追求協(xié)議的簡(jiǎn)潔性和高性能，并未充分考慮安全性問題，在使用中便頻繁暴露出安全漏洞［8］。漏洞挖掘指綜合應(yīng)用各種技術(shù)工具，最大限度地識(shí)別軟件程序、網(wǎng)絡(luò)協(xié)議等系統(tǒng)中潛在安全漏洞的過程［9］。傳統(tǒng)的漏洞挖掘方法通常依賴于靜態(tài)代碼分析或已知協(xié)議的逆向分析［10］。這些方法需要豐富的先驗(yàn)知識(shí)，并且對(duì)工控系統(tǒng)特有的復(fù)雜協(xié)議結(jié)構(gòu)缺乏針對(duì)性。近年來模糊測(cè)試(Fuzz Testing)［11］作為一種通用的漏洞挖掘方法［12］，受到了廣泛關(guān)注。模糊測(cè)試的基本流程通常包括數(shù)據(jù)預(yù)處理、測(cè)試用例生成、測(cè)試執(zhí)行、異常監(jiān)測(cè)與漏洞分析等環(huán)節(jié)。模糊測(cè)試前需要收集目標(biāo)系統(tǒng)的歷史通信流量或已知協(xié)議數(shù)據(jù)，以構(gòu)建初始測(cè)試樣本并提取關(guān)鍵特征。隨后，測(cè)試用例生成模塊依據(jù)不同策略構(gòu)造大量測(cè)試數(shù)據(jù)，這些數(shù)據(jù)可以通過變異已有輸入(如隨機(jī)修改、插入或刪除字節(jié))或基于規(guī)則從零生成［13］，以最大程度覆蓋潛在攻擊面。然而，在模糊測(cè)試的實(shí)施過程中，通常需要依據(jù)特定的規(guī)范設(shè)計(jì)和生成測(cè)試數(shù)據(jù)，這一過程帶來了諸多限制［14］。為突破這些限制，研究者們開始探索將深度學(xué)習(xí)［15］引入模糊測(cè)試，以優(yōu)化測(cè)試用例生成和協(xié)議格式學(xué)習(xí)。例如，Wang等人［16］提出基于Transformer的協(xié)議相似性變異方法，通過語義建模提升測(cè)試用例接收率以增強(qiáng)異常觸發(fā)能力，但其性能依賴訓(xùn)練數(shù)據(jù)質(zhì)量，跨協(xié)議泛化能力不足。Wanyan等人［17］基于非關(guān)鍵字段變異融合信息熵的獨(dú)特性來提升樣本多樣性，但其依賴協(xié)議先驗(yàn)解析，難以適應(yīng)未知或私有協(xié)議。Yu等人［18］提出CovGAN方法(CGFuzzer)，利用生成對(duì)抗網(wǎng)絡(luò)提升覆蓋率，但GAN模型在高維空間中易出現(xiàn)模式崩潰，導(dǎo)致生成分布集中。Lv等人［19］提出BLSTMDCNNFuzz，提高了模糊測(cè)試的自動(dòng)化程度，但需大量標(biāo)注樣本，計(jì)算成本高，不適用于資源受限的場(chǎng)景。Zhao等人［20］提出的SeqFuzzer提高了測(cè)試效率和對(duì)狀態(tài)協(xié)議的適應(yīng)性，但生成階段缺乏分布約束，難以兼顧覆蓋率與多樣性。Zhao等人［21］提出的AMSFuzz通過自適應(yīng)調(diào)度優(yōu)化變異算子選擇，提高路徑探索能力，但仍受傳統(tǒng)變異策略框架限制，對(duì)高維輸入泛化不足，且依賴初始種子質(zhì)量，難以實(shí)現(xiàn)真正的自主生成與多樣性控制。綜上，本文提出一種協(xié)同多尺度表征學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的工控協(xié)議模糊測(cè)試方法。利用深度可分離卷積高效提取協(xié)議報(bào)文的多層次特征，并通過多頭注意力機(jī)制融合局部字段與全局依賴信息；引入潛在空間優(yōu)化策略，動(dòng)態(tài)調(diào)整潛在空間的結(jié)構(gòu)與分布，顯著提升測(cè)試用例的多樣性。在典型能源企業(yè)工業(yè)場(chǎng)景的攻防演練靶場(chǎng)上進(jìn)行實(shí)驗(yàn)以驗(yàn)證模型的有效性。實(shí)驗(yàn)結(jié)果表明，本文方法具備較強(qiáng)的異常觸發(fā)能力，能夠生成多樣性且符合標(biāo)準(zhǔn)的測(cè)試用例，具備更強(qiáng)的漏洞挖掘能力。

本文詳細(xì)內(nèi)容請(qǐng)下載：

http://ihrv.cn/resource/share/2000006894

作者信息：

何戡1,2，王植1,2，史洪巖1,2，連蓮1,2，

孫逸菲1,2，寧博偉2,3，宗學(xué)軍1,2

(1.沈陽(yáng)化工大學(xué)信息工程學(xué)院，遼寧沈陽(yáng)110142；

2.遼寧省石油化工行業(yè)信息安全重點(diǎn)實(shí)驗(yàn)室，

遼寧沈陽(yáng)110142；3.沈陽(yáng)工業(yè)大學(xué)人工智能學(xué)院，遼寧沈陽(yáng)110870)

官方訂閱.jpg

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容