中文引用格式 : 宗學(xué)軍 , 孫俊輝 , 何戡 , 等. 融合深度特征與強(qiáng)化學(xué)習(xí)的工控協(xié)議模糊測(cè)試方法 [J]. 網(wǎng)絡(luò)安全與數(shù)據(jù)治理 ,
2026 , 45(2) : 1 - 11.
英文引用格式 : Zong Xuejun, Sun Junhui, He Kan, et al. Fuzzing test method for industrial control protocol based on deep feature and rein- forcement learning [J]. Cyber Security and Data Governance, 2026 , 45(2) : 1 - 11.
引言
工業(yè) 控 制 系 統(tǒng) ( Industrial Control Systems, ICS ) 在現(xiàn)代工業(yè)自動(dòng)化中至關(guān)重要 , 廣泛應(yīng)用于制造業(yè)、 電力系 統(tǒng) 等 領(lǐng) 域[1] 。ICS 通 常 由 可 編 程 邏 輯 控 制 器 (PLC) 、分 布 式 控 制 系 統(tǒng) ( DCS ) 、遠(yuǎn) 程 終 端 單 元 (RTU) 等 [2] 工控設(shè)備組成 , 設(shè)備之間通過(guò)工業(yè)控制協(xié) 議 (Industrial Control Protocol, ICP) 進(jìn)行通信和控制。 隨著工業(yè)互聯(lián)網(wǎng)的發(fā)展 , ICS 逐步向開(kāi)放網(wǎng)絡(luò)架構(gòu)轉(zhuǎn) 型 [3] , 雖提升了系統(tǒng)的互聯(lián)互通能力 , 卻面臨網(wǎng)絡(luò)攻 擊威脅 。例如 , 2025 年 5 月 巴基斯坦對(duì)印度發(fā)動(dòng)大規(guī) 模網(wǎng)絡(luò)攻擊 , 導(dǎo)致印度國(guó)家電網(wǎng)工業(yè)控制系統(tǒng)受到攻 擊 , 使印度約 70% 的電網(wǎng)癱瘓[4] 。
許多 ICP 設(shè)計(jì)之初并未充分考慮網(wǎng)絡(luò)安全問(wèn)題 , 其固有的脆弱性使得漏洞挖掘成為研究的重點(diǎn)[5] 。模 糊測(cè)試可通過(guò)變異協(xié)議報(bào)文并觀察設(shè)備響應(yīng)發(fā)現(xiàn)未知 漏洞[6] , 然而 , 傳統(tǒng)的模糊測(cè)試在應(yīng)用于 ICP 時(shí)面臨 著多樣性不足和接收率低等問(wèn)題[7] 。
近年來(lái) , 深度 學(xué) 習(xí)[8] 和 強(qiáng) 化 學(xué) 習(xí)[9] 在 漏 洞 挖 掘 領(lǐng)域展現(xiàn)出強(qiáng)大潛力 。Cheng 等 [10] 提出 MSFuzz, 利 用大型語(yǔ)言模型 ( Large Language Models, LLM) 理 解協(xié)議語(yǔ)法結(jié)構(gòu) , 生成符合協(xié)議規(guī)范的測(cè)試用例 , 但 模型訓(xùn)練依賴有限的協(xié)議樣本 。Yang 等[11] 提出 WG- GFuzz, 利 用 生 成 對(duì) 抗 網(wǎng) 絡(luò) ( Generative Adversarial Network , GAN) 生成測(cè)試用例 , 但過(guò)度依賴特定協(xié) 議的格式和狀態(tài)特征且普適性不足 。Che 等 [12] 提出 了一種基于信息理論的模糊測(cè)試方法 , 通過(guò)協(xié)議結(jié)構(gòu) 解析算法和基于遺傳算法生成測(cè)試用例 , 但對(duì)訓(xùn)練數(shù) 據(jù)的質(zhì)量和數(shù)量有一定依賴 。Wanyan 等 [13] 提出了基 于協(xié)議特征的變異方法 , 利用非關(guān)鍵字段的變異與測(cè) 試用例組合技術(shù) , 減少了冗余輸入的生成 , 但接收率 不足。
當(dāng)前 , 針對(duì)工控協(xié)議的特征提取存在一些不足 , 單一的深度學(xué)習(xí)模型不能準(zhǔn)確提取特征 。卷積神經(jīng)網(wǎng) 絡(luò) (Convolutional Neural Networks, CNN) [14] 雖能捕捉 協(xié)議字段局部組合模式 , 但無(wú)法建模長(zhǎng)距離時(shí)序依賴。 時(shí) 序 卷 積 網(wǎng) 絡(luò) ( Temporal Convolutional Network, TCN) [15] 可通過(guò)因果卷積與膨脹卷積覆蓋長(zhǎng)時(shí)序 , 但 對(duì)關(guān)鍵語(yǔ)義字段關(guān)注度不足 。因此 , 本文通過(guò) CTCA- Net 模型提取特征 。不同于單一模型的局限性 , CTCA- Net 采用融合設(shè)計(jì)思路 , CNN 捕捉協(xié)議報(bào)文的局部結(jié) 構(gòu)特征 , TCN 建立字段間的長(zhǎng)時(shí)序依賴關(guān)系 , 再通過(guò) 注意力機(jī)制對(duì)關(guān)鍵語(yǔ)義字段進(jìn)行強(qiáng)調(diào) , 最終實(shí)現(xiàn)特征 提取性能的提升。
綜上 , 本文提出了一種融合深度特征與強(qiáng)化學(xué) 習(xí)的工 控 協(xié) 議 模 糊 測(cè) 試 方 法 。本 文 主 要 貢 獻(xiàn) 概 括 如下 :
(1) 提出 CTCA-Net 模型提取協(xié)議深層特征 , 解 決傳統(tǒng)方法對(duì)協(xié)議語(yǔ)義理解不足的問(wèn)題 , 提升測(cè)試用 例接收率與多樣性。
(2) 設(shè)計(jì) Actor-Critic 強(qiáng)化學(xué)習(xí)框架 , 實(shí)現(xiàn)變異策 略自主優(yōu)化 , 解決傳統(tǒng)變異策略單一問(wèn)題 , 提升測(cè)試 效率。
(3) 采用 Modbus TCP、EtherNet/IP 和 S7Comm 協(xié) 議評(píng)估 CTARFuzz 性能 , 與現(xiàn)有模糊測(cè)試方法相比 , CTARFuzz 擁有較高的異常觸發(fā)率 , 驗(yàn)證了其在不同協(xié) 議與設(shè)備中的適配性及實(shí)用性。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://ihrv.cn/resource/share/2000006983
作者信息:
宗學(xué)軍1 ,2 , 孫俊輝1 ,2 , 何 戡1 ,2 , 史洪巖1 ,2 , 連 蓮1 ,2 , 寧博偉2 ,3
(1. 沈陽(yáng)化工大學(xué) 信息工程學(xué)院 , 遼寧 沈陽(yáng) 110142 ;
2. 遼寧省石油化工行業(yè)信息安全重點(diǎn)實(shí)驗(yàn)室 , 遼寧 沈陽(yáng) 110142 ;
3. 沈陽(yáng)工業(yè)大學(xué) 人工智能學(xué)院 , 遼寧 沈陽(yáng) 110870)

