引用格式:康未,李維皓,劉桐菊.基于生成對抗神經(jīng)網(wǎng)絡(luò)的流量生成方法研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2024,43(6):33-41.
引言
隨著計算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)環(huán)境變得日益復(fù)雜[1],網(wǎng)絡(luò)攻擊事件頻發(fā),使得網(wǎng)絡(luò)的安全性測試和評估尤為重要。在網(wǎng)絡(luò)攻擊方式不斷演變之下,人工智能的發(fā)展使得網(wǎng)絡(luò)的攻擊和防御進(jìn)入了一種新的態(tài)勢[2],導(dǎo)致傳統(tǒng)的測試方法無法應(yīng)對當(dāng)前的需求。在此背景之下,亟需一種能夠模擬真實(shí)場景的流量生成工具,以評估網(wǎng)絡(luò)性能、檢測網(wǎng)絡(luò)潛在的風(fēng)險和優(yōu)化應(yīng)用程序,防止網(wǎng)絡(luò)攻擊事件的發(fā)生。
現(xiàn)有網(wǎng)絡(luò)流量生成器主要分為[3]:最大吞吐量生成器,以恒定或最大的速率生成網(wǎng)絡(luò)流量,常用于網(wǎng)絡(luò)帶寬的測試,例如 Iperf2[4];回放生成器,重放之前捕獲的網(wǎng)絡(luò)流量,如 TCPReplay[5];隨機(jī)模型生成器,利用隨機(jī)模型來模擬網(wǎng)絡(luò)流量的特征,如 Harpoon[6];腳本生成器,允許用戶編寫復(fù)雜的邏輯,動態(tài)地修改數(shù)據(jù)包內(nèi)容,可以生成任意類型的數(shù)據(jù)包,如 Moongen[7]和 Scapy[8];特定場景生成器,對特定應(yīng)用程序?qū)崿F(xiàn)的流量生成器,高度定制化,很難在其他環(huán)境繼續(xù)使用。其中只有隨機(jī)模型生成器和腳本生成器具有更多的靈活性,能夠在不同的維度模擬網(wǎng)絡(luò)流量,不過這需要用戶首先對采集到的數(shù)據(jù)設(shè)定一個統(tǒng)計模型,或者利用統(tǒng)計方法估計一個模型。因此如果設(shè)定的隨機(jī)分布不正確,或者流量數(shù)據(jù)的模型是未知的,那么生成流量就會不準(zhǔn)確甚至失敗。
深度神經(jīng)網(wǎng)絡(luò)在擬合隨機(jī)模型上有著天然的優(yōu)勢,可以利用在真實(shí)網(wǎng)絡(luò)中采集的流量數(shù)據(jù),擬合對應(yīng)數(shù)據(jù)的統(tǒng)計分布。而生成對抗神經(jīng)網(wǎng)絡(luò) (Generative Adversarial Networks,GAN)[9]已經(jīng)在很多領(lǐng)域被廣泛應(yīng)用,如圖像[10]、音頻[11]、視頻[12]等。通過對現(xiàn)有網(wǎng)絡(luò)流量生成方法的研究,基于統(tǒng)計的流量生成方法如圖1所示,首先在真實(shí)網(wǎng)絡(luò)中采集一段數(shù)據(jù),然后提取需要生成的網(wǎng)絡(luò)流量的特征;將數(shù)據(jù)經(jīng)過預(yù)處理,得到神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),使用一種或多種統(tǒng)計模型進(jìn)行擬合訓(xùn)練,利用擬合后的模型生成網(wǎng)絡(luò)流量在另一個時間段的特征;最后再將生成特征組合成的流量,發(fā)送到模擬的網(wǎng)絡(luò)環(huán)境中,用以測試網(wǎng)絡(luò)環(huán)境,或者研究網(wǎng)絡(luò)用戶的行為。
本文詳細(xì)內(nèi)容請下載:
http://ihrv.cn/resource/share/2000006045
作者信息:
康未,李維皓,劉桐菊
(華北計算機(jī)系統(tǒng)工程研究所,北京100083)