引用格式:康未,李維皓,劉桐菊.基于生成對(duì)抗神經(jīng)網(wǎng)絡(luò)的流量生成方法研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2024,43(6):33-41.
引言
隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)環(huán)境變得日益復(fù)雜[1],網(wǎng)絡(luò)攻擊事件頻發(fā),使得網(wǎng)絡(luò)的安全性測(cè)試和評(píng)估尤為重要。在網(wǎng)絡(luò)攻擊方式不斷演變之下,人工智能的發(fā)展使得網(wǎng)絡(luò)的攻擊和防御進(jìn)入了一種新的態(tài)勢(shì)[2],導(dǎo)致傳統(tǒng)的測(cè)試方法無法應(yīng)對(duì)當(dāng)前的需求。在此背景之下,亟需一種能夠模擬真實(shí)場景的流量生成工具,以評(píng)估網(wǎng)絡(luò)性能、檢測(cè)網(wǎng)絡(luò)潛在的風(fēng)險(xiǎn)和優(yōu)化應(yīng)用程序,防止網(wǎng)絡(luò)攻擊事件的發(fā)生。
現(xiàn)有網(wǎng)絡(luò)流量生成器主要分為[3]:最大吞吐量生成器,以恒定或最大的速率生成網(wǎng)絡(luò)流量,常用于網(wǎng)絡(luò)帶寬的測(cè)試,例如 Iperf2[4];回放生成器,重放之前捕獲的網(wǎng)絡(luò)流量,如 TCPReplay[5];隨機(jī)模型生成器,利用隨機(jī)模型來模擬網(wǎng)絡(luò)流量的特征,如 Harpoon[6];腳本生成器,允許用戶編寫復(fù)雜的邏輯,動(dòng)態(tài)地修改數(shù)據(jù)包內(nèi)容,可以生成任意類型的數(shù)據(jù)包,如 Moongen[7]和 Scapy[8];特定場景生成器,對(duì)特定應(yīng)用程序?qū)崿F(xiàn)的流量生成器,高度定制化,很難在其他環(huán)境繼續(xù)使用。其中只有隨機(jī)模型生成器和腳本生成器具有更多的靈活性,能夠在不同的維度模擬網(wǎng)絡(luò)流量,不過這需要用戶首先對(duì)采集到的數(shù)據(jù)設(shè)定一個(gè)統(tǒng)計(jì)模型,或者利用統(tǒng)計(jì)方法估計(jì)一個(gè)模型。因此如果設(shè)定的隨機(jī)分布不正確,或者流量數(shù)據(jù)的模型是未知的,那么生成流量就會(huì)不準(zhǔn)確甚至失敗。
深度神經(jīng)網(wǎng)絡(luò)在擬合隨機(jī)模型上有著天然的優(yōu)勢(shì),可以利用在真實(shí)網(wǎng)絡(luò)中采集的流量數(shù)據(jù),擬合對(duì)應(yīng)數(shù)據(jù)的統(tǒng)計(jì)分布。而生成對(duì)抗神經(jīng)網(wǎng)絡(luò) (Generative Adversarial Networks,GAN)[9]已經(jīng)在很多領(lǐng)域被廣泛應(yīng)用,如圖像[10]、音頻[11]、視頻[12]等。通過對(duì)現(xiàn)有網(wǎng)絡(luò)流量生成方法的研究,基于統(tǒng)計(jì)的流量生成方法如圖1所示,首先在真實(shí)網(wǎng)絡(luò)中采集一段數(shù)據(jù),然后提取需要生成的網(wǎng)絡(luò)流量的特征;將數(shù)據(jù)經(jīng)過預(yù)處理,得到神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),使用一種或多種統(tǒng)計(jì)模型進(jìn)行擬合訓(xùn)練,利用擬合后的模型生成網(wǎng)絡(luò)流量在另一個(gè)時(shí)間段的特征;最后再將生成特征組合成的流量,發(fā)送到模擬的網(wǎng)絡(luò)環(huán)境中,用以測(cè)試網(wǎng)絡(luò)環(huán)境,或者研究網(wǎng)絡(luò)用戶的行為。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://ihrv.cn/resource/share/2000006045
作者信息:
康未,李維皓,劉桐菊
(華北計(jì)算機(jī)系統(tǒng)工程研究所,北京100083)