《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > 基于聯(lián)邦學(xué)習(xí)的加密流量分析研究
基于聯(lián)邦學(xué)習(xí)的加密流量分析研究
網(wǎng)絡(luò)安全與數(shù)據(jù)治理
崔又文1,2,馮千燁1,何云華1,高健桐1,2,單伯瑜1,2,劉馨妍1
1.北方工業(yè)大學(xué)信息學(xué)院;2.文脈聯(lián)坊(北京)科技有限責(zé)任公司
摘要: 當(dāng)今信息化時代背景下,加密流量呈爆炸式增長,其在保障了信息傳輸?shù)陌踩缘耐瑫r,也給了不法分子可乘之機(jī),對流量的分類、識別提出了前所未有的挑戰(zhàn),盡管傳統(tǒng)的基于規(guī)則的識別方法和流級行為特征等方案能實(shí)現(xiàn)較高準(zhǔn)確率的分類、識別,但在數(shù)據(jù)隱私和安全方面仍有待提升。著重研究基于聯(lián)邦學(xué)習(xí)技術(shù)的網(wǎng)絡(luò)加密流量識別系統(tǒng),針對使用SSL/TLS進(jìn)行加密的流量特征,提出了一種高效加密流量識別模型,主要通過特征提取和模型訓(xùn)練來實(shí)現(xiàn)對加密流量的準(zhǔn)確分類,可以在不接觸原始數(shù)據(jù)的前提下,進(jìn)行信息共享和模型訓(xùn)練,通過加權(quán)平均策略獲得準(zhǔn)確的加密流量分析模型,有效監(jiān)測夾雜在海量數(shù)據(jù)中的高危流量。在加密數(shù)據(jù)集上的實(shí)驗有效驗證了該方法的可行性。
中圖分類號:TP309.2文獻(xiàn)標(biāo)識碼:ADOI:10.19358/j.issn.2097-1788.2025.01.002引用格式:崔又文,馮千燁,何云華,等. 基于聯(lián)邦學(xué)習(xí)的加密流量分析研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2025,44(1):9-15,36.
Research on encrypted traffic analysis based on federated learning
Cui Youwen 1, 2, Feng Qianye 1, He Yunhua 1, Gao Jiantong 1, 2, Shan Boyu 1, 2, Liu Xinyan 1
1. School of Information Science and Technology, Northern Polytechnic University; 2. Wenmai Lianfang (Beijing) Technology Co., Ltd.
Abstract: In the era of informatization, the encrypted traffic is exploding. While ensuring the security of information transmission, it also gives criminals plenty of opportunities, and poses unprecedented challenges to the classification and identification of traffic. Although traditional rule-based identification methods and flow-level behavior characteristics can achieve higher accuracy classification and identification, it still needs to be improved in data privacy and security.This paper focuses on the network encryption traffic identification system based on federated learning. Aiming at the traffic characteristics encrypted by SSL / TLS, an efficient encryption traffic identification model is proposed. The model mainly realizes the accurate classification of encrypted traffic through feature extraction and model training. The scheme can carry out information sharing and model training without touching the original data. The accurate encrypted traffic analysis model is obtained by weighted average strategy, and the high-risk traffic mixed in massive data is effectively monitored. Experiments on encrypted data sets effectively verify the feasibility of the method.
Key words : encrypting traffic; federated learning; network security; network traffic classification

引言

隨著信息化的快速發(fā)展,網(wǎng)絡(luò)流量的安全性備受關(guān)注。近年來,隨著 SSL/TLS 等流量加密算法的普及,加密流量比例已超過 90%。雖然加密技術(shù)提升了信息傳輸?shù)陌踩裕絹碓蕉嗟膼阂廛浖ㄟ^加密技術(shù)隱藏自己,引發(fā)了更多不可控的安全隱患?!吨袊ヂ?lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截至2023年6月,我國互聯(lián)網(wǎng)普及率更是高達(dá)76.4%[1],互聯(lián)網(wǎng)企業(yè)對加密流量識別和檢測的不重視給了不法分子更多可乘之機(jī),如何保障安全的網(wǎng)絡(luò)環(huán)境成為了當(dāng)下的挑戰(zhàn)。SSL/TLS協(xié)議是當(dāng)下主流的加密算法之一,攻擊者可以通過將惡意行為嵌入被 SSL/TLS 協(xié)議加密的內(nèi)容中,對公眾網(wǎng)絡(luò)安全造成威脅。傳統(tǒng)的基于端口號和深度包檢測的流量分析方法在加密流量面前顯得力不從心。在加密通信時代,學(xué)界積極探索新的技術(shù)路徑,如楊旭提出的基于流量統(tǒng)計特征的分類方法,將流量外部統(tǒng)計特征與機(jī)器學(xué)習(xí)相結(jié)合,有效解決了偽裝端口、加密流量等問題,為加密流量分類提供了新思路[2]。仝鑫等人提出的基于機(jī)器學(xué)習(xí)的加密流量分析方法,展示了該領(lǐng)域在特征工程、分類器模型等方面的研究進(jìn)展,在一定程度上提高了加密流量識別的準(zhǔn)確率[3]。此外,朱蓓佳等人提出的基于對比學(xué)習(xí)的加密流量檢測技術(shù),通過設(shè)計特定的檢測方案來提高檢測準(zhǔn)確率和泛化性,但仍需在保障數(shù)據(jù)安全方面進(jìn)一步探索[4]。在此情形下,迫切需求一種既能有效利用數(shù)據(jù)又能保障數(shù)據(jù)安全的新技術(shù),聯(lián)邦學(xué)習(xí)等技術(shù)應(yīng)運(yùn)而生,其核心優(yōu)勢在于可在不匯聚原始數(shù)據(jù)的前提下進(jìn)行分布式建模,打破數(shù)據(jù)孤島,實(shí)現(xiàn)數(shù)據(jù)隱私保護(hù)與高效利用的雙重目標(biāo)。面對這一問題,本研究認(rèn)為,根據(jù)SSL/TLS分別在客戶端與服務(wù)端相互認(rèn)證等技術(shù)特點(diǎn),使用分布式聯(lián)邦學(xué)習(xí)進(jìn)行本地監(jiān)測成為了一種可行的方案。聯(lián)邦學(xué)習(xí)的核心理念是在保證數(shù)據(jù)隱私安全及合法合規(guī)的基礎(chǔ)上,利用各個節(jié)點(diǎn)完全掌握的數(shù)據(jù)共同建模,核心優(yōu)勢在于原始數(shù)據(jù)無需匯聚在中央服務(wù)器,在各個終端服務(wù)器即可進(jìn)行訓(xùn)練和計算模型梯度信息,只將參數(shù)和梯度等信息上傳至中央服務(wù)器,通過加權(quán)等方式整合最終模型,下發(fā)到各個服務(wù)器終端,從而有效打破數(shù)據(jù)孤島,提升模型的效果。該方法不僅可以有效保護(hù)用戶隱私,還可以綜合大量數(shù)據(jù)使得系統(tǒng)對加密流量更加敏感,識別率大大提高。 本文研究了基于聯(lián)邦學(xué)習(xí)技術(shù)的SSL/TLS加密流量識別,通過預(yù)處理網(wǎng)絡(luò)流量數(shù)據(jù),提取關(guān)鍵特征,并利用聯(lián)邦學(xué)習(xí)框架訓(xùn)練模型,實(shí)現(xiàn)了高效的加密流量分類,同時保護(hù)了數(shù)據(jù)安全和用戶隱私。實(shí)驗結(jié)果表明,該方法在分類準(zhǔn)確率、實(shí)時性和隱私保護(hù)等方面均優(yōu)于傳統(tǒng)方法。


本文詳細(xì)內(nèi)容請下載:

http://ihrv.cn/resource/share/2000006295


作者信息:

崔又文1,2,馮千燁1,何云華1,高健桐1,2,單伯瑜1,2,劉馨妍1

(1.北方工業(yè)大學(xué)信息學(xué)院,北京100144;

2.文脈聯(lián)坊(北京)科技有限責(zé)任公司,北京100143)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。