《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 兩階段物聯(lián)網(wǎng)資產(chǎn)識(shí)別模型的研究
兩階段物聯(lián)網(wǎng)資產(chǎn)識(shí)別模型的研究
網(wǎng)絡(luò)安全與數(shù)據(jù)治理
權(quán)曉文1,2,汪連連2,韓衛(wèi)東2,任高峰2,楊家海1
1.清華大學(xué)網(wǎng)絡(luò)科學(xué)與網(wǎng)絡(luò)空間研究院; 2.遠(yuǎn)江盛邦(北京)網(wǎng)絡(luò)安全科技股份有限公司
摘要: 提出了一種兩階段的物聯(lián)網(wǎng)資產(chǎn)識(shí)別模型。首先,對(duì)異構(gòu)協(xié)議進(jìn)行分析,解決多樣化協(xié)議流量特征提取困難問(wèn)題。其次,利用輕量級(jí)模型SqueezeNet過(guò)濾非物聯(lián)網(wǎng)設(shè)備,提高識(shí)別效率并降低計(jì)算負(fù)擔(dān)。為進(jìn)一步解決數(shù)據(jù)不均衡問(wèn)題,引入生成對(duì)抗網(wǎng)絡(luò)(GAN)生成合成樣本數(shù)據(jù),平衡數(shù)據(jù)分布。最后,采用 XLNet與注意力機(jī)制結(jié)合的模型來(lái)識(shí)別物聯(lián)網(wǎng)設(shè)備的類(lèi)型,有效提升了模型在大規(guī)模物聯(lián)網(wǎng)網(wǎng)絡(luò)環(huán)境中的識(shí)別精度和效率。實(shí)驗(yàn)結(jié)果表明,模型在公開(kāi)數(shù)據(jù)集上的準(zhǔn)確率達(dá)到99.48%,召回率提升2.02%,F(xiàn)1分?jǐn)?shù)提高1.85%,并在真實(shí)環(huán)境中保持99.01%的準(zhǔn)確率。該模型為物聯(lián)網(wǎng)資產(chǎn)管理和安全管理提供了有效的解決方案。
中圖分類(lèi)號(hào):TP309文獻(xiàn)標(biāo)識(shí)碼:ADOI:10.19358/j.issn.2097-1788.2025.04.002
引用格式:權(quán)曉文,汪連連,韓衛(wèi)東,等. 兩階段物聯(lián)網(wǎng)資產(chǎn)識(shí)別模型的研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2025,44(4):10-18.
Research on two-stage IoT asset identification model
Quan Xiaowen1,2, Wang Lianlian2, Han Weidong2, Ren Gaofeng2, Yang Jiahai1
1. Institute of Network Science and Cyberspace, Tsinghua University; 2. WebRay(Beijing) Technology Co., Ltd.
Abstract: This article proposes a two-stage IoT asset identification model. Firstly, this article analyzes heterogeneous protocols to address the difficulty of extracting traffic characteristics from diverse protocols. Secondly, this article utilizes the lightweight model SqueezeNet to filter non IoT devices, improving recognition efficiency and reducing computational burden. To further address the issue of data imbalance, a Generative Adversarial Network (GAN) is introduced to generate synthetic sample data and balance the data distribution. Finally, this article adopts a model combining XLNet and attention mechanism to identify the types of IoT devices, effectively improving the recognition accuracy and efficiency of the model in large-scale IoT network environments. The experimental results show that the accuracy of the model on public datasets reaches 99.48%, the recall rate increases by 2.02%, the F1 score increases by 1.85%, and maintains an accuracy of 99.01% in real environments. This model provides an effective solution for IoT asset management and security management.
Key words : IoT;feature selection; equipment filtering; asset recognition; sample balancing; deep learning

引言

物聯(lián)網(wǎng)(IoT)作為信息科技產(chǎn)業(yè)的第三次革命,正迅速擴(kuò)展,尤其在工業(yè)物聯(lián)網(wǎng)、車(chē)聯(lián)網(wǎng)、衛(wèi)星互聯(lián)網(wǎng)等領(lǐng)域[1]。然而,伴隨物聯(lián)網(wǎng)設(shè)備的激增,傳統(tǒng)的設(shè)備資產(chǎn)管理方式不僅需要大量人力物力,還對(duì)管理員的專(zhuān)業(yè)能力提出了更高要求。物聯(lián)網(wǎng)設(shè)備通過(guò)多種無(wú)線方式接入網(wǎng)絡(luò),使用多種協(xié)議,其中許多為專(zhuān)有或非標(biāo)準(zhǔn)協(xié)議,如何快速、準(zhǔn)確地識(shí)別和管理這些設(shè)備成為亟待解決的難題。

傳統(tǒng)的主被動(dòng)資產(chǎn)摸底檢測(cè)方式容易將物聯(lián)網(wǎng)設(shè)備誤分類(lèi),忽略其獨(dú)特屬性。同時(shí),物聯(lián)網(wǎng)設(shè)備的安全問(wèn)題不容忽視,受攻擊的設(shè)備不僅會(huì)喪失功能,還可能被利用作為跳板威脅整個(gè)網(wǎng)絡(luò)的安全[2]。因此,有效識(shí)別物聯(lián)網(wǎng)設(shè)備顯得尤為緊迫。

物聯(lián)網(wǎng)資產(chǎn)識(shí)別技術(shù)在物聯(lián)網(wǎng)系統(tǒng)中具有重要作用[3]:它幫助管理員建立全面的設(shè)備清單,支持漏洞管理、補(bǔ)丁分發(fā)和訪問(wèn)控制;能夠發(fā)現(xiàn)未授權(quán)或異常設(shè)備,有效降低安全風(fēng)險(xiǎn);同時(shí),精準(zhǔn)識(shí)別和跟蹤設(shè)備活動(dòng)是滿足隱私保護(hù)法規(guī)的前提。

近年來(lái),物聯(lián)網(wǎng)設(shè)備識(shí)別和異常檢測(cè)工作成為研究熱點(diǎn),主要針對(duì)以下幾個(gè)方面:

(1)針對(duì)物聯(lián)網(wǎng)特征提取問(wèn)題,文獻(xiàn)[4]提出了一種稱(chēng)為DPFEN的獨(dú)特雙相特征提取技術(shù),用于對(duì)IoT設(shè)備上的網(wǎng)絡(luò)攻擊進(jìn)行分類(lèi),但所提出的方法在數(shù)據(jù)集的選擇和應(yīng)用范圍上存在一定的局限性,會(huì)影響其在實(shí)際IoT環(huán)境中的有效性和可靠性。文獻(xiàn)[5]使用云計(jì)算的多特征提取極限學(xué)習(xí)機(jī)(MFEELM)算法,檢測(cè)和發(fā)現(xiàn)對(duì)云節(jié)點(diǎn)的網(wǎng)絡(luò)入侵。但MFE-ELM算法只在特定的云環(huán)境上進(jìn)行訓(xùn)練和測(cè)試,無(wú)法很好地泛化到其他不同的網(wǎng)絡(luò)環(huán)境和攻擊類(lèi)型。

(2)針對(duì)樣本不均衡問(wèn)題,文獻(xiàn)[6]根據(jù)語(yǔ)義邊界檢測(cè)任務(wù)的特點(diǎn),提出了一種損失函數(shù)來(lái)解決樣本不平衡的問(wèn)題,可以以不同的方式處理樣本,讓網(wǎng)絡(luò)更加關(guān)注難以分類(lèi)的樣本。文獻(xiàn)[7]提出了樣本平衡策略模塊來(lái)優(yōu)化訓(xùn)練樣本之間的不平衡,尤其是正和負(fù)、簡(jiǎn)單和困難樣本之間的不平衡。但這兩種方法,在處理極端不平衡的數(shù)據(jù)集時(shí),會(huì)限制模型的泛化能力,導(dǎo)致預(yù)測(cè)精度較低。

(3)針對(duì)物聯(lián)網(wǎng)資產(chǎn)識(shí)別問(wèn)題,文獻(xiàn)[8]提出一種基于流量特征的兩層物聯(lián)網(wǎng)設(shè)備類(lèi)型定義和識(shí)別方法,可以訓(xùn)練物聯(lián)網(wǎng)設(shè)備類(lèi)型并識(shí)別每種類(lèi)型下的設(shè)備。文獻(xiàn)[9]提出一種基于網(wǎng)絡(luò)流量的物聯(lián)網(wǎng)設(shè)備識(shí)別方法,此方法通過(guò)提取協(xié)議統(tǒng)計(jì)特征和流級(jí)統(tǒng)計(jì)特征,有效降低了特征提取的成本。IoT設(shè)備類(lèi)型眾多,特征構(gòu)造復(fù)雜,但當(dāng)新的設(shè)備類(lèi)型被引入網(wǎng)絡(luò)或現(xiàn)有設(shè)備的行為因制造商的合法固件升級(jí)而發(fā)生變化時(shí),文獻(xiàn)[8]需要為每種設(shè)備類(lèi)型定制特征模型,而文獻(xiàn)[9]則必須針對(duì)所有類(lèi)別重新訓(xùn)練所有型號(hào)。上述兩種方法均表現(xiàn)了其在實(shí)現(xiàn)上具有較高的算法復(fù)雜度。

上述方法雖然能夠識(shí)別出網(wǎng)絡(luò)中的物聯(lián)網(wǎng)設(shè)備,但依舊存在局限性:(1)隨著物聯(lián)網(wǎng)設(shè)備種類(lèi)和特征的增加,模型計(jì)算復(fù)雜度和資源需求顯著提高;(2)設(shè)備加密通信的普及,流量?jī)?nèi)容特征無(wú)法直接獲取;(3)設(shè)備流量分布不均,某些設(shè)備流量稀少,導(dǎo)致訓(xùn)練數(shù)據(jù)不平衡,影響模型性能,可能導(dǎo)致過(guò)擬合。

為解決上述問(wèn)題,本文提出了兩階段物聯(lián)網(wǎng)資產(chǎn)識(shí)別技術(shù)。第一階段,采用異構(gòu)協(xié)議融合的流量特征選擇算法,從網(wǎng)絡(luò)流量中提取關(guān)鍵特征,有效應(yīng)對(duì)多樣化協(xié)議環(huán)境和加密流量特征提取困難問(wèn)題。同時(shí),利用輕量化SqueezeNet模型過(guò)濾非物聯(lián)網(wǎng)設(shè)備,減少不必要的計(jì)算資源消耗。第二階段,引入GAN模型生成稀缺類(lèi)別樣本,平衡數(shù)據(jù)分布,提升模型的泛化能力。在此基礎(chǔ)上,結(jié)合XLNet-Attention模型進(jìn)一步對(duì)物聯(lián)網(wǎng)資產(chǎn)類(lèi)型進(jìn)行識(shí)別。該方法有效應(yīng)對(duì)了計(jì)算復(fù)雜度、加密流量分析和數(shù)據(jù)不均衡問(wèn)題,為物聯(lián)網(wǎng)資產(chǎn)管理和安全防護(hù)提供了可行技術(shù)路徑。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://ihrv.cn/resource/share/2000006407


作者信息:

權(quán)曉文1,2,汪連連2,韓衛(wèi)東2,任高峰2,楊家海1

(1.清華大學(xué)網(wǎng)絡(luò)科學(xué)與網(wǎng)絡(luò)空間研究院,北京100084;

2.遠(yuǎn)江盛邦(北京)網(wǎng)絡(luò)安全科技股份有限公司,北京100085)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。