引用格式:權(quán)曉文,汪連連,韓衛(wèi)東,等. 兩階段物聯(lián)網(wǎng)資產(chǎn)識(shí)別模型的研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2025,44(4):10-18.
引言
物聯(lián)網(wǎng)(IoT)作為信息科技產(chǎn)業(yè)的第三次革命,正迅速擴(kuò)展,尤其在工業(yè)物聯(lián)網(wǎng)、車(chē)聯(lián)網(wǎng)、衛(wèi)星互聯(lián)網(wǎng)等領(lǐng)域[1]。然而,伴隨物聯(lián)網(wǎng)設(shè)備的激增,傳統(tǒng)的設(shè)備資產(chǎn)管理方式不僅需要大量人力物力,還對(duì)管理員的專(zhuān)業(yè)能力提出了更高要求。物聯(lián)網(wǎng)設(shè)備通過(guò)多種無(wú)線方式接入網(wǎng)絡(luò),使用多種協(xié)議,其中許多為專(zhuān)有或非標(biāo)準(zhǔn)協(xié)議,如何快速、準(zhǔn)確地識(shí)別和管理這些設(shè)備成為亟待解決的難題。
傳統(tǒng)的主被動(dòng)資產(chǎn)摸底檢測(cè)方式容易將物聯(lián)網(wǎng)設(shè)備誤分類(lèi),忽略其獨(dú)特屬性。同時(shí),物聯(lián)網(wǎng)設(shè)備的安全問(wèn)題不容忽視,受攻擊的設(shè)備不僅會(huì)喪失功能,還可能被利用作為跳板威脅整個(gè)網(wǎng)絡(luò)的安全[2]。因此,有效識(shí)別物聯(lián)網(wǎng)設(shè)備顯得尤為緊迫。
物聯(lián)網(wǎng)資產(chǎn)識(shí)別技術(shù)在物聯(lián)網(wǎng)系統(tǒng)中具有重要作用[3]:它幫助管理員建立全面的設(shè)備清單,支持漏洞管理、補(bǔ)丁分發(fā)和訪問(wèn)控制;能夠發(fā)現(xiàn)未授權(quán)或異常設(shè)備,有效降低安全風(fēng)險(xiǎn);同時(shí),精準(zhǔn)識(shí)別和跟蹤設(shè)備活動(dòng)是滿足隱私保護(hù)法規(guī)的前提。
近年來(lái),物聯(lián)網(wǎng)設(shè)備識(shí)別和異常檢測(cè)工作成為研究熱點(diǎn),主要針對(duì)以下幾個(gè)方面:
(1)針對(duì)物聯(lián)網(wǎng)特征提取問(wèn)題,文獻(xiàn)[4]提出了一種稱(chēng)為DPFEN的獨(dú)特雙相特征提取技術(shù),用于對(duì)IoT設(shè)備上的網(wǎng)絡(luò)攻擊進(jìn)行分類(lèi),但所提出的方法在數(shù)據(jù)集的選擇和應(yīng)用范圍上存在一定的局限性,會(huì)影響其在實(shí)際IoT環(huán)境中的有效性和可靠性。文獻(xiàn)[5]使用云計(jì)算的多特征提取極限學(xué)習(xí)機(jī)(MFEELM)算法,檢測(cè)和發(fā)現(xiàn)對(duì)云節(jié)點(diǎn)的網(wǎng)絡(luò)入侵。但MFE-ELM算法只在特定的云環(huán)境上進(jìn)行訓(xùn)練和測(cè)試,無(wú)法很好地泛化到其他不同的網(wǎng)絡(luò)環(huán)境和攻擊類(lèi)型。
(2)針對(duì)樣本不均衡問(wèn)題,文獻(xiàn)[6]根據(jù)語(yǔ)義邊界檢測(cè)任務(wù)的特點(diǎn),提出了一種損失函數(shù)來(lái)解決樣本不平衡的問(wèn)題,可以以不同的方式處理樣本,讓網(wǎng)絡(luò)更加關(guān)注難以分類(lèi)的樣本。文獻(xiàn)[7]提出了樣本平衡策略模塊來(lái)優(yōu)化訓(xùn)練樣本之間的不平衡,尤其是正和負(fù)、簡(jiǎn)單和困難樣本之間的不平衡。但這兩種方法,在處理極端不平衡的數(shù)據(jù)集時(shí),會(huì)限制模型的泛化能力,導(dǎo)致預(yù)測(cè)精度較低。
(3)針對(duì)物聯(lián)網(wǎng)資產(chǎn)識(shí)別問(wèn)題,文獻(xiàn)[8]提出一種基于流量特征的兩層物聯(lián)網(wǎng)設(shè)備類(lèi)型定義和識(shí)別方法,可以訓(xùn)練物聯(lián)網(wǎng)設(shè)備類(lèi)型并識(shí)別每種類(lèi)型下的設(shè)備。文獻(xiàn)[9]提出一種基于網(wǎng)絡(luò)流量的物聯(lián)網(wǎng)設(shè)備識(shí)別方法,此方法通過(guò)提取協(xié)議統(tǒng)計(jì)特征和流級(jí)統(tǒng)計(jì)特征,有效降低了特征提取的成本。IoT設(shè)備類(lèi)型眾多,特征構(gòu)造復(fù)雜,但當(dāng)新的設(shè)備類(lèi)型被引入網(wǎng)絡(luò)或現(xiàn)有設(shè)備的行為因制造商的合法固件升級(jí)而發(fā)生變化時(shí),文獻(xiàn)[8]需要為每種設(shè)備類(lèi)型定制特征模型,而文獻(xiàn)[9]則必須針對(duì)所有類(lèi)別重新訓(xùn)練所有型號(hào)。上述兩種方法均表現(xiàn)了其在實(shí)現(xiàn)上具有較高的算法復(fù)雜度。
上述方法雖然能夠識(shí)別出網(wǎng)絡(luò)中的物聯(lián)網(wǎng)設(shè)備,但依舊存在局限性:(1)隨著物聯(lián)網(wǎng)設(shè)備種類(lèi)和特征的增加,模型計(jì)算復(fù)雜度和資源需求顯著提高;(2)設(shè)備加密通信的普及,流量?jī)?nèi)容特征無(wú)法直接獲取;(3)設(shè)備流量分布不均,某些設(shè)備流量稀少,導(dǎo)致訓(xùn)練數(shù)據(jù)不平衡,影響模型性能,可能導(dǎo)致過(guò)擬合。
為解決上述問(wèn)題,本文提出了兩階段物聯(lián)網(wǎng)資產(chǎn)識(shí)別技術(shù)。第一階段,采用異構(gòu)協(xié)議融合的流量特征選擇算法,從網(wǎng)絡(luò)流量中提取關(guān)鍵特征,有效應(yīng)對(duì)多樣化協(xié)議環(huán)境和加密流量特征提取困難問(wèn)題。同時(shí),利用輕量化SqueezeNet模型過(guò)濾非物聯(lián)網(wǎng)設(shè)備,減少不必要的計(jì)算資源消耗。第二階段,引入GAN模型生成稀缺類(lèi)別樣本,平衡數(shù)據(jù)分布,提升模型的泛化能力。在此基礎(chǔ)上,結(jié)合XLNet-Attention模型進(jìn)一步對(duì)物聯(lián)網(wǎng)資產(chǎn)類(lèi)型進(jìn)行識(shí)別。該方法有效應(yīng)對(duì)了計(jì)算復(fù)雜度、加密流量分析和數(shù)據(jù)不均衡問(wèn)題,為物聯(lián)網(wǎng)資產(chǎn)管理和安全防護(hù)提供了可行技術(shù)路徑。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://ihrv.cn/resource/share/2000006407
作者信息:
權(quán)曉文1,2,汪連連2,韓衛(wèi)東2,任高峰2,楊家海1
(1.清華大學(xué)網(wǎng)絡(luò)科學(xué)與網(wǎng)絡(luò)空間研究院,北京100084;
2.遠(yuǎn)江盛邦(北京)網(wǎng)絡(luò)安全科技股份有限公司,北京100085)