一種基于機器學習的Tor網絡識別探測技術
2021年電子技術應用第4期
張 玲1,衛(wèi)傳征1,林臻彪1,段琳琳2
1.北京賽博興安科技有限公司,北京102200;2.鄭州大學 信息工程學院,河南 鄭州450001
摘要: Tor是一種基于洋蔥路由通信協議建立的隱蔽加密通信系統(tǒng)。該系統(tǒng)基于互聯網現有路由、數據加密等協議,構建了一套保護通信實體的身份隱匿機制,使得經過Tor網絡傳播的數據難以被有效追蹤和分析。然而近年來這項隱蔽通信技術被罪犯大量使用,已成為網絡犯罪和非法交易的溫床。為有效應對該問題,提出一項基于機器學習的Tor網絡識別檢測技術,通過主動生成Tor網絡流量,基于機器學習技術實施流特征提取與檢測,從而發(fā)現參與Tor通信的網絡實體及其通信類型,進而檢出潛在的惡意暗網用戶。實驗表明,該方法可有效識別Tor通信實體以及通信行為,如電子郵件和FTP應用等。
中圖分類號: TN918
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200759
中文引用格式: 張玲,衛(wèi)傳征,林臻彪,等. 一種基于機器學習的Tor網絡識別探測技術[J].電子技術應用,2021,47(4):54-58.
英文引用格式: Zhang Ling,Wei Chuanzheng,Lin Zhenbiao,et al. A method for identifying Tor hosts based on machine learning techniques[J]. Application of Electronic Technique,2021,47(4):54-58.
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200759
中文引用格式: 張玲,衛(wèi)傳征,林臻彪,等. 一種基于機器學習的Tor網絡識別探測技術[J].電子技術應用,2021,47(4):54-58.
英文引用格式: Zhang Ling,Wei Chuanzheng,Lin Zhenbiao,et al. A method for identifying Tor hosts based on machine learning techniques[J]. Application of Electronic Technique,2021,47(4):54-58.
A method for identifying Tor hosts based on machine learning techniques
Zhang Ling1,Wei Chuanzheng1,Lin Zhenbiao1,Duan Linlin2
1.Beijing Cyber XingAn Technology Co.,Ltd.,Beijing 102200,China; 2.School of Information Engineering,Zhengzhou University,Zhengzhou 450001,China
Abstract: Tor is an anonymous Internet communication system based on onion routing network protocol. Network traffics generated by normal applications become hard to trace when they are delivered by Tor system. However, an increasing number of cyber criminals are utilizing Tor to remain anonymous while carrying out their crimes or make illegal transactions. As a countermeasure, this paper presents a method able to identify Tor traffics and thereby recognize related Tor hosts. The method proposes several groups of features extracted from network traffic and resort to machine learning algorithm to evaluate feature effectiveness. Experiments in real world dataset demonstrate that the proposed method is able to distinguish Tor flows from normal traffics as well as recognize the kind of activity in Tor generated by different normal applications.
Key words : darknet detection;Tor;communication entity recognition;machine learning
0 引言
Tor匿名網絡是一個由全球志愿者維護的各自匿名網絡所組成的大型分布式匿名通信網絡,其核心技術是美國海軍研究室開發(fā)的洋蔥路由系統(tǒng),設計初衷是保護政府機關的數據通信隱私。
Tor用戶通過連接一系列虛擬通道在通信的源端與目的端之間建立間接的數據鏈路,使得包括個人和機構在內的用戶在互聯網中的數據傳輸行為匿名化[1]。由于該技術能夠有效規(guī)避網絡監(jiān)管,成為訪問受限網段的有效措施。
洋蔥路由技術提供的身份匿名性和數據安全性使得Tor網絡成為網絡內容犯罪的溫床。同時,區(qū)塊鏈、虛擬數字貨幣等技術的發(fā)展為網上非法交易帶來便利,更使得包括Tor網絡在內的暗網成為互聯網中的法外之地,產生越來越多涉及黃、暴、恐的非法信息和非法交易。鑒于此,本文研究Tor網絡流量的分析和識別。對于給定的真實網絡數據,本研究的目標是鑒別其中流量是通過普通網絡通信數據還是Tor流量。在有效識別Tor流量基礎上,本文進一步研究Tor通信行為分類,包括瀏覽網頁、郵件服務、即時通信、流媒體、FTP、VoIP和P2P通信等。
本文詳細內容請下載:http://ihrv.cn/resource/share/2000003463
作者信息:
張 玲1,衛(wèi)傳征1,林臻彪1,段琳琳2
(1.北京賽博興安科技有限公司,北京102200;2.鄭州大學 信息工程學院,河南 鄭州450001)
此內容為AET網站原創(chuàng),未經授權禁止轉載。