123,123

一种基于机器学习的Tor网络识别探测技术

2021年电子技术应用第4期

张玲1，卫传征1，林臻彪1，段琳琳2

1.北京赛博兴安科技有限公司，北京102200；2.郑州大学信息工程学院，河南郑州450001

摘要： Tor是一种基于洋葱路由通信协议建立的隐蔽加密通信系统。该系统基于互联网现有路由、数据加密等协议，构建了一套保护通信实体的身份隐匿机制，使得经过Tor网络传播的数据难以被有效追踪和分析。然而近年来这项隐蔽通信技术被罪犯大量使用，已成为网络犯罪和非法交易的温床。为有效应对该问题，提出一项基于机器学习的Tor网络识别检测技术，通过主动生成Tor网络流量，基于机器学习技术实施流特征提取与检测，从而发现参与Tor通信的网络实体及其通信类型，进而检出潜在的恶意暗网用户。实验表明，该方法可有效识别Tor通信实体以及通信行为，如电子邮件和FTP应用等。

關(guān)鍵詞： 暗网探测 Tor 通信实体识别机器学习

中圖分類號(hào)： TN918
文獻(xiàn)標(biāo)識(shí)碼： A
DOI：10.16157/j.issn.0258-7998.200759
中文引用格式： 張玲，衛(wèi)傳征，林臻彪，等. 一種基于機(jī)器學(xué)習(xí)的Tor網(wǎng)絡(luò)識(shí)別探測(cè)技術(shù)[J].電子技術(shù)應(yīng)用，2021，47(4)：54-58.
英文引用格式： Zhang Ling，Wei Chuanzheng，Lin Zhenbiao，et al. A method for identifying Tor hosts based on machine learning techniques[J]. Application of Electronic Technique，2021，47(4)：54-58.

A method for identifying Tor hosts based on machine learning techniques

Zhang Ling1，Wei Chuanzheng1，Lin Zhenbiao1，Duan Linlin2

1.Beijing Cyber XingAn Technology Co.，Ltd.，Beijing 102200，China； 2.School of Information Engineering，Zhengzhou University，Zhengzhou 450001，China

Abstract： Tor is an anonymous Internet communication system based on onion routing network protocol. Network traffics generated by normal applications become hard to trace when they are delivered by Tor system. However, an increasing number of cyber criminals are utilizing Tor to remain anonymous while carrying out their crimes or make illegal transactions. As a countermeasure, this paper presents a method able to identify Tor traffics and thereby recognize related Tor hosts. The method proposes several groups of features extracted from network traffic and resort to machine learning algorithm to evaluate feature effectiveness. Experiments in real world dataset demonstrate that the proposed method is able to distinguish Tor flows from normal traffics as well as recognize the kind of activity in Tor generated by different normal applications.

Key words : darknet detection；Tor；communication entity recognition；machine learning

0 引言

Tor匿名網(wǎng)絡(luò)是一個(gè)由全球志愿者維護(hù)的各自匿名網(wǎng)絡(luò)所組成的大型分布式匿名通信網(wǎng)絡(luò)，其核心技術(shù)是美國海軍研究室開發(fā)的洋蔥路由系統(tǒng)，設(shè)計(jì)初衷是保護(hù)政府機(jī)關(guān)的數(shù)據(jù)通信隱私。

Tor用戶通過連接一系列虛擬通道在通信的源端與目的端之間建立間接的數(shù)據(jù)鏈路，使得包括個(gè)人和機(jī)構(gòu)在內(nèi)的用戶在互聯(lián)網(wǎng)中的數(shù)據(jù)傳輸行為匿名化^[1]。由于該技術(shù)能夠有效規(guī)避網(wǎng)絡(luò)監(jiān)管，成為訪問受限網(wǎng)段的有效措施。

洋蔥路由技術(shù)提供的身份匿名性和數(shù)據(jù)安全性使得Tor網(wǎng)絡(luò)成為網(wǎng)絡(luò)內(nèi)容犯罪的溫床。同時(shí)，區(qū)塊鏈、虛擬數(shù)字貨幣等技術(shù)的發(fā)展為網(wǎng)上非法交易帶來便利，更使得包括Tor網(wǎng)絡(luò)在內(nèi)的暗網(wǎng)成為互聯(lián)網(wǎng)中的法外之地，產(chǎn)生越來越多涉及黃、暴、恐的非法信息和非法交易。鑒于此，本文研究Tor網(wǎng)絡(luò)流量的分析和識(shí)別。對(duì)于給定的真實(shí)網(wǎng)絡(luò)數(shù)據(jù)，本研究的目標(biāo)是鑒別其中流量是通過普通網(wǎng)絡(luò)通信數(shù)據(jù)還是Tor流量。在有效識(shí)別Tor流量基礎(chǔ)上，本文進(jìn)一步研究Tor通信行為分類，包括瀏覽網(wǎng)頁、郵件服務(wù)、即時(shí)通信、流媒體、FTP、VoIP和P2P通信等。

本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003463

作者信息:

張玲1，衛(wèi)傳征1，林臻彪1，段琳琳2

（1.北京賽博興安科技有限公司，北京102200；2.鄭州大學(xué) 信息工程學(xué)院，河南鄭州450001)

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容