基于深度殘差神經網絡的博彩網頁識別算法設計
2022年電子技術應用第2期
張 聰,張 恒,張立坤,趙 彤,鄧桂英
中國互聯(lián)網絡信息中心 技術研發(fā)部,北京100190
摘要: 互聯(lián)網對人民群眾的生活和工作產生了重要影響,然而網絡空間中隱藏著大量有害的博彩網站或賭博網站,很容易給網民造成損失和困擾,甚至可能擾亂社會秩序,因而研究對此類網站進行高效識別的方法具有重要意義。提出利用深度殘差神經網絡解決博彩類網頁識別問題,基于深度殘差網絡的原理設計了算法GamblingRec。經驗證,算法準確率達到了95.16%,正樣本召回率為93.21%,表明基于深度殘差神經網絡的方法能夠用于博彩類網頁識別,并能達到較高的識別性能。
中圖分類號: TN91
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.211757
中文引用格式: 張聰,張恒,張立坤,等. 基于深度殘差神經網絡的博彩網頁識別算法設計[J].電子技術應用,2022,48(2):15-18.
英文引用格式: Zhang Cong,Zhang Heng,Zhang Likun,et al. Gambling web page recognition algorithm design based on deep residual neural network[J]. Application of Electronic Technique,2022,48(2):15-18.
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.211757
中文引用格式: 張聰,張恒,張立坤,等. 基于深度殘差神經網絡的博彩網頁識別算法設計[J].電子技術應用,2022,48(2):15-18.
英文引用格式: Zhang Cong,Zhang Heng,Zhang Likun,et al. Gambling web page recognition algorithm design based on deep residual neural network[J]. Application of Electronic Technique,2022,48(2):15-18.
Gambling web page recognition algorithm design based on deep residual neural network
Zhang Cong,Zhang Heng,Zhang Likun,Zhao Tong,Deng Guiying
Technological Research and Development Department,China Internet Network Information Center(CNNIC),Beijing 100190,China
Abstract: The Internet has an important impact on people′s life and work. However, there are a large number of harmful gambling websites hidden in cyberspace, which is easy to cause losses and troubles to netizens, it can even disturb society order. Therefore, it is of great significance to study the efficient recognition method of such websites. In this paper, the deep residual neural network is used to solve the problem of gambling web page recognition, and the algorithm GamblingRec is designed based on principle of deep residual network. The results show that the accuracy of GamblingRec reaches 95.16%, and the positive sample recall rate is 93.21%,which indicates that the method based on deep residual neural network can be applied for gambling web page recognition, and can achieve high recognition performance.
Key words : convolutional neural network;residual network;gambling;web page classification;ResNet
0 引言
隨著互聯(lián)網技術的高速發(fā)展,我國網民人數持續(xù)增長,根據《第47次中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》的數據,截至2020年12月,我國網民人數已達到9.89億[1],毫無疑問,互聯(lián)網已經成為人們日常生活不可或缺的一部分。然而,虛擬的網絡空間中隱藏著大量有害的博彩類型網站,極易給參與者造成經濟損失,設計有效方法對博彩類網站進行識別具有重要意義。
1 相關工作
博彩網站識別相當于對網頁進行分類,預測其為博彩網頁或其他類型網頁。付順順[2]采用FastText[3]算法和Bootstrap[4]集成算法,利用網站文本數據,提高了識別速度并減輕了正常網站和博彩網站數據不均衡問題。唐喆[5]等人采用SVM[6]算法并提取不同的文本特征,實現(xiàn)對網頁的分類。
本文詳細內容請下載:http://ihrv.cn/resource/share/2000003959。
作者信息:
張 聰,張 恒,張立坤,趙 彤,鄧桂英
(中國互聯(lián)網絡信息中心 技術研發(fā)部,北京100190)
此內容為AET網站原創(chuàng),未經授權禁止轉載。