《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 融合輕量化與梯形結構的學生行為檢測算法
融合輕量化與梯形結構的學生行為檢測算法
2022年電子技術應用第12期
張 穎1,張 喆1,龍光利2
1.西安理工大學 自動化與信息工程學院,陜西 西安710048; 2.陜西理工大學 物理與電信工程學院,陜西 漢中723000
摘要: 為了解決常見目標檢測算法在課堂場景中難以有效應用的問題,提出了一種融合輕量化與梯形結構的學生行為檢測算法。該算法基于YOLOv4架構,針對目標分類和分布空間的特點,提出一種新的“梯”形特征融合結構,并結合MobileNetv2思想,優(yōu)化模型參數(shù)得到梯形-MobileDarknet19特征提取網(wǎng)絡,既減少了網(wǎng)絡的計算量,提高了工作效率,同時加強了目標特征的信息傳輸,提升了模型學習能力;在尺度檢測階段引入5層的DenseNet網(wǎng)絡,增強網(wǎng)絡對小目標的檢測能力。實驗結果表明,提出的YOLOv4-ST算法相比于原YOLOv4算法mAP提高了5.5%,相比于其他主流算法,在學生課堂行為檢測任務中具有較好的實用性。
中圖分類號: TP399
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.222837
中文引用格式: 張穎,張喆,龍光利. 融合輕量化與梯形結構的學生行為檢測算法[J].電子技術應用,2022,48(12):47-53.
英文引用格式: Zhang Ying,Zhang Zhe,Long Guangli. Student behavior detection algorithm combining lightweight and trapezoidal structure[J]. Application of Electronic Technique,2022,48(12):47-53.
Student behavior detection algorithm combining lightweight and trapezoidal structure
Zhang Ying1,Zhang Zhe1,Long Guangli2
1.School of Automation and Information Engineering,Xi′an University of Technology,Xi′an 710048,China; 2.School of Physics and Telecommunications Engineering,Shaanxi University of Technology,Hanzhong 723000,China
Abstract: In order to solve the problem that common target detection algorithms are difficult to apply effectively in classroom scenarios, a student behavior detection algorithm combining lightweight and trapezoidal structure is proposed. The algorithm is based on YOLOv4 architecture, according to the characteristics of target classification and distribution space, a new “trapezoidal” feature fusion structure is proposed, and combined with the MobileNetv2 idea, the model parameters are optimized to obtain a trapezoidal-MobileDarknet19 feature extraction network, which not only reduces the computational load of the network, but also improves the work efficiency. At the same time, it strengthens the information transmission of target features and improves the learning ability of the model. In the scale detection stage, a five-layer DenseNet network is introduced to enhance the network′s detection ability for small targets. The experimental results show that the proposed YOLOv4-ST algorithm is better than the original one. The mAP of YOLOv4 algorithm is improved by 5.5%. Compared with other mainstream algorithms, it has better practicability in the task of student classroom behavior detection.
Key words : trapezoidal structure;student behavior detection;YOLOv4;feature fusion;DenseNet

0 引言

    隨著教育現(xiàn)代化的推進,信息化教學越來越普遍,作為學校教育中最基本也是最重要的環(huán)節(jié),課堂教學面臨著傳統(tǒng)走向現(xiàn)代的變革。課堂中,老師通過觀察學生的表現(xiàn)獲得授課情況的反饋,但一對多的教學方式存在著觀察不全面、可信度低、無法實時掌握學生課堂學習情況等問題。將基于深度學習的行為檢測應用到課堂教學場景中,通過實時監(jiān)控,幫助老師全面地掌握學生課堂狀態(tài),及時合理地調整教學進度和策略,不僅能夠提高教學效率,還能夠推動智能化教學的發(fā)展,為今后現(xiàn)代化課堂的探索奠定了基礎。

    近年來,隨著深度學習在計算機視覺領域取得了突破性進展[1],F(xiàn)aster-RCNN(Faster Region-based Convolutional Neural Networks)[2]、SSD(Single Shot Detection)[3]、YOLO(You Only Look Once)[4-6]等目標檢測算法也相繼出現(xiàn)。Zheng等[7]通過一種新的特征融合策略改進Faster R-CNN進行行為檢測,但檢測精度不高;Liu等[8]提出了一種基于雙流結構的改進時空注意力模型,將空間和時間特征分別饋入空間長短期記憶(Long Short-rm Memory,LSTM)和時間LSTM,融合特征來識別視頻中的不同動作;2020年,Bochkovskiy等[9]提出YOLOv4算法,該算法的網(wǎng)絡骨干結構使用了結合跨階段部分連接[10](Cross Stage Partial Connection)與Darknet53結合而形成的CSPDarknet53特征提取結構,有效提升了檢測精度和速度;Ren等[11]通過在YOLOv4的特征提取結構中添加了跳躍式的連接,能夠融合更多的特征,在一定程度上提升了學生行為檢測精度,但效率較低。以上研究表明,深度學習用于學生行為檢測具有一定的理論基礎和實踐可行性。雖然許多檢測算法在應用領域表現(xiàn)優(yōu)異,但對于課堂場景來說,學生活動范圍有限,受攝像頭位置及視覺角度的影響,學生目標較小且行為易受遮擋,導致會出現(xiàn)漏檢錯檢、檢測精度低等問題。其次,課堂學生行為檢測需要建立特定的學生行為數(shù)據(jù)集,要從海量的課堂監(jiān)控視頻進行篩選和制作,并選用適合的先驗框參數(shù),以適應學生目標尺寸。




本文詳細內容請下載:http://ihrv.cn/resource/share/2000005039。




作者信息:

張  穎1,張  喆1,龍光利2

(1.西安理工大學 自動化與信息工程學院,陜西 西安710048;

2.陜西理工大學 物理與電信工程學院,陜西 漢中723000)




wd.jpg

此內容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。