中文引用格式: 丁鋆,徐愛俊,吳小芬,等. 基于多特征融合和知識蒸餾的亞熱帶常見喬木識別方法[J]. 電子技術應用,2024,50(8):1-9.
英文引用格式: Ding Yun,Xu Aijun,Wu Xiaofen,et al. Common arbor identification method in subtropics based on multiple features fusion and knowledge distillation[J]. Application of Electronic Technique,2024,50(8):1-9.
引言
亞熱帶地區(qū)處于熱帶和溫帶之間,氣候和地理特征獨特,為喬木、灌木、草本植物以及濕地植被等多種植物提供了適宜的生存條件,形成了復雜多樣的植被環(huán)境[1-3]。喬木作為生態(tài)系統(tǒng)中的關鍵組成部分,其信息的準確獲取對于珍稀瀕危樹木的保護和管理、木材資源的高效生產利用、亞熱帶地區(qū)生態(tài)系統(tǒng)健康的監(jiān)測和分析都至關重要。因此,如何在復雜環(huán)境下準確識別喬木種類成為一項具有挑戰(zhàn)性的任務。
傳統(tǒng)的樹種識別主要依靠相關領域專家觀察樹木部分器官的形狀、顏色、紋理等特征來完成,該方法主觀性強且效率較低,不適于大量樹木的識別。隨著計算機視覺和機器學習的發(fā)展,樹種分類和識別方法取得了很大的進展,部分研究者利用圖像處理提取樹木顏色、紋理、邊緣、形狀等信息進而完成樹種識別[4-6],盡管分類效果較好,但該方法需要人工選擇特征,復雜的預處理過程增加了時間成本,降低了實用性。
近年來,深度學習技術在農林領域的應用日益增多,不少國內外學者將卷積神經網絡(Convolutional Neural Network, CNN)用于樹種識別[7-10]。朱良寬等[11]利用深度卷積生成式對抗網絡(Deep Convolutional Generative Adversarial Networks, DCGAN)擴充15種葉片圖像,通過遷移學習訓練Inception V3網絡后識別準確率為0.965 7,但圖片選取局限于簡單背景,無法評估模型在復雜背景下的識別性能。劉嘉政等[12]設計3路并列CNN,融合RGB、H通道和局部二值模式(Local Binary Pattern, LBP)特征后,對6種常見樹種的樹皮紋理圖像識別準確率為0.935 0,高于單一特征識別率,但樹皮圖像特征較為明顯易于區(qū)分。Cui等[13]使用ConvNeXt網絡的3種規(guī)格(ConvNeXt-Small、Base和Tiny)識別BarkNetV2數據集中的33種樹皮圖像,準確率較高,分別為0.976 1、0.975 8和0.972 9,但參數量較大,其中參數量最小的Tiny網絡達到了28.59 M。上述研究證實了深度學習在樹種識別上的可行性,也取得了較好的效果,但普遍存在選取的樹木種類較少、部分數據集背景單一特征明顯以及改進的網絡模型參數量較大等問題。
為準確識別復雜背景下特征不明顯的遠距離喬木,本文提出了一種多特征融合的亞熱帶常見喬木識別模型MFFMN-KD-TA(Multiple Features Fusion MobileNetV3_Small complemented by Knowledge Distillation and Triplet Attention),模型將3個MobileNetV3_Small主干網絡融合為MFFMN模型,分別提取樹葉、樹干和樹木整體特征;再引入知識蒸餾策略,以3個ResNet50構建的3-ResNet50融合模型作為教師網絡指導MFFMN訓練,最終將蒸餾得到的MFFMN-KD模型與Triplet Attention注意力機制相結合,實現了自然環(huán)境下遠距離喬木的準確識別。
本文詳細內容請下載:
http://ihrv.cn/resource/share/2000006113
作者信息:
丁鋆1,2,3,徐愛俊1,2,3,吳小芬4,周素茵1,2,3
(1.浙江農林大學 數學與計算機科學學院,浙江 杭州 311300;
2.浙江農林大學 浙江省林業(yè)智能監(jiān)測與信息技術研究重點實驗室,浙江 杭州 311300;
3.浙江農林大學 林業(yè)感知技術與智能裝備國家林業(yè)與草原局重點實驗室,浙江 杭州 311300;
4.杭州市臨安區(qū)農村水務資產經營有限公司,浙江 杭州 311300)