123,123

基于多特征融合和知识蒸馏的亚热带常见乔木识别方法

电子技术应用

丁鋆1，2，3，徐爱俊1，2，3，吴小芬4，周素茵1，2，3

1.浙江农林大学数学与计算机科学学院；2.浙江农林大学浙江省林业智能监测与信息技术研究重点实验室；3.浙江农林大学林业感知技术与智能装备国家林业与草原局重点实验室；4.杭州市临安区农村水务资产经营有限公司

摘要： 乔木在维持生态平衡、保护生物多样性以及调节气候和改善空气质量等方面发挥着至关重要的作用。针对复杂背景下乔木识别准确率较低的问题，提出了一种基于树木多特征融合和知识蒸馏的亚热带常见乔木识别模型MFFMN-KD-TA。该模型采用3个并行的MobileNetV3_Small主干网络分别提取树叶、树干和树木整体特征；并通过知识蒸馏和嵌入Triplet Attention模块的方法优化训练。试验结果表明，MFFMN-KD-TA模型在自建树木测试集上的准确率、精确率和F1分数分别为0.960 9、0.962 1和0.960 8，较MFFMN模型分别提升了3.05%、2.83%和3.07%。与三分支融合模型3-ShuffleNetV2和3-MobileNetV2相比，提出的多特征融合模型MFFMN-KD-TA参数量较小且能够较准确地识别乔木种类，为亚热带和其他地区的树种识别提供了新思路和新方法。

關(guān)鍵詞： 树种识别亚热带地区 MobileNetV3 多特征融合知识蒸馏

中圖分類號(hào)：TP391.4 文獻(xiàn)標(biāo)志碼：A DOI: 10.16157/j.issn.0258-7998.244969
中文引用格式： 丁鋆，徐愛俊，吳小芬，等. 基于多特征融合和知識(shí)蒸餾的亞熱帶常見喬木識(shí)別方法[J]. 電子技術(shù)應(yīng)用，2024，50(8)：1-9.
英文引用格式： Ding Yun，Xu Aijun，Wu Xiaofen，et al. Common arbor identification method in subtropics based on multiple features fusion and knowledge distillation[J]. Application of Electronic Technique，2024，50(8)：1-9.

Common arbor identification method in subtropics based on multiple features fusion and knowledge distillation

Ding Yun1，2，3，Xu Aijun1，2，3，Wu Xiaofen4，Zhou Suyin1，2，3

1.College of Mathematics and Computer Science， Zhejiang A&F University； 2.Zhejiang Provincial Key Laboratory of Forestry Intelligent Monitoring and Information Technology， Zhejiang A&F University；3.Key Laboratory of National Forestry and Grassland Administration on Forestry Sensing Technology and Intelligent Engineering， Zhejiang A&F University； 4.Hangzhou Lin′an District Rural Water Asset Management Co.， Ltd.

Abstract： Trees play a vital role in maintaining ecological balance, protecting biodiversity, regulating climate and improving air quality. In order to solve the problem of low tree identification accuracy in complex backgrounds, a tree species identification model MFFMN-KD-TA for common arbor in subtropics is proposed based on tree multi-feature fusion and knowledge distillation. The model uses three parallel MobileNetV3_Small backbone networks to extract features of leaves, trunks and overall trees respectively, and optimizes training by using knowledge distillation and embedding Triplet Attention modules. The test results show that the accuracy, precision and F1 score of the MFFMN-KD-TA model on the self-built tree test set are 0.960 9, 0.962 1 and 0.960 8 respectively, which are 3.05%， 2.83% and 3.07% higher than the MFFMN model respectively. Compared with the three-branch fusion models 3-ShuffleNetV2 and 3-MobileNetV2, the multi-feature fusion model MFFMN-KD-TA proposed in this study has a smaller number of parameters and can identify arbor species more accurately, providing a new idea and method for tree species identification in subtropics and other areas.

Key words : tree species identification；subtropical areas；MobileNetV3；multiple features fusion；knowledge distillation

引言

亞熱帶地區(qū)處于熱帶和溫帶之間，氣候和地理特征獨(dú)特，為喬木、灌木、草本植物以及濕地植被等多種植物提供了適宜的生存條件，形成了復(fù)雜多樣的植被環(huán)境[1-3]。喬木作為生態(tài)系統(tǒng)中的關(guān)鍵組成部分，其信息的準(zhǔn)確獲取對于珍稀瀕危樹木的保護(hù)和管理、木材資源的高效生產(chǎn)利用、亞熱帶地區(qū)生態(tài)系統(tǒng)健康的監(jiān)測和分析都至關(guān)重要。因此，如何在復(fù)雜環(huán)境下準(zhǔn)確識(shí)別喬木種類成為一項(xiàng)具有挑戰(zhàn)性的任務(wù)。

傳統(tǒng)的樹種識(shí)別主要依靠相關(guān)領(lǐng)域?qū)＜矣^察樹木部分器官的形狀、顏色、紋理等特征來完成，該方法主觀性強(qiáng)且效率較低，不適于大量樹木的識(shí)別。隨著計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)的發(fā)展，樹種分類和識(shí)別方法取得了很大的進(jìn)展，部分研究者利用圖像處理提取樹木顏色、紋理、邊緣、形狀等信息進(jìn)而完成樹種識(shí)別[4-6]，盡管分類效果較好，但該方法需要人工選擇特征，復(fù)雜的預(yù)處理過程增加了時(shí)間成本，降低了實(shí)用性。

近年來，深度學(xué)習(xí)技術(shù)在農(nóng)林領(lǐng)域的應(yīng)用日益增多，不少國內(nèi)外學(xué)者將卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network, CNN）用于樹種識(shí)別[7-10]。朱良寬等[11]利用深度卷積生成式對抗網(wǎng)絡(luò)（Deep Convolutional Generative Adversarial Networks, DCGAN）擴(kuò)充15種葉片圖像，通過遷移學(xué)習(xí)訓(xùn)練Inception V3網(wǎng)絡(luò)后識(shí)別準(zhǔn)確率為0.965 7，但圖片選取局限于簡單背景，無法評估模型在復(fù)雜背景下的識(shí)別性能。劉嘉政等[12]設(shè)計(jì)3路并列CNN，融合RGB、H通道和局部二值模式（Local Binary Pattern, LBP）特征后，對6種常見樹種的樹皮紋理圖像識(shí)別準(zhǔn)確率為0.935 0，高于單一特征識(shí)別率，但樹皮圖像特征較為明顯易于區(qū)分。Cui等[13]使用ConvNeXt網(wǎng)絡(luò)的3種規(guī)格（ConvNeXt-Small、Base和Tiny）識(shí)別BarkNetV2數(shù)據(jù)集中的33種樹皮圖像，準(zhǔn)確率較高，分別為0.976 1、0.975 8和0.972 9，但參數(shù)量較大，其中參數(shù)量最小的Tiny網(wǎng)絡(luò)達(dá)到了28.59 M。上述研究證實(shí)了深度學(xué)習(xí)在樹種識(shí)別上的可行性，也取得了較好的效果，但普遍存在選取的樹木種類較少、部分?jǐn)?shù)據(jù)集背景單一特征明顯以及改進(jìn)的網(wǎng)絡(luò)模型參數(shù)量較大等問題。

為準(zhǔn)確識(shí)別復(fù)雜背景下特征不明顯的遠(yuǎn)距離喬木，本文提出了一種多特征融合的亞熱帶常見喬木識(shí)別模型MFFMN-KD-TA（Multiple Features Fusion MobileNetV3_Small complemented by Knowledge Distillation and Triplet Attention），模型將3個(gè)MobileNetV3_Small主干網(wǎng)絡(luò)融合為MFFMN模型，分別提取樹葉、樹干和樹木整體特征；再引入知識(shí)蒸餾策略，以3個(gè)ResNet50構(gòu)建的3-ResNet50融合模型作為教師網(wǎng)絡(luò)指導(dǎo)MFFMN訓(xùn)練，最終將蒸餾得到的MFFMN-KD模型與Triplet Attention注意力機(jī)制相結(jié)合，實(shí)現(xiàn)了自然環(huán)境下遠(yuǎn)距離喬木的準(zhǔn)確識(shí)別。

本文詳細(xì)內(nèi)容請下載：

http://ihrv.cn/resource/share/2000006113

作者信息：

丁鋆1，2，3，徐愛俊1，2，3，吳小芬4，周素茵1，2，3

（1.浙江農(nóng)林大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院，浙江杭州 311300；

2.浙江農(nóng)林大學(xué) 浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室，浙江杭州 311300；

3.浙江農(nóng)林大學(xué) 林業(yè)感知技術(shù)與智能裝備國家林業(yè)與草原局重點(diǎn)實(shí)驗(yàn)室，浙江杭州 311300；

4.杭州市臨安區(qū)農(nóng)村水務(wù)資產(chǎn)經(jīng)營有限公司，浙江杭州 311300）

Magazine.Subscription.jpg

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容