《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 設(shè)計應(yīng)用 > 基于多特征融合和知識蒸餾的亞熱帶常見喬木識別方法
基于多特征融合和知識蒸餾的亞熱帶常見喬木識別方法
電子技術(shù)應(yīng)用
丁鋆1,2,3,徐愛俊1,2,3,吳小芬4,周素茵1,2,3
1.浙江農(nóng)林大學(xué) 數(shù)學(xué)與計算機科學(xué)學(xué)院;2.浙江農(nóng)林大學(xué) 浙江省林業(yè)智能監(jiān)測與 信息技術(shù)研究重點實驗室;3.浙江農(nóng)林大學(xué) 林業(yè)感知技術(shù)與智能裝備國家林業(yè)與 草原局重點實驗室;4.杭州市臨安區(qū)農(nóng)村水務(wù)資產(chǎn)經(jīng)營有限公司
摘要: 喬木在維持生態(tài)平衡、保護生物多樣性以及調(diào)節(jié)氣候和改善空氣質(zhì)量等方面發(fā)揮著至關(guān)重要的作用。針對復(fù)雜背景下喬木識別準(zhǔn)確率較低的問題,提出了一種基于樹木多特征融合和知識蒸餾的亞熱帶常見喬木識別模型MFFMN-KD-TA。該模型采用3個并行的MobileNetV3_Small主干網(wǎng)絡(luò)分別提取樹葉、樹干和樹木整體特征;并通過知識蒸餾和嵌入Triplet Attention模塊的方法優(yōu)化訓(xùn)練。試驗結(jié)果表明,MFFMN-KD-TA模型在自建樹木測試集上的準(zhǔn)確率、精確率和F1分?jǐn)?shù)分別為0.960 9、0.962 1和0.960 8,較MFFMN模型分別提升了3.05%、2.83%和3.07%。與三分支融合模型3-ShuffleNetV2和3-MobileNetV2相比,提出的多特征融合模型MFFMN-KD-TA參數(shù)量較小且能夠較準(zhǔn)確地識別喬木種類,為亞熱帶和其他地區(qū)的樹種識別提供了新思路和新方法。
中圖分類號:TP391.4 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.244969
中文引用格式: 丁鋆,徐愛俊,吳小芬,等. 基于多特征融合和知識蒸餾的亞熱帶常見喬木識別方法[J]. 電子技術(shù)應(yīng)用,2024,50(8):1-9.
英文引用格式: Ding Yun,Xu Aijun,Wu Xiaofen,et al. Common arbor identification method in subtropics based on multiple features fusion and knowledge distillation[J]. Application of Electronic Technique,2024,50(8):1-9.
Common arbor identification method in subtropics based on multiple features fusion and knowledge distillation
Ding Yun1,2,3,Xu Aijun1,2,3,Wu Xiaofen4,Zhou Suyin1,2,3
1.College of Mathematics and Computer Science, Zhejiang A&F University; 2.Zhejiang Provincial Key Laboratory of Forestry Intelligent Monitoring and Information Technology, Zhejiang A&F University;3.Key Laboratory of National Forestry and Grassland Administration on Forestry Sensing Technology and Intelligent Engineering, Zhejiang A&F University; 4.Hangzhou Lin′an District Rural Water Asset Management Co., Ltd.
Abstract: Trees play a vital role in maintaining ecological balance, protecting biodiversity, regulating climate and improving air quality. In order to solve the problem of low tree identification accuracy in complex backgrounds, a tree species identification model MFFMN-KD-TA for common arbor in subtropics is proposed based on tree multi-feature fusion and knowledge distillation. The model uses three parallel MobileNetV3_Small backbone networks to extract features of leaves, trunks and overall trees respectively, and optimizes training by using knowledge distillation and embedding Triplet Attention modules. The test results show that the accuracy, precision and F1 score of the MFFMN-KD-TA model on the self-built tree test set are 0.960 9, 0.962 1 and 0.960 8 respectively, which are 3.05%, 2.83% and 3.07% higher than the MFFMN model respectively. Compared with the three-branch fusion models 3-ShuffleNetV2 and 3-MobileNetV2, the multi-feature fusion model MFFMN-KD-TA proposed in this study has a smaller number of parameters and can identify arbor species more accurately, providing a new idea and method for tree species identification in subtropics and other areas.
Key words : tree species identification;subtropical areas;MobileNetV3;multiple features fusion;knowledge distillation

引言

亞熱帶地區(qū)處于熱帶和溫帶之間,氣候和地理特征獨特,為喬木、灌木、草本植物以及濕地植被等多種植物提供了適宜的生存條件,形成了復(fù)雜多樣的植被環(huán)境[1-3]。喬木作為生態(tài)系統(tǒng)中的關(guān)鍵組成部分,其信息的準(zhǔn)確獲取對于珍稀瀕危樹木的保護和管理、木材資源的高效生產(chǎn)利用、亞熱帶地區(qū)生態(tài)系統(tǒng)健康的監(jiān)測和分析都至關(guān)重要。因此,如何在復(fù)雜環(huán)境下準(zhǔn)確識別喬木種類成為一項具有挑戰(zhàn)性的任務(wù)。

傳統(tǒng)的樹種識別主要依靠相關(guān)領(lǐng)域?qū)<矣^察樹木部分器官的形狀、顏色、紋理等特征來完成,該方法主觀性強且效率較低,不適于大量樹木的識別。隨著計算機視覺和機器學(xué)習(xí)的發(fā)展,樹種分類和識別方法取得了很大的進展,部分研究者利用圖像處理提取樹木顏色、紋理、邊緣、形狀等信息進而完成樹種識別[4-6],盡管分類效果較好,但該方法需要人工選擇特征,復(fù)雜的預(yù)處理過程增加了時間成本,降低了實用性。

近年來,深度學(xué)習(xí)技術(shù)在農(nóng)林領(lǐng)域的應(yīng)用日益增多,不少國內(nèi)外學(xué)者將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)用于樹種識別[7-10]。朱良寬等[11]利用深度卷積生成式對抗網(wǎng)絡(luò)(Deep Convolutional Generative Adversarial Networks, DCGAN)擴充15種葉片圖像,通過遷移學(xué)習(xí)訓(xùn)練Inception V3網(wǎng)絡(luò)后識別準(zhǔn)確率為0.965 7,但圖片選取局限于簡單背景,無法評估模型在復(fù)雜背景下的識別性能。劉嘉政等[12]設(shè)計3路并列CNN,融合RGB、H通道和局部二值模式(Local Binary Pattern, LBP)特征后,對6種常見樹種的樹皮紋理圖像識別準(zhǔn)確率為0.935 0,高于單一特征識別率,但樹皮圖像特征較為明顯易于區(qū)分。Cui等[13]使用ConvNeXt網(wǎng)絡(luò)的3種規(guī)格(ConvNeXt-Small、Base和Tiny)識別BarkNetV2數(shù)據(jù)集中的33種樹皮圖像,準(zhǔn)確率較高,分別為0.976 1、0.975 8和0.972 9,但參數(shù)量較大,其中參數(shù)量最小的Tiny網(wǎng)絡(luò)達(dá)到了28.59 M。上述研究證實了深度學(xué)習(xí)在樹種識別上的可行性,也取得了較好的效果,但普遍存在選取的樹木種類較少、部分?jǐn)?shù)據(jù)集背景單一特征明顯以及改進的網(wǎng)絡(luò)模型參數(shù)量較大等問題。

為準(zhǔn)確識別復(fù)雜背景下特征不明顯的遠(yuǎn)距離喬木,本文提出了一種多特征融合的亞熱帶常見喬木識別模型MFFMN-KD-TA(Multiple Features Fusion MobileNetV3_Small complemented by Knowledge Distillation and Triplet Attention),模型將3個MobileNetV3_Small主干網(wǎng)絡(luò)融合為MFFMN模型,分別提取樹葉、樹干和樹木整體特征;再引入知識蒸餾策略,以3個ResNet50構(gòu)建的3-ResNet50融合模型作為教師網(wǎng)絡(luò)指導(dǎo)MFFMN訓(xùn)練,最終將蒸餾得到的MFFMN-KD模型與Triplet Attention注意力機制相結(jié)合,實現(xiàn)了自然環(huán)境下遠(yuǎn)距離喬木的準(zhǔn)確識別。


本文詳細(xì)內(nèi)容請下載:

http://ihrv.cn/resource/share/2000006113


作者信息:

丁鋆1,2,3,徐愛俊1,2,3,吳小芬4,周素茵1,2,3

(1.浙江農(nóng)林大學(xué) 數(shù)學(xué)與計算機科學(xué)學(xué)院,浙江 杭州 311300;

2.浙江農(nóng)林大學(xué) 浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點實驗室,浙江 杭州 311300;

3.浙江農(nóng)林大學(xué) 林業(yè)感知技術(shù)與智能裝備國家林業(yè)與草原局重點實驗室,浙江 杭州 311300;

4.杭州市臨安區(qū)農(nóng)村水務(wù)資產(chǎn)經(jīng)營有限公司,浙江 杭州 311300)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。