《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 設(shè)計(jì)應(yīng)用 > 基于多特征融合和知識(shí)蒸餾的亞熱帶常見喬木識(shí)別方法
基于多特征融合和知識(shí)蒸餾的亞熱帶常見喬木識(shí)別方法
電子技術(shù)應(yīng)用
丁鋆1,2,3,徐愛俊1,2,3,吳小芬4,周素茵1,2,3
1.浙江農(nóng)林大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院;2.浙江農(nóng)林大學(xué) 浙江省林業(yè)智能監(jiān)測(cè)與 信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室;3.浙江農(nóng)林大學(xué) 林業(yè)感知技術(shù)與智能裝備國(guó)家林業(yè)與 草原局重點(diǎn)實(shí)驗(yàn)室;4.杭州市臨安區(qū)農(nóng)村水務(wù)資產(chǎn)經(jīng)營(yíng)有限公司
摘要: 喬木在維持生態(tài)平衡、保護(hù)生物多樣性以及調(diào)節(jié)氣候和改善空氣質(zhì)量等方面發(fā)揮著至關(guān)重要的作用。針對(duì)復(fù)雜背景下喬木識(shí)別準(zhǔn)確率較低的問題,提出了一種基于樹木多特征融合和知識(shí)蒸餾的亞熱帶常見喬木識(shí)別模型MFFMN-KD-TA。該模型采用3個(gè)并行的MobileNetV3_Small主干網(wǎng)絡(luò)分別提取樹葉、樹干和樹木整體特征;并通過知識(shí)蒸餾和嵌入Triplet Attention模塊的方法優(yōu)化訓(xùn)練。試驗(yàn)結(jié)果表明,MFFMN-KD-TA模型在自建樹木測(cè)試集上的準(zhǔn)確率、精確率和F1分?jǐn)?shù)分別為0.960 9、0.962 1和0.960 8,較MFFMN模型分別提升了3.05%、2.83%和3.07%。與三分支融合模型3-ShuffleNetV2和3-MobileNetV2相比,提出的多特征融合模型MFFMN-KD-TA參數(shù)量較小且能夠較準(zhǔn)確地識(shí)別喬木種類,為亞熱帶和其他地區(qū)的樹種識(shí)別提供了新思路和新方法。
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.244969
中文引用格式: 丁鋆,徐愛俊,吳小芬,等. 基于多特征融合和知識(shí)蒸餾的亞熱帶常見喬木識(shí)別方法[J]. 電子技術(shù)應(yīng)用,2024,50(8):1-9.
英文引用格式: Ding Yun,Xu Aijun,Wu Xiaofen,et al. Common arbor identification method in subtropics based on multiple features fusion and knowledge distillation[J]. Application of Electronic Technique,2024,50(8):1-9.
Common arbor identification method in subtropics based on multiple features fusion and knowledge distillation
Ding Yun1,2,3,Xu Aijun1,2,3,Wu Xiaofen4,Zhou Suyin1,2,3
1.College of Mathematics and Computer Science, Zhejiang A&F University; 2.Zhejiang Provincial Key Laboratory of Forestry Intelligent Monitoring and Information Technology, Zhejiang A&F University;3.Key Laboratory of National Forestry and Grassland Administration on Forestry Sensing Technology and Intelligent Engineering, Zhejiang A&F University; 4.Hangzhou Lin′an District Rural Water Asset Management Co., Ltd.
Abstract: Trees play a vital role in maintaining ecological balance, protecting biodiversity, regulating climate and improving air quality. In order to solve the problem of low tree identification accuracy in complex backgrounds, a tree species identification model MFFMN-KD-TA for common arbor in subtropics is proposed based on tree multi-feature fusion and knowledge distillation. The model uses three parallel MobileNetV3_Small backbone networks to extract features of leaves, trunks and overall trees respectively, and optimizes training by using knowledge distillation and embedding Triplet Attention modules. The test results show that the accuracy, precision and F1 score of the MFFMN-KD-TA model on the self-built tree test set are 0.960 9, 0.962 1 and 0.960 8 respectively, which are 3.05%, 2.83% and 3.07% higher than the MFFMN model respectively. Compared with the three-branch fusion models 3-ShuffleNetV2 and 3-MobileNetV2, the multi-feature fusion model MFFMN-KD-TA proposed in this study has a smaller number of parameters and can identify arbor species more accurately, providing a new idea and method for tree species identification in subtropics and other areas.
Key words : tree species identification;subtropical areas;MobileNetV3;multiple features fusion;knowledge distillation

引言

亞熱帶地區(qū)處于熱帶和溫帶之間,氣候和地理特征獨(dú)特,為喬木、灌木、草本植物以及濕地植被等多種植物提供了適宜的生存條件,形成了復(fù)雜多樣的植被環(huán)境[1-3]。喬木作為生態(tài)系統(tǒng)中的關(guān)鍵組成部分,其信息的準(zhǔn)確獲取對(duì)于珍稀瀕危樹木的保護(hù)和管理、木材資源的高效生產(chǎn)利用、亞熱帶地區(qū)生態(tài)系統(tǒng)健康的監(jiān)測(cè)和分析都至關(guān)重要。因此,如何在復(fù)雜環(huán)境下準(zhǔn)確識(shí)別喬木種類成為一項(xiàng)具有挑戰(zhàn)性的任務(wù)。

傳統(tǒng)的樹種識(shí)別主要依靠相關(guān)領(lǐng)域?qū)<矣^察樹木部分器官的形狀、顏色、紋理等特征來完成,該方法主觀性強(qiáng)且效率較低,不適于大量樹木的識(shí)別。隨著計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)的發(fā)展,樹種分類和識(shí)別方法取得了很大的進(jìn)展,部分研究者利用圖像處理提取樹木顏色、紋理、邊緣、形狀等信息進(jìn)而完成樹種識(shí)別[4-6],盡管分類效果較好,但該方法需要人工選擇特征,復(fù)雜的預(yù)處理過程增加了時(shí)間成本,降低了實(shí)用性。

近年來,深度學(xué)習(xí)技術(shù)在農(nóng)林領(lǐng)域的應(yīng)用日益增多,不少國(guó)內(nèi)外學(xué)者將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)用于樹種識(shí)別[7-10]。朱良寬等[11]利用深度卷積生成式對(duì)抗網(wǎng)絡(luò)(Deep Convolutional Generative Adversarial Networks, DCGAN)擴(kuò)充15種葉片圖像,通過遷移學(xué)習(xí)訓(xùn)練Inception V3網(wǎng)絡(luò)后識(shí)別準(zhǔn)確率為0.965 7,但圖片選取局限于簡(jiǎn)單背景,無法評(píng)估模型在復(fù)雜背景下的識(shí)別性能。劉嘉政等[12]設(shè)計(jì)3路并列CNN,融合RGB、H通道和局部二值模式(Local Binary Pattern, LBP)特征后,對(duì)6種常見樹種的樹皮紋理圖像識(shí)別準(zhǔn)確率為0.935 0,高于單一特征識(shí)別率,但樹皮圖像特征較為明顯易于區(qū)分。Cui等[13]使用ConvNeXt網(wǎng)絡(luò)的3種規(guī)格(ConvNeXt-Small、Base和Tiny)識(shí)別BarkNetV2數(shù)據(jù)集中的33種樹皮圖像,準(zhǔn)確率較高,分別為0.976 1、0.975 8和0.972 9,但參數(shù)量較大,其中參數(shù)量最小的Tiny網(wǎng)絡(luò)達(dá)到了28.59 M。上述研究證實(shí)了深度學(xué)習(xí)在樹種識(shí)別上的可行性,也取得了較好的效果,但普遍存在選取的樹木種類較少、部分?jǐn)?shù)據(jù)集背景單一特征明顯以及改進(jìn)的網(wǎng)絡(luò)模型參數(shù)量較大等問題。

為準(zhǔn)確識(shí)別復(fù)雜背景下特征不明顯的遠(yuǎn)距離喬木,本文提出了一種多特征融合的亞熱帶常見喬木識(shí)別模型MFFMN-KD-TA(Multiple Features Fusion MobileNetV3_Small complemented by Knowledge Distillation and Triplet Attention),模型將3個(gè)MobileNetV3_Small主干網(wǎng)絡(luò)融合為MFFMN模型,分別提取樹葉、樹干和樹木整體特征;再引入知識(shí)蒸餾策略,以3個(gè)ResNet50構(gòu)建的3-ResNet50融合模型作為教師網(wǎng)絡(luò)指導(dǎo)MFFMN訓(xùn)練,最終將蒸餾得到的MFFMN-KD模型與Triplet Attention注意力機(jī)制相結(jié)合,實(shí)現(xiàn)了自然環(huán)境下遠(yuǎn)距離喬木的準(zhǔn)確識(shí)別。


本文詳細(xì)內(nèi)容請(qǐng)下載:

http://ihrv.cn/resource/share/2000006113


作者信息:

丁鋆1,2,3,徐愛俊1,2,3,吳小芬4,周素茵1,2,3

(1.浙江農(nóng)林大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,浙江 杭州 311300;

2.浙江農(nóng)林大學(xué) 浙江省林業(yè)智能監(jiān)測(cè)與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 311300;

3.浙江農(nóng)林大學(xué) 林業(yè)感知技術(shù)與智能裝備國(guó)家林業(yè)與草原局重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 311300;

4.杭州市臨安區(qū)農(nóng)村水務(wù)資產(chǎn)經(jīng)營(yíng)有限公司,浙江 杭州 311300)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。