中文引用格式: 黃炯炯. 智慧農(nóng)業(yè)下基于聯(lián)邦學(xué)習(xí)的水稻病蟲害分類研究[J]. 電子技術(shù)應(yīng)用,2024,50(11):89-98.
英文引用格式: Huang Jiongjiong. Research on rice pest and disease classification based on federated learning under smart agriculture[J]. Application of Electronic Technique,2024,50(11):89-98.
引言
水稻是全世界重要的食物來源,在亞洲更是占據(jù)了不可代替的地位。中國60以上的人口以米飯為主食,水稻種植面積在3 000萬公頃左右,占我國總播種面積的五分之一以上[1]。在傳統(tǒng)的農(nóng)業(yè)生產(chǎn)模式中,人力資源的消耗通常十分顯著。在水稻的種植過程中,細(xì)菌、真菌和其他微生物的侵害對水稻的健康狀況和產(chǎn)量構(gòu)成了嚴(yán)重威脅,導(dǎo)致了巨大的損失。農(nóng)業(yè)生產(chǎn)中為了應(yīng)對病蟲害問題,需要投入大量勞動力,這不僅增加了農(nóng)業(yè)成本,也加大了勞動力的工作負(fù)擔(dān)。
物聯(lián)網(wǎng)技術(shù)[2]和計(jì)算機(jī)視覺[3]等科技的引入、科技與農(nóng)業(yè)的深度融合推動了農(nóng)業(yè)智慧化方向的快速發(fā)展,實(shí)現(xiàn)智慧農(nóng)業(yè)[4]的全新格局。在智慧農(nóng)業(yè)下,農(nóng)業(yè)通過智能農(nóng)業(yè)設(shè)備進(jìn)行水稻病蟲害的自動化治理,不僅顯著提升了農(nóng)業(yè)種植的效率,更在減少農(nóng)業(yè)損失方面發(fā)揮了至關(guān)重要的作用。這種智能化的治理模式不僅代表了農(nóng)業(yè)現(xiàn)代化的重要方向,也為提高農(nóng)業(yè)生產(chǎn)效益、促進(jìn)農(nóng)業(yè)可持續(xù)發(fā)展注入了新的動力與意義。
近年來,深度學(xué)習(xí)技術(shù)在各個領(lǐng)域都取得了巨大進(jìn)展,特別是植物病蟲害分類方面。隨著農(nóng)業(yè)智能化發(fā)展,人們對于智能治理植物病蟲害提出了更高要求。在智慧農(nóng)場中,由于分散于不同地區(qū)且歸屬于不同組織機(jī)構(gòu)的農(nóng)業(yè)設(shè)備在運(yùn)行中產(chǎn)生了數(shù)據(jù)孤島問題,給數(shù)據(jù)整合與分析帶來較大困擾。為了解決該問題,本文在研究中加入了聯(lián)邦學(xué)習(xí)框架(FL),聯(lián)邦學(xué)習(xí)在設(shè)備進(jìn)行深度學(xué)習(xí)任務(wù)時對數(shù)據(jù)隱私保護(hù)和提高模型性有很大幫助。聯(lián)邦學(xué)習(xí)在2016年由谷歌研究院提出[5],它是一種分布式機(jī)器學(xué)習(xí)方法,允許在多個設(shè)備或計(jì)算節(jié)點(diǎn)上進(jìn)行模型訓(xùn)練,而無需將原始數(shù)據(jù)傳輸?shù)街醒敕?wù)器。這種學(xué)習(xí)方法的核心思想是在保護(hù)數(shù)據(jù)隱私的同時,允許多個參與方共同學(xué)習(xí)一個全局模型,聯(lián)邦學(xué)習(xí)有效地解決了數(shù)據(jù)孤島[6]這個難題。
在以往的研究中,不少學(xué)者通過改進(jìn)深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)來提高水稻病蟲害的識別分類性能。比如Latif等學(xué)者[7]對預(yù)訓(xùn)練模型VGG19進(jìn)行改進(jìn),在非歸一化增強(qiáng)數(shù)據(jù)上擁有96.08的準(zhǔn)確率,高于相同或類似數(shù)據(jù)集在其他研究中的表現(xiàn)。Bhimavarapu[8]在卷積神經(jīng)網(wǎng)絡(luò)中改進(jìn)了激活和優(yōu)化函數(shù),減少了損失并明顯地提高了預(yù)測性能和分類準(zhǔn)確性。預(yù)訓(xùn)練能夠加速訓(xùn)練過程并提高訓(xùn)練效果,在研究中使用預(yù)訓(xùn)練模型進(jìn)行遷移學(xué)習(xí)也是不錯的方法[9]。Ahad等學(xué)者[10]對六種CNN預(yù)訓(xùn)練模型進(jìn)行了水稻病蟲害分類比較,對五種預(yù)訓(xùn)練模型進(jìn)行遷移學(xué)習(xí),通過比較得到不同模型的效果及優(yōu)缺點(diǎn)。
傳統(tǒng)的集中式機(jī)器學(xué)習(xí)要面對數(shù)據(jù)安全隱私和數(shù)據(jù)中心化的挑戰(zhàn)[11],醫(yī)療和金融領(lǐng)域飽受這些問題的困擾[12]。谷歌團(tuán)隊(duì)設(shè)計(jì)了聯(lián)邦學(xué)習(xí)應(yīng)用在這些領(lǐng)域來解決以上矛盾。在醫(yī)療領(lǐng)域,Sheller等研究者[13]發(fā)現(xiàn),對十個醫(yī)療機(jī)構(gòu)的數(shù)據(jù)進(jìn)行聯(lián)邦學(xué)習(xí)的結(jié)果已經(jīng)達(dá)到了集中數(shù)據(jù)模型質(zhì)量的99%。他們又進(jìn)一步研究了合作機(jī)構(gòu)間的數(shù)據(jù)分布對模型質(zhì)量和學(xué)習(xí)模式的影響,通過與其他多種協(xié)作方法相比證明了聯(lián)邦學(xué)習(xí)的優(yōu)越性,聯(lián)邦學(xué)習(xí)在醫(yī)院數(shù)據(jù)上的應(yīng)用將進(jìn)一步推動個性化精準(zhǔn)醫(yī)療的發(fā)展。Adnan等人[14]則是利用聯(lián)邦學(xué)習(xí)分析醫(yī)學(xué)上的組織病理學(xué)圖像,與傳統(tǒng)訓(xùn)練相比他們所使用的差分私有聯(lián)邦學(xué)習(xí)是醫(yī)學(xué)圖像分析中機(jī)器學(xué)習(xí)模型協(xié)作開發(fā)的可行且可靠的框架。Li等人[15]提出一種聯(lián)邦學(xué)習(xí)用于金融信用風(fēng)險管理領(lǐng)域的應(yīng)用方案,聯(lián)邦學(xué)習(xí)在具有異構(gòu)特征的Non-IID銀行小樣本數(shù)據(jù)下的金融信貸風(fēng)險管理中的性能提高了14%。聯(lián)邦學(xué)習(xí)在近期開始應(yīng)用到了農(nóng)業(yè)領(lǐng)域中。Sharma等學(xué)者[16]利用聯(lián)邦學(xué)習(xí)下的CNN模型對馬鈴薯作物病蟲害進(jìn)行準(zhǔn)確分類;Kaur等人[17]則是利用該技術(shù)對辣椒葉的疾病進(jìn)行了分類;Tripathy等人[18]在聯(lián)邦學(xué)習(xí)框架下,利用LeNet模型提取特征,對水稻病蟲害進(jìn)行了分類優(yōu)化。聯(lián)邦學(xué)習(xí)在這些農(nóng)業(yè)場景下都有不錯的表現(xiàn)。
盡管病蟲害識別技術(shù)已相當(dāng)成熟,但隨著智慧農(nóng)業(yè)的崛起,對該場景的需求也呈現(xiàn)出新的趨勢和變化。本文在智慧農(nóng)業(yè)場景下,使用聯(lián)邦學(xué)習(xí)解決了不同機(jī)構(gòu)和地區(qū)設(shè)備的數(shù)據(jù)孤島問題。不同的數(shù)據(jù)分布對聯(lián)邦學(xué)習(xí)產(chǎn)生影響,本文將水稻病蟲害圖像分為IID和Non-IID數(shù)據(jù)[19],并把預(yù)訓(xùn)練模型作為初模型進(jìn)行特征提取以獲得更高的效率和準(zhǔn)確率。
針對以上幾點(diǎn),本文做了相應(yīng)的研究和實(shí)驗(yàn)加以驗(yàn)證,證實(shí)了該場景下應(yīng)用聯(lián)邦學(xué)習(xí)和使用預(yù)訓(xùn)練模型的方案可行性并探索了適合該方案和實(shí)驗(yàn)環(huán)境下的預(yù)訓(xùn)練模型和條件。
本文詳細(xì)內(nèi)容請下載:
http://ihrv.cn/resource/share/2000006216
作者信息:
黃炯炯
(浙江農(nóng)林大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,浙江 杭州 311300)