《電子技術(shù)應用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設計應用 > 基于改進神經(jīng)網(wǎng)絡的農(nóng)作物產(chǎn)量預測方法
基于改進神經(jīng)網(wǎng)絡的農(nóng)作物產(chǎn)量預測方法
2019年電子技術(shù)應用第10期
劉 鵬1,鄭 勇2,楊紅軍3
1.山東麥港數(shù)據(jù)系統(tǒng)有限公司,山東 濟南250100; 2.山東省農(nóng)業(yè)信息中心,山東 濟南250100;3.濟南市農(nóng)業(yè)信息中心,山東 濟南250002
摘要: 農(nóng)作物產(chǎn)量預測對政府規(guī)劃國民經(jīng)濟的發(fā)展具有決定性作用,對于合理統(tǒng)籌種植策略以及減少水肥的浪費有著重要意義。影響農(nóng)作物產(chǎn)量的因素眾多,準確預測農(nóng)作物產(chǎn)量具有非常重要的意義。氣候是影響農(nóng)作物產(chǎn)量的重要因素。以氣候因素為依據(jù),提出了一種基于改進長短期記憶神經(jīng)網(wǎng)絡的農(nóng)作物產(chǎn)量時間序列預測的方法,將歷史產(chǎn)量和氣候因素相結(jié)合,以固定年份為單位對下一年農(nóng)作物產(chǎn)量進行預測。實驗結(jié)果表明,與長短期記憶神經(jīng)網(wǎng)絡、支持向量機方法進行對比,本方法在農(nóng)作物產(chǎn)量時間序列預測中有較高的準確性。
中圖分類號: TP391
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.190537
中文引用格式: 劉鵬,鄭勇,楊紅軍. 基于改進神經(jīng)網(wǎng)絡的農(nóng)作物產(chǎn)量預測方法[J].電子技術(shù)應用,2019,45(10):88-91,99.
英文引用格式: Liu Peng,Zheng Yong,Yang Hongjun. Crop yield prediction method based on an improved neural network[J]. Application of Electronic Technique,2019,45(10):88-91,99.
Crop yield prediction method based on an improved neural network
Liu Peng1,Zheng Yong2,Yang Hongjun3
1.Shandong MGdaas Systems Co.,Ltd.,Jinan 250100,China; 2.Shandong Agricultural Information Center,Jinan 250100,China;3.Jinan Agricultural Information Center,Jinan 250002,China
Abstract: Crop yield forecasting plays a decisive role in the development of national economy planned by the government. It is of great significance to rationally plan planting strategies and reduce the waste of water and fertilizer. There are many factors affecting crop yield, and accurate prediction of crop growth means a lot. Climate is an important factor affecting crop yield. Based on climatic factors, this paper proposes a time series prediction method based on the long short-term memory(LSTM) for crop yield prediction. The method combines historical yields with climatic factors to forecast the crop yield of the next period by years. Experimental results show that compared with LSTM and support vector machine methods, the proposed method achieves higher accuracy in crop yield prediction.
Key words : crop yield prediction;long short-term memory;deep learning;recurrent neural network;climate factor

0 引言

    農(nóng)業(yè)是國民經(jīng)濟組成的重要部分,農(nóng)作物生產(chǎn)對于社會的穩(wěn)定具有重要作用。農(nóng)作物產(chǎn)量是政府部門進行農(nóng)業(yè)決策和宏觀調(diào)控的重要依據(jù),預估農(nóng)作物產(chǎn)量具有重要的意義。影響農(nóng)作物產(chǎn)量的因素眾多,農(nóng)作物產(chǎn)量的形成通常具有非線性的特點,準確地預估農(nóng)作物產(chǎn)量一直是農(nóng)業(yè)發(fā)展中的一個難題。

    現(xiàn)有的估產(chǎn)辦法主要包括統(tǒng)計方法、遙感術(shù)[1]、水肥測量[2]、一元或多元回歸分析[3]等方法。這些方法通常存在成本高、周期長、精確度不夠高等缺點。同時只使用產(chǎn)量信息的預測方法無法得到更加準確的預測結(jié)果。隨著現(xiàn)代農(nóng)業(yè)和大數(shù)據(jù)時代的發(fā)展,能夠獲得大量影響農(nóng)作物生長因素的信息,其中氣候因素對農(nóng)作物的產(chǎn)量影響重大[4]

    近十多年來神經(jīng)網(wǎng)絡快速發(fā)展,它模擬人腦的神經(jīng)系統(tǒng)對復雜信息的處理機制,具有高度的非線性特點[5]。不同于多元回歸只能對線性關系建模,神經(jīng)網(wǎng)絡對線性關系和非線性關系都能建模,而且不需要預處理,也不需要對輸入輸出關系做任何假設。遞歸神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)能夠更靈活、準確地對農(nóng)作物產(chǎn)量做出預測。但是標準的遞歸神經(jīng)網(wǎng)絡由于梯度消失比較難捕獲長期依賴關系[6],HOCHREITER S等人[7]提出一種特殊的RNN結(jié)構(gòu)類型——長短期記憶網(wǎng)絡(Long Short-Term Memory,LSTM),它可以處理長期信息依賴,所以適合于處理和預測時間序列中間隔和延遲相對較長的重要事件[8-9]。

    然而,僅用單一的LSTM模型無法充分考慮其他影響產(chǎn)量的因素。在農(nóng)作物產(chǎn)量預測中,溫度、降水量等是重要的決定因素。針對此問題,本文提出一種基于LSTM,同時使用影響產(chǎn)量的氣候因素的ELSTM模型,對農(nóng)作物的產(chǎn)量進行更加準確的預測。實驗表明ELSTM模型比LSTM模型具有更高的準確性。

1 相關工作

    許多學者對預測問題做了深入的研究,特別是神經(jīng)網(wǎng)絡可以快速有效地解決復雜問題,近年來在眾多領域得到了廣泛的應用。

    MISHRA S等人[10]提出一種新型的RNN結(jié)構(gòu)來處理短期預測問題,時間關系由神經(jīng)元提供,可以根據(jù)具體情況使用不同類型的激活函數(shù)和不同數(shù)量的神經(jīng)元來提高準確性。該模型只適用于短期預測,不適用于本文要解決的問題。

    Guo Tao等人[11]使用LSTM模型來處理預測問題,LSTM最多增加4個層來改進重復模塊,方便實現(xiàn)和控制長期記憶,在準確性方面得到令人滿意的預測。

    Hu Haiqing等人[12]綜合了灰色預測模型和三角模型的優(yōu)點,建立TGM模型來預測中國糧食的產(chǎn)量。但是該模型只使用了產(chǎn)量信息,沒有考慮其他的條件,不符合本文要解決的問題。

    HOSSAIN M A等人[13]考慮氣候?qū)r(nóng)作物產(chǎn)量的影響,利用神經(jīng)網(wǎng)絡(NN)建立天氣參數(shù)預測模型,然后將預測天氣以及當前的農(nóng)業(yè)數(shù)據(jù)作為支持向量機(SVM)的輸入對水稻產(chǎn)量進行預測。但是SVM適用于分類問題,產(chǎn)量預測準確性不是很高。

    綜上,當前用于處理預測問題的方法無法很好地解決本文所述問題,而且僅用單一的LSTM預測模型無法進行準確預測,其他方法也沒有充分利用影響產(chǎn)量的氣候因素?;谶@個問題,本文考慮在使用LSTM預測的基礎上同時優(yōu)化LSTM,在預測模型中考慮氣候因素對產(chǎn)量的影響以使預測更加準確,提出了使用氣候因素進行產(chǎn)量預測的ELSTM模型。

2 數(shù)據(jù)預處理和ELSTM模型

    隨著現(xiàn)代農(nóng)業(yè)和精準農(nóng)業(yè)的發(fā)展,對農(nóng)作物的產(chǎn)量和氣候因素有準確的記錄。農(nóng)作物的產(chǎn)量預測模型主要根據(jù)歷史產(chǎn)量來建模學習和預測當前年份的產(chǎn)量,同時在模型中加入歷史年份的氣候因素,以更加準確地給出當前年份的產(chǎn)量的預測。

2.1 數(shù)據(jù)預處理

    基于農(nóng)作物生長的自然規(guī)律,氣候條件對產(chǎn)量的影響是產(chǎn)量預測中必須注意的一個要點。氣候中最重要的兩個因素是氣溫和降水[14]。對初始數(shù)據(jù)進行下述處理可以獲得適用于本模型的數(shù)據(jù)集:

    定義 s為預測的目標年份,使用前i年的信息進行預測,則Xs={xs-i,…,xs-2,xs-1}為預測s年產(chǎn)量的歷史產(chǎn)量數(shù)據(jù);Es={es-i,…,es-2,es-1}為預測s年產(chǎn)量的氣候因素數(shù)據(jù)。例如預測2010年的產(chǎn)量,使用前3年數(shù)據(jù)進行預測,則產(chǎn)量是數(shù)據(jù)為X2010={x2007,x2008,x2009},氣候因素數(shù)據(jù)為E2010={e2007,e2008,e2009}。

    本模型主要利用前s-i年所有產(chǎn)量數(shù)據(jù)和氣候數(shù)據(jù)對接下來s年產(chǎn)量進行預測。

2.2 LSTM

    RNN是一種節(jié)點定向連接成環(huán)的人工神經(jīng)網(wǎng)絡,可以利用它內(nèi)部的記憶來處理任意時序的輸入序列。然而BENGIO Y等人[15]觀察到由于梯度消失問題,RNN無法處理長距離依賴的問題。LSTM是RNN的變體,但是單一的產(chǎn)量數(shù)據(jù)進行預測結(jié)果不夠準確。因此,本文提出了在LSTM基礎上增加了考慮氣候因素的ELSTM模型。

2.3 ELSTM模型

    不同年份農(nóng)作物生長期內(nèi)溫度、降水情況對產(chǎn)量有重要影響。結(jié)合歷史年份氣候條件和預測年份氣候條件相似性可以進一步挖掘產(chǎn)量中的內(nèi)部聯(lián)系,這對提高預測性能是重要的。

    ELSTM模型整體架構(gòu)如圖1所示,模型在標準LSTM架構(gòu)的結(jié)果上加入氣候因素權(quán)重,以便能夠捕捉氣候條件對農(nóng)作物產(chǎn)量的影響。

jsj3-t1.gif

    ELSTM模型共分為LSTM層、權(quán)重層和預測層。模型需要兩個輸入,即歷史產(chǎn)量Xs和氣候條件Es。Xs經(jīng)過LSTM層得到每年產(chǎn)量的向量表示Hs={hs-i,…,hs-2,hs-1},Es經(jīng)過權(quán)重層得到每年生長條件對應的As={jsj3-t1-x1.gifs-i,…,jsj3-t1-x1.gifs-2,jsj3-t1-x1.gifs-1}。Hs和As經(jīng)過預測層得到預測產(chǎn)量。

    首先是LSTM層,如圖2所示歷史產(chǎn)量Xs經(jīng)過LSTM層得到對應的產(chǎn)量向量表示Hs。

jsj3-t2.gif

    LSTM在普通RNN基礎上,在隱藏層各神經(jīng)單元中增加記憶單元,從而使時間序列上的記憶信息可控。一個LSTM單元有3個門:遺忘門、輸入門、輸出門。LSTM單元結(jié)構(gòu)如圖3所示。

jsj3-t3.gif

    (1)遺忘門:遺忘門是以上一單元的輸出ht-1和本單元的輸入xt為輸入的sigmoid函數(shù),{Wf,Uf,bf}是遺忘門的參數(shù)。

jsj3-gs1-6.gif

    由于一個年份對應一個LSTM單元,因此取每個單元的輸出向量表示當前年份的產(chǎn)量信息。離被預測年份越近的年份受之前年份的產(chǎn)量影響越大。

    在權(quán)重層得到s-i年氣候因素所對應的權(quán)重。

    首先將s-i年與s年的氣候因素做差,氣候條件與s年越相似的年份,差值越小。將每年的差值歸一化并組合成一條信息,具體計算如下:

jsj3-gs7-12.gif

jsj3-gs13.gif

    訓練過程如下:

    (1)LSTM層。產(chǎn)量信息Xs作為LSTM層的輸入。按年份順序?qū)a(chǎn)量信息輸入不同LSTM單元中,在每個LSTM單元得到包含所有歷史產(chǎn)量信息Hs。

    (2)權(quán)重層。將生長條件信息作為權(quán)重層的輸入,經(jīng)過計算得到每個年份的權(quán)重As。

    (3)預測層。將Hs和As作為最終預測層的輸入,經(jīng)過預測層的運算即可得到歷史產(chǎn)量向量,然后得到預測值。

    (4)通過有監(jiān)督的訓練調(diào)整模型。按照損失函數(shù)計算預測值與真實值之間的差別,使用BP算法調(diào)整模型每層的參數(shù)。

    參數(shù)調(diào)整后重復這一過程,直到得到一組最優(yōu)的參數(shù)并保留下來。

3 實驗

    用于建模分析的數(shù)據(jù)是2000年~2016年山東省17個市農(nóng)作物產(chǎn)量和氣候情況。其中農(nóng)作物選擇的是小麥、玉米這兩種代表性的農(nóng)作物。為了避免因為種植面積變化帶來的產(chǎn)量變化,本文使用每公頃產(chǎn)量作為農(nóng)作物的產(chǎn)量的單位。氣候因素是兩種農(nóng)作物對應生長期每天的降水量和溫度,小麥的氣候因素數(shù)據(jù)是每年9月份到下年5月份每天的降水量和溫度,玉米的氣候因素數(shù)據(jù)是每年6月份~9月份每天的降水量和溫度。

3.1 實驗設置說明

    本節(jié)將通過實驗評估所提出的ELSTM模型。實驗環(huán)境為:INTELCorei5 CPU,3.20 GHz;8 GB內(nèi)存。每個對比實驗情況均運行10遍,取平均值。主要設置3個對比模型:

    (1)ELSTM模型:本文提出的ELSTM模型,利用產(chǎn)量和生長條件信息進行預測。

    (2)LSTM模型:標準的LSTM模型,只使用歷年產(chǎn)量信息進行預測。

    (3)SVM模型:使用支持向量機(SVM)對歷年產(chǎn)量信息進行預測。

3.2 模擬比較實驗

    本節(jié)使用ELSTM、LSTM和SVM 3種模型進行實驗。將過去2~6年的歷史產(chǎn)量和氣候條件作為模型輸入。

    使用偏差率(Deviation rate)來計算預測值同真實值之間的偏差占真實值的百分比,偏差率值越小,模型的準確率越高。使用以下公式計算:

    jsj3-gs14.gif

    使用決定系數(shù)(R2)來判斷模型擬合的程度,擬合程度越高,R2越接近1。使用如下公式計算:

jsj3-gs15.gif

    小麥誤差率實驗結(jié)果如表1所示。玉米誤差率實驗結(jié)果如表2所示。

jsj3-b1.gif

jsj3-b2.gif

    從實驗結(jié)果中可以看出,在3個模型中,ELSTM模型預測結(jié)果最好。同時根據(jù)誤差率的分布,可以得出使用過去4年的產(chǎn)量預測下一年產(chǎn)量預測結(jié)果更準確。

    將過去4年小麥的產(chǎn)量和氣候條件作為輸入進行計算,得到實驗結(jié)果如表3所示。

jsj3-b3.gif

    從實驗結(jié)果中可以看出,ELSTM模型的決定系數(shù)最大,擬合程度優(yōu)于其他模型。

    通過以上實驗可以看出,ELSTM模型的預測結(jié)果準確率更高,擬合程度更好。針對此問題,ELSTM是一個很好的預測模型。

4 結(jié)論

    預測農(nóng)作物產(chǎn)量是農(nóng)業(yè)生產(chǎn)中的一個重要問題。由于農(nóng)作物生長受多方面因素影響,準確預測農(nóng)作物產(chǎn)量非常重要。

    本文針對農(nóng)作物產(chǎn)量預測問題設計了一個基于LSTM的改進模型進行求解。在求解過程中,將農(nóng)作物歷史產(chǎn)量數(shù)據(jù)與生長條件數(shù)據(jù)相結(jié)合,作為輸入對模型進行訓練,可對當年農(nóng)作物產(chǎn)量進行精準預測。實驗表明,與其他預測方法相比,本模型有更理想的預測結(jié)果。

    在未來的工作中,計劃將所提出的方法應用于其他具有相同特征的預測問題,以觀察該模型在不同問題上的預測精確度和通用性。

參考文獻

[1] GUERIF M,LAUNAY M,DUKE C.Remote sensing as a tool enabling the spatial use of crop models for crop diagnosis and yield prediction[C].IEEE International Geoscience and Remote Sensing Symposium,2000:1477-1479.

[2] Jin Chuan,Qin Qiming,Zhu Lin,et al.TVDI basedcrop yield prediction model for stressed surfaces[C].IEEE International Geoscience and Remote Sensing Symposium,2007:4656-4658.

[3] KERDILES H,REMBOLD F,LEO O,et al.CST,a freeware for predicting crop yield from remote sensing orcrop model indicators:illustration with RSA and Ethiopia[C].International Conference on Agro-Geoinformatic,2017:1-6.

[4] Zhuo Zhihong,Gao Chaochao,Liu Yonghong.Regional grain yield response to climate change in China: a statistic modeling approach[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(11):4472-4479.

[5] Wang Anhong,Zhang Xueying,Sun Zhiyi,et al.A nonlinear prediction speech coding ADPCM algorithm based on RNN[C].International Conference on Machine Learning and Cybernetics,2002:1353-1357.

[6] PASCANU R,MIKOLOV T,BENGIO Y.On the difficulty of training recurrent neural networks[J].Computer Science,2013,28(1):337-345.

[7] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.

[8] 涂小萌,陳強國.基于ARIMA-LSSVM混合模型的犯罪時間序列預測[J].電子技術(shù)應用,2015,41(2):160-162,166.

[9] 楊爍,孫欽斐,朱潔,等.基于大數(shù)據(jù)平臺的電采暖用電量預測分析[J].電子技術(shù)應用,2018,44(11):67-69.

[10] MISHRA S,PATRA S K.Short term load forecasting using a novel recurrent neural network[C].IEEE Region 10 Conference,2008:1-6.

[11] Guo Tao,Liu Rui,Yang Heng,et al.Predict atmosphere electric field value with the LSTM neural network[C].International Conference on Computer Systems,Electronics and Control,2017:263-266.

[12] Hu Haiqing,Zhang Dan,Qiu Ping.Application of trigonometric grey prediction approach to forecasting China grain yield[C].IEEE International Conference on Grey Systems and Intelligent Services,2009:538-542.

[13] HOSSAIN M A,UDDIN M N,HOSSAIN M A,et al.Predicting rice yield for Bangladesh by exploiting weather conditions[C].International Conference on Information and Communication Technology Convergence,2017:589-594.

[14] Huang Youxin,Liu Xiuguo,Shen Yonglin,et al.Assessment of agricultural drought indicators impact on soybean crop yield:a case study in Iowa,USA[C].The Third International Conference on Agro-Geoinformatics,2014:1-6.

[15] BENGIO Y,F(xiàn)RASCONI P,SIMARD P.The problem of learning long-term dependencies in recurrent networks[C].IEEE International Conference on Neural Networks.San Francisco,USA,1993(3):1183-1188.



作者信息:

劉  鵬1,鄭  勇2,楊紅軍3

(1.山東麥港數(shù)據(jù)系統(tǒng)有限公司,山東 濟南250100;

2.山東省農(nóng)業(yè)信息中心,山東 濟南250100;3.濟南市農(nóng)業(yè)信息中心,山東 濟南250002)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。