文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.190537
中文引用格式: 劉鵬,鄭勇,楊紅軍. 基于改進神經網絡的農作物產量預測方法[J].電子技術應用,2019,45(10):88-91,99.
英文引用格式: Liu Peng,Zheng Yong,Yang Hongjun. Crop yield prediction method based on an improved neural network[J]. Application of Electronic Technique,2019,45(10):88-91,99.
0 引言
農業(yè)是國民經濟組成的重要部分,農作物生產對于社會的穩(wěn)定具有重要作用。農作物產量是政府部門進行農業(yè)決策和宏觀調控的重要依據(jù),預估農作物產量具有重要的意義。影響農作物產量的因素眾多,農作物產量的形成通常具有非線性的特點,準確地預估農作物產量一直是農業(yè)發(fā)展中的一個難題。
現(xiàn)有的估產辦法主要包括統(tǒng)計方法、遙感術[1]、水肥測量[2]、一元或多元回歸分析[3]等方法。這些方法通常存在成本高、周期長、精確度不夠高等缺點。同時只使用產量信息的預測方法無法得到更加準確的預測結果。隨著現(xiàn)代農業(yè)和大數(shù)據(jù)時代的發(fā)展,能夠獲得大量影響農作物生長因素的信息,其中氣候因素對農作物的產量影響重大[4]。
近十多年來神經網絡快速發(fā)展,它模擬人腦的神經系統(tǒng)對復雜信息的處理機制,具有高度的非線性特點[5]。不同于多元回歸只能對線性關系建模,神經網絡對線性關系和非線性關系都能建模,而且不需要預處理,也不需要對輸入輸出關系做任何假設。遞歸神經網絡(Recurrent Neural Network,RNN)能夠更靈活、準確地對農作物產量做出預測。但是標準的遞歸神經網絡由于梯度消失比較難捕獲長期依賴關系[6],HOCHREITER S等人[7]提出一種特殊的RNN結構類型——長短期記憶網絡(Long Short-Term Memory,LSTM),它可以處理長期信息依賴,所以適合于處理和預測時間序列中間隔和延遲相對較長的重要事件[8-9]。
然而,僅用單一的LSTM模型無法充分考慮其他影響產量的因素。在農作物產量預測中,溫度、降水量等是重要的決定因素。針對此問題,本文提出一種基于LSTM,同時使用影響產量的氣候因素的ELSTM模型,對農作物的產量進行更加準確的預測。實驗表明ELSTM模型比LSTM模型具有更高的準確性。
1 相關工作
許多學者對預測問題做了深入的研究,特別是神經網絡可以快速有效地解決復雜問題,近年來在眾多領域得到了廣泛的應用。
MISHRA S等人[10]提出一種新型的RNN結構來處理短期預測問題,時間關系由神經元提供,可以根據(jù)具體情況使用不同類型的激活函數(shù)和不同數(shù)量的神經元來提高準確性。該模型只適用于短期預測,不適用于本文要解決的問題。
Guo Tao等人[11]使用LSTM模型來處理預測問題,LSTM最多增加4個層來改進重復模塊,方便實現(xiàn)和控制長期記憶,在準確性方面得到令人滿意的預測。
Hu Haiqing等人[12]綜合了灰色預測模型和三角模型的優(yōu)點,建立TGM模型來預測中國糧食的產量。但是該模型只使用了產量信息,沒有考慮其他的條件,不符合本文要解決的問題。
HOSSAIN M A等人[13]考慮氣候對農作物產量的影響,利用神經網絡(NN)建立天氣參數(shù)預測模型,然后將預測天氣以及當前的農業(yè)數(shù)據(jù)作為支持向量機(SVM)的輸入對水稻產量進行預測。但是SVM適用于分類問題,產量預測準確性不是很高。
綜上,當前用于處理預測問題的方法無法很好地解決本文所述問題,而且僅用單一的LSTM預測模型無法進行準確預測,其他方法也沒有充分利用影響產量的氣候因素?;谶@個問題,本文考慮在使用LSTM預測的基礎上同時優(yōu)化LSTM,在預測模型中考慮氣候因素對產量的影響以使預測更加準確,提出了使用氣候因素進行產量預測的ELSTM模型。
2 數(shù)據(jù)預處理和ELSTM模型
隨著現(xiàn)代農業(yè)和精準農業(yè)的發(fā)展,對農作物的產量和氣候因素有準確的記錄。農作物的產量預測模型主要根據(jù)歷史產量來建模學習和預測當前年份的產量,同時在模型中加入歷史年份的氣候因素,以更加準確地給出當前年份的產量的預測。
2.1 數(shù)據(jù)預處理
基于農作物生長的自然規(guī)律,氣候條件對產量的影響是產量預測中必須注意的一個要點。氣候中最重要的兩個因素是氣溫和降水[14]。對初始數(shù)據(jù)進行下述處理可以獲得適用于本模型的數(shù)據(jù)集:
定義 s為預測的目標年份,使用前i年的信息進行預測,則Xs={xs-i,…,xs-2,xs-1}為預測s年產量的歷史產量數(shù)據(jù);Es={es-i,…,es-2,es-1}為預測s年產量的氣候因素數(shù)據(jù)。例如預測2010年的產量,使用前3年數(shù)據(jù)進行預測,則產量是數(shù)據(jù)為X2010={x2007,x2008,x2009},氣候因素數(shù)據(jù)為E2010={e2007,e2008,e2009}。
本模型主要利用前s-i年所有產量數(shù)據(jù)和氣候數(shù)據(jù)對接下來s年產量進行預測。
2.2 LSTM
RNN是一種節(jié)點定向連接成環(huán)的人工神經網絡,可以利用它內部的記憶來處理任意時序的輸入序列。然而BENGIO Y等人[15]觀察到由于梯度消失問題,RNN無法處理長距離依賴的問題。LSTM是RNN的變體,但是單一的產量數(shù)據(jù)進行預測結果不夠準確。因此,本文提出了在LSTM基礎上增加了考慮氣候因素的ELSTM模型。
2.3 ELSTM模型
不同年份農作物生長期內溫度、降水情況對產量有重要影響。結合歷史年份氣候條件和預測年份氣候條件相似性可以進一步挖掘產量中的內部聯(lián)系,這對提高預測性能是重要的。
ELSTM模型整體架構如圖1所示,模型在標準LSTM架構的結果上加入氣候因素權重,以便能夠捕捉氣候條件對農作物產量的影響。
ELSTM模型共分為LSTM層、權重層和預測層。模型需要兩個輸入,即歷史產量Xs和氣候條件Es。Xs經過LSTM層得到每年產量的向量表示Hs={hs-i,…,hs-2,hs-1},Es經過權重層得到每年生長條件對應的As={s-i,…,s-2,s-1}。Hs和As經過預測層得到預測產量。
首先是LSTM層,如圖2所示歷史產量Xs經過LSTM層得到對應的產量向量表示Hs。
LSTM在普通RNN基礎上,在隱藏層各神經單元中增加記憶單元,從而使時間序列上的記憶信息可控。一個LSTM單元有3個門:遺忘門、輸入門、輸出門。LSTM單元結構如圖3所示。
(1)遺忘門:遺忘門是以上一單元的輸出ht-1和本單元的輸入xt為輸入的sigmoid函數(shù),{Wf,Uf,bf}是遺忘門的參數(shù)。
由于一個年份對應一個LSTM單元,因此取每個單元的輸出向量表示當前年份的產量信息。離被預測年份越近的年份受之前年份的產量影響越大。
在權重層得到s-i年氣候因素所對應的權重。
首先將s-i年與s年的氣候因素做差,氣候條件與s年越相似的年份,差值越小。將每年的差值歸一化并組合成一條信息,具體計算如下:
訓練過程如下:
(1)LSTM層。產量信息Xs作為LSTM層的輸入。按年份順序將產量信息輸入不同LSTM單元中,在每個LSTM單元得到包含所有歷史產量信息Hs。
(2)權重層。將生長條件信息作為權重層的輸入,經過計算得到每個年份的權重As。
(3)預測層。將Hs和As作為最終預測層的輸入,經過預測層的運算即可得到歷史產量向量,然后得到預測值。
(4)通過有監(jiān)督的訓練調整模型。按照損失函數(shù)計算預測值與真實值之間的差別,使用BP算法調整模型每層的參數(shù)。
參數(shù)調整后重復這一過程,直到得到一組最優(yōu)的參數(shù)并保留下來。
3 實驗
用于建模分析的數(shù)據(jù)是2000年~2016年山東省17個市農作物產量和氣候情況。其中農作物選擇的是小麥、玉米這兩種代表性的農作物。為了避免因為種植面積變化帶來的產量變化,本文使用每公頃產量作為農作物的產量的單位。氣候因素是兩種農作物對應生長期每天的降水量和溫度,小麥的氣候因素數(shù)據(jù)是每年9月份到下年5月份每天的降水量和溫度,玉米的氣候因素數(shù)據(jù)是每年6月份~9月份每天的降水量和溫度。
3.1 實驗設置說明
本節(jié)將通過實驗評估所提出的ELSTM模型。實驗環(huán)境為:INTELCorei5 CPU,3.20 GHz;8 GB內存。每個對比實驗情況均運行10遍,取平均值。主要設置3個對比模型:
(1)ELSTM模型:本文提出的ELSTM模型,利用產量和生長條件信息進行預測。
(2)LSTM模型:標準的LSTM模型,只使用歷年產量信息進行預測。
(3)SVM模型:使用支持向量機(SVM)對歷年產量信息進行預測。
3.2 模擬比較實驗
本節(jié)使用ELSTM、LSTM和SVM 3種模型進行實驗。將過去2~6年的歷史產量和氣候條件作為模型輸入。
使用偏差率(Deviation rate)來計算預測值同真實值之間的偏差占真實值的百分比,偏差率值越小,模型的準確率越高。使用以下公式計算:
使用決定系數(shù)(R2)來判斷模型擬合的程度,擬合程度越高,R2越接近1。使用如下公式計算:
小麥誤差率實驗結果如表1所示。玉米誤差率實驗結果如表2所示。
從實驗結果中可以看出,在3個模型中,ELSTM模型預測結果最好。同時根據(jù)誤差率的分布,可以得出使用過去4年的產量預測下一年產量預測結果更準確。
將過去4年小麥的產量和氣候條件作為輸入進行計算,得到實驗結果如表3所示。
從實驗結果中可以看出,ELSTM模型的決定系數(shù)最大,擬合程度優(yōu)于其他模型。
通過以上實驗可以看出,ELSTM模型的預測結果準確率更高,擬合程度更好。針對此問題,ELSTM是一個很好的預測模型。
4 結論
預測農作物產量是農業(yè)生產中的一個重要問題。由于農作物生長受多方面因素影響,準確預測農作物產量非常重要。
本文針對農作物產量預測問題設計了一個基于LSTM的改進模型進行求解。在求解過程中,將農作物歷史產量數(shù)據(jù)與生長條件數(shù)據(jù)相結合,作為輸入對模型進行訓練,可對當年農作物產量進行精準預測。實驗表明,與其他預測方法相比,本模型有更理想的預測結果。
在未來的工作中,計劃將所提出的方法應用于其他具有相同特征的預測問題,以觀察該模型在不同問題上的預測精確度和通用性。
參考文獻
[1] GUERIF M,LAUNAY M,DUKE C.Remote sensing as a tool enabling the spatial use of crop models for crop diagnosis and yield prediction[C].IEEE International Geoscience and Remote Sensing Symposium,2000:1477-1479.
[2] Jin Chuan,Qin Qiming,Zhu Lin,et al.TVDI basedcrop yield prediction model for stressed surfaces[C].IEEE International Geoscience and Remote Sensing Symposium,2007:4656-4658.
[3] KERDILES H,REMBOLD F,LEO O,et al.CST,a freeware for predicting crop yield from remote sensing orcrop model indicators:illustration with RSA and Ethiopia[C].International Conference on Agro-Geoinformatic,2017:1-6.
[4] Zhuo Zhihong,Gao Chaochao,Liu Yonghong.Regional grain yield response to climate change in China: a statistic modeling approach[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(11):4472-4479.
[5] Wang Anhong,Zhang Xueying,Sun Zhiyi,et al.A nonlinear prediction speech coding ADPCM algorithm based on RNN[C].International Conference on Machine Learning and Cybernetics,2002:1353-1357.
[6] PASCANU R,MIKOLOV T,BENGIO Y.On the difficulty of training recurrent neural networks[J].Computer Science,2013,28(1):337-345.
[7] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[8] 涂小萌,陳強國.基于ARIMA-LSSVM混合模型的犯罪時間序列預測[J].電子技術應用,2015,41(2):160-162,166.
[9] 楊爍,孫欽斐,朱潔,等.基于大數(shù)據(jù)平臺的電采暖用電量預測分析[J].電子技術應用,2018,44(11):67-69.
[10] MISHRA S,PATRA S K.Short term load forecasting using a novel recurrent neural network[C].IEEE Region 10 Conference,2008:1-6.
[11] Guo Tao,Liu Rui,Yang Heng,et al.Predict atmosphere electric field value with the LSTM neural network[C].International Conference on Computer Systems,Electronics and Control,2017:263-266.
[12] Hu Haiqing,Zhang Dan,Qiu Ping.Application of trigonometric grey prediction approach to forecasting China grain yield[C].IEEE International Conference on Grey Systems and Intelligent Services,2009:538-542.
[13] HOSSAIN M A,UDDIN M N,HOSSAIN M A,et al.Predicting rice yield for Bangladesh by exploiting weather conditions[C].International Conference on Information and Communication Technology Convergence,2017:589-594.
[14] Huang Youxin,Liu Xiuguo,Shen Yonglin,et al.Assessment of agricultural drought indicators impact on soybean crop yield:a case study in Iowa,USA[C].The Third International Conference on Agro-Geoinformatics,2014:1-6.
[15] BENGIO Y,F(xiàn)RASCONI P,SIMARD P.The problem of learning long-term dependencies in recurrent networks[C].IEEE International Conference on Neural Networks.San Francisco,USA,1993(3):1183-1188.
作者信息:
劉 鵬1,鄭 勇2,楊紅軍3
(1.山東麥港數(shù)據(jù)系統(tǒng)有限公司,山東 濟南250100;
2.山東省農業(yè)信息中心,山東 濟南250100;3.濟南市農業(yè)信息中心,山東 濟南250002)