崔翔鵬,黃洪瓊
?。ㄉ虾:J麓髮W(xué) 信息工程學(xué)院,上海 201306)
摘要:為了提高船舶交通流預(yù)測(cè)的效率和準(zhǔn)確率,分析了船舶流量預(yù)測(cè)中的影響因素多、非線性、隨機(jī)性等問(wèn)題,建立了ELM(極限學(xué)習(xí)機(jī))預(yù)測(cè)模型。同時(shí)為了避免極限學(xué)習(xí)機(jī)算法受輸入權(quán)值矩陣和隱含層偏差隨機(jī)性的影響,算法又采用GA(遺傳算法)對(duì)極限學(xué)習(xí)機(jī)的輸入權(quán)值矩陣和隱含層偏差進(jìn)行優(yōu)化,建立GAELM船舶交通流預(yù)測(cè)模型。利用上海洋山港船舶流量對(duì)該模型進(jìn)行了實(shí)例分析,通過(guò)MATLAB仿真進(jìn)行預(yù)測(cè),將GAELM模型與單純的BP模型、ELM模型進(jìn)行對(duì)比和分析,結(jié)果表明:GA-ELM模型具有更高的預(yù)測(cè)精度和效率,從而能夠相對(duì)準(zhǔn)確、高效地對(duì)船舶交通流量進(jìn)行預(yù)測(cè)。
關(guān)鍵詞:船舶交通流量;遺傳算法;極限學(xué)習(xí)機(jī);預(yù)測(cè)
中圖分類號(hào):TP391.9文獻(xiàn)標(biāo)識(shí)碼:ADOI: 10.19358/j.issn.1674-7720.2017.09.005
引用格式:崔翔鵬,黃洪瓊.基于GA優(yōu)化ELM的船舶交通流預(yù)測(cè)模型[J].微型機(jī)與應(yīng)用,2017,36(9):15-17,21.
0引言
近年來(lái),隨著社會(huì)經(jīng)濟(jì)和對(duì)外貿(mào)易的迅速發(fā)展,各種水域的船舶流量不斷增加,導(dǎo)致了航行水域的船舶交通事故頻發(fā),不僅帶來(lái)了巨大的經(jīng)濟(jì)損失更是造成了人員傷亡。因此,提升航行水域船舶流量預(yù)測(cè)的準(zhǔn)確性和高效性尤為重要。同時(shí),預(yù)測(cè)的準(zhǔn)確性和高效性又為航道的規(guī)劃設(shè)計(jì)和船舶通航管理提供了有力的依據(jù)。目前國(guó)內(nèi)外研究船舶流量預(yù)測(cè)的方法有支持向量機(jī)預(yù)測(cè)[1]、回歸分析[2]、灰色分析[3]等方法,然而這些預(yù)測(cè)方法都很難滿足預(yù)測(cè)的高效性和準(zhǔn)確性。
針對(duì)現(xiàn)有預(yù)測(cè)方法存在的泛化能力不強(qiáng)、訓(xùn)練速度慢、預(yù)測(cè)準(zhǔn)確率不高等不足之處,本文采用了一種新的船舶交通流量預(yù)測(cè)模型,即GA-ELM預(yù)測(cè)模型,首次將遺傳算法(GA)對(duì)極限學(xué)習(xí)機(jī)(ELM)進(jìn)行優(yōu)化的方法用于船舶交通流量預(yù)測(cè)。遺傳算法具有良好的隨機(jī)搜索能力,它是根據(jù)生物界的進(jìn)化規(guī)律演化而來(lái);而極限學(xué)習(xí)機(jī)(ELM)算法具有獲得唯一最優(yōu)解以及學(xué)習(xí)速度快、泛化性能好等優(yōu)點(diǎn)。將兩者結(jié)合,利用GA優(yōu)化ELM的輸入層與隱含層間的連接權(quán)值及隱含層神經(jīng)元的閾值,實(shí)現(xiàn)了預(yù)測(cè)船舶交通流量的目的。
1極限學(xué)習(xí)機(jī)(ELM)
南洋理工大學(xué)副教授黃廣斌于2004年提出極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)算法,ELM是一種改進(jìn)的前饋神經(jīng)網(wǎng)絡(luò)(SLFN)學(xué)習(xí)算法,相比于傳統(tǒng)
的SLFN,ELM具有訓(xùn)練速度快、獲得全局唯一的最優(yōu)解且具有良好的泛化能力[4]。另外,在樣本數(shù)據(jù)不足的情況下,ELM的預(yù)測(cè)結(jié)果也較好,其結(jié)構(gòu)如圖1所示,由輸入層、隱含層和輸出層三部分組成。
通常設(shè)wij(i=1,…,l,j=1,…,n)為輸入層和隱含層之間的連接權(quán)值;bk(k=1,…,l)為隱含層神經(jīng)元的閾值;βjk(j=1,…,l,k=1,…,m)為隱含層和輸出層之間的連接權(quán)值;wij表示輸入層第i個(gè)神經(jīng)元和隱含層第j個(gè)神經(jīng)元的連接權(quán)值;βjk表示隱含層第j個(gè)神經(jīng)元與輸出層第k個(gè)神經(jīng)元的連接權(quán)值。設(shè)訓(xùn)練集輸入矩陣X和輸出矩陣Y分別為
X=[x1,x2,…,xn]T,Y=[y1,y2,…,ym]T(1)
設(shè)隱含層神經(jīng)元的激勵(lì)函數(shù)為Sigmoid,其表達(dá)式為:
式中,j=1,2,…,n;
wi=[wi1wi2…wim]。則式(4)可以表示為Hβ=T′,式中,T′為T(mén)的轉(zhuǎn)置矩陣。神經(jīng)網(wǎng)絡(luò)隱含層的矩陣H為:
當(dāng)隱含層的神經(jīng)元數(shù)目等于訓(xùn)練集樣本數(shù)目時(shí),設(shè)定w和b,單隱層前饋神經(jīng)網(wǎng)絡(luò)(Singlehidden Layer Feedforward Neural Network,SLFNN)能夠沒(méi)有誤差接近訓(xùn)練樣本[5],即:
式中,j=1,2,…,m。然而當(dāng)訓(xùn)練集X的樣本數(shù)較多時(shí),通常取隱含層神經(jīng)元的個(gè)數(shù)K<n,SLFN的訓(xùn)練誤差可以任意逼近[5]ε>0,即:
當(dāng)選定激勵(lì)函數(shù)g(x)可以無(wú)限可微時(shí),取w和b,β值可以通過(guò)式(8)求得最小二乘解,即:
minβHβ-T′(8)
解得:
β=H+T′(9)
其中,H+為隱含層輸出矩陣H的MoorePenrose逆。
2GA-ELM預(yù)測(cè)模型的建立
遺傳優(yōu)化算法是根據(jù)生物界的進(jìn)化規(guī)律演化而來(lái)的隨機(jī)化搜索方法,在內(nèi)在的隱并行性、實(shí)用性和全局尋優(yōu)能力等方面具有較大優(yōu)勢(shì)。
由于ELM模型隱含層輸入權(quán)值和偏差是隨機(jī)給定的,可能存在某些隨機(jī)設(shè)定值為0時(shí),導(dǎo)致部分隱含層節(jié)點(diǎn)失效。因此本文采用遺傳算法對(duì)輸入權(quán)值和偏差進(jìn)行優(yōu)化,其通過(guò)遺傳算法的選擇、交叉、變異操作得到最優(yōu)的初始權(quán)值和閾值,進(jìn)而得到最優(yōu)的ELM模型。圖2為GA-ELM模型的流程圖,訓(xùn)練步驟如下:
(1)設(shè)定適應(yīng)度函數(shù)、種群個(gè)數(shù)k及進(jìn)化次數(shù)p,本文選取測(cè)試集樣本數(shù)據(jù)均方差作為適應(yīng)度函數(shù)。適應(yīng)度函數(shù)值越小,模型越精確。
(2)規(guī)定種群。種群個(gè)數(shù)k一般設(shè)定為20~40個(gè)。個(gè)體的長(zhǎng)度是由隱含層輸入權(quán)值矩陣和偏差向量構(gòu)成,即D=L(n+1),其中L為隱含層節(jié)點(diǎn)數(shù)量,n為輸入層神經(jīng)元數(shù)量,即輸入向量的維度。
Qγ=[aγ11,aγ12,…,aγ1L,aγ21,aγ22,…,aγ2L,…aγL1,aγL2,…,aγLL,bγ1,bγ2,…,bγL],其中Qγ表示種群中第γ個(gè)個(gè)體,1≤γ≤k,aij、bj在區(qū)間[-1,1]隨機(jī)取值。
(3)局部求解最優(yōu)適應(yīng)度函數(shù)αbest。αbest初始值為
10,θ及γ的初始值為0,把訓(xùn)練數(shù)據(jù)歸一化后帶入模型,依次求出每個(gè)個(gè)體的適應(yīng)度函數(shù),直到γ=k時(shí)循環(huán)終止,解得αbest的值[6]。
(4)全局求解最優(yōu)適應(yīng)度函數(shù)αbest。每次解得最優(yōu)適應(yīng)度函數(shù)后,采用交叉、變異將種群進(jìn)行優(yōu)化,檢驗(yàn)進(jìn)化代數(shù)θ,當(dāng)θ小于等于p時(shí),將γ值初始為0,退回到步驟(3),直到θ大于p停止運(yùn)算,即得出的αbest為最優(yōu)適應(yīng)度函數(shù),根據(jù)所對(duì)應(yīng)的參數(shù)便可得到優(yōu)化的ELM模型。
3實(shí)驗(yàn)仿真及分析
3.1實(shí)驗(yàn)數(shù)據(jù)及設(shè)置
以上海洋山深水港經(jīng)過(guò)的船舶為研究對(duì)象,根據(jù)上海洋山港統(tǒng)計(jì)的數(shù)據(jù),選取2016年4月10日至2016年7月16日的船舶流量數(shù)據(jù)作為預(yù)測(cè)數(shù)據(jù)。前60天數(shù)據(jù)作為預(yù)測(cè)數(shù)據(jù),后37天數(shù)據(jù)作為測(cè)試數(shù)據(jù)。選取自然因素、船舶平均噸位、物流成本、業(yè)務(wù)指數(shù)、上海經(jīng)濟(jì)指數(shù)5個(gè)因素來(lái)建立預(yù)測(cè)模型。為降低預(yù)測(cè)誤差,對(duì)樣本數(shù)據(jù)按式(10)歸一化處理[7]。
仿真實(shí)驗(yàn)時(shí),利用MATLAB中的Sheffield工具箱實(shí)現(xiàn)GA,構(gòu)建最佳的GAELM船舶流量預(yù)測(cè)模型。設(shè)定GA的參數(shù)如下:種群大小為20,最大遺傳代數(shù)為100,交叉概率0.75,變異概率0.02,代溝0.95。
3.2實(shí)驗(yàn)仿真效果及分析
為了對(duì)實(shí)驗(yàn)的效果進(jìn)行比較,本文分別記錄BP、ELM和GAELM 3種算法的MAE、MAPE、RMSE和仿真時(shí)間。令pt為實(shí)際測(cè)量值,預(yù)測(cè)值為t,n為觀測(cè)序列總數(shù),預(yù)測(cè)指標(biāo)如下[8]:
將這3種模型進(jìn)行性能比較,其結(jié)果如表1所示。此外,對(duì)BP神經(jīng)網(wǎng)絡(luò)、ELM模型和GAELM模型分別進(jìn)行了仿真實(shí)驗(yàn)和對(duì)比,仿真結(jié)果如圖3~圖5所示。
從表1及圖3~圖5可見(jiàn),BP神經(jīng)網(wǎng)絡(luò)和ELM模型都得到了相應(yīng)的預(yù)測(cè)效果,但在預(yù)測(cè)的準(zhǔn)確性上不及GA_ELM模型。由于BP神經(jīng)網(wǎng)絡(luò)對(duì)樣本數(shù)存在較高的要求,會(huì)存在過(guò)擬合現(xiàn)象以及ELM中隨機(jī)賦值問(wèn)題,導(dǎo)致這兩種算法預(yù)測(cè)的準(zhǔn)確性受到了影響。GA具有更好的全局尋優(yōu)能力,采用GA優(yōu)化ELM模型的隨機(jī)賦值問(wèn)題,使其得到最優(yōu)解,得到的預(yù)測(cè)誤差變小。
由表1可見(jiàn),GA-ELM預(yù)測(cè)模型的平均絕對(duì)誤差、平均絕對(duì)百分誤差、均方根誤差和仿真時(shí)間都明顯小于BP模型和ELM模型。因此,GA-ELM模型比BP模型以及ELM模型在預(yù)測(cè)的準(zhǔn)確性和高效性等方面具有更好的優(yōu)勢(shì)。
4結(jié)論
本文首次將遺傳算法優(yōu)化的極限學(xué)習(xí)機(jī)模型應(yīng)用于船舶流量預(yù)測(cè)中,根據(jù)GA算法原理,對(duì)ELM預(yù)測(cè)模型的參數(shù)的選擇進(jìn)行優(yōu)化,避免隨機(jī)性對(duì)模型預(yù)測(cè)的準(zhǔn)確性的影響,提高了預(yù)測(cè)精度。
利用GA-ELM對(duì)船舶交通流量進(jìn)行預(yù)測(cè),將預(yù)測(cè)效果與BP模型和ELM模型進(jìn)行對(duì)比分析。結(jié)果表明,GA-ELM具有更好的泛化能力和良好的穩(wěn)定性,預(yù)測(cè)結(jié)果與實(shí)際船舶交通流量相吻合,可以準(zhǔn)確、高效地預(yù)測(cè)船舶交通流量,為船舶交通流量的預(yù)測(cè)提供了一種新方法。
參考文獻(xiàn)
[1] 馮宏祥,肖英杰,孔凡邨.基于支持向量機(jī)的船舶交通流量預(yù)測(cè)模型[J].中國(guó)航海,2011,34(4):62-66.
?。?] 王東, 熊錫龍. 基于影響因素分析的船舶交通流量預(yù)測(cè)多元線性回歸模型[J]. 船海工程, 2010, 39(3):178-180.
[3] 李俊, 徐志京, 唐貝貝. 基于GA優(yōu)化的灰色神經(jīng)網(wǎng)絡(luò)船舶交通流量預(yù)測(cè)方法研究[J]. 船海工程, 2013, 42(5):135-137.
?。?] HUANG G B, ZHU Q Y,SIEW C K. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006, 70(13):489-501.
?。?] HUANG G B, ZHU Q Y,SIEW C K. Extreme learning machine: a new learning scheme of feedforward neural networks[J]. Proceedings of International Joint Conference on Neural Networks, 2004, 2(2):985-990.
?。?] 王新民, 李天正, 張欽禮. 基于 GA-ELM 漿體管道輸送臨界流速預(yù)測(cè)模型研究[J]. 中國(guó)安全生產(chǎn)科學(xué)技術(shù), 2015(8):101-105.
[7] 鈕浩東, 黃洪瓊. 基于FOA優(yōu)化GRNN的船舶交通流預(yù)測(cè)模型[J]. 微型機(jī)與應(yīng)用, 2016, 35(12):81-83.
?。?] 郎茂祥. 預(yù)測(cè)理論與方法[M]. 北京:清華大學(xué)出版社, 2011.