文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.182981
中文引用格式: 張曉明,曹國清,陳增強(qiáng),等. 基于AdaBoost-PSO-ELM算法的滑坡位移預(yù)測研究[J].電子技術(shù)應(yīng)用,2019,45(2):84-87,92.
英文引用格式: Zhang Xiaoming,Cao Guoqing,Chen Zengqiang,et al. Landslide displacement prediction based on AdaBoost-PSO-ELM algorithm[J]. Application of Electronic Technique,2019,45(2):84-87,92.
0 引言
礦山排土場滑坡是一種非常普遍發(fā)生的地質(zhì)災(zāi)害,由于滑坡的頻繁發(fā)生,每年都會造成大量的人員傷亡和巨額的財(cái)產(chǎn)損失。很多排土場都存在著滑坡風(fēng)險(xiǎn),排土場的堆放位置以及堆放方式和管理方式的不合適可能會造成滑坡事故的發(fā)生。隨著傳感器技術(shù)的發(fā)展,各種類型的傳感器相繼被應(yīng)用到了礦山排土場的安全監(jiān)測當(dāng)中,傳感器能長時(shí)間保持不間斷地采集排土場的相關(guān)指標(biāo),這些相關(guān)指標(biāo)對排土場的安全指標(biāo)具有重大意義,在一定程度上體現(xiàn)著排土場的穩(wěn)定狀態(tài)。傳感器傳輸?shù)膶?shí)時(shí)數(shù)據(jù)代表排土場的某一時(shí)刻相關(guān)特征指標(biāo)的值,但是當(dāng)技術(shù)人員接收到異常數(shù)據(jù)時(shí),排土場滑坡或許已經(jīng)發(fā)生了,若能夠提前預(yù)測出傳感器下一時(shí)刻的信息,可以有效降低排土場滑坡造成的財(cái)產(chǎn)損失和人員傷亡,到目前為止,礦山排土場滑坡災(zāi)害預(yù)警仍然是一個(gè)處于探索階段的世界性難題[1]。
目前關(guān)于滑坡預(yù)測方法主要是分析滑坡位移隨時(shí)間變化的曲線及各類直接或間接影響滑坡產(chǎn)生的環(huán)境影響因子的監(jiān)測信息[2],來反演滑坡內(nèi)在的非線性動力學(xué)變化過程,進(jìn)而建立起滑坡位移同各個(gè)環(huán)境影響因子之間的非線性映射關(guān)系,最終達(dá)到預(yù)測滑坡位移的變化趨勢的效果。傳統(tǒng)的滑坡預(yù)測模型主要以時(shí)間序列分析方法和各類統(tǒng)計(jì)方法預(yù)測為主[3],這些方法在智能性、精確性和及時(shí)性方面都存在著較大的缺陷。為了有效提高對滑坡的預(yù)測能力,本文提出了一種AdaBoost的粒子群優(yōu)化極限學(xué)習(xí)機(jī)的集成學(xué)習(xí)方法實(shí)現(xiàn)滑坡位移預(yù)測(AdaBoost-PSO-ELM),與以往方法相比,其具有以下優(yōu)點(diǎn):(1)利用粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)來優(yōu)化極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)的輸出權(quán)重和隱層偏置,解決了人工參數(shù)整定困難的問題[4],提高了預(yù)測效率;(2)采用多神經(jīng)網(wǎng)絡(luò)集成學(xué)習(xí)算法,提高網(wǎng)絡(luò)預(yù)測泛化能力;(3)引入AdaBoost算法極大降低了ELM陷入局部最優(yōu)的風(fēng)險(xiǎn),進(jìn)一步提高了預(yù)測精度。
1 算法分析與設(shè)計(jì)
1.1 極限學(xué)習(xí)機(jī)模型
極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是HUANG G B等在2006年提出的一種單隱含層前饋神經(jīng)網(wǎng)絡(luò)(Single Hidden Layer Feedforward Neural Networks,SLFNN)的算法,該算法隨機(jī)產(chǎn)生輸入層與隱含層的連接權(quán)值及隱含層神經(jīng)元的偏置[5],構(gòu)建無需任何迭代的單隱層神經(jīng)網(wǎng)絡(luò),與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,通過一步計(jì)算即可解析出網(wǎng)絡(luò)的輸出權(quán)值,大大提高了網(wǎng)絡(luò)的泛化能力和學(xué)習(xí)速度,具有較強(qiáng)的非線性擬合能力。ELM的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
1.2 粒子群優(yōu)化算法
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)的基本思想源于鳥群的覓食行為,每個(gè)粒子在初始階段都會被初始化為一定的速度、位置和一個(gè)由適應(yīng)度函數(shù)決定的適應(yīng)值,同時(shí)每個(gè)粒子都被賦予記憶功能。在每一次迭代尋優(yōu)的過程中,粒子通過比較適應(yīng)度值和兩個(gè)邊界值來更新自己的速度和位置,通過不斷的更新速度和位置,粒子本身最終能找到個(gè)體最優(yōu)解和整個(gè)種群全局最優(yōu)解[6]。
利用動態(tài)慣性權(quán)重ω的方法提高粒子群的尋優(yōu)能力進(jìn)而加快極限學(xué)習(xí)機(jī)(ELM)的預(yù)測效率和提高預(yù)測精度,較高的慣性權(quán)重ω會使粒子群算法有更好的全局的尋優(yōu)能力,而較低的慣性權(quán)重ω則對于局部尋優(yōu)效果更好[7],粒子速度和位置更新表述如下:
本文中以實(shí)際值與預(yù)測值的均方誤差(MSE)作為粒子尋優(yōu)的適應(yīng)度函數(shù)[8]:
利用PSO尋找ELM中最優(yōu)的隱含層節(jié)點(diǎn)數(shù)、輸入權(quán)值和隱含層偏置,使獲得的模型更能準(zhǔn)確預(yù)測滑坡的地表位移。
1.3 AdaBoost的粒子群優(yōu)化極限學(xué)習(xí)機(jī)算法(AdaBoost-PSO-ELM)設(shè)計(jì)
AdaBoost算法是Boosting思想的機(jī)器學(xué)習(xí)算法,其核心思想先從初始訓(xùn)練集訓(xùn)練出一個(gè)基學(xué)習(xí)器,根據(jù)基學(xué)習(xí)器的表現(xiàn)對訓(xùn)練樣本進(jìn)行調(diào)整,使得先前基學(xué)習(xí)器做錯(cuò)的訓(xùn)練樣本在后續(xù)受到更多的關(guān)注,然后基于調(diào)整后的樣本分布來訓(xùn)練下一個(gè)基學(xué)習(xí)器,重復(fù)進(jìn)行,直至基學(xué)習(xí)器數(shù)目達(dá)到指定的值[9]。
本文提出的AdaBoost-PSO-ELM算法基本思想是:初始化一個(gè)ELM基學(xué)習(xí)器,反復(fù)訓(xùn)練得到多個(gè)ELM的弱預(yù)測器,使用AdaBoost算法將得到的多個(gè)ELM弱預(yù)測器組成一個(gè)強(qiáng)預(yù)測器,進(jìn)一步提高ELM網(wǎng)絡(luò)的預(yù)測準(zhǔn)確率,降低ELM網(wǎng)絡(luò)陷入局部最優(yōu)的風(fēng)險(xiǎn)[10],提高ELM的泛化能力。AdaBoost-PSO-ELM算法流程如圖2所示。其詳細(xì)步驟如下:
(1)給定輸入樣本。對ELM網(wǎng)絡(luò)、PSO相關(guān)參數(shù)進(jìn)行初始化,從輸入樣本數(shù)據(jù)中選取訓(xùn)練集中的m組數(shù)據(jù),初始化測試數(shù)據(jù)分布權(quán)值D1=(1/g,…,1/g)1×m,根據(jù)輸入輸出樣本的特性指標(biāo)維度確定ELM網(wǎng)絡(luò)結(jié)構(gòu)。
(2)輸入樣本數(shù)據(jù)預(yù)處理。其中包括異常值處理、空缺值填補(bǔ)、無量綱化等,對異常值作為缺失值處理,通過拉格朗日插值法對所有空缺值進(jìn)行插值填補(bǔ);排土場數(shù)據(jù)集中每個(gè)特性指標(biāo)間的單位存在量綱差異,為消除不同量綱間對預(yù)測精度的影響,對排土場數(shù)據(jù)進(jìn)行無量綱化處理[11];
(3)通過PSO優(yōu)化ELM的輸入?yún)?shù),同時(shí)得到多個(gè)ELM弱預(yù)測器,在訓(xùn)練第n個(gè)ELM弱預(yù)測器時(shí),使用ELM對訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練,得到預(yù)測序列的預(yù)測誤差和errorn,誤差和errorn的公式如式(10)所示:
2 試驗(yàn)研究與結(jié)果分析
為驗(yàn)證本文提出的AdaBoost的粒子群優(yōu)化極限學(xué)習(xí)機(jī)算法的有效性和準(zhǔn)確性,采用中國貴州某礦山排土場在2016年12月~2017年11月間從傳感器中采集到的該礦山排土場的各特性指標(biāo)數(shù)據(jù),各指標(biāo)數(shù)據(jù)每隔半小時(shí)到一小時(shí)更新一次,總共含有14 423條數(shù)據(jù),其中被選取的特性指標(biāo)有地表位移(Mp)、土壓力(Dm)、土壤含水率(Smc)、降雨量(Rg)、孔隙水壓力(St)、濕度(Hum)、溫度(Tpr)、內(nèi)部位移(Ep)共8個(gè)指標(biāo)。
8個(gè)指標(biāo)中,地表位移是最直觀、最能反映排土場邊坡變化趨勢的觀測性指標(biāo);邊坡內(nèi)部位移最能反映滑坡體多層變形和滑帶的位置,是滑坡監(jiān)測的一個(gè)非常重要的監(jiān)測對象;同時(shí)降雨量、土壤含水率、土壓力、孔隙水壓力、濕度和溫度也會直接或間接地影響到前面指標(biāo)的變化。本文將地表位移作為判斷排土場滑坡的直接因素,其余特性指標(biāo)作為間接判斷排土場滑坡的綜合因素。本文主要進(jìn)行了3個(gè)模型的驗(yàn)證分析,將數(shù)據(jù)集的前70%作為訓(xùn)練數(shù)據(jù),后30%作為驗(yàn)證數(shù)據(jù),以均方根誤差(RMSE)作為性能評價(jià)指標(biāo)。
本文做了3組對比試驗(yàn),分別為ELM、PSO-ELM、AdaBoost-PSO-ELM模型對地表位移的預(yù)測,其他7個(gè)特性指標(biāo)作為目標(biāo)的輸入。首先,采用ELM進(jìn)行地表位移的預(yù)測,圖3所示的是ELM對地表位移的預(yù)測效果曲線圖,該模型隨機(jī)初始化一組輸入權(quán)值和隱含層偏置,采用sigmoid函數(shù)作為激活函數(shù),神經(jīng)元的個(gè)數(shù)為100,從圖中可以看出,預(yù)測效果不是很好,RMSE的值為2.89。
為避免ELM輸入?yún)?shù)隨機(jī)化,利用PSO得到ELM的輸入權(quán)值和隱含層偏置,種群為100的粒子群,其預(yù)測效果如圖4所示,預(yù)測效果比ELM網(wǎng)絡(luò)有了一定的提高,同時(shí)也基本擬合了真實(shí)曲線的趨勢,其RMSE的值為2.62,但是在精度方面還有上升的空間。圖5表示的是PSO在尋優(yōu)過程中的迭代次數(shù)和均方誤差的關(guān)系,從圖中可以看出在迭代的初期,粒子群的收斂速度很快,變化率很大,隨著迭代次數(shù)的增加,粒子群的收斂速度趨于平緩,PSO在尋優(yōu)過程中迭代到100次左右已開始收斂。
PSO尋優(yōu)過程無法完全避免種群陷入局部最優(yōu)風(fēng)險(xiǎn),本文提出在PSO優(yōu)化ELM的基礎(chǔ)上,采用AdaBoost算法進(jìn)一步提升ELM預(yù)測的準(zhǔn)確性,構(gòu)造10個(gè)由ELM組成的弱預(yù)測器,利用AdaBoost算法將10個(gè)ELM弱預(yù)測器構(gòu)成一個(gè)強(qiáng)預(yù)測器。實(shí)驗(yàn)結(jié)果表明,該方法可以大幅度提升ELM預(yù)測精度,如圖6所示,從圖中可以發(fā)現(xiàn)經(jīng)AdaBoost的粒子群優(yōu)化的預(yù)測值與真實(shí)值的曲線趨勢基本處于同步,真實(shí)值與預(yù)測值曲線的間隔比起前兩種模型處理的效果有明顯的提高,預(yù)測結(jié)果能很好地?cái)M合真實(shí)值,其RMSE的值為1.17。3組對比實(shí)驗(yàn)的RMSE如表1所示。
3 結(jié)論
礦山排土場滑坡的過程是一個(gè)動態(tài)、大延遲、高度非線性的特性問題,影響礦山排土場滑坡的因素眾多,同時(shí)PSO無法避免陷入局部最優(yōu)風(fēng)險(xiǎn)。對此,本文提出AdaBoost-PSO-ELM算法構(gòu)成的強(qiáng)預(yù)測器方法,利用PSO算法確定了ELM的輸入權(quán)值,提高了ELM的學(xué)習(xí)效率,解決了人工參數(shù)整定難的問題。本文的具體思路是將ELM作為基學(xué)習(xí)器,經(jīng)過反復(fù)訓(xùn)練ELM的預(yù)測輸出,得到由多個(gè)ELM的弱預(yù)測器組成的強(qiáng)預(yù)測器。實(shí)驗(yàn)結(jié)果表明,該方法具有較高的預(yù)測精度,有效地提高了礦山排土場滑坡位移預(yù)測精度。
參考文獻(xiàn)
[1] 秦宏楠.紫金山金銅礦排土場滑坡誘發(fā)機(jī)理及監(jiān)測預(yù)警技術(shù)研究[D].北京:北京科技大學(xué),2016.
[2] 張艷博,張國鋒,田寶柱,等.露天煤礦邊坡穩(wěn)態(tài)影響因子敏感性分析及滑坡控制對策[J].煤炭工程,2011,1(5):105-107.
[3] 徐峰,汪洋,杜娟,等.基于時(shí)間序列分析的滑坡位移預(yù)測模型研究[J].巖石力學(xué)與工程學(xué)報(bào),2011,30(4):746-751.
[4] 楊向萍,吳玉丹.基于PSO-BP神經(jīng)網(wǎng)絡(luò)的人體穴位定位系統(tǒng)設(shè)計(jì)[J].電子技術(shù)應(yīng)用,2018,44(9):75-78.
[5] HUANG G B,WANG D H,LAN Y.Extreme learning machines:a survey[J].International Journal of Machine Learning & Cybernetics,2011,2(2):107-122.
[6] 楊錫運(yùn),關(guān)文淵,劉玉奇,等.基于粒子群優(yōu)化的核極限學(xué)習(xí)機(jī)模型的風(fēng)電功率區(qū)間預(yù)測方法[J].中國電機(jī)工程學(xué)報(bào),2015,35(S1):146-153.
[7] 李艷,楊華芬.一種改進(jìn)的動態(tài)慣性權(quán)重粒子群優(yōu)化算法[J].長春工程學(xué)院學(xué)報(bào)(自然科學(xué)版),2014(4):116-119.
[8] ABREU L D,ROMERO J L.MSE estimates for multitaper spectral estimation and off-grid compressive sensing[J].IEEE Transactions on Information Theory,2017,PP(99):1.
[9] GUO H,LI Y,LI Y,et al.BPSO-Adaboost-KNN ensemble learning algorithm for multi-class imbalanced data classification[J].Engineering Applications of Artificial Intelligence,2016,49(C):176-193.
[10] 趙英剛,龔壘.基于行為識別和SVM的短信過濾方法研究[J].微計(jì)算機(jī)信息,2012(1):176-177.
[11] 曹國清,張曉明,陳亞峰.基于PCA-LSTM的多變量礦山排土場滑坡預(yù)警研究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2018,27(11):252-258.
作者信息:
張曉明1,曹國清1,2,陳增強(qiáng)1,何佳康1,2
(1.北京石油化工學(xué)院 信息工程學(xué)院,北京102617;2.北京化工大學(xué) 信息科學(xué)與技術(shù)學(xué)院,北京100029)