《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > 基于改進遺傳算法的支持向量機預(yù)測模型研究
基于改進遺傳算法的支持向量機預(yù)測模型研究
來源:微型機與應(yīng)用2013年第24期
陳錦青,韓延杰
(福州大學(xué) 管理學(xué)院 信息管理與信息系統(tǒng)專業(yè),福建 福州350108)
摘要: 作為一種新的機器學(xué)習(xí)方法,支持向量機的參數(shù)選擇沒有一個統(tǒng)一的模式和標(biāo)準(zhǔn)。為了克服這一缺點,對遺傳算法進行改進,構(gòu)造一種混沌云自適應(yīng)模擬退火遺傳算法(CCASAGA)對支持向量機回歸參數(shù)進行優(yōu)化。該算法將混沌優(yōu)化、基于云模型的自適應(yīng)控制機制和模擬退火的Metropolis準(zhǔn)則結(jié)合起來,并采取精英保持策略加快算法的收斂速度。利用改進后的CCASAGA-SVR預(yù)測模型對某股份制銀行ATM機現(xiàn)金需求進行預(yù)測,并引入GA-SVR模型和BP神經(jīng)網(wǎng)絡(luò)模型進行對比,從而證實該預(yù)測模型具有更高的預(yù)測精度。
Abstract:
Key words :

摘  要: 作為一種新的機器學(xué)習(xí)方法,支持向量機的參數(shù)選擇沒有一個統(tǒng)一的模式和標(biāo)準(zhǔn)。為了克服這一缺點,對遺傳算法進行改進,構(gòu)造一種混沌云自適應(yīng)模擬退火遺傳算法(CCASAGA)對支持向量機回歸參數(shù)進行優(yōu)化。該算法將混沌優(yōu)化、基于云模型的自適應(yīng)控制機制和模擬退火的Metropolis準(zhǔn)則結(jié)合起來,并采取精英保持策略加快算法的收斂速度。利用改進后的CCASAGA-SVR預(yù)測模型對某股份制銀行ATM機現(xiàn)金需求進行預(yù)測,并引入GA-SVR模型和BP神經(jīng)網(wǎng)絡(luò)模型進行對比,從而證實該預(yù)測模型具有更高的預(yù)測精度。
關(guān)鍵詞: 遺傳算法;支持向量機;BP神經(jīng)網(wǎng)絡(luò);預(yù)測

    支持向量機SVM(Support Vector Machine)最初于20世紀(jì)90年代由Vapnik等人首先提出,是一種基于統(tǒng)計學(xué)習(xí)理論的新型的通用學(xué)習(xí)方法[1]。支持向量機模型可以用于分類和預(yù)測。在應(yīng)用支持向量機模型進行預(yù)測時,對預(yù)測精度產(chǎn)生重要影響的參數(shù)是:懲罰因子C、不敏感損失函數(shù)參數(shù)ε和核函數(shù)及其參數(shù)。因此,本文的預(yù)測模型需要利用遺傳算法對這3個參數(shù)進行優(yōu)化以提高SVR預(yù)測模型的預(yù)測精度。標(biāo)準(zhǔn)遺傳算法SGA(Standard Genetic Algorithm)存在早熟收斂和易陷入局部最優(yōu)解的缺陷,主要表現(xiàn)在種群中所有個體狀態(tài)趨于一致而停止進化,算法不能找到令人滿意的解。針對上述缺點,各國學(xué)者對遺傳算法的編碼方式、適應(yīng)度函數(shù)的設(shè)計、遺傳算子機理等進行深入研究,提出了眾多的改進方法,包括免疫遺傳算法[2]、基于多樣化成長策略的遺傳算法[3]和模糊自適應(yīng)遺傳算法[4]等。
    本文在前人研究成果的基礎(chǔ)上,提出一種混沌云自適應(yīng)模擬退火遺傳算法CCASAGA(Chaos Cloud-based Adaptive Simulated Annealing Genetic Algorithm),使用混沌映射優(yōu)化遺傳算法的初始種群,采用云模型實現(xiàn)交叉概率和變異概率的自適應(yīng)調(diào)整,引入模擬退火避免算法陷入局部最優(yōu),并采取精英保持策略,防止進化過程中產(chǎn)生的優(yōu)秀個體模式遭到破壞,提高了算法的收斂速度。運用CCASAGA對SVR的參數(shù)進行優(yōu)化,尋找到更好的參數(shù)值,從而提高模型的預(yù)測精度。
1 遺傳算法的改進
1.1 利用混沌映射優(yōu)化遺傳算法初始種群

    傳統(tǒng)遺傳算法的初始種群由隨機的方法產(chǎn)生,因此每次尋優(yōu)效果可能不盡相同,且容易導(dǎo)致算法陷入局部最優(yōu)。本文采用混沌映射優(yōu)化遺傳算法的初始種群,利用混沌變量具有的遍歷性、隨機性和內(nèi)在規(guī)律性,在一定范圍內(nèi)不重復(fù)地遍歷所有狀態(tài),從而保證種群分布均勻,具有多樣性。
  

3 實驗結(jié)果
3.1 實驗數(shù)據(jù)

    本文數(shù)據(jù)來源于某股份制銀行某市分行ATM交易后臺數(shù)據(jù)庫中的取款數(shù)據(jù)。這里選取某臺ATM機2010年12月6日~2012年9月13日的日取款量數(shù)據(jù)作為研究樣本,樣本量的大小為648,以前643天數(shù)據(jù)為訓(xùn)練集,后5天數(shù)據(jù)為測試集。模型訓(xùn)練完后對后5天的ATM現(xiàn)金需求量進行多步預(yù)測,并在測試集上檢驗?zāi)P偷念A(yù)測效果。
3.2 實驗的實現(xiàn)和結(jié)果
    整個模型算法通過MATLAB軟件編程實現(xiàn),其中支持向量機的實現(xiàn)用到了臺灣大學(xué)林智仁教授團隊所編寫的Libsvm-3.1工具箱,對遺傳算法的改進用到了英國謝菲爾德大學(xué)開發(fā)的GATBX遺傳算法工具箱。整個模型的參數(shù)設(shè)置如表1所示。

    應(yīng)用前面提出的預(yù)測模型對ATM機的現(xiàn)金需求進行預(yù)測。首先運用改進后的遺傳算法對SVR參數(shù)進行優(yōu)化,尋優(yōu)過程如圖2所示。最終得到最佳的C=0.270 589,γ=9.264 51,ε=0.081 102 7。將最佳參數(shù)代入SVR模型進行訓(xùn)練,得到最優(yōu)的SVR預(yù)測模型,用最優(yōu)模型預(yù)測后5天的現(xiàn)金需求量,并與測試集數(shù)據(jù)進行對比,得到最終的預(yù)測結(jié)果,如圖3所示。

 

 

    將本文提出的CCASAGA-SVR模型與傳統(tǒng)GA-SVR模型及BP神經(jīng)網(wǎng)絡(luò)模型[5]預(yù)測結(jié)果進行對比,如表2所示。

      由表2可知,本文提出的CCASAGA-SVR模型預(yù)測精度最高,而神經(jīng)網(wǎng)絡(luò)模型相對來說預(yù)測精度最低。本文對遺傳算法改進后,使用CCASAGA-SVR的預(yù)測誤差比GA-SVR的預(yù)測誤差降低了約1.03個百分點。然而,本身GA-SVR模型的預(yù)測平均精度也在90%以上,這一方面說明采用標(biāo)準(zhǔn)遺傳算法對支持向量回歸機進行優(yōu)化也可以得到預(yù)測精度較高的預(yù)測模型,另外也說明本文對遺傳算法的改進是有效的,能夠在原來較好的預(yù)測效果上進一步提高預(yù)測精度。另外,BP神經(jīng)網(wǎng)絡(luò)模型的總體預(yù)測精度較差,而且預(yù)測誤差波動范圍較大,這可能是由于其在訓(xùn)練過程中產(chǎn)生了過擬合的現(xiàn)象,因此其泛化能力不如支持向量回歸機。
參考文獻
[1] 曹建芳,王鴻斌.一種新的基于SVM-KNN的Web文本分類算法[J].計算機與數(shù)字工程,2010,38(4):59-61.
[2] 王潔,高家全,方志民,等.一種新的免疫遺傳算法及應(yīng)用[J].計算機應(yīng)用與軟件,2010,27(12):89-91.
[3] 袁煜明,范文慧,楊雨田,等.一種基于多樣化成長策略的遺傳算法[J].控制與決策,2009,24(12):1801-1804.
[4] Guo Yiqiang,Wu Yanbin,Ju Zhengshan,et al.Remote  sensing image classification by the chaos genetic algorithm  in monitoring land use changes[J].Mathematical and Computer Modelling,2010,51(11):1408-1416.
[5] 李仿華,王愛平,姚麗娜,等.基于遺傳優(yōu)化的RBF-BP 網(wǎng)絡(luò)的實時故障檢測[J].微型機與應(yīng)用,2012,31(8):90-93.
[6] 戴朝華,朱云芳,陳維榮.云自適應(yīng)遺傳算法[J].控制理論與應(yīng)用,2007,24(4):646-650.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。