《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > SVM與神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測中的應(yīng)用研究
SVM與神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測中的應(yīng)用研究
2015年微型機(jī)與應(yīng)用第5期
黃秋萍,周 霞,甘宇健,韋 宇
(廣西財經(jīng)學(xué)院 信息與統(tǒng)計學(xué)院,廣西 南寧 530003)
摘要: 介紹了SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測中的應(yīng)用研究。通過輸入歷史股票價格走勢數(shù)據(jù)進(jìn)行模型訓(xùn)練,并分別進(jìn)行三個模型預(yù)測輸出,最后通過均方誤差、走勢方向準(zhǔn)確率和總盈利率三個指標(biāo)分析比較三個模型,從而了解模型在股票預(yù)測領(lǐng)域的應(yīng)用效果,為后續(xù)研究做參考。
Abstract:
Key words :

  摘  要: 介紹了SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測中的應(yīng)用研究。通過輸入歷史股票價格走勢數(shù)據(jù)進(jìn)行模型訓(xùn)練,并分別進(jìn)行三個模型預(yù)測輸出,最后通過均方誤差、走勢方向準(zhǔn)確率和總盈利率三個指標(biāo)分析比較三個模型,從而了解模型在股票預(yù)測領(lǐng)域的應(yīng)用效果,為后續(xù)研究做參考。

  關(guān)鍵詞: 股票預(yù)測;SVM;神經(jīng)網(wǎng)絡(luò)

0 引言

  如何準(zhǔn)確地對股票進(jìn)行預(yù)測一直是一個熱門的證券研究話題。在國內(nèi),張秀艷、徐立本基于神經(jīng)網(wǎng)絡(luò)集成理論,建立股市預(yù)測模型,實驗分析表明,股市預(yù)測神經(jīng)網(wǎng)絡(luò)集成系統(tǒng)具有更好的穩(wěn)健性和更好的應(yīng)用價值[1]。近幾年來,SVM(Support Vector Machines)發(fā)展較快,國內(nèi)研究人員開展了許多有效的研究工作,取得了良好的效果[2-3]。在國外,神經(jīng)網(wǎng)絡(luò)、SVM等經(jīng)常出現(xiàn)在股票識別、走勢預(yù)測的論文中。除此之外,神經(jīng)網(wǎng)絡(luò)模型已在借貸評估、市場研究、金融預(yù)測等方面得到了應(yīng)用,并顯示出巨大的生命力。

  SVM對經(jīng)驗的依賴較小,能夠獲得全局最優(yōu)解,具有良好的泛化性能,從而有效地克服了神經(jīng)網(wǎng)絡(luò)等方法無法避免的局部極值問題。另外,SVM是專門針對有限樣本而設(shè)計的學(xué)習(xí)機(jī),它采用結(jié)構(gòu)風(fēng)險最小化原則對經(jīng)驗風(fēng)險和學(xué)習(xí)機(jī)的復(fù)雜度進(jìn)行控制,有效地避免過學(xué)習(xí)現(xiàn)象的產(chǎn)生,能獲得比傳統(tǒng)學(xué)習(xí)方法更優(yōu)良的泛化能力。在人工神經(jīng)網(wǎng)絡(luò)的實際應(yīng)用中,80%~90%的人工神經(jīng)網(wǎng)絡(luò)模型采用的是BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)或它的變化形式,它是前饋網(wǎng)絡(luò)的核心部分,體現(xiàn)了神經(jīng)網(wǎng)絡(luò)的精華,具有非線性映射能力、自學(xué)習(xí)和自適應(yīng)能力、泛化能力以及容錯能力。小波神經(jīng)網(wǎng)絡(luò)結(jié)合了神經(jīng)網(wǎng)絡(luò)和小波分析的優(yōu)點(diǎn),克服了二者各自應(yīng)用于預(yù)測系統(tǒng)的不足,具有神經(jīng)網(wǎng)絡(luò)的自適應(yīng)、自學(xué)習(xí)和容錯性的優(yōu)點(diǎn),同時可以充分利用小波的時頻局部化性質(zhì),學(xué)習(xí)過程只利用局部信息就可以大大提高小波神經(jīng)網(wǎng)絡(luò)的訓(xùn)練收斂速度。

  結(jié)合上述三個模型的優(yōu)點(diǎn),本文通過建立SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)模型預(yù)測上證指數(shù),通過分析這三個模型在相同訓(xùn)練數(shù)據(jù)長度下的預(yù)測結(jié)果,對比分析三個模型的優(yōu)缺點(diǎn),為后續(xù)相關(guān)研究做準(zhǔn)備。

1 SVM和神經(jīng)網(wǎng)絡(luò)模型簡介

  1.1 SVM模型

  支持向量機(jī)(SVM)以統(tǒng)計學(xué)習(xí)理論為理論基礎(chǔ),是結(jié)構(gòu)風(fēng)險最大化的近似實現(xiàn)。它的主要思想是通過建立一個分類超平面作為決策曲面,最大化正例和反例之間的隔離邊緣。與多層感知器網(wǎng)絡(luò)和徑向基函數(shù)網(wǎng)絡(luò)一樣,SVM可用于模式分類和非線性回歸。在處理非線性問題時,運(yùn)用一個核函數(shù)來代替高維空間中的內(nèi)積運(yùn)算,將非線性問題轉(zhuǎn)化為高維空間的線性運(yùn)算問題。其中K為核函數(shù),其種類主要有:

  1.jpg

  1.2 BP神經(jīng)網(wǎng)絡(luò)模型

  誤差反傳神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))是一種基于誤差反向傳播算法的多層前饋型神經(jīng)網(wǎng)絡(luò)。它由輸入層、中間層和輸出層組成,中間層也稱為隱含層,可以是一層也可以是多層。它的基本原理是梯度最速下降法,通過誤差反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,網(wǎng)絡(luò)的總誤差最小。

  與一般的人工神經(jīng)網(wǎng)絡(luò)一樣,構(gòu)成BP神經(jīng)網(wǎng)絡(luò)的神經(jīng)元仍然是神經(jīng)元。按照BP算法的要求,神經(jīng)元所用的激活函數(shù)必須是處處可導(dǎo),一般使用S型函數(shù)。對一個神經(jīng)元來說,它的網(wǎng)絡(luò)輸入可表示為:

  net=x1w1+x2w2+…+xnwn

  其中,x1,x2,…,xn為神經(jīng)元的輸入,w1,w2,…,wn分別是它們對應(yīng)的連接權(quán)值。該神經(jīng)元的輸出為:

  2.png

  1.3 小波神經(jīng)網(wǎng)絡(luò)模型

  小波神經(jīng)網(wǎng)絡(luò)是一種以BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為基礎(chǔ),以小波分析為理論,將小波基函數(shù)作為隱含層節(jié)點(diǎn)的傳遞函數(shù),信號前向傳播的同時誤差反向傳播的神經(jīng)網(wǎng)絡(luò)[4]。小波神經(jīng)網(wǎng)絡(luò)結(jié)合了小波分析和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),在一定程度上克服了二者各自應(yīng)用于預(yù)測系統(tǒng)的不足,因此,將小波神經(jīng)網(wǎng)絡(luò)應(yīng)用于股價預(yù)測具有重要的理論意義和實際的應(yīng)用價值。而小波分析是針對傅里葉變換的不足發(fā)展而來,它能夠通過小波基函數(shù)的變換分析信號的局部特征,并且在二維情況下具有信號方向選擇性能力,它的特點(diǎn)包括:

 ?。?)時域都具有緊支集或近似緊支集;

 ?。?)直流分量為0。

  小波函數(shù)是將一個母小波函數(shù)經(jīng)過平移與尺寸伸縮得到的,小波分析即把信號分解成一系列的小波函數(shù)的疊加。

  小波變換是指把某一基本小波函數(shù)?準(zhǔn)(t)平移τ后,再在不同尺度a下與待分析的信號x(t)做內(nèi)積:

  3.png

  式中,τ和a為參數(shù),τ相當(dāng)于使鏡頭相對于目標(biāo)平移,a相當(dāng)于使鏡頭向目標(biāo)推進(jìn)和遠(yuǎn)離。

2 模型建立

  參考目前論文中出現(xiàn)頻率最高的SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)股票預(yù)測模型,分別構(gòu)建了3個6輸入、1輸出的股票預(yù)測模型[5-7]。輸入分別為:某日上證指數(shù)的開盤指數(shù)(價)、指數(shù)(股價)最高值、指數(shù)(股價)最低值、收盤指數(shù)(價)、交易量和交易額;輸出為輸入次日的收盤指數(shù)(價)。

  在設(shè)計SVM模型時,選取不同的核函數(shù)對SVM模型性能的影響不大,但核函數(shù)的參數(shù)g和誤差懲罰因子c卻會嚴(yán)重影響SVM模型的泛化推廣性能,故針對核函數(shù)g和誤差懲罰因子c的參數(shù)選擇方法尤為重要。本文選擇交叉驗證的方式尋找最優(yōu)參數(shù),將樣本數(shù)據(jù)進(jìn)行分組,一部分作為訓(xùn)練集,另一部分作為驗證集,先用訓(xùn)練集對學(xué)習(xí)機(jī)器進(jìn)行訓(xùn)練,再利用驗證集檢測訓(xùn)練得到的模型[4]。

  在設(shè)計BP神經(jīng)網(wǎng)絡(luò)時,輸入層和輸出層的神經(jīng)元數(shù)目由實際情況而定,在設(shè)計時應(yīng)盡量減小系統(tǒng)的規(guī)模和復(fù)雜度,使模型運(yùn)行的時間減小。另外,由于BP神經(jīng)網(wǎng)絡(luò)是非線性的,初始權(quán)值的選取對于模型的學(xué)習(xí)效果是否能達(dá)到局部最小和能否收斂有密切的關(guān)系,因此初始權(quán)值選取的一個重要標(biāo)準(zhǔn)是使得初始權(quán)值在輸入累加時每個神經(jīng)元的狀態(tài)值能接近于零。

  小波神經(jīng)網(wǎng)絡(luò)權(quán)值參數(shù)修正算法類似于BP神經(jīng)網(wǎng)絡(luò)權(quán)值修正算法,采用梯度修正網(wǎng)絡(luò)的權(quán)值和小波基函數(shù)參數(shù),從而使小波神經(jīng)網(wǎng)絡(luò)預(yù)測輸出不斷逼近期望輸出。三個模型的算法流程如圖1所示。

001.jpg

  3 模型評價指標(biāo)

  為了對比分析三個模型的預(yù)測效果,本文選擇三個指標(biāo)評判模型的預(yù)測結(jié)果:均方誤差、走勢準(zhǔn)確率和總盈利率。

  均方誤差是衡量平均誤差的一種較為方便的方法,可以評價數(shù)據(jù)的變化。大多學(xué)者在評價神經(jīng)網(wǎng)絡(luò)模型時,常用的評價指標(biāo)是均方誤差。在數(shù)學(xué)理論中,均方誤差越小可以說明預(yù)測結(jié)果越好。其計算公式為:

  4.png

  其中,a為預(yù)測期望輸出值,b為預(yù)測輸出值,n為預(yù)測個數(shù)。

  走勢方向準(zhǔn)確率是指預(yù)測走勢方向和期望走勢方向相同的次數(shù)與總預(yù)測數(shù)之間的比值。走勢方向準(zhǔn)確率可以反映一個模型的預(yù)測勝算率,在一些投資場合,投資者可能只關(guān)心明天是漲是跌,而不關(guān)心具體漲多少或跌多少。走勢方向準(zhǔn)確率如果能超過70%,則說明預(yù)測10次,準(zhǔn)確7次,這樣的預(yù)測模型將有非常高的直接使用價值。

  總盈利率是投資者非常關(guān)心的指標(biāo),該指標(biāo)反映模型在一定交易日內(nèi)的盈利情況。股票預(yù)測模型能否指導(dǎo)投資產(chǎn)生穩(wěn)定客觀的正贏利,是評判預(yù)測模型效果的重要指標(biāo)之一。

  其計算公式為:

  5.png

4 模型預(yù)測結(jié)果分析

  本文選取上證指數(shù)2000年2月15日~2014年7月25日共3 500個交易日數(shù)據(jù)作為模型數(shù)據(jù)源,從中劃分訓(xùn)練和預(yù)測數(shù)據(jù),訓(xùn)練數(shù)據(jù)和預(yù)測數(shù)據(jù)相鄰。分別進(jìn)行訓(xùn)練1 000個數(shù)據(jù)預(yù)測500個數(shù)據(jù);訓(xùn)練3 000個數(shù)據(jù),預(yù)測500個數(shù)據(jù)的試驗,之后計算預(yù)測結(jié)果的均方誤差、走勢方向準(zhǔn)確率、500個交易日的總盈利率,結(jié)果見表1和表2。

002.jpg

  由以上二表可知,三個模型的均方誤差較低,與前人研究的結(jié)果相近[5-7]。三個模型預(yù)測的走勢方向準(zhǔn)確率不高,準(zhǔn)確率徘徊在50%附近。總盈利率的表現(xiàn)也較差,且不穩(wěn)定,這說明若直接使用三個模型的預(yù)測結(jié)果進(jìn)行股票投資無法取得穩(wěn)定良好的收益。此外,從預(yù)測結(jié)果還能發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)的運(yùn)行結(jié)果波動性大,隨機(jī)性較強(qiáng),而SVM的結(jié)果較為穩(wěn)定。

5 結(jié)論

  本文通過建立SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)三種模型分別對上證指數(shù)進(jìn)行訓(xùn)練及預(yù)測,通過均方誤差、走勢方向準(zhǔn)確率和總盈利率三個指標(biāo)分析比較三個模型,發(fā)現(xiàn)直接使用三個模型的預(yù)測結(jié)果進(jìn)行股票投資無法取得穩(wěn)定良好的收益。在今后的工作中,會繼續(xù)深入研究股票預(yù)測問題,尋找一個基于神經(jīng)網(wǎng)絡(luò)等人工智能方法的可穩(wěn)定盈利的股票預(yù)測模型。

參考文獻(xiàn)

  [1] 張秀艷,徐本立.基于神經(jīng)網(wǎng)絡(luò)集成系統(tǒng)的股市預(yù)測模型[J].系統(tǒng)工程理論與實踐,2003,23(9):67-70.

  [2] 喻勝華,肖雨峰.基于信息?;椭С窒蛄繖C(jī)的股票價格預(yù)測[J].財經(jīng)理論與實踐,20011,32(6):44-47.

  [3] 程硯秋.基于支持向量機(jī)的證券價格預(yù)測方法研究[D].大連:大連理工大學(xué),2007.

  [4] MATLAB中文論壇.MATLAB神經(jīng)網(wǎng)絡(luò)30個案例分析[M].北京:北京航空航天大學(xué)出版社,2010.

  [5] 馮居易.BP神經(jīng)網(wǎng)絡(luò)股票價格預(yù)測模型研究[D].西安:西安建筑科技大學(xué),2008.

  [6] 張立霞,馬芳芳,葉德謙.基于支持向量機(jī)方法的金融時間序列研究[J].遼寧工業(yè)大學(xué)學(xué)報,2008,28(1):28-30.

  [7] 張海珍.小波神經(jīng)網(wǎng)絡(luò)在股價預(yù)測中的應(yīng)用[D].西安:西安科技大學(xué),2008.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。