《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > SVM與神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測(cè)中的應(yīng)用研究
SVM與神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測(cè)中的應(yīng)用研究
2015年微型機(jī)與應(yīng)用第5期
黃秋萍,周 霞,甘宇健,韋 宇
(廣西財(cái)經(jīng)學(xué)院 信息與統(tǒng)計(jì)學(xué)院,廣西 南寧 530003)
摘要: 介紹了SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測(cè)中的應(yīng)用研究。通過輸入歷史股票價(jià)格走勢(shì)數(shù)據(jù)進(jìn)行模型訓(xùn)練,并分別進(jìn)行三個(gè)模型預(yù)測(cè)輸出,最后通過均方誤差、走勢(shì)方向準(zhǔn)確率和總盈利率三個(gè)指標(biāo)分析比較三個(gè)模型,從而了解模型在股票預(yù)測(cè)領(lǐng)域的應(yīng)用效果,為后續(xù)研究做參考。
Abstract:
Key words :

  摘  要: 介紹了SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測(cè)中的應(yīng)用研究。通過輸入歷史股票價(jià)格走勢(shì)數(shù)據(jù)進(jìn)行模型訓(xùn)練,并分別進(jìn)行三個(gè)模型預(yù)測(cè)輸出,最后通過均方誤差、走勢(shì)方向準(zhǔn)確率和總盈利率三個(gè)指標(biāo)分析比較三個(gè)模型,從而了解模型在股票預(yù)測(cè)領(lǐng)域的應(yīng)用效果,為后續(xù)研究做參考。

  關(guān)鍵詞: 股票預(yù)測(cè);SVM;神經(jīng)網(wǎng)絡(luò)

0 引言

  如何準(zhǔn)確地對(duì)股票進(jìn)行預(yù)測(cè)一直是一個(gè)熱門的證券研究話題。在國(guó)內(nèi),張秀艷、徐立本基于神經(jīng)網(wǎng)絡(luò)集成理論,建立股市預(yù)測(cè)模型,實(shí)驗(yàn)分析表明,股市預(yù)測(cè)神經(jīng)網(wǎng)絡(luò)集成系統(tǒng)具有更好的穩(wěn)健性和更好的應(yīng)用價(jià)值[1]。近幾年來(lái),SVM(Support Vector Machines)發(fā)展較快,國(guó)內(nèi)研究人員開展了許多有效的研究工作,取得了良好的效果[2-3]。在國(guó)外,神經(jīng)網(wǎng)絡(luò)、SVM等經(jīng)常出現(xiàn)在股票識(shí)別、走勢(shì)預(yù)測(cè)的論文中。除此之外,神經(jīng)網(wǎng)絡(luò)模型已在借貸評(píng)估、市場(chǎng)研究、金融預(yù)測(cè)等方面得到了應(yīng)用,并顯示出巨大的生命力。

  SVM對(duì)經(jīng)驗(yàn)的依賴較小,能夠獲得全局最優(yōu)解,具有良好的泛化性能,從而有效地克服了神經(jīng)網(wǎng)絡(luò)等方法無(wú)法避免的局部極值問題。另外,SVM是專門針對(duì)有限樣本而設(shè)計(jì)的學(xué)習(xí)機(jī),它采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則對(duì)經(jīng)驗(yàn)風(fēng)險(xiǎn)和學(xué)習(xí)機(jī)的復(fù)雜度進(jìn)行控制,有效地避免過學(xué)習(xí)現(xiàn)象的產(chǎn)生,能獲得比傳統(tǒng)學(xué)習(xí)方法更優(yōu)良的泛化能力。在人工神經(jīng)網(wǎng)絡(luò)的實(shí)際應(yīng)用中,80%~90%的人工神經(jīng)網(wǎng)絡(luò)模型采用的是BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)或它的變化形式,它是前饋網(wǎng)絡(luò)的核心部分,體現(xiàn)了神經(jīng)網(wǎng)絡(luò)的精華,具有非線性映射能力、自學(xué)習(xí)和自適應(yīng)能力、泛化能力以及容錯(cuò)能力。小波神經(jīng)網(wǎng)絡(luò)結(jié)合了神經(jīng)網(wǎng)絡(luò)和小波分析的優(yōu)點(diǎn),克服了二者各自應(yīng)用于預(yù)測(cè)系統(tǒng)的不足,具有神經(jīng)網(wǎng)絡(luò)的自適應(yīng)、自學(xué)習(xí)和容錯(cuò)性的優(yōu)點(diǎn),同時(shí)可以充分利用小波的時(shí)頻局部化性質(zhì),學(xué)習(xí)過程只利用局部信息就可以大大提高小波神經(jīng)網(wǎng)絡(luò)的訓(xùn)練收斂速度。

  結(jié)合上述三個(gè)模型的優(yōu)點(diǎn),本文通過建立SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)上證指數(shù),通過分析這三個(gè)模型在相同訓(xùn)練數(shù)據(jù)長(zhǎng)度下的預(yù)測(cè)結(jié)果,對(duì)比分析三個(gè)模型的優(yōu)缺點(diǎn),為后續(xù)相關(guān)研究做準(zhǔn)備。

1 SVM和神經(jīng)網(wǎng)絡(luò)模型簡(jiǎn)介

  1.1 SVM模型

  支持向量機(jī)(SVM)以統(tǒng)計(jì)學(xué)習(xí)理論為理論基礎(chǔ),是結(jié)構(gòu)風(fēng)險(xiǎn)最大化的近似實(shí)現(xiàn)。它的主要思想是通過建立一個(gè)分類超平面作為決策曲面,最大化正例和反例之間的隔離邊緣。與多層感知器網(wǎng)絡(luò)和徑向基函數(shù)網(wǎng)絡(luò)一樣,SVM可用于模式分類和非線性回歸。在處理非線性問題時(shí),運(yùn)用一個(gè)核函數(shù)來(lái)代替高維空間中的內(nèi)積運(yùn)算,將非線性問題轉(zhuǎn)化為高維空間的線性運(yùn)算問題。其中K為核函數(shù),其種類主要有:

  1.jpg

  1.2 BP神經(jīng)網(wǎng)絡(luò)模型

  誤差反傳神經(jīng)網(wǎng)絡(luò)(BP神經(jīng)網(wǎng)絡(luò))是一種基于誤差反向傳播算法的多層前饋型神經(jīng)網(wǎng)絡(luò)。它由輸入層、中間層和輸出層組成,中間層也稱為隱含層,可以是一層也可以是多層。它的基本原理是梯度最速下降法,通過誤差反向傳播來(lái)不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,網(wǎng)絡(luò)的總誤差最小。

  與一般的人工神經(jīng)網(wǎng)絡(luò)一樣,構(gòu)成BP神經(jīng)網(wǎng)絡(luò)的神經(jīng)元仍然是神經(jīng)元。按照BP算法的要求,神經(jīng)元所用的激活函數(shù)必須是處處可導(dǎo),一般使用S型函數(shù)。對(duì)一個(gè)神經(jīng)元來(lái)說(shuō),它的網(wǎng)絡(luò)輸入可表示為:

  net=x1w1+x2w2+…+xnwn

  其中,x1,x2,…,xn為神經(jīng)元的輸入,w1,w2,…,wn分別是它們對(duì)應(yīng)的連接權(quán)值。該神經(jīng)元的輸出為:

  2.png

  1.3 小波神經(jīng)網(wǎng)絡(luò)模型

  小波神經(jīng)網(wǎng)絡(luò)是一種以BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為基礎(chǔ),以小波分析為理論,將小波基函數(shù)作為隱含層節(jié)點(diǎn)的傳遞函數(shù),信號(hào)前向傳播的同時(shí)誤差反向傳播的神經(jīng)網(wǎng)絡(luò)[4]。小波神經(jīng)網(wǎng)絡(luò)結(jié)合了小波分析和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),在一定程度上克服了二者各自應(yīng)用于預(yù)測(cè)系統(tǒng)的不足,因此,將小波神經(jīng)網(wǎng)絡(luò)應(yīng)用于股價(jià)預(yù)測(cè)具有重要的理論意義和實(shí)際的應(yīng)用價(jià)值。而小波分析是針對(duì)傅里葉變換的不足發(fā)展而來(lái),它能夠通過小波基函數(shù)的變換分析信號(hào)的局部特征,并且在二維情況下具有信號(hào)方向選擇性能力,它的特點(diǎn)包括:

 ?。?)時(shí)域都具有緊支集或近似緊支集;

 ?。?)直流分量為0。

  小波函數(shù)是將一個(gè)母小波函數(shù)經(jīng)過平移與尺寸伸縮得到的,小波分析即把信號(hào)分解成一系列的小波函數(shù)的疊加。

  小波變換是指把某一基本小波函數(shù)?準(zhǔn)(t)平移τ后,再在不同尺度a下與待分析的信號(hào)x(t)做內(nèi)積:

  3.png

  式中,τ和a為參數(shù),τ相當(dāng)于使鏡頭相對(duì)于目標(biāo)平移,a相當(dāng)于使鏡頭向目標(biāo)推進(jìn)和遠(yuǎn)離。

2 模型建立

  參考目前論文中出現(xiàn)頻率最高的SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)股票預(yù)測(cè)模型,分別構(gòu)建了3個(gè)6輸入、1輸出的股票預(yù)測(cè)模型[5-7]。輸入分別為:某日上證指數(shù)的開盤指數(shù)(價(jià))、指數(shù)(股價(jià))最高值、指數(shù)(股價(jià))最低值、收盤指數(shù)(價(jià))、交易量和交易額;輸出為輸入次日的收盤指數(shù)(價(jià))。

  在設(shè)計(jì)SVM模型時(shí),選取不同的核函數(shù)對(duì)SVM模型性能的影響不大,但核函數(shù)的參數(shù)g和誤差懲罰因子c卻會(huì)嚴(yán)重影響SVM模型的泛化推廣性能,故針對(duì)核函數(shù)g和誤差懲罰因子c的參數(shù)選擇方法尤為重要。本文選擇交叉驗(yàn)證的方式尋找最優(yōu)參數(shù),將樣本數(shù)據(jù)進(jìn)行分組,一部分作為訓(xùn)練集,另一部分作為驗(yàn)證集,先用訓(xùn)練集對(duì)學(xué)習(xí)機(jī)器進(jìn)行訓(xùn)練,再利用驗(yàn)證集檢測(cè)訓(xùn)練得到的模型[4]。

  在設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)時(shí),輸入層和輸出層的神經(jīng)元數(shù)目由實(shí)際情況而定,在設(shè)計(jì)時(shí)應(yīng)盡量減小系統(tǒng)的規(guī)模和復(fù)雜度,使模型運(yùn)行的時(shí)間減小。另外,由于BP神經(jīng)網(wǎng)絡(luò)是非線性的,初始權(quán)值的選取對(duì)于模型的學(xué)習(xí)效果是否能達(dá)到局部最小和能否收斂有密切的關(guān)系,因此初始權(quán)值選取的一個(gè)重要標(biāo)準(zhǔn)是使得初始權(quán)值在輸入累加時(shí)每個(gè)神經(jīng)元的狀態(tài)值能接近于零。

  小波神經(jīng)網(wǎng)絡(luò)權(quán)值參數(shù)修正算法類似于BP神經(jīng)網(wǎng)絡(luò)權(quán)值修正算法,采用梯度修正網(wǎng)絡(luò)的權(quán)值和小波基函數(shù)參數(shù),從而使小波神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出不斷逼近期望輸出。三個(gè)模型的算法流程如圖1所示。

001.jpg

  3 模型評(píng)價(jià)指標(biāo)

  為了對(duì)比分析三個(gè)模型的預(yù)測(cè)效果,本文選擇三個(gè)指標(biāo)評(píng)判模型的預(yù)測(cè)結(jié)果:均方誤差、走勢(shì)準(zhǔn)確率和總盈利率。

  均方誤差是衡量平均誤差的一種較為方便的方法,可以評(píng)價(jià)數(shù)據(jù)的變化。大多學(xué)者在評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)模型時(shí),常用的評(píng)價(jià)指標(biāo)是均方誤差。在數(shù)學(xué)理論中,均方誤差越小可以說(shuō)明預(yù)測(cè)結(jié)果越好。其計(jì)算公式為:

  4.png

  其中,a為預(yù)測(cè)期望輸出值,b為預(yù)測(cè)輸出值,n為預(yù)測(cè)個(gè)數(shù)。

  走勢(shì)方向準(zhǔn)確率是指預(yù)測(cè)走勢(shì)方向和期望走勢(shì)方向相同的次數(shù)與總預(yù)測(cè)數(shù)之間的比值。走勢(shì)方向準(zhǔn)確率可以反映一個(gè)模型的預(yù)測(cè)勝算率,在一些投資場(chǎng)合,投資者可能只關(guān)心明天是漲是跌,而不關(guān)心具體漲多少或跌多少。走勢(shì)方向準(zhǔn)確率如果能超過70%,則說(shuō)明預(yù)測(cè)10次,準(zhǔn)確7次,這樣的預(yù)測(cè)模型將有非常高的直接使用價(jià)值。

  總盈利率是投資者非常關(guān)心的指標(biāo),該指標(biāo)反映模型在一定交易日內(nèi)的盈利情況。股票預(yù)測(cè)模型能否指導(dǎo)投資產(chǎn)生穩(wěn)定客觀的正贏利,是評(píng)判預(yù)測(cè)模型效果的重要指標(biāo)之一。

  其計(jì)算公式為:

  5.png

4 模型預(yù)測(cè)結(jié)果分析

  本文選取上證指數(shù)2000年2月15日~2014年7月25日共3 500個(gè)交易日數(shù)據(jù)作為模型數(shù)據(jù)源,從中劃分訓(xùn)練和預(yù)測(cè)數(shù)據(jù),訓(xùn)練數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)相鄰。分別進(jìn)行訓(xùn)練1 000個(gè)數(shù)據(jù)預(yù)測(cè)500個(gè)數(shù)據(jù);訓(xùn)練3 000個(gè)數(shù)據(jù),預(yù)測(cè)500個(gè)數(shù)據(jù)的試驗(yàn),之后計(jì)算預(yù)測(cè)結(jié)果的均方誤差、走勢(shì)方向準(zhǔn)確率、500個(gè)交易日的總盈利率,結(jié)果見表1和表2。

002.jpg

  由以上二表可知,三個(gè)模型的均方誤差較低,與前人研究的結(jié)果相近[5-7]。三個(gè)模型預(yù)測(cè)的走勢(shì)方向準(zhǔn)確率不高,準(zhǔn)確率徘徊在50%附近??傆实谋憩F(xiàn)也較差,且不穩(wěn)定,這說(shuō)明若直接使用三個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行股票投資無(wú)法取得穩(wěn)定良好的收益。此外,從預(yù)測(cè)結(jié)果還能發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)的運(yùn)行結(jié)果波動(dòng)性大,隨機(jī)性較強(qiáng),而SVM的結(jié)果較為穩(wěn)定。

5 結(jié)論

  本文通過建立SVM、BP神經(jīng)網(wǎng)絡(luò)和小波神經(jīng)網(wǎng)絡(luò)三種模型分別對(duì)上證指數(shù)進(jìn)行訓(xùn)練及預(yù)測(cè),通過均方誤差、走勢(shì)方向準(zhǔn)確率和總盈利率三個(gè)指標(biāo)分析比較三個(gè)模型,發(fā)現(xiàn)直接使用三個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行股票投資無(wú)法取得穩(wěn)定良好的收益。在今后的工作中,會(huì)繼續(xù)深入研究股票預(yù)測(cè)問題,尋找一個(gè)基于神經(jīng)網(wǎng)絡(luò)等人工智能方法的可穩(wěn)定盈利的股票預(yù)測(cè)模型。

參考文獻(xiàn)

  [1] 張秀艷,徐本立.基于神經(jīng)網(wǎng)絡(luò)集成系統(tǒng)的股市預(yù)測(cè)模型[J].系統(tǒng)工程理論與實(shí)踐,2003,23(9):67-70.

  [2] 喻勝華,肖雨峰.基于信息?;椭С窒蛄繖C(jī)的股票價(jià)格預(yù)測(cè)[J].財(cái)經(jīng)理論與實(shí)踐,20011,32(6):44-47.

  [3] 程硯秋.基于支持向量機(jī)的證券價(jià)格預(yù)測(cè)方法研究[D].大連:大連理工大學(xué),2007.

  [4] MATLAB中文論壇.MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2010.

  [5] 馮居易.BP神經(jīng)網(wǎng)絡(luò)股票價(jià)格預(yù)測(cè)模型研究[D].西安:西安建筑科技大學(xué),2008.

  [6] 張立霞,馬芳芳,葉德謙.基于支持向量機(jī)方法的金融時(shí)間序列研究[J].遼寧工業(yè)大學(xué)學(xué)報(bào),2008,28(1):28-30.

  [7] 張海珍.小波神經(jīng)網(wǎng)絡(luò)在股價(jià)預(yù)測(cè)中的應(yīng)用[D].西安:西安科技大學(xué),2008.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。