《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)在音樂分類中的應(yīng)用
自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)在音樂分類中的應(yīng)用
來源:微型機與應(yīng)用2012年第1期
彭建喜,喻 曉
(佛山職業(yè)技術(shù)學(xué)院 電子信息系,廣東 佛山 528137)
摘要: 自適應(yīng)變異粒子群算法具備了基本粒子群算法和遺傳算法優(yōu)點,用此算法尋找BP網(wǎng)絡(luò)較好的網(wǎng)絡(luò)權(quán)值和閾值,使得BP網(wǎng)絡(luò)的全局誤差最小化,不僅可以克服基本BP算法收斂速度慢和易陷入局部極值的局限, 而且模型的精度高。仿真實驗結(jié)果表明,本算法與傳統(tǒng)的分類方法相比,具有更高的正確率,驗證了自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)是一種有效的分類方法。
Abstract:
Key words :

摘  要: 自適應(yīng)變異粒子群算法具備了基本粒子群算法和遺傳算法優(yōu)點,用此算法尋找BP網(wǎng)絡(luò)較好的網(wǎng)絡(luò)權(quán)值和閾值,使得BP網(wǎng)絡(luò)的全局誤差最小化,不僅可以克服基本BP算法收斂速度慢和易陷入局部極值的局限, 而且模型的精度高。仿真實驗結(jié)果表明,本算法與傳統(tǒng)的分類方法相比,具有更高的正確率,驗證了自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)是一種有效的分類方法。
關(guān)鍵詞: 音樂分類;神經(jīng)網(wǎng)絡(luò);粒子群優(yōu)化算法;交叉算子

 音頻分類識別技術(shù)是利用計算機對音頻信號進(jìn)行分析,從而實現(xiàn)對聲音自動理解的一門學(xué)科。音頻分類識別技術(shù)己經(jīng)成為信息科學(xué)中一個十分活躍的研究領(lǐng)域。作為一門交叉學(xué)科,它正逐步成為信息技術(shù)中人機交互的關(guān)鍵技術(shù)。音頻分類識別是一個復(fù)雜的非線性過程,本質(zhì)上是一個模式識別的問題,很多研究者在這個領(lǐng)域做了大量的工作,但均存在需要改進(jìn)之處。如基于規(guī)則的音頻分類方法難于滿足復(fù)雜的、多特征的音樂分類應(yīng)用[1];模式匹配法計算量大,分類精度低[2];隱馬爾可夫模型(HMM)算法分類決策能力差,需要語音識別的先驗統(tǒng)計知識等缺陷[3]。
 人工神經(jīng)網(wǎng)絡(luò)是一種分布式并行信息處理系統(tǒng),它的自適應(yīng)、自組織及自學(xué)習(xí)等特征使其特別適合于音頻識別中的分類問題,為解決音頻分類識別這樣的一個復(fù)雜的模式分類問題提供了新的途徑。眾多神經(jīng)網(wǎng)絡(luò)中,BP神經(jīng)網(wǎng)絡(luò)因其結(jié)構(gòu)簡單、算法成熟并能精確尋優(yōu)而被廣泛地應(yīng)用于音頻分類識別領(lǐng)域。但是,由于BP算法是一種基于梯度下降的算法,因而不可避免地存在收斂速度慢、易陷入局部極小點等缺點。近年來,人們圍繞如何加速傳統(tǒng)BP網(wǎng)絡(luò)的收斂速度及盡量避免陷入局部最優(yōu)解等問題做了大量的工作,并提出了許多改進(jìn)方案[4-5]。
 本文借鑒了遺傳算法中的變異思想,提出了基于遺傳交叉算子的自適應(yīng)變異粒子群算法,它具備了基本粒子群算法和遺傳算法優(yōu)點,使粒子能夠跳出先前搜索到的局部最優(yōu)解,在更大的空間中開展搜索,同時保持了種群多樣性,提高算法尋找到更優(yōu)解的可能性。因此可以充分利用BP神經(jīng)網(wǎng)絡(luò)與自適應(yīng)變異粒子群算法的優(yōu)點,把兩者結(jié)合起來,優(yōu)勢互補,在全局搜索的同時利用梯度法加速尋優(yōu),從而能改善整個網(wǎng)絡(luò)的學(xué)習(xí)性能和收斂性能,最終提高整個系統(tǒng)的識別率。
1 BP神經(jīng)網(wǎng)絡(luò)
 誤差反向傳播神經(jīng)網(wǎng)絡(luò)(簡稱BP神經(jīng)網(wǎng)絡(luò)),它是一種單向傳播的多層前向網(wǎng)絡(luò),網(wǎng)絡(luò)中除了輸入輸出節(jié)點外,還有一層或多層的隱含層節(jié)點,且同層節(jié)點間沒有任何禍合。輸入信號從輸入層節(jié)點依次傳過各隱含層節(jié)點,然后傳到輸出層節(jié)點,每一層節(jié)點的輸出只影響下一層節(jié)點的輸出。


 經(jīng)過上述計算,由父代粒子形成的超立方體中隨機產(chǎn)生了兩個新的位置,其中在速率的交叉處將兩個父代個體的速率之和的長度進(jìn)行了規(guī)格化。因此,只有粒子的方向受到影響,數(shù)量卻不會改變。
3 自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)
 自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)分為BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定、自適應(yīng)變異粒子群算法優(yōu)化和BP神經(jīng)網(wǎng)絡(luò)預(yù)測三部分。其中BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定部分是根據(jù)應(yīng)用的輸入輸出參數(shù)個數(shù)確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)而確定粒子群算法個體的長度。自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,種群中的每個個體都包含了一個網(wǎng)絡(luò)所有權(quán)值和閾值,個體通過適度函數(shù)計算個體適應(yīng)度值,然后更新個體極值和群體極值來尋找到最優(yōu)適應(yīng)值對應(yīng)個體。BP神經(jīng)網(wǎng)絡(luò)預(yù)測用自適應(yīng)變異粒子群算法得到的最優(yōu)個體對網(wǎng)絡(luò)初始權(quán)值和閾值賦值,網(wǎng)絡(luò)經(jīng)訓(xùn)練后預(yù)測結(jié)果。
 自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)算法流程如圖2所示。

4 實驗仿真與結(jié)果討論
4.1 網(wǎng)絡(luò)訓(xùn)練與識別

 本文選取了民歌、古箏、搖滾和流行四類不同音樂,每段音樂都用倒譜法提取500組24維語音特征信號,共有2 000組語音特征信號。由于語音特征輸入信號有24維,待分類的語音信號共有4類,所以BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為24-25-4,即輸入層有24個節(jié)點,隱含層有25個節(jié)點,輸出層有4個節(jié)點。
 從語音特征信號數(shù)據(jù)中隨機選擇1 500組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)用來訓(xùn)練網(wǎng)絡(luò)。根據(jù)語音特征信號的特性并參考經(jīng)典PSO參數(shù)集,本文設(shè)置算法的基本參數(shù)如下:(1)粒子規(guī)模數(shù)n=30;(2)粒子維數(shù)D=729;(3)最大速度vmax=1;(4)最大迭代次數(shù)設(shè)為100次;(5)終止條件,循環(huán)達(dá)到終止迭代次數(shù)或最優(yōu)適度值連續(xù)迭代50次,計算結(jié)果差值小于0.000 5;(6)粒子群節(jié)點適應(yīng)度函數(shù)使用BP算法的MSE(Mean Squared Error)定義。
 用PSO得出的最優(yōu)解確定BP網(wǎng)絡(luò)的權(quán)值和閾值,從2 000組語音特征信號中隨機選擇1 500組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)用來訓(xùn)練網(wǎng)絡(luò),500組數(shù)據(jù)作為測試數(shù)據(jù)用來測試網(wǎng)絡(luò)的分類能力。將這個分類號與輸入自帶的分類號進(jìn)行比較,相等則識別正確;反之,識別錯誤。最后將識別正確的個數(shù)與所有待識別數(shù)作比值即可得到最終的識別率。
4.2 結(jié)果與分析
 用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)分類語音特征信號測試數(shù)據(jù),圖3 所示是BP神經(jīng)網(wǎng)絡(luò)分類誤差,圖4所示是預(yù)測結(jié)果。

 

 

 為了驗證自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)基于遺傳交叉算子的改進(jìn)粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)(HPSOBPNN)的有效性,同時用其他模型(GABPNN、PSOBPNN、BPNN、模式匹配法、HMM)進(jìn)行了的實驗,結(jié)果如表1所示。從表1可知,HPSOBPNN分類正確率比其他模型方法有了明顯的提高。

 音頻的自動分類,尤其是語音和音樂的分類,作為提取音頻內(nèi)容語義和結(jié)構(gòu)的重要手段之一,其研究也日益地引起關(guān)注。本文采用倒譜系數(shù)法提取音樂特征,利用自適應(yīng)變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)對音樂類型進(jìn)行分類,與其他方法相比,其分類正確率有了明顯的提高。仿真實驗結(jié)果表明,該方法分類性能較好,具有一定的現(xiàn)實意義與參考價值。
參考文獻(xiàn)
[1] Tian Lan, Lu Xiaoshan,Bai Shuzhong. Speaker-independent speech recognition based on a fast algorithm[J]. Control and Decision, 2002,17(1):65-68.
[2] DOWNIE T R, SILVERMAN B W. The discrete multiple wavelet transform and thresholding methods[J]. IEEE Trans on Signal Processing,1998,46(9):2558-256.
[3] TZANETAKIS G, COOK P. Musical genre classification of audio signals[J]. IEEE Trans. on Speech and Audio Processing, 2002,10(5):293-302.
[4] MANIEZZO V. Genetic evolution of the topology and weight distribution of neural networks[J]. IEEE Trans on Neural Networks, 1994,5(1):39-53.
[5] HAGAN M T, MENHAJ M B. Trainning feed forward networks with the marquardt algorithm[J]. IEEE Trans on Neural Networks, 1994, 5(6):989-993.
[6] EBERHART R C, KENNEDY J. A new optimizer using particle swarm theory[C]. Proc. of the 6th Int’1 Symp. on Micro Machine and Human Science. Nagoya, Japan:[s. n.], 1995.
[7] CLERC M. The swarm and the queen: Towards a deterministic and adaptive particle swarm optimization [C].Proc. 1999 Congress on Evolutionary Computation. Washington, DC: [s. n.], 1999:1951-1957.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。