《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 自適應變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡在音樂分類中的應用
自適應變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡在音樂分類中的應用
來源:微型機與應用2012年第1期
彭建喜,喻 曉
(佛山職業(yè)技術學院 電子信息系,廣東 佛山 528137)
摘要: 自適應變異粒子群算法具備了基本粒子群算法和遺傳算法優(yōu)點,用此算法尋找BP網(wǎng)絡較好的網(wǎng)絡權值和閾值,使得BP網(wǎng)絡的全局誤差最小化,不僅可以克服基本BP算法收斂速度慢和易陷入局部極值的局限, 而且模型的精度高。仿真實驗結果表明,本算法與傳統(tǒng)的分類方法相比,具有更高的正確率,驗證了自適應變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡是一種有效的分類方法。
Abstract:
Key words :

摘  要: 自適應變異粒子群算法具備了基本粒子群算法和遺傳算法優(yōu)點,用此算法尋找BP網(wǎng)絡較好的網(wǎng)絡權值和閾值,使得BP網(wǎng)絡的全局誤差最小化,不僅可以克服基本BP算法收斂速度慢和易陷入局部極值的局限, 而且模型的精度高。仿真實驗結果表明,本算法與傳統(tǒng)的分類方法相比,具有更高的正確率,驗證了自適應變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡是一種有效的分類方法。
關鍵詞: 音樂分類;神經(jīng)網(wǎng)絡;粒子群優(yōu)化算法;交叉算子

 音頻分類識別技術是利用計算機對音頻信號進行分析,從而實現(xiàn)對聲音自動理解的一門學科。音頻分類識別技術己經(jīng)成為信息科學中一個十分活躍的研究領域。作為一門交叉學科,它正逐步成為信息技術中人機交互的關鍵技術。音頻分類識別是一個復雜的非線性過程,本質上是一個模式識別的問題,很多研究者在這個領域做了大量的工作,但均存在需要改進之處。如基于規(guī)則的音頻分類方法難于滿足復雜的、多特征的音樂分類應用[1];模式匹配法計算量大,分類精度低[2];隱馬爾可夫模型(HMM)算法分類決策能力差,需要語音識別的先驗統(tǒng)計知識等缺陷[3]。
 人工神經(jīng)網(wǎng)絡是一種分布式并行信息處理系統(tǒng),它的自適應、自組織及自學習等特征使其特別適合于音頻識別中的分類問題,為解決音頻分類識別這樣的一個復雜的模式分類問題提供了新的途徑。眾多神經(jīng)網(wǎng)絡中,BP神經(jīng)網(wǎng)絡因其結構簡單、算法成熟并能精確尋優(yōu)而被廣泛地應用于音頻分類識別領域。但是,由于BP算法是一種基于梯度下降的算法,因而不可避免地存在收斂速度慢、易陷入局部極小點等缺點。近年來,人們圍繞如何加速傳統(tǒng)BP網(wǎng)絡的收斂速度及盡量避免陷入局部最優(yōu)解等問題做了大量的工作,并提出了許多改進方案[4-5]。
 本文借鑒了遺傳算法中的變異思想,提出了基于遺傳交叉算子的自適應變異粒子群算法,它具備了基本粒子群算法和遺傳算法優(yōu)點,使粒子能夠跳出先前搜索到的局部最優(yōu)解,在更大的空間中開展搜索,同時保持了種群多樣性,提高算法尋找到更優(yōu)解的可能性。因此可以充分利用BP神經(jīng)網(wǎng)絡與自適應變異粒子群算法的優(yōu)點,把兩者結合起來,優(yōu)勢互補,在全局搜索的同時利用梯度法加速尋優(yōu),從而能改善整個網(wǎng)絡的學習性能和收斂性能,最終提高整個系統(tǒng)的識別率。
1 BP神經(jīng)網(wǎng)絡
 誤差反向傳播神經(jīng)網(wǎng)絡(簡稱BP神經(jīng)網(wǎng)絡),它是一種單向傳播的多層前向網(wǎng)絡,網(wǎng)絡中除了輸入輸出節(jié)點外,還有一層或多層的隱含層節(jié)點,且同層節(jié)點間沒有任何禍合。輸入信號從輸入層節(jié)點依次傳過各隱含層節(jié)點,然后傳到輸出層節(jié)點,每一層節(jié)點的輸出只影響下一層節(jié)點的輸出。


 經(jīng)過上述計算,由父代粒子形成的超立方體中隨機產(chǎn)生了兩個新的位置,其中在速率的交叉處將兩個父代個體的速率之和的長度進行了規(guī)格化。因此,只有粒子的方向受到影響,數(shù)量卻不會改變。
3 自適應變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡
 自適應變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡分為BP神經(jīng)網(wǎng)絡結構確定、自適應變異粒子群算法優(yōu)化和BP神經(jīng)網(wǎng)絡預測三部分。其中BP神經(jīng)網(wǎng)絡結構確定部分是根據(jù)應用的輸入輸出參數(shù)個數(shù)確定BP神經(jīng)網(wǎng)絡結構,進而確定粒子群算法個體的長度。自適應變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡的權值和閾值,種群中的每個個體都包含了一個網(wǎng)絡所有權值和閾值,個體通過適度函數(shù)計算個體適應度值,然后更新個體極值和群體極值來尋找到最優(yōu)適應值對應個體。BP神經(jīng)網(wǎng)絡預測用自適應變異粒子群算法得到的最優(yōu)個體對網(wǎng)絡初始權值和閾值賦值,網(wǎng)絡經(jīng)訓練后預測結果。
 自適應變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡算法流程如圖2所示。

4 實驗仿真與結果討論
4.1 網(wǎng)絡訓練與識別

 本文選取了民歌、古箏、搖滾和流行四類不同音樂,每段音樂都用倒譜法提取500組24維語音特征信號,共有2 000組語音特征信號。由于語音特征輸入信號有24維,待分類的語音信號共有4類,所以BP神經(jīng)網(wǎng)絡的結構為24-25-4,即輸入層有24個節(jié)點,隱含層有25個節(jié)點,輸出層有4個節(jié)點。
 從語音特征信號數(shù)據(jù)中隨機選擇1 500組數(shù)據(jù)作為訓練數(shù)據(jù)用來訓練網(wǎng)絡。根據(jù)語音特征信號的特性并參考經(jīng)典PSO參數(shù)集,本文設置算法的基本參數(shù)如下:(1)粒子規(guī)模數(shù)n=30;(2)粒子維數(shù)D=729;(3)最大速度vmax=1;(4)最大迭代次數(shù)設為100次;(5)終止條件,循環(huán)達到終止迭代次數(shù)或最優(yōu)適度值連續(xù)迭代50次,計算結果差值小于0.000 5;(6)粒子群節(jié)點適應度函數(shù)使用BP算法的MSE(Mean Squared Error)定義。
 用PSO得出的最優(yōu)解確定BP網(wǎng)絡的權值和閾值,從2 000組語音特征信號中隨機選擇1 500組數(shù)據(jù)作為訓練數(shù)據(jù)用來訓練網(wǎng)絡,500組數(shù)據(jù)作為測試數(shù)據(jù)用來測試網(wǎng)絡的分類能力。將這個分類號與輸入自帶的分類號進行比較,相等則識別正確;反之,識別錯誤。最后將識別正確的個數(shù)與所有待識別數(shù)作比值即可得到最終的識別率。
4.2 結果與分析
 用訓練好的BP神經(jīng)網(wǎng)絡分類語音特征信號測試數(shù)據(jù),圖3 所示是BP神經(jīng)網(wǎng)絡分類誤差,圖4所示是預測結果。

 

 

 為了驗證自適應變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡基于遺傳交叉算子的改進粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(HPSOBPNN)的有效性,同時用其他模型(GABPNN、PSOBPNN、BPNN、模式匹配法、HMM)進行了的實驗,結果如表1所示。從表1可知,HPSOBPNN分類正確率比其他模型方法有了明顯的提高。

 音頻的自動分類,尤其是語音和音樂的分類,作為提取音頻內(nèi)容語義和結構的重要手段之一,其研究也日益地引起關注。本文采用倒譜系數(shù)法提取音樂特征,利用自適應變異粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡對音樂類型進行分類,與其他方法相比,其分類正確率有了明顯的提高。仿真實驗結果表明,該方法分類性能較好,具有一定的現(xiàn)實意義與參考價值。
參考文獻
[1] Tian Lan, Lu Xiaoshan,Bai Shuzhong. Speaker-independent speech recognition based on a fast algorithm[J]. Control and Decision, 2002,17(1):65-68.
[2] DOWNIE T R, SILVERMAN B W. The discrete multiple wavelet transform and thresholding methods[J]. IEEE Trans on Signal Processing,1998,46(9):2558-256.
[3] TZANETAKIS G, COOK P. Musical genre classification of audio signals[J]. IEEE Trans. on Speech and Audio Processing, 2002,10(5):293-302.
[4] MANIEZZO V. Genetic evolution of the topology and weight distribution of neural networks[J]. IEEE Trans on Neural Networks, 1994,5(1):39-53.
[5] HAGAN M T, MENHAJ M B. Trainning feed forward networks with the marquardt algorithm[J]. IEEE Trans on Neural Networks, 1994, 5(6):989-993.
[6] EBERHART R C, KENNEDY J. A new optimizer using particle swarm theory[C]. Proc. of the 6th Int’1 Symp. on Micro Machine and Human Science. Nagoya, Japan:[s. n.], 1995.
[7] CLERC M. The swarm and the queen: Towards a deterministic and adaptive particle swarm optimization [C].Proc. 1999 Congress on Evolutionary Computation. Washington, DC: [s. n.], 1999:1951-1957.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。