《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 一種改進(jìn)型HMM說(shuō)話人識(shí)別算法
一種改進(jìn)型HMM說(shuō)話人識(shí)別算法
來(lái)源:微型機(jī)與應(yīng)用2012年第21期
陶 潔,張會(huì)林
(上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200090)
摘要: 針對(duì)Baum-Welch算法依賴于初始值的選取而容易陷入局部最優(yōu)解的問(wèn)題,基于全局優(yōu)化的思想,提出了一種改進(jìn)的HMM語(yǔ)音識(shí)別算法。該算法將遺傳算法應(yīng)用到HMM模型訓(xùn)練中,得到了全局最優(yōu)解。實(shí)驗(yàn)結(jié)果表明,所提出的算法使用有效,識(shí)別率顯著提高。
Abstract:
Key words :

摘  要: 針對(duì)Baum-Welch算法依賴于初始值的選取而容易陷入局部最優(yōu)解的問(wèn)題,基于全局優(yōu)化的思想,提出了一種改進(jìn)的HMM語(yǔ)音識(shí)別算法。該算法將遺傳算法應(yīng)用到HMM模型訓(xùn)練中,得到了全局最優(yōu)解。實(shí)驗(yàn)結(jié)果表明,所提出的算法使用有效,識(shí)別率顯著提高。
關(guān)鍵詞: 遺傳算法;HMM模型;語(yǔ)音識(shí)別

 近年來(lái),隨著語(yǔ)音識(shí)別技術(shù)的不斷發(fā)展,語(yǔ)音識(shí)別系統(tǒng)的性能不斷提高,隱馬爾可夫模型方法是當(dāng)中的一個(gè)主要識(shí)別方法。語(yǔ)音識(shí)別系統(tǒng)的識(shí)別率十分依賴于模型的訓(xùn)練,而經(jīng)典的訓(xùn)練算法(Baum-Welch算法)有一個(gè)致命的弱點(diǎn),即最終所得的解十分依賴于初始值的選取,所以總是局部最優(yōu)解,影響了整個(gè)系統(tǒng)的識(shí)別率。本文將遺傳算法植入HMM模型參數(shù)的優(yōu)化當(dāng)中,使得整個(gè)語(yǔ)音識(shí)別系統(tǒng)的識(shí)別效果大大改善。
1 遺傳算法
 遺傳算法將自然界的生物進(jìn)化原理引入待優(yōu)化參數(shù)形成的編碼串聯(lián)群體中,按所選擇的適應(yīng)度函數(shù)通過(guò)遺傳中的復(fù)制、交叉及變異對(duì)個(gè)體進(jìn)行篩選,使得適應(yīng)度高的個(gè)體被保留下來(lái),組成新的群體。通過(guò)不斷迭代,保留下的個(gè)體適應(yīng)度不斷提高,直到滿足一定的條件。從數(shù)學(xué)的角度解釋,可以簡(jiǎn)單地認(rèn)為,基因重組使子代基因趨向于局部最優(yōu)解,而基因變異能使子代基因突破局部范疇,經(jīng)過(guò)多代的交叉和變異,達(dá)到全局最優(yōu)解。
 根據(jù)待優(yōu)化問(wèn)題的數(shù)學(xué)模型,定義適應(yīng)度函數(shù)F(ai),其中ai為其中的一條染色體,則F(ai)就是判斷該染色體優(yōu)劣的依據(jù)。對(duì)于每一代基因,計(jì)算所有染色體的適應(yīng)度函數(shù),進(jìn)行排序,選擇一定數(shù)目的優(yōu)秀染色體,用于產(chǎn)生子代的父代樣本。
 復(fù)制操作只能從舊種群中選擇出較優(yōu)秀的染色體,但是不能創(chuàng)造出新的染色體。交叉操作模擬了生物進(jìn)化過(guò)程中的交配過(guò)程,通過(guò)兩條染色體的分離重組,產(chǎn)生新的優(yōu)良物種。圖1為多點(diǎn)交叉重組的示意圖。交叉過(guò)程為:在匹配池中任選兩條染色體,隨機(jī)選擇一點(diǎn)或多點(diǎn)交換點(diǎn),然后交換雙親染色體交換點(diǎn)右邊的部分,即可得到兩條新的子代染色體。
 最佳基因是在一代一代的基因重組和基因變異中產(chǎn)生的。基因突變用來(lái)模擬生物在自然的遺傳環(huán)境中由于各種偶然因素引起的變異突變,它以很小的概率隨機(jī)地改變?nèi)旧w編碼串中的某一位。變異算法有利于局部最優(yōu)處跳出,防止算法過(guò)早地收斂。
 遺傳算法的具體實(shí)現(xiàn)步驟如下:
 (1)隨機(jī)產(chǎn)生最初的染色體群體p={a1,a2,…,aL},ai為其中的一條染色體。
?。?)計(jì)算各個(gè)染色體的適應(yīng)度函數(shù)F(ai),并對(duì)適應(yīng)度函數(shù)F(ai)進(jìn)行排序,根據(jù)設(shè)定的門限選取一定數(shù)目的優(yōu)秀染色體作為產(chǎn)生子代染色體的父代樣本。
?。?)以一點(diǎn)或多點(diǎn)交叉產(chǎn)生新的子代染色體,交叉點(diǎn)隨機(jī)生成。
?。?)設(shè)定變異概率門限,根據(jù)生成的隨機(jī)數(shù)決定染色體中的某個(gè)變量是否有突變發(fā)生。
2 HMM說(shuō)話人識(shí)別系統(tǒng)
 識(shí)別主要有兩個(gè)任務(wù):一個(gè)是對(duì)每個(gè)HMM模型的訓(xùn)練,也就是計(jì)算HMM參數(shù);另一個(gè)是識(shí)別任務(wù),也就是已知了參考模型的HMM參數(shù),決定未知模式與哪個(gè)參考模式是最佳匹配。訓(xùn)練采用Baum-Welch算法,識(shí)別采用Viterbi算法。


4 實(shí)驗(yàn)結(jié)果分析
 實(shí)驗(yàn)基于HMM進(jìn)行語(yǔ)音識(shí)別,訓(xùn)練數(shù)據(jù)取自10人,在不同SNR下獲取語(yǔ)音數(shù)據(jù),時(shí)間長(zhǎng)度為5 s,采樣率為8 kHz,A/D轉(zhuǎn)換精度為16 bit,單聲道。遺傳算法的優(yōu)化過(guò)程中適應(yīng)度函數(shù)F的變化過(guò)程如圖3所示。語(yǔ)音識(shí)別系統(tǒng)識(shí)別結(jié)果如表1所示。

 

 

 表1中,系統(tǒng)I為基于HMM的語(yǔ)音識(shí)別系統(tǒng),系統(tǒng)II為基于遺傳算法改進(jìn)的HMM語(yǔ)音識(shí)別系統(tǒng)。從實(shí)驗(yàn)結(jié)果可以看出,基于遺傳算法改進(jìn)的HMM模型對(duì)語(yǔ)音識(shí)別率有較大改善,平均提高了4~5個(gè)百分點(diǎn)。
 本應(yīng)用基于HMM語(yǔ)音識(shí)別算法,結(jié)合遺傳算法進(jìn)行HMM模型訓(xùn)練并將其應(yīng)用于到語(yǔ)音識(shí)別中。經(jīng)過(guò)實(shí)際驗(yàn)證,計(jì)算簡(jiǎn)單,效果好,基本達(dá)到了設(shè)計(jì)目的和現(xiàn)實(shí)要求。
參考文獻(xiàn)
[1] 張思才,張方曉.一種遺傳算法適應(yīng)度函數(shù)的改進(jìn)方法[J].計(jì)算機(jī)應(yīng)用與軟件,2011,23(2):108-110.
[2] MANIEZZO V. Genetic evolution of the topology and weight distribution of neural networks[J]. IEEE Transactions on Neural Networks, 1994, 5(6):900~909.
[3] TERASHIMA R, YOSHIMURA T, WAKITA T. Prediction method of speech recognition performance based on HMM-based speech synthesis technique[J]. IEEE Transactions on Electronics, Information and Systems,2010,130: 557-564.
[4] 胡廣書. 現(xiàn)代信號(hào)處理教程[M].北京:清華大學(xué)出版社,2004.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。