《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 設(shè)計(jì)應(yīng)用 > 自適應(yīng)壓縮感知的語音壓縮重構(gòu)算法研究
自適應(yīng)壓縮感知的語音壓縮重構(gòu)算法研究
2015年電子技術(shù)應(yīng)用第2期
毛 靜1,2,尹鵬亮1,2,馬 琦1,2,張斌珍1,2
1.中北大學(xué) 電子測(cè)試國家重點(diǎn)實(shí)驗(yàn)室,山西 太原030051; 2.中北大學(xué) 儀器科學(xué)與動(dòng)態(tài)測(cè)試教育部重點(diǎn)實(shí)驗(yàn)室,山西 太原030051
摘要: 根據(jù)傳統(tǒng)語音信號(hào)的處理過程和語音信號(hào)的特征,提出了利用自適應(yīng)冗余字典KSVD算法、自適應(yīng)觀測(cè)矩陣和SAMP重構(gòu)算法的壓縮重構(gòu)方法,通過仿真分析,并與普通壓縮感知對(duì)比平均幀重構(gòu)信噪比、相對(duì)誤差,驗(yàn)證了壓縮感知自適應(yīng)算法的優(yōu)越性。
中圖分類號(hào): TN912
文獻(xiàn)標(biāo)識(shí)碼: A
文章編號(hào): 0258-7998(2015)02-0072-03
Research on algorithm of speech compression and recovery based on adaptive compressed sensing
Mao Jing1,2,Yin Pengliang1,2,Ma Qi1,2,Zhang Binzhen1,2
1.National Key Laboratory for Electronic Measurement Technology,North University of China,Taiyuan 030051;China; 2.Key Laboratory of Instrumentation Science & Dynamic Measurement of Ministry of Education,North University of China, Taiyuan 030051,China
Abstract: According to the speech characteristics and traditional signal processing, this paper proposes that the adaptive algorithm is joined in compressed sensing, combined with redundant dictionary KSVD adaptive algorithm, adaptive observation matrix and SAMP reconstruction algorithm. By simulation analysis and comparison with the general compressed sensing on the average frame reconstruction SNR and relative error, it is ended to verify the superiority of adaptive compressed sensing algorithm.
Key words : compressed sensing;speech signal;adaptive algorithm


0 引言

  傳統(tǒng)的奈奎斯特采樣定理要求采樣率高于信號(hào)最高頻率的兩倍,來實(shí)現(xiàn)信號(hào)的采集、壓縮和恢復(fù)。但隨著采集數(shù)據(jù)和頻率的急劇增加,壓縮過程中丟棄了絕大部分采集數(shù)據(jù),只保留了小部分來恢復(fù)信號(hào),導(dǎo)致增加大量不必要的存儲(chǔ)和傳輸設(shè)備。Donoho、Candès等人提出的壓縮感知理論很好地解決了這個(gè)難題[1-2]。壓縮感知將可稀疏的信號(hào)通過觀測(cè)從高階矩陣線性投影為低階,信號(hào)的采集和壓縮在此過程同時(shí)進(jìn)行,最后高概率精確地重建原始信號(hào)。在語音信號(hào)的處理過程中,模擬信號(hào)的高采樣率必然會(huì)產(chǎn)生海量的冗余數(shù)據(jù),根據(jù)語音信號(hào)的可壓縮性,DCT變換域以及小波變換的稀疏特性,滿足壓縮感知理論的先驗(yàn)條件[3-4]。壓縮感知的理論包含三項(xiàng)內(nèi)容:選擇信號(hào)稀疏基,設(shè)計(jì)觀測(cè)矩陣和重構(gòu)原信號(hào)。其中信號(hào)是否具有稀疏性是前提條件;設(shè)計(jì)觀測(cè)矩陣是實(shí)現(xiàn)的重要部分,不僅關(guān)系到壓縮和采樣速率的快慢,而且影響重構(gòu)信號(hào)的質(zhì)量;重構(gòu)原始信號(hào)是壓縮感知理論的核心,決定著恢復(fù)原信號(hào)質(zhì)量的好壞。

1 語音自適應(yīng)壓縮感知的設(shè)計(jì)

  信號(hào)在稀疏矩陣變換下越稀疏,重構(gòu)時(shí)所用的觀測(cè)數(shù)目就越少,重建信號(hào)的效率就越高。由于語音信號(hào)具有短時(shí)穩(wěn)態(tài)性,因此基于壓縮感知的語音處理要先對(duì)信號(hào)進(jìn)行編幀,然后利用隨機(jī)觀測(cè)矩陣對(duì)每幀信號(hào)壓縮采樣,最后逐幀恢復(fù)原信號(hào)。

  實(shí)驗(yàn)仿真選用的一段女生聲音內(nèi)容為“hello,酷狗”,共有44 100個(gè)樣點(diǎn),采樣率為22.05 kS/s[5-6]。

  1.1 自適應(yīng)信號(hào)稀疏

  DCT是語音信號(hào)處理中應(yīng)用較多的稀疏方法,具有很強(qiáng)的能量集中功能。但它屬于正交基變換,信號(hào)的稀疏變換唯一,正交基的選擇影響稀疏性,進(jìn)而影響信號(hào)重構(gòu)。冗余字典可以使信號(hào)呈現(xiàn)最佳稀疏,需要遵循各個(gè)基向量使輸入信號(hào)達(dá)到最佳稀疏的原則?;谶@種原則,冗余字典是一定非正交并且冗余的矩陣,可以通過增加稀疏基的梳理來提高變換系統(tǒng)的冗余性,進(jìn)而增強(qiáng)信號(hào)逼近的靈活性,同時(shí)也提高了稀疏表示高階信號(hào)的能力。研究采用基于K-均值的K-SVD算法作為自適應(yīng)冗余字典對(duì)語音信號(hào)稀疏。K-SVD算法的方程表示為:

  6W[NX__J3LX8NGK2{{Q@Y21.png

  KSVD算法的相對(duì)誤差和平均幀重構(gòu)信噪比(AFSNR)示意如圖1。KSVD算法的平均幀重構(gòu)信噪比如表1所示。

  由表1的數(shù)據(jù)得到結(jié)論:經(jīng)過KSVD算法稀疏得到重構(gòu)語音的AFSNR隨幀長(zhǎng)和信號(hào)壓縮比的增加而增大。

  1.2 自適應(yīng)觀測(cè)矩陣

  觀測(cè)矩陣的設(shè)計(jì)原則是與稀疏矩陣盡可能不相干,且自身的列矩陣之間相互獨(dú)立。隨機(jī)觀測(cè)矩陣具有上述特點(diǎn),如高斯矩陣等。在語音信號(hào)觀測(cè)投影時(shí)首先對(duì)信號(hào)進(jìn)行編幀,然后選擇與稀疏矩陣盡量不相干的觀測(cè)矩陣相乘,得到觀測(cè)值。

  語音信號(hào)信號(hào)壓縮比值越大,恢復(fù)信號(hào)的質(zhì)量就越高;但觀測(cè)值越多,其恢復(fù)時(shí)間也越長(zhǎng)。根據(jù)語音信號(hào)每幀信息量的大小,選擇相應(yīng)的觀測(cè)數(shù),即自適應(yīng)觀測(cè);能量大的幀分配較多的觀測(cè)數(shù),能量小的幀分配較小的觀測(cè)數(shù),噪聲大部分存在于能量較小的幀,較少的觀測(cè)數(shù)能起到去噪的作用。

  對(duì)已知的語音信號(hào)進(jìn)行自適應(yīng)觀測(cè),得到的相對(duì)誤差和平均幀重構(gòu)信噪比(AFSNR)如圖2所示。

002.jpg

  圖2的相對(duì)誤差表明,語音信號(hào)的幀長(zhǎng)對(duì)自適應(yīng)觀測(cè)的相對(duì)誤差值幾乎沒有影響,而壓縮比的值對(duì)信號(hào)相對(duì)誤差影響也較小,自適應(yīng)觀測(cè)的相對(duì)誤差集中在0.45左右。

  自適應(yīng)觀測(cè)矩陣的重構(gòu)語音質(zhì)量的好壞與壓縮比有直接關(guān)系,但每幀信號(hào)的幀長(zhǎng)大小對(duì)重構(gòu)語音的影響微乎其微,如表2所示。

008.jpg

  1.3 自適應(yīng)重構(gòu)算法

  重構(gòu)信號(hào)是利用優(yōu)化求解的方法從觀測(cè)值和稀疏矩陣中重構(gòu)原信號(hào)。重建算法的設(shè)計(jì)應(yīng)遵循如下原則:算法應(yīng)使用較少的觀測(cè)值,并且能精確和快速地恢復(fù)原信號(hào)。重構(gòu)語音需要對(duì)每幀語音信號(hào)逐一進(jìn)行恢復(fù)。常用的信號(hào)重構(gòu)算法有BP(Basic pursuit)算法和OMP算法。

  稀疏自適應(yīng)匹配追蹤算法(Sparse Adaptive Matching Pursuit,SAMP)是基于OMP算法基礎(chǔ)上提出的,SAMP算法的主要思路是:在未知稀疏度的情況下進(jìn)行信號(hào)重構(gòu),然后利用逐步加大步長(zhǎng)的方法不斷增加所用的原子規(guī)模,并引入回溯思想,在每次加大步長(zhǎng)和選擇原子后,都會(huì)與上步的原子合并,最后從中選擇最佳的匹配原子。SAMP算法最大的優(yōu)點(diǎn)是在稀疏度未知的前提下能夠自適應(yīng)重構(gòu)原信號(hào)。

  對(duì)已知語音信號(hào)采用SAMP算法進(jìn)行重構(gòu),得到的相對(duì)誤差和平均幀重構(gòu)信噪比結(jié)果如圖3所示。

003.jpg

  采用BP算法和OMP算法與SAMP算法進(jìn)行比較,AFSNR結(jié)果如圖4所示。

004.jpg

  以重構(gòu)語音時(shí)間的角度評(píng)判,運(yùn)行觀測(cè)矩陣約為1 s,剩余全部為重構(gòu)時(shí)間,SAMP算法用時(shí)在10 s內(nèi),OMP算法最少時(shí)間是10 s,而隨著壓縮比的增大,重構(gòu)時(shí)間最高可達(dá)400 s,BP算法時(shí)間更長(zhǎng),最小為40 s,最高為2 500 s。因此使用SAMP算法會(huì)大大減小壓縮感知重構(gòu)語音的時(shí)間。

2 自適應(yīng)壓縮感知

  語音自適應(yīng)壓縮感知的設(shè)計(jì)流程如圖5所示。

  自適應(yīng)壓縮感知重構(gòu)語音平均幀重構(gòu)信噪比如表3所示,表3的數(shù)據(jù)表明,幀長(zhǎng)與信號(hào)壓縮比對(duì)重構(gòu)語音的質(zhì)量有積極影響,而且信號(hào)壓縮比值較小的條件下,恢復(fù)的語音質(zhì)量較高;在幀長(zhǎng)400時(shí),壓縮比的大小對(duì)重構(gòu)語音影響不大,重構(gòu)的語音信號(hào)達(dá)到優(yōu)的級(jí)別,同時(shí)要遠(yuǎn)遠(yuǎn)高于KSVD算法、自適應(yīng)觀測(cè)矩陣和SAMP算法單獨(dú)重構(gòu)語音的質(zhì)量。3種自適應(yīng)算法組合一起能充分發(fā)揮各自的優(yōu)點(diǎn),彌補(bǔ)了每個(gè)算法的缺陷:減少了KSVD所產(chǎn)生的噪聲,重構(gòu)語音的相對(duì)誤差成倍的降低,并且提高了重構(gòu)的AFSNR,使得語音的質(zhì)量更好,同時(shí)提高了信號(hào)稀疏度,降低了在重構(gòu)時(shí)計(jì)算的復(fù)雜度,從而進(jìn)一步減少重構(gòu)語音的時(shí)間。

006.jpg

  如圖6所示,相對(duì)于普通壓縮感知,自適應(yīng)壓縮感知具有更好的重構(gòu)語音信號(hào)質(zhì)量,采樣恢復(fù)語音時(shí)間更短,而且在信號(hào)低壓縮的條件下,能恢復(fù)出良好的語音。

3 結(jié)論

  本文通過將自適應(yīng)算法引入壓縮感知,結(jié)合自適應(yīng)冗余字典KSVD算法、自適應(yīng)觀測(cè)矩陣和SAMP重構(gòu)算法,提出自適應(yīng)壓縮感知,并分別進(jìn)行仿真分析,通過平均幀重構(gòu)信噪比、相對(duì)誤差,與普通壓縮感知進(jìn)行對(duì)比,驗(yàn)證了KSVD的稀疏的性能以及SAMP算法的優(yōu)勢(shì)。最后對(duì)自適應(yīng)壓縮感知進(jìn)行仿真分析,驗(yàn)證了將自適應(yīng)算法引入壓縮感知理論的可行性。

參考文獻(xiàn)

  [1] CANDS E,WAKIN M.An introduction to compressive sampling[J].IEEE Signal Processing Magazine,2008,25(2):21-30.

  [2] CANDS E,ROMBERG J,TAO T.Robust uncertainty prin-ciples:exact signal reconstruction from highly incomplete frequency information[J].IEEE Transactions on Information Theory,2006,52(2):489-509.

  [3] 余愷,李元實(shí),王智,等.基于壓縮感知的新型聲信號(hào)采集方法[J].儀器儀表學(xué)報(bào),2011,33(1):106-112.

  [4] 周小星,王安娜,孫紅英,等.基于壓縮感知過程的語音增強(qiáng)[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,51(9):1234-1238.

  [5] 羅武駿,陶文鳳,左加闊,等.自適應(yīng)語音壓縮感知方法[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,42(6):1027-1030.

  [6] 張雪英.數(shù)字語音處理及MATLAB仿真[M].北京:電子工業(yè)出版社,2010.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。