文獻標識碼: A
文章編號: 0258-7998(2015)02-0072-03
0 引言
傳統(tǒng)的奈奎斯特采樣定理要求采樣率高于信號最高頻率的兩倍,來實現信號的采集、壓縮和恢復。但隨著采集數據和頻率的急劇增加,壓縮過程中丟棄了絕大部分采集數據,只保留了小部分來恢復信號,導致增加大量不必要的存儲和傳輸設備。Donoho、Candès等人提出的壓縮感知理論很好地解決了這個難題[1-2]。壓縮感知將可稀疏的信號通過觀測從高階矩陣線性投影為低階,信號的采集和壓縮在此過程同時進行,最后高概率精確地重建原始信號。在語音信號的處理過程中,模擬信號的高采樣率必然會產生海量的冗余數據,根據語音信號的可壓縮性,DCT變換域以及小波變換的稀疏特性,滿足壓縮感知理論的先驗條件[3-4]。壓縮感知的理論包含三項內容:選擇信號稀疏基,設計觀測矩陣和重構原信號。其中信號是否具有稀疏性是前提條件;設計觀測矩陣是實現的重要部分,不僅關系到壓縮和采樣速率的快慢,而且影響重構信號的質量;重構原始信號是壓縮感知理論的核心,決定著恢復原信號質量的好壞。
1 語音自適應壓縮感知的設計
信號在稀疏矩陣變換下越稀疏,重構時所用的觀測數目就越少,重建信號的效率就越高。由于語音信號具有短時穩(wěn)態(tài)性,因此基于壓縮感知的語音處理要先對信號進行編幀,然后利用隨機觀測矩陣對每幀信號壓縮采樣,最后逐幀恢復原信號。
實驗仿真選用的一段女生聲音內容為“hello,酷狗”,共有44 100個樣點,采樣率為22.05 kS/s[5-6]。
1.1 自適應信號稀疏
DCT是語音信號處理中應用較多的稀疏方法,具有很強的能量集中功能。但它屬于正交基變換,信號的稀疏變換唯一,正交基的選擇影響稀疏性,進而影響信號重構。冗余字典可以使信號呈現最佳稀疏,需要遵循各個基向量使輸入信號達到最佳稀疏的原則。基于這種原則,冗余字典是一定非正交并且冗余的矩陣,可以通過增加稀疏基的梳理來提高變換系統(tǒng)的冗余性,進而增強信號逼近的靈活性,同時也提高了稀疏表示高階信號的能力。研究采用基于K-均值的K-SVD算法作為自適應冗余字典對語音信號稀疏。K-SVD算法的方程表示為:
KSVD算法的相對誤差和平均幀重構信噪比(AFSNR)示意如圖1。KSVD算法的平均幀重構信噪比如表1所示。
由表1的數據得到結論:經過KSVD算法稀疏得到重構語音的AFSNR隨幀長和信號壓縮比的增加而增大。
1.2 自適應觀測矩陣
觀測矩陣的設計原則是與稀疏矩陣盡可能不相干,且自身的列矩陣之間相互獨立。隨機觀測矩陣具有上述特點,如高斯矩陣等。在語音信號觀測投影時首先對信號進行編幀,然后選擇與稀疏矩陣盡量不相干的觀測矩陣相乘,得到觀測值。
語音信號信號壓縮比值越大,恢復信號的質量就越高;但觀測值越多,其恢復時間也越長。根據語音信號每幀信息量的大小,選擇相應的觀測數,即自適應觀測;能量大的幀分配較多的觀測數,能量小的幀分配較小的觀測數,噪聲大部分存在于能量較小的幀,較少的觀測數能起到去噪的作用。
對已知的語音信號進行自適應觀測,得到的相對誤差和平均幀重構信噪比(AFSNR)如圖2所示。
圖2的相對誤差表明,語音信號的幀長對自適應觀測的相對誤差值幾乎沒有影響,而壓縮比的值對信號相對誤差影響也較小,自適應觀測的相對誤差集中在0.45左右。
自適應觀測矩陣的重構語音質量的好壞與壓縮比有直接關系,但每幀信號的幀長大小對重構語音的影響微乎其微,如表2所示。
1.3 自適應重構算法
重構信號是利用優(yōu)化求解的方法從觀測值和稀疏矩陣中重構原信號。重建算法的設計應遵循如下原則:算法應使用較少的觀測值,并且能精確和快速地恢復原信號。重構語音需要對每幀語音信號逐一進行恢復。常用的信號重構算法有BP(Basic pursuit)算法和OMP算法。
稀疏自適應匹配追蹤算法(Sparse Adaptive Matching Pursuit,SAMP)是基于OMP算法基礎上提出的,SAMP算法的主要思路是:在未知稀疏度的情況下進行信號重構,然后利用逐步加大步長的方法不斷增加所用的原子規(guī)模,并引入回溯思想,在每次加大步長和選擇原子后,都會與上步的原子合并,最后從中選擇最佳的匹配原子。SAMP算法最大的優(yōu)點是在稀疏度未知的前提下能夠自適應重構原信號。
對已知語音信號采用SAMP算法進行重構,得到的相對誤差和平均幀重構信噪比結果如圖3所示。
采用BP算法和OMP算法與SAMP算法進行比較,AFSNR結果如圖4所示。
以重構語音時間的角度評判,運行觀測矩陣約為1 s,剩余全部為重構時間,SAMP算法用時在10 s內,OMP算法最少時間是10 s,而隨著壓縮比的增大,重構時間最高可達400 s,BP算法時間更長,最小為40 s,最高為2 500 s。因此使用SAMP算法會大大減小壓縮感知重構語音的時間。
2 自適應壓縮感知
語音自適應壓縮感知的設計流程如圖5所示。
自適應壓縮感知重構語音平均幀重構信噪比如表3所示,表3的數據表明,幀長與信號壓縮比對重構語音的質量有積極影響,而且信號壓縮比值較小的條件下,恢復的語音質量較高;在幀長400時,壓縮比的大小對重構語音影響不大,重構的語音信號達到優(yōu)的級別,同時要遠遠高于KSVD算法、自適應觀測矩陣和SAMP算法單獨重構語音的質量。3種自適應算法組合一起能充分發(fā)揮各自的優(yōu)點,彌補了每個算法的缺陷:減少了KSVD所產生的噪聲,重構語音的相對誤差成倍的降低,并且提高了重構的AFSNR,使得語音的質量更好,同時提高了信號稀疏度,降低了在重構時計算的復雜度,從而進一步減少重構語音的時間。
如圖6所示,相對于普通壓縮感知,自適應壓縮感知具有更好的重構語音信號質量,采樣恢復語音時間更短,而且在信號低壓縮的條件下,能恢復出良好的語音。
3 結論
本文通過將自適應算法引入壓縮感知,結合自適應冗余字典KSVD算法、自適應觀測矩陣和SAMP重構算法,提出自適應壓縮感知,并分別進行仿真分析,通過平均幀重構信噪比、相對誤差,與普通壓縮感知進行對比,驗證了KSVD的稀疏的性能以及SAMP算法的優(yōu)勢。最后對自適應壓縮感知進行仿真分析,驗證了將自適應算法引入壓縮感知理論的可行性。
參考文獻
[1] CANDS E,WAKIN M.An introduction to compressive sampling[J].IEEE Signal Processing Magazine,2008,25(2):21-30.
[2] CANDS E,ROMBERG J,TAO T.Robust uncertainty prin-ciples:exact signal reconstruction from highly incomplete frequency information[J].IEEE Transactions on Information Theory,2006,52(2):489-509.
[3] 余愷,李元實,王智,等.基于壓縮感知的新型聲信號采集方法[J].儀器儀表學報,2011,33(1):106-112.
[4] 周小星,王安娜,孫紅英,等.基于壓縮感知過程的語音增強[J].清華大學學報(自然科學版),2011,51(9):1234-1238.
[5] 羅武駿,陶文鳳,左加闊,等.自適應語音壓縮感知方法[J].東南大學學報(自然科學版),2012,42(6):1027-1030.
[6] 張雪英.數字語音處理及MATLAB仿真[M].北京:電子工業(yè)出版社,2010.