123,123,123

自适应压缩感知的语音压缩重构算法研究

2015年电子技术应用第2期

毛静1，2，尹鹏亮1，2，马琦1，2，张斌珍1，2

1.中北大学电子测试国家重点实验室，山西太原030051； 2.中北大学仪器科学与动态测试教育部重点实验室，山西太原030051

摘要： 根据传统语音信号的处理过程和语音信号的特征，提出了利用自适应冗余字典KSVD算法、自适应观测矩阵和SAMP重构算法的压缩重构方法，通过仿真分析，并与普通压缩感知对比平均帧重构信噪比、相对误差，验证了压缩感知自适应算法的优越性。

關(guān)鍵詞： 压缩感知语音信号自适应算法 KSVD算法

中圖分類(lèi)號(hào)： TN912
文獻(xiàn)標(biāo)識(shí)碼： A
文章編號(hào)： 0258-7998(2015)02-0072-03

Research on algorithm of speech compression and recovery based on adaptive compressed sensing

Mao Jing1，2，Yin Pengliang1，2，Ma Qi1，2，Zhang Binzhen1，2

1．National Key Laboratory for Electronic Measurement Technology，North University of China，Taiyuan 030051；China； 2．Key Laboratory of Instrumentation Science & Dynamic Measurement of Ministry of Education，North University of China， Taiyuan 030051，China

Abstract： According to the speech characteristics and traditional signal processing, this paper proposes that the adaptive algorithm is joined in compressed sensing, combined with redundant dictionary KSVD adaptive algorithm, adaptive observation matrix and SAMP reconstruction algorithm. By simulation analysis and comparison with the general compressed sensing on the average frame reconstruction SNR and relative error, it is ended to verify the superiority of adaptive compressed sensing algorithm.

Key words : compressed sensing；speech signal；adaptive algorithm

0 引言

　　傳統(tǒng)的奈奎斯特采樣定理要求采樣率高于信號(hào)最高頻率的兩倍，來(lái)實(shí)現(xiàn)信號(hào)的采集、壓縮和恢復(fù)。但隨著采集數(shù)據(jù)和頻率的急劇增加，壓縮過(guò)程中丟棄了絕大部分采集數(shù)據(jù)，只保留了小部分來(lái)恢復(fù)信號(hào)，導(dǎo)致增加大量不必要的存儲(chǔ)和傳輸設(shè)備。Donoho、Candès等人提出的壓縮感知理論很好地解決了這個(gè)難題[1-2]。壓縮感知將可稀疏的信號(hào)通過(guò)觀測(cè)從高階矩陣線性投影為低階，信號(hào)的采集和壓縮在此過(guò)程同時(shí)進(jìn)行，最后高概率精確地重建原始信號(hào)。在語(yǔ)音信號(hào)的處理過(guò)程中，模擬信號(hào)的高采樣率必然會(huì)產(chǎn)生海量的冗余數(shù)據(jù)，根據(jù)語(yǔ)音信號(hào)的可壓縮性，DCT變換域以及小波變換的稀疏特性，滿(mǎn)足壓縮感知理論的先驗(yàn)條件[3-4]。壓縮感知的理論包含三項(xiàng)內(nèi)容：選擇信號(hào)稀疏基，設(shè)計(jì)觀測(cè)矩陣和重構(gòu)原信號(hào)。其中信號(hào)是否具有稀疏性是前提條件；設(shè)計(jì)觀測(cè)矩陣是實(shí)現(xiàn)的重要部分，不僅關(guān)系到壓縮和采樣速率的快慢，而且影響重構(gòu)信號(hào)的質(zhì)量；重構(gòu)原始信號(hào)是壓縮感知理論的核心，決定著恢復(fù)原信號(hào)質(zhì)量的好壞。

1 語(yǔ)音自適應(yīng)壓縮感知的設(shè)計(jì)

　　信號(hào)在稀疏矩陣變換下越稀疏，重構(gòu)時(shí)所用的觀測(cè)數(shù)目就越少，重建信號(hào)的效率就越高。由于語(yǔ)音信號(hào)具有短時(shí)穩(wěn)態(tài)性，因此基于壓縮感知的語(yǔ)音處理要先對(duì)信號(hào)進(jìn)行編幀，然后利用隨機(jī)觀測(cè)矩陣對(duì)每幀信號(hào)壓縮采樣，最后逐幀恢復(fù)原信號(hào)。

　　實(shí)驗(yàn)仿真選用的一段女生聲音內(nèi)容為“hello，酷狗”，共有44 100個(gè)樣點(diǎn)，采樣率為22.05 kS/s[5-6]。

　　1.1 自適應(yīng)信號(hào)稀疏

　　DCT是語(yǔ)音信號(hào)處理中應(yīng)用較多的稀疏方法，具有很強(qiáng)的能量集中功能。但它屬于正交基變換，信號(hào)的稀疏變換唯一，正交基的選擇影響稀疏性，進(jìn)而影響信號(hào)重構(gòu)。冗余字典可以使信號(hào)呈現(xiàn)最佳稀疏，需要遵循各個(gè)基向量使輸入信號(hào)達(dá)到最佳稀疏的原則。基于這種原則，冗余字典是一定非正交并且冗余的矩陣，可以通過(guò)增加稀疏基的梳理來(lái)提高變換系統(tǒng)的冗余性，進(jìn)而增強(qiáng)信號(hào)逼近的靈活性，同時(shí)也提高了稀疏表示高階信號(hào)的能力。研究采用基于K-均值的K-SVD算法作為自適應(yīng)冗余字典對(duì)語(yǔ)音信號(hào)稀疏。K-SVD算法的方程表示為：

　　 $6W[NX__J3LX8NGK2{{Q@Y21.png$

　　KSVD算法的相對(duì)誤差和平均幀重構(gòu)信噪比(AFSNR)示意如圖1。KSVD算法的平均幀重構(gòu)信噪比如表1所示。

　　由表1的數(shù)據(jù)得到結(jié)論：經(jīng)過(guò)KSVD算法稀疏得到重構(gòu)語(yǔ)音的AFSNR隨幀長(zhǎng)和信號(hào)壓縮比的增加而增大。

　　1.2 自適應(yīng)觀測(cè)矩陣

　　觀測(cè)矩陣的設(shè)計(jì)原則是與稀疏矩陣盡可能不相干，且自身的列矩陣之間相互獨(dú)立。隨機(jī)觀測(cè)矩陣具有上述特點(diǎn)，如高斯矩陣等。在語(yǔ)音信號(hào)觀測(cè)投影時(shí)首先對(duì)信號(hào)進(jìn)行編幀，然后選擇與稀疏矩陣盡量不相干的觀測(cè)矩陣相乘，得到觀測(cè)值。

　　語(yǔ)音信號(hào)信號(hào)壓縮比值越大，恢復(fù)信號(hào)的質(zhì)量就越高；但觀測(cè)值越多，其恢復(fù)時(shí)間也越長(zhǎng)。根據(jù)語(yǔ)音信號(hào)每幀信息量的大小，選擇相應(yīng)的觀測(cè)數(shù)，即自適應(yīng)觀測(cè)；能量大的幀分配較多的觀測(cè)數(shù)，能量小的幀分配較小的觀測(cè)數(shù)，噪聲大部分存在于能量較小的幀，較少的觀測(cè)數(shù)能起到去噪的作用。

　　對(duì)已知的語(yǔ)音信號(hào)進(jìn)行自適應(yīng)觀測(cè)，得到的相對(duì)誤差和平均幀重構(gòu)信噪比（AFSNR）如圖2所示。

　　圖2的相對(duì)誤差表明，語(yǔ)音信號(hào)的幀長(zhǎng)對(duì)自適應(yīng)觀測(cè)的相對(duì)誤差值幾乎沒(méi)有影響，而壓縮比的值對(duì)信號(hào)相對(duì)誤差影響也較小，自適應(yīng)觀測(cè)的相對(duì)誤差集中在0.45左右。

　　自適應(yīng)觀測(cè)矩陣的重構(gòu)語(yǔ)音質(zhì)量的好壞與壓縮比有直接關(guān)系，但每幀信號(hào)的幀長(zhǎng)大小對(duì)重構(gòu)語(yǔ)音的影響微乎其微，如表2所示。

　　1.3 自適應(yīng)重構(gòu)算法

　　重構(gòu)信號(hào)是利用優(yōu)化求解的方法從觀測(cè)值和稀疏矩陣中重構(gòu)原信號(hào)。重建算法的設(shè)計(jì)應(yīng)遵循如下原則：算法應(yīng)使用較少的觀測(cè)值，并且能精確和快速地恢復(fù)原信號(hào)。重構(gòu)語(yǔ)音需要對(duì)每幀語(yǔ)音信號(hào)逐一進(jìn)行恢復(fù)。常用的信號(hào)重構(gòu)算法有BP(Basic pursuit)算法和OMP算法。

　　稀疏自適應(yīng)匹配追蹤算法（Sparse Adaptive Matching Pursuit，SAMP）是基于OMP算法基礎(chǔ)上提出的，SAMP算法的主要思路是：在未知稀疏度的情況下進(jìn)行信號(hào)重構(gòu)，然后利用逐步加大步長(zhǎng)的方法不斷增加所用的原子規(guī)模，并引入回溯思想，在每次加大步長(zhǎng)和選擇原子后，都會(huì)與上步的原子合并，最后從中選擇最佳的匹配原子。SAMP算法最大的優(yōu)點(diǎn)是在稀疏度未知的前提下能夠自適應(yīng)重構(gòu)原信號(hào)。

　　對(duì)已知語(yǔ)音信號(hào)采用SAMP算法進(jìn)行重構(gòu)，得到的相對(duì)誤差和平均幀重構(gòu)信噪比結(jié)果如圖3所示。

　　采用BP算法和OMP算法與SAMP算法進(jìn)行比較，AFSNR結(jié)果如圖4所示。

　　以重構(gòu)語(yǔ)音時(shí)間的角度評(píng)判，運(yùn)行觀測(cè)矩陣約為1 s，剩余全部為重構(gòu)時(shí)間，SAMP算法用時(shí)在10 s內(nèi)，OMP算法最少時(shí)間是10 s，而隨著壓縮比的增大，重構(gòu)時(shí)間最高可達(dá)400 s，BP算法時(shí)間更長(zhǎng)，最小為40 s，最高為2 500 s。因此使用SAMP算法會(huì)大大減小壓縮感知重構(gòu)語(yǔ)音的時(shí)間。

2 自適應(yīng)壓縮感知

　　語(yǔ)音自適應(yīng)壓縮感知的設(shè)計(jì)流程如圖5所示。

　　自適應(yīng)壓縮感知重構(gòu)語(yǔ)音平均幀重構(gòu)信噪比如表3所示，表3的數(shù)據(jù)表明，幀長(zhǎng)與信號(hào)壓縮比對(duì)重構(gòu)語(yǔ)音的質(zhì)量有積極影響，而且信號(hào)壓縮比值較小的條件下，恢復(fù)的語(yǔ)音質(zhì)量較高；在幀長(zhǎng)400時(shí)，壓縮比的大小對(duì)重構(gòu)語(yǔ)音影響不大，重構(gòu)的語(yǔ)音信號(hào)達(dá)到優(yōu)的級(jí)別，同時(shí)要遠(yuǎn)遠(yuǎn)高于KSVD算法、自適應(yīng)觀測(cè)矩陣和SAMP算法單獨(dú)重構(gòu)語(yǔ)音的質(zhì)量。3種自適應(yīng)算法組合一起能充分發(fā)揮各自的優(yōu)點(diǎn)，彌補(bǔ)了每個(gè)算法的缺陷：減少了KSVD所產(chǎn)生的噪聲，重構(gòu)語(yǔ)音的相對(duì)誤差成倍的降低，并且提高了重構(gòu)的AFSNR，使得語(yǔ)音的質(zhì)量更好，同時(shí)提高了信號(hào)稀疏度，降低了在重構(gòu)時(shí)計(jì)算的復(fù)雜度，從而進(jìn)一步減少重構(gòu)語(yǔ)音的時(shí)間。

　　如圖6所示，相對(duì)于普通壓縮感知，自適應(yīng)壓縮感知具有更好的重構(gòu)語(yǔ)音信號(hào)質(zhì)量，采樣恢復(fù)語(yǔ)音時(shí)間更短，而且在信號(hào)低壓縮的條件下，能恢復(fù)出良好的語(yǔ)音。

3 結(jié)論

　　本文通過(guò)將自適應(yīng)算法引入壓縮感知，結(jié)合自適應(yīng)冗余字典KSVD算法、自適應(yīng)觀測(cè)矩陣和SAMP重構(gòu)算法，提出自適應(yīng)壓縮感知，并分別進(jìn)行仿真分析，通過(guò)平均幀重構(gòu)信噪比、相對(duì)誤差，與普通壓縮感知進(jìn)行對(duì)比，驗(yàn)證了KSVD的稀疏的性能以及SAMP算法的優(yōu)勢(shì)。最后對(duì)自適應(yīng)壓縮感知進(jìn)行仿真分析，驗(yàn)證了將自適應(yīng)算法引入壓縮感知理論的可行性。

參考文獻(xiàn)

　　[1] CANDS E，WAKIN M.An introduction to compressive sampling[J].IEEE Signal Processing Magazine，2008，25(2)：21-30.

　　[2] CANDS E，ROMBERG J，TAO T.Robust uncertainty prin-ciples：exact signal reconstruction from highly incomplete frequency information[J].IEEE Transactions on Information Theory，2006，52(2)：489-509.

　　[3] 余愷，李元實(shí)，王智，等.基于壓縮感知的新型聲信號(hào)采集方法[J].儀器儀表學(xué)報(bào)，2011，33(1)：106-112.

　　[4] 周小星，王安娜，孫紅英，等.基于壓縮感知過(guò)程的語(yǔ)音增強(qiáng)[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版)，2011，51(9)：1234-1238.

　　[5] 羅武駿，陶文鳳，左加闊，等.自適應(yīng)語(yǔ)音壓縮感知方法[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版)，2012，42(6)：1027-1030.

　　[6] 張雪英.數(shù)字語(yǔ)音處理及MATLAB仿真[M].北京：電子工業(yè)出版社，2010.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容