123,123,123

SVD分解和离散小波域特征值量化的安全数字语音水印算法

2015年电子技术应用第12期

戴冬1，卫娟1，王磊2

1.河南机电高等专科学校计算机科学与技术系，河南新乡453003； 2.西南财经大学经济信息工程学院，四川成都610074

摘要： 针对传统数字语言水印算法鲁棒性较差、复杂度较高等问题，提出一种基于SVD分解和离散小波域特征值量化的安全水印算法。该算法以离散小波变换的特征值量化为基础，利用离散小波变换将每帧数字语音转化到小波域，再利用SVD奇异值分解计算近似系数特征值，而不是细节系数部分；最后，使用量化后的特征值嵌入水印比特位信息。实验结果表明，当量化步长和所选帧长较高时，该算法能有效抵御过滤攻击、加性高斯白噪声攻击、重采样攻击和剪切攻击，其中高斯白噪声攻击和剪切攻击的误码率几乎为0。相比其他优秀算法，该算法具有更好的鲁棒性。

關(guān)鍵詞： 数字语音水印近似系数离散小波特征值量化 SVD奇异值分解

中圖分類(lèi)號(hào)： TP391
文獻(xiàn)標(biāo)識(shí)碼： A
DOI：10.16157/j.issn.0258-7998.2015.12.025

中文引用格式： 戴冬，衛(wèi)娟，王磊. SVD分解和離散小波域特征值量化的安全數(shù)字語(yǔ)音水印算法[J].電子技術(shù)應(yīng)用，2015，41(12)：94-97，101.
英文引用格式： Dai Dong，Wei Juan，Wang Lei. Secure digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain[J].Application of Electronic Technique，2015，41(12)：94-97，101.

Secure digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain

Dai Dong1，Wei Juan1，Wang Lei2

1.Department of Computer Science & Technology，Henan Mechanical and Electrical Engineering College，Xinxiang 453003，China； 2.College of Economic Information Engineering，Southwestern University of Finance and Economics，Chengdu 610074，China

Abstract： As the low robustness and high complexity problem of traditional digital speech watermarking algorithm, a digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain is proposed. Eigenvalues quantization in discrete wavelet domain is the base of the proposed algorithm, firstly, discrete wavelet transform is used to transform every frame of the digital voice into wavelet domain; Then, SVD singular value decomposition is used to calculate the eigenvalues of approximate coefficient, rather than part of the detail coefficients; Finally, the watermark bits were embedded by quantization of the eigenvalue. The experimental results show that when quantization step size and the length of the selected frame are high, the algorithm can effectively resist filter attacks, additive white Gaussian noise attack, resampling and cropping attack, where the bit error rates of Gaussian white noise attacks and cut attacks are almost zero. Compared to other outstanding algorithms, the proposed algorithm has better robustness.

Key words : digital speech watermarking；approximate coefficient；discrete wavelet；eigenvalues quantization；SVD singular value decomposition

0 引言

近年來(lái)，社會(huì)上很多企業(yè)、組織和用戶通過(guò)互聯(lián)網(wǎng)對(duì)數(shù)字媒體進(jìn)行傳播，數(shù)字媒體的版權(quán)保護(hù)等安全問(wèn)題已成為社會(huì)關(guān)注的焦點(diǎn)。而數(shù)字水印是保護(hù)和監(jiān)控?cái)?shù)字媒體的最好方法之一^[1]。數(shù)字水印的思想是將水印信息直接嵌入到載體，同時(shí)不影響原載體的性能和使用價(jià)值^[2]，在版權(quán)保護(hù)、商標(biāo)隱藏和通信安全等方面應(yīng)用十分廣泛^[3]。如何在水印信息載入到載體后，保證載入后的宿主擁有盡可能多的原屬性、擴(kuò)大載入容量以及對(duì)外界攻擊的魯棒性是現(xiàn)代水印技術(shù)主要目標(biāo)^[4]。

數(shù)字水印以圖像水印和音頻水印最為常見(jiàn)，本文討論音頻水印。音頻水印可以分為變換域聽(tīng)覺(jué)屏蔽^[5，6]、相位調(diào)制^[7，8]和參數(shù)化建模^[9，10]等主要類(lèi)別。

文獻(xiàn)[7-8]利用一幀儲(chǔ)存所有的水印數(shù)據(jù)。在對(duì)數(shù)譜域的倒譜系數(shù)中嵌入水印信息，僅對(duì)不可聽(tīng)性具有一定魯棒性。

參數(shù)化建模利用極點(diǎn)濾波器（如自回歸模型）對(duì)語(yǔ)音信號(hào)進(jìn)行建模及嵌入水印，有線性預(yù)測(cè)編碼（Linear Predictive Coding，LPC）^[9]或線譜對(duì)系數(shù)（Line Spectrum Pair，LSP）間接修改或量化參數(shù)^[10]等算法。然而，該類(lèi)算法容易受到在語(yǔ)音壓縮期間或其后分流語(yǔ)音期間進(jìn)行壓縮攻擊。

雖然利用離散小波變換和奇異值分解技術(shù)嵌入水印^[11]并不是一個(gè)新的想法，但本文相比于其他文獻(xiàn)有其獨(dú)特之處，主要?jiǎng)?chuàng)新點(diǎn)如下：(1)本文的水印是嵌入在離散小波變換的近似系數(shù)中，而不是離散小波變換的細(xì)節(jié)系數(shù)。研究表明，將水印嵌入近似系數(shù)魯棒性更強(qiáng)；(2)本文主要討論的語(yǔ)音水印是一種盲算法，即這種算法在水印提取或水印檢測(cè)過(guò)程中不需要原始信號(hào)，增大了容量，提高了隱蔽性；(3)本文音頻水印的量化指數(shù)調(diào)制（Quantization Index Modulation，QIM）選擇簡(jiǎn)單，所需運(yùn)行時(shí)間更少。

1 分解技術(shù)

圖1顯示了單層離散小波變換(Discrete Wavelet Transformation，DWT)的一般過(guò)程，分別利用低通濾波器和高通濾波器將信號(hào)分解為近似系數(shù)（低頻部分）和細(xì)節(jié)系數(shù)（高頻部分），然后將其結(jié)果發(fā)給另一組低通濾波器和高通濾波器，作進(jìn)一步分解。

奇異值分解作用于對(duì)角矩陣，以最優(yōu)方式將信號(hào)分解為基本態(tài)。N×N的矩陣A奇異值分解如式(1)和式(2)。矩陣S的對(duì)角線元素是矩陣A的奇異值，按照σ(i)>σ(i+1)降序排列。矩陣U和矩陣V的縱列分別是A的左奇異向量和右奇異向量。

通常，矩陣S各元素的細(xì)微變化不會(huì)改變觀眾對(duì)信號(hào)質(zhì)量變化的感知，這個(gè)特點(diǎn)主要用于音頻水印。因此，水印信息可以被簡(jiǎn)單添加到對(duì)角矩陣S的奇異值中，同時(shí)不會(huì)嚴(yán)重影響信號(hào)的感知性或可聽(tīng)性^[11]。

2 提出的數(shù)字語(yǔ)音水印算法

2.1 嵌入過(guò)程

(1)將原始語(yǔ)音信號(hào)分成幀；

(2)對(duì)每幀進(jìn)行第一級(jí)離散小波變換，計(jì)算近似系數(shù)和細(xì)節(jié)系數(shù)；

(3)通過(guò)近似系數(shù)使用二維矩陣公式；

(4)對(duì)矩陣進(jìn)行奇異值分解，找到右特性向量V、奇異值S和左特性向量U；

(5)基于式(3)的每個(gè)特征值利用奇或偶調(diào)制函數(shù)嵌入水印，奇或偶調(diào)制函數(shù)能夠保存原始信號(hào)的直方圖，同時(shí)還能確保信號(hào)統(tǒng)計(jì)數(shù)據(jù)的改動(dòng)較小，因?yàn)樾薷陌l(fā)生在小范圍內(nèi)，宿主信號(hào)失真較少；

(6)運(yùn)用逆奇異值分解計(jì)算修正矩陣；

(7)將修正矩陣轉(zhuǎn)換為修正近似系數(shù)；

(8)細(xì)節(jié)系數(shù)和近似系數(shù)進(jìn)行逆小波變換，獲得修正框架；

(9)以修正框架為基礎(chǔ)重構(gòu)信號(hào)，得到有水印的語(yǔ)音信號(hào)。

2.2 提取過(guò)程

(1)利用同步位尋找水印的初始位置；

(2)將有水印的語(yǔ)音信號(hào)分成幀；

(3)對(duì)每幀進(jìn)行第一級(jí)離散小波變換，計(jì)算近似系數(shù)和細(xì)節(jié)系數(shù)；

(4)通過(guò)近似系數(shù)使用二維矩陣公式；

(5)對(duì)矩陣進(jìn)行奇異值分解，找到右特征向量V、奇異值S和左特征向量U；

(6)對(duì)每個(gè)特征值應(yīng)用逆奇或逆偶調(diào)制函數(shù)，提取水印，如式(4)所示：

3 實(shí)驗(yàn)結(jié)果與討論

3.1 本文算法的實(shí)驗(yàn)結(jié)果

本文采用模擬方法研究提出的數(shù)字語(yǔ)音水印的魯棒性、隱蔽性和容量，仿真實(shí)驗(yàn)在Intel i5雙核處理器、內(nèi)存為4.0G、2.93 GHz主頻、Windows7操作系統(tǒng)的筆記本電腦上進(jìn)行，使用的平臺(tái)為MATLAB2011b，實(shí)驗(yàn)材料為兩組語(yǔ)音數(shù)據(jù)。第一組采用交錯(cuò)正交幅度調(diào)制(SQAM)的6個(gè)信號(hào)，指數(shù)49～54，抽樣頻率44.1 kHz，平均時(shí)長(zhǎng)大約22 s，分辨率16 bit。第二組采用ATCOSIM語(yǔ)音語(yǔ)料庫(kù)的20個(gè)語(yǔ)音數(shù)據(jù)[12]，抽樣頻率32 kHz，分辨率12 bit，平均時(shí)長(zhǎng)3.8 s。圖2所示的二值水印標(biāo)志的尺寸為22×31，用于本文實(shí)驗(yàn)。

表1顯示了本文所提出盲數(shù)字語(yǔ)音水印的多種因素。分別運(yùn)用式(5)的誤碼率(BER)、位秒(BPS)、式(6)的信噪比(SNR)來(lái)測(cè)量本文算法的魯棒性、容量和隱蔽性：

式中，w是原始信號(hào)，是水印信號(hào)，是OX（XOR）運(yùn)算子，N是信號(hào)長(zhǎng)度。

表1給出了增加容量對(duì)隱蔽性的影響。嵌入原始數(shù)據(jù)的水印越多，失真就越大，進(jìn)而影響語(yǔ)音的隱蔽性。

表2 給出了不同量化步長(zhǎng)的誤碼率和信噪比?？梢钥闯?，量化步長(zhǎng)越少，有水印信號(hào)的隱蔽性越強(qiáng)。

表3給出了在不同攻擊之下的誤碼率?？梢钥闯?，帶通濾波器降低了一半的誤碼率，因?yàn)楹芏嗨”磺度氲皖l區(qū)域。當(dāng)加性高斯白噪聲的信噪比增加時(shí)，誤碼率隨之降低。

3.2 與其他算法的比較

本文的對(duì)比算法與文獻(xiàn)[5]和文獻(xiàn)[11]算法作比較，選擇的原因如下：在信號(hào)嵌入水印方面應(yīng)用類(lèi)似離散小波變換和奇異值分解的技術(shù)可以以相同的方式改變水印強(qiáng)度因子(Δ和α)，且這些技術(shù)都流行且簡(jiǎn)單。設(shè)置Δ=0.2，α=0.2。

表4從誤碼率和信噪比方面，對(duì)各算法的不同量化步長(zhǎng)進(jìn)行比較。可以看出，本文的平均誤碼率高于文獻(xiàn)[11]和文獻(xiàn)[5]的平均誤碼率，表現(xiàn)出了更強(qiáng)的魯棒性。另外，本文算法的信噪比也高于文獻(xiàn)[5]和文獻(xiàn)[11]，即本文算法的隱蔽性更強(qiáng)。

表5給出了本文算法與文獻(xiàn)[5]和文獻(xiàn)[11]在誤碼率方面的魯棒性表現(xiàn)，測(cè)試了5種不同情況，包括無(wú)攻擊、添加高斯白噪聲使信號(hào)SNR為35 dB、低通濾波使截止頻率為22 kHz、隨機(jī)設(shè)置嵌入水印和信號(hào)重采樣然后恢復(fù)。當(dāng)處于這些不同攻擊下，本文算法的魯棒性更強(qiáng)，這是因?yàn)樗∈乔度胝Z(yǔ)音近似系數(shù)部分，該部分的能量多于語(yǔ)音細(xì)節(jié)系數(shù)部分的能量。

圖3是各算法在不同攻擊下提取出來(lái)的水印標(biāo)志，為了進(jìn)行公平有效的比較，所有條件完全相同?？梢钥闯?，與文獻(xiàn)[5]和文獻(xiàn)[11]的算法相比，運(yùn)用本文算法所提取出來(lái)的水印最為清晰，這也印證了表4和表5的數(shù)據(jù)結(jié)論。

表6為各算法嵌入和提取水印的運(yùn)行時(shí)間，可以看出本文算法明顯快于其他兩種算法，這是由于本文在量化特征值方面只修改了較小范圍的統(tǒng)計(jì)數(shù)據(jù)，而且嵌入的系數(shù)部分是離散小波域的近似系數(shù)部分。而文獻(xiàn)[5]和文獻(xiàn)[11]均需要原始信號(hào)，水印嵌入在細(xì)節(jié)系數(shù)部分。

3.3 信噪比、誤碼率與幀長(zhǎng)、量化步長(zhǎng)的關(guān)系

實(shí)驗(yàn)中幀長(zhǎng)和量化步長(zhǎng)的設(shè)置直接關(guān)系實(shí)驗(yàn)結(jié)果，故這節(jié)討論信噪比、誤碼率與幀長(zhǎng)、量化步長(zhǎng)關(guān)系。

圖4給出了信噪比和幀長(zhǎng)之間的關(guān)系，從圖中可以看出，幀尺寸增大時(shí)，信噪比也會(huì)隨之增加，其原因在于水印嵌入時(shí)，水印的語(yǔ)音信號(hào)失真較少。此外，選擇較少的量化步長(zhǎng)會(huì)提高語(yǔ)音信號(hào)的質(zhì)量。

圖5給出了信噪比和量化步長(zhǎng)之間的關(guān)系，很明顯，增加量化步長(zhǎng)會(huì)減少信噪比，信噪比的減少會(huì)降低語(yǔ)音信號(hào)的質(zhì)量。而在量化步長(zhǎng)非常小時(shí)，誤碼率并非都是零，較小的量化步長(zhǎng)不適用于較大的幀尺寸，因?yàn)檫@樣的量化步長(zhǎng)無(wú)法改變特征值，會(huì)在水印提取過(guò)程中產(chǎn)生錯(cuò)誤。

圖6給出了處于不同攻擊下誤碼率與量化步長(zhǎng)之間的關(guān)系。從圖中可以看出，量化步長(zhǎng)增加時(shí)，誤碼率會(huì)降低。因此，選擇較高的量化步長(zhǎng)會(huì)提高魯棒性，但也會(huì)降低質(zhì)量。圖6還表明，選擇較高的量化步長(zhǎng)并不會(huì)提高使用低通濾波器的魯棒性。使用低通濾波器時(shí)，小波的許多能量將會(huì)喪失，這會(huì)直接影響水印載體的特征值。

4 結(jié)論與展望

本文提出了一種盲數(shù)字語(yǔ)音水印技術(shù)，在離散小波變換域進(jìn)行特征值量化。實(shí)驗(yàn)表明，當(dāng)量化步長(zhǎng)和所選幀長(zhǎng)較高時(shí)，該算法能夠抵御多種攻擊，魯棒性很強(qiáng)，否則，水印就會(huì)減弱。而且，將水印嵌入細(xì)節(jié)系數(shù)中能夠提高隱蔽性，但也會(huì)降低魯棒性。未來(lái)工作主要研究自適應(yīng)量化步長(zhǎng)和同步技術(shù)，進(jìn)一步改善水印提取過(guò)程。

參考文獻(xiàn)

[1] PHADIKAR A.Multibit quantization index modulation：A high-rate robust data-hiding method[J].Journal of King Saud University Computer and Information Sciences，2013，25(2)：163-171.

[2] 王新宇，詹永照.構(gòu)造頂點(diǎn)分布特征的三維模型數(shù)字水印算法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào)，2014，26(2)：272-279.

[3] 尹浩，林闖，邱鋒，等.數(shù)字水印技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展，2005，42(7)：1093-1099.

[4] 秦樹(shù)東.音頻數(shù)字水印算法的研究[D].南京：南京郵電大學(xué)，2014.

[5] 王飛.基于SVD和預(yù)測(cè)錯(cuò)誤擴(kuò)展的數(shù)字音頻水印算法研究[D].長(zhǎng)沙：湖南大學(xué)，2014.

[6] 謝斌，肖玲玲，吳君欽.一種抗剪切的DWT域多重音頻數(shù)字水印算法[J].電子技術(shù)應(yīng)用，2010，36(4)：138-140.

[7] GOPALAN K.A unified audio and image steganography by spectrum modification[C].Industrial Technology.ICIT 2009.IEEE International Conference on.IEEE，2009：1-5.

[8] 侯劍，付永生，郭愷.基于相位調(diào)制的立體聲音頻數(shù)字水印[J].電子技術(shù)應(yīng)用，2006，32(6)：49-51.

[9] 高裴裴，朱耀庭，張世濤，等.基于數(shù)字水印載體的圖像語(yǔ)音判讀方法研究[J].激光與紅外，2012，42(10)：1187-1190.

[10] Nematollahi Mohammad Ali，Al-Haddad S A R.An overview of digital speech watermarking[J].Int.J.Speech Technol.2013，17(8)：1-18.

[11] LEI B，SOON I Y，LI Z.A robust audio watermarking scheme based on lifting wavelet transform and singular value decomposition[M].Berlin：Digital Forensics and Watermarking，2012：1985-2001.

[12] HOFBAUER K，PETRIK S，HERING H.The ATCOSIM corpus of non-prompted clean air traffic control speech[J].Sixth International Conference on Language Resources & Evaluation Lrec，2008，24(1)：2147-2152.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容