《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應(yīng)用 > SVD分解和離散小波域特征值量化的安全數(shù)字語音水印算法
SVD分解和離散小波域特征值量化的安全數(shù)字語音水印算法
2015年電子技術(shù)應(yīng)用第12期
戴 冬1,衛(wèi) 娟1,王 磊2
1.河南機電高等專科學校 計算機科學與技術(shù)系,河南 新鄉(xiāng)453003; 2.西南財經(jīng)大學 經(jīng)濟信息工程學院,四川 成都610074
摘要: 針對傳統(tǒng)數(shù)字語言水印算法魯棒性較差、復(fù)雜度較高等問題,提出一種基于SVD分解和離散小波域特征值量化的安全水印算法。該算法以離散小波變換的特征值量化為基礎(chǔ),利用離散小波變換將每幀數(shù)字語音轉(zhuǎn)化到小波域,再利用SVD奇異值分解計算近似系數(shù)特征值,而不是細節(jié)系數(shù)部分;最后,使用量化后的特征值嵌入水印比特位信息。實驗結(jié)果表明,當量化步長和所選幀長較高時,該算法能有效抵御過濾攻擊、加性高斯白噪聲攻擊、重采樣攻擊和剪切攻擊,其中高斯白噪聲攻擊和剪切攻擊的誤碼率幾乎為0。相比其他優(yōu)秀算法,該算法具有更好的魯棒性。
中圖分類號: TP391
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2015.12.025

中文引用格式: 戴冬,衛(wèi)娟,王磊. SVD分解和離散小波域特征值量化的安全數(shù)字語音水印算法[J].電子技術(shù)應(yīng)用,2015,41(12):94-97,101.
英文引用格式: Dai Dong,Wei Juan,Wang Lei. Secure digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain[J].Application of Electronic Technique,2015,41(12):94-97,101.
Secure digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain
Dai Dong1,Wei Juan1,Wang Lei2
1.Department of Computer Science & Technology,Henan Mechanical and Electrical Engineering College,Xinxiang 453003,China; 2.College of Economic Information Engineering,Southwestern University of Finance and Economics,Chengdu 610074,China
Abstract: As the low robustness and high complexity problem of traditional digital speech watermarking algorithm, a digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain is proposed. Eigenvalues quantization in discrete wavelet domain is the base of the proposed algorithm, firstly, discrete wavelet transform is used to transform every frame of the digital voice into wavelet domain; Then, SVD singular value decomposition is used to calculate the eigenvalues of approximate coefficient, rather than part of the detail coefficients; Finally, the watermark bits were embedded by quantization of the eigenvalue. The experimental results show that when quantization step size and the length of the selected frame are high, the algorithm can effectively resist filter attacks, additive white Gaussian noise attack, resampling and cropping attack, where the bit error rates of Gaussian white noise attacks and cut attacks are almost zero. Compared to other outstanding algorithms, the proposed algorithm has better robustness.
Key words : digital speech watermarking;approximate coefficient;discrete wavelet;eigenvalues quantization;SVD singular value decomposition

  

0 引言

    近年來,社會上很多企業(yè)、組織和用戶通過互聯(lián)網(wǎng)對數(shù)字媒體進行傳播,數(shù)字媒體的版權(quán)保護等安全問題已成為社會關(guān)注的焦點。而數(shù)字水印是保護和監(jiān)控數(shù)字媒體的最好方法之一[1]。數(shù)字水印的思想是將水印信息直接嵌入到載體,同時不影響原載體的性能和使用價值[2],在版權(quán)保護、商標隱藏和通信安全等方面應(yīng)用十分廣泛[3]。如何在水印信息載入到載體后,保證載入后的宿主擁有盡可能多的原屬性、擴大載入容量以及對外界攻擊的魯棒性是現(xiàn)代水印技術(shù)主要目標[4]。

    數(shù)字水印以圖像水印和音頻水印最為常見,本文討論音頻水印。音頻水印可以分為變換域聽覺屏蔽[5,6]、相位調(diào)制[7,8]和參數(shù)化建模[9,10]等主要類別。

    文獻[7-8]利用一幀儲存所有的水印數(shù)據(jù)。在對數(shù)譜域的倒譜系數(shù)中嵌入水印信息,僅對不可聽性具有一定魯棒性。

    參數(shù)化建模利用極點濾波器(如自回歸模型)對語音信號進行建模及嵌入水印,有線性預(yù)測編碼(Linear Predictive Coding,LPC)[9]或線譜對系數(shù)(Line Spectrum Pair,LSP)間接修改或量化參數(shù)[10]等算法。然而,該類算法容易受到在語音壓縮期間或其后分流語音期間進行壓縮攻擊。

    雖然利用離散小波變換和奇異值分解技術(shù)嵌入水印[11]并不是一個新的想法,但本文相比于其他文獻有其獨特之處,主要創(chuàng)新點如下:(1)本文的水印是嵌入在離散小波變換的近似系數(shù)中,而不是離散小波變換的細節(jié)系數(shù)。研究表明,將水印嵌入近似系數(shù)魯棒性更強;(2)本文主要討論的語音水印是一種盲算法,即這種算法在水印提取或水印檢測過程中不需要原始信號,增大了容量,提高了隱蔽性;(3)本文音頻水印的量化指數(shù)調(diào)制(Quantization Index Modulation,QIM)選擇簡單,所需運行時間更少。

1 分解技術(shù)

    圖1顯示了單層離散小波變換(Discrete Wavelet Transformation,DWT)的一般過程,分別利用低通濾波器和高通濾波器將信號分解為近似系數(shù)(低頻部分)和細節(jié)系數(shù)(高頻部分),然后將其結(jié)果發(fā)給另一組低通濾波器和高通濾波器,作進一步分解。

wl1-t1.gif

    奇異值分解作用于對角矩陣,以最優(yōu)方式將信號分解為基本態(tài)。N×N的矩陣A奇異值分解如式(1)和式(2)。矩陣S的對角線元素是矩陣A的奇異值,按照σ(i)>σ(i+1)降序排列。矩陣U和矩陣V的縱列分別是A的左奇異向量和右奇異向量。

    wl1-gs1-2.gif

    通常, 矩陣S各元素的細微變化不會改變觀眾對信號質(zhì)量變化的感知,這個特點主要用于音頻水印。因此,水印信息可以被簡單添加到對角矩陣S的奇異值中,同時不會嚴重影響信號的感知性或可聽性[11]。

2 提出的數(shù)字語音水印算法

2.1 嵌入過程

    (1)將原始語音信號分成幀;

    (2)對每幀進行第一級離散小波變換,計算近似系數(shù)和細節(jié)系數(shù);

    (3)通過近似系數(shù)使用二維矩陣公式;

    (4)對矩陣進行奇異值分解,找到右特性向量V、奇異值S和左特性向量U;

    (5)基于式(3)的每個特征值利用奇或偶調(diào)制函數(shù)嵌入水印,奇或偶調(diào)制函數(shù)能夠保存原始信號的直方圖,同時還能確保信號統(tǒng)計數(shù)據(jù)的改動較小,因為修改發(fā)生在小范圍內(nèi),宿主信號失真較少;

wl1-gs3.gif

    (6)運用逆奇異值分解計算修正矩陣;

    (7)將修正矩陣轉(zhuǎn)換為修正近似系數(shù);

    (8)細節(jié)系數(shù)和近似系數(shù)進行逆小波變換,獲得修正框架;

    (9)以修正框架為基礎(chǔ)重構(gòu)信號,得到有水印的語音信號。

2.2 提取過程

    (1)利用同步位尋找水印的初始位置;

    (2)將有水印的語音信號分成幀;

    (3)對每幀進行第一級離散小波變換,計算近似系數(shù)和細節(jié)系數(shù);

    (4)通過近似系數(shù)使用二維矩陣公式;

    (5)對矩陣進行奇異值分解,找到右特征向量V、奇異值S和左特征向量U;

    (6)對每個特征值應(yīng)用逆奇或逆偶調(diào)制函數(shù),提取水印,如式(4)所示:

wl1-gs4.gif

3 實驗結(jié)果與討論

3.1 本文算法的實驗結(jié)果

    本文采用模擬方法研究提出的數(shù)字語音水印的魯棒性、隱蔽性和容量,仿真實驗在Intel i5雙核處理器、內(nèi)存為4.0G、2.93 GHz主頻、Windows7操作系統(tǒng)的筆記本電腦上進行,使用的平臺為MATLAB2011b,實驗材料為兩組語音數(shù)據(jù)。wl1-t2.gif第一組采用交錯正交幅度調(diào)制(SQAM)的6個信號,指數(shù)49~54,抽樣頻率44.1 kHz,平均時長大約22 s,分辨率16 bit。第二組采用ATCOSIM語音語料庫的20個語音數(shù)據(jù)[12],抽樣頻率32 kHz,分辨率12 bit,平均時長3.8 s。圖2所示的二值水印標志的尺寸為22×31,用于本文實驗。

    表1顯示了本文所提出盲數(shù)字語音水印的多種因素。分別運用式(5)的誤碼率(BER)、位秒(BPS)、式(6)的信噪比(SNR)來測量本文算法的魯棒性、容量和隱蔽性:

wl1-gs5-6.gif

wl1-b1.gif式中,w是原始信號,wl1-b1-s1.gif是水印信號,wl1-b1-s2.gif是OX(XOR)運算子,N是信號長度。

    表1給出了增加容量對隱蔽性的影響。嵌入原始數(shù)據(jù)的水印越多,失真就越大,進而影響語音的隱蔽性。

    表2 給出了不同量化步長的誤碼率和信噪比。可以看出,量化步長越少,有水印信號的隱蔽性越強。

wl1-b2.gif

    表3給出了在不同攻擊之下的誤碼率??梢钥闯觯瑤V波器降低了一半的誤碼率,因為很多水印被嵌入低頻區(qū)域。當加性高斯白噪聲的信噪比增加時,誤碼率隨之降低。

wl1-b3.gif

3.2 與其他算法的比較

    本文的對比算法與文獻[5]和文獻[11]算法作比較,選擇的原因如下:在信號嵌入水印方面應(yīng)用類似離散小波變換和奇異值分解的技術(shù)可以以相同的方式改變水印強度因子(Δ和α),且這些技術(shù)都流行且簡單。設(shè)置Δ=0.2,α=0.2。

    表4從誤碼率和信噪比方面,對各算法的不同量化步長進行比較??梢钥闯觯疚牡钠骄`碼率高于文獻[11]和文獻[5]的平均誤碼率,表現(xiàn)出了更強的魯棒性。另外,本文算法的信噪比也高于文獻[5]和文獻[11],即本文算法的隱蔽性更強。

wl1-b4.gif

    表5給出了本文算法與文獻[5]和文獻[11]在誤碼率方面的魯棒性表現(xiàn),測試了5種不同情況,包括無攻擊、添加高斯白噪聲使信號SNR為35 dB、低通濾波使截止頻率為22 kHz、隨機設(shè)置嵌入水印和信號重采樣然后恢復(fù)。當處于這些不同攻擊下,本文算法的魯棒性更強,這是因為水印是嵌入語音近似系數(shù)部分,該部分的能量多于語音細節(jié)系數(shù)部分的能量。

wl1-b5.gif

    圖3是各算法在不同攻擊下提取出來的水印標志,為了進行公平有效的比較,所有條件完全相同??梢钥闯觯c文獻[5]和文獻[11]的算法相比,運用本文算法所提取出來的水印最為清晰,這也印證了表4和表5的數(shù)據(jù)結(jié)論。

wl1-t3.gif

    表6為各算法嵌入和提取水印的運行時間,可以看出本文算法明顯快于其他兩種算法,這是由于本文在量化特征值方面只修改了較小范圍的統(tǒng)計數(shù)據(jù),而且嵌入的系數(shù)部分是離散小波域的近似系數(shù)部分。而文獻[5]和文獻[11]均需要原始信號,水印嵌入在細節(jié)系數(shù)部分。

wl1-b6.gif

3.3 信噪比、誤碼率與幀長、量化步長的關(guān)系

    實驗中幀長和量化步長的設(shè)置直接關(guān)系實驗結(jié)果,故這節(jié)討論信噪比、誤碼率與幀長、量化步長關(guān)系。

    圖4給出了信噪比和幀長之間的關(guān)系,從圖中可以看出,幀尺寸增大時,信噪比也會隨之增加,其原因在于水印嵌入時,水印的語音信號失真較少。此外,選擇較少的量化步長會提高語音信號的質(zhì)量。

wl1-t4.gif

    圖5給出了信噪比和量化步長之間的關(guān)系,很明顯,增加量化步長會減少信噪比,信噪比的減少會降低語音信號的質(zhì)量。而在量化步長非常小時,誤碼率并非都是零,較小的量化步長不適用于較大的幀尺寸,因為這樣的量化步長無法改變特征值,會在水印提取過程中產(chǎn)生錯誤。

wl1-t5.gif

    圖6給出了處于不同攻擊下誤碼率與量化步長之間的關(guān)系。從圖中可以看出,量化步長增加時,誤碼率會降低。因此,選擇較高的量化步長會提高魯棒性,但也會降低質(zhì)量。圖6還表明,選擇較高的量化步長并不會提高使用低通濾波器的魯棒性。使用低通濾波器時,小波的許多能量將會喪失,這會直接影響水印載體的特征值。

wl1-t6.gif

4 結(jié)論與展望

    本文提出了一種盲數(shù)字語音水印技術(shù),在離散小波變換域進行特征值量化。實驗表明,當量化步長和所選幀長較高時,該算法能夠抵御多種攻擊,魯棒性很強,否則,水印就會減弱。而且,將水印嵌入細節(jié)系數(shù)中能夠提高隱蔽性,但也會降低魯棒性。未來工作主要研究自適應(yīng)量化步長和同步技術(shù),進一步改善水印提取過程。

參考文獻

[1] PHADIKAR A.Multibit quantization index modulation:A high-rate robust data-hiding method[J].Journal of King Saud University Computer and Information Sciences,2013,25(2):163-171.

[2] 王新宇,詹永照.構(gòu)造頂點分布特征的三維模型數(shù)字水印算法[J].計算機輔助設(shè)計與圖形學學報,2014,26(2):272-279.

[3] 尹浩,林闖,邱鋒,等.數(shù)字水印技術(shù)綜述[J].計算機研究與發(fā)展,2005,42(7):1093-1099.

[4] 秦樹東.音頻數(shù)字水印算法的研究[D].南京:南京郵電大學,2014.

[5] 王飛.基于SVD和預(yù)測錯誤擴展的數(shù)字音頻水印算法研究[D].長沙:湖南大學,2014.

[6] 謝斌,肖玲玲,吳君欽.一種抗剪切的DWT域多重音頻數(shù)字水印算法[J].電子技術(shù)應(yīng)用,2010,36(4):138-140.

[7] GOPALAN K.A unified audio and image steganography by spectrum modification[C].Industrial Technology.ICIT 2009.IEEE International Conference on.IEEE,2009:1-5.

[8] 侯劍,付永生,郭愷.基于相位調(diào)制的立體聲音頻數(shù)字水印[J].電子技術(shù)應(yīng)用,2006,32(6):49-51.

[9] 高裴裴,朱耀庭,張世濤,等.基于數(shù)字水印載體的圖像語音判讀方法研究[J].激光與紅外,2012,42(10):1187-1190.

[10] Nematollahi Mohammad Ali,Al-Haddad S A R.An overview of digital speech watermarking[J].Int.J.Speech Technol.2013,17(8):1-18.

[11] LEI B,SOON I Y,LI Z.A robust audio watermarking scheme based on lifting wavelet transform and singular value decomposition[M].Berlin:Digital Forensics and Watermarking,2012:1985-2001.

[12] HOFBAUER K,PETRIK S,HERING H.The ATCOSIM corpus of non-prompted clean air traffic control speech[J].Sixth International Conference on Language Resources & Evaluation Lrec,2008,24(1):2147-2152.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。