摘 要: 介紹了水印技術(shù)的定義及基本框架,并對其理論基礎(chǔ)和評價標準進行了闡述,對數(shù)字水印的各種算法進行了分類研究與深入分析,并對不同視頻水印嵌入和提取方案進行了比較,同時分析了人類視覺系統(tǒng)對水印可見性的影響,最后指出了數(shù)字水印的應(yīng)用領(lǐng)域及今后的研究方向。
關(guān)鍵詞: 數(shù)字水?。?a class="innerlink" href="http://ihrv.cn/tags/版權(quán)保護" title="版權(quán)保護" target="_blank">版權(quán)保護;水印算法;多媒體安全
隨著網(wǎng)絡(luò)和多媒體技術(shù)的發(fā)展,越來越多的媒體文件(包括圖像、音頻和視頻)轉(zhuǎn)化成了數(shù)字形式,并廣泛地分布在網(wǎng)絡(luò)上。因此,知識產(chǎn)權(quán)的保護問題就成為了如今的關(guān)鍵問題。數(shù)字水?。―igital Watermarking)技術(shù)[1]的提出正是為了識別數(shù)字產(chǎn)品的所有權(quán)及分布途徑問題。作為信息隱藏技術(shù)研究領(lǐng)域的一個重要分支,數(shù)字水印可以實現(xiàn)多媒體版權(quán)保護和信息完整性驗證,目前也正成為信息安全領(lǐng)域的一個研究熱點[2-3]。
1 數(shù)字水印的定義與框架模型
數(shù)字水印技術(shù)是將一個不可見的(諸如版權(quán)信息或驗證信息等)標志嵌入到數(shù)字媒體中,用于證明作品的所有權(quán),起到版權(quán)保護的作用。該標志具有不可感知性,能抵抗試圖破壞或者移除水印信息的惡意攻擊。
根據(jù)信號處理理論,數(shù)字水印可以看作在載體對象的背景下,附加一個類似水印的弱信號。根據(jù)數(shù)字通信理論,數(shù)字水印可以理解為應(yīng)用擴頻技術(shù)等通信手段,在一個寬帶信道(載體)上傳輸一個窄帶信號(水印)。一般地,數(shù)字水印系統(tǒng)包括水印嵌入器和水印檢測器[4]。水印嵌入器需要嵌入原始水印信息(密鑰信息)和含水印的數(shù)字作品(載體作品),其輸出結(jié)果為含水印的數(shù)字產(chǎn)品。水印檢測器需要嵌入含水印的數(shù)字產(chǎn)品。當提取水印時,水印檢測器根據(jù)需要確定是否包含原始載體或原始水印信息。圖1為數(shù)字水印系統(tǒng)的基本框架圖[4]。可以定義為九元體(M,I,W,K,G,Em,At,D,Ex),分別定義如下:
2 數(shù)字視頻水印理論基礎(chǔ)
2.1 數(shù)字視頻水印分類
(1)按照載體類型可以分為基于壓縮視頻的水印算法和基于原始視頻的水印算法。
(2)按照水印嵌入域可以分為時空域水印算法和變換域(頻域)水印算法。
(3)按照檢測時是否需要原始視頻可以分為盲水印和非盲水印。
(4)按照水印特性可以分為魯棒水印、脆弱水印與半脆弱水印。
2.2 數(shù)字視頻水印特征
(1)不可感知性(Imperceptibility)是指用來辨別信號被處理前后的相似性。
?。?)魯棒性(Robustness)是指作品在遭受了各種信號處理和各種攻擊后,數(shù)字水印的可提取性或可檢測性。評價數(shù)字水印魯棒性的性能包括脆弱性、有效性和安全性。
(3)容量(Capacity)是指在單位時間內(nèi)或在一個數(shù)字產(chǎn)品中最多可以嵌入的水印量。
三者之間是相互制約的,在水印系統(tǒng)中不能同時達到最優(yōu)性,只能根據(jù)實際需要在三者中進行折中,其關(guān)系如圖2所示。
3 數(shù)字視頻水印技術(shù)評價
3.1 數(shù)字視頻水印攻擊
所謂“攻擊”是指對含水印的數(shù)字作品執(zhí)行各種操作,以此來削弱、移除或破壞水印信息,其目的是篡改水印信息,使水印信號檢測系統(tǒng)無法提取或檢測水印信號。水印攻擊的分類如下:
?。?)簡單攻擊,又稱為波形攻擊或噪聲攻擊。它通過對嵌入水印數(shù)據(jù)(含水印的作品)的載體進行操作,以此降低嵌入水印的強度,導(dǎo)致提取水印信息時發(fā)生錯誤,甚至無法檢測到水印信息。
?。?)同步攻擊,又稱為禁止提取攻擊。它的目的在于破壞載體數(shù)據(jù)和水印信息的同步性,從而使得水印的相關(guān)檢測失效或無法提取嵌入的水印。
?。?)分析攻擊,也稱為計算攻擊或去除攻擊。在水印的嵌入階段和檢測階段,使用特殊的方法來移除或修改載體中的水印,通過分析水印算法中的數(shù)據(jù),估算載體中的水印信息并分離出水印,使提取失敗,以達到篡改的目的。
?。?)解釋攻擊,又稱為IBM水印攻擊。當檢測到水印信息時,攻擊算法會捏造出很多偽源信息或偽水印信息,以此來混淆真?zhèn)巍?br />
3.2 數(shù)字視頻水印性能評估
對水印系統(tǒng)的評價包括主觀的評價標準和客觀的評價標準[5]。主觀測試方面,由于不同的人經(jīng)歷不同,對水印圖像的測試結(jié)果差異就會很大,測試及評估結(jié)果不是很有效,所以在實際的測試中,往往采用定量的分析方法。
客觀測試方面,常用的標準包括:
?。?)嵌入水印信息量:當使用同一種水印算法時,預(yù)嵌入的水印量越多,水印的魯棒性就越好。
?。?)嵌入水印強度:預(yù)嵌入的水印強度越強,水印的魯棒性就越好,但會增加水印的不可見性。
?。?)宿主信號信息量和特征:宿主信號信息越大,特征越明顯,水印系統(tǒng)的魯棒性就越強。
?。?)密鑰信息:為了防止攻擊者采用窮舉法破譯,這就需要有足夠大的密鑰空間(密鑰信息值的最大范圍),因此應(yīng)將密碼學(xué)原理引入到水印系統(tǒng)中。
一個公平客觀的水印性能評估系統(tǒng),即使輸入的數(shù)據(jù)測試集不同,得到的測試結(jié)果也應(yīng)該是相似的。為了在統(tǒng)計上計算結(jié)果的有效性,在測試過程中應(yīng)采用不用的密鑰信息和水印信號。通常使用以下評估參數(shù)進行測試:
(1)峰值信噪比PSNR:用來衡量嵌入水印的能力,值越高,透明性越好。假設(shè):I(x,y)表示原始圖像,I′表示含水印圖像,M、N表示圖像尺寸,I(i,j)表示原始圖像中任意一點,max(I)表示信號的峰值,取對數(shù),可將PSNR計算出的值換算成標準單位(即dB)。公式如下:
三種水印嵌入/提取方案及其比較如表1所示。
4.2 基于原始視頻的水印算法
原始視頻水印是指視頻數(shù)據(jù)不經(jīng)過壓縮,直接操作,與視頻的擴展名無關(guān)。在水印的嵌入和提取的過程中,根據(jù)是否需要變換宿主信號,將水印細分為空間域水印和變換域水印。
(1)空間域水印
是指直接將水印信息嵌入到未壓縮視頻數(shù)據(jù)的亮度分量或色度分量中,優(yōu)點是易于操作且空間復(fù)雜度低,但魯棒性和不可感知性較差。
Kalker等[7]人提出了一種基于廣播通信監(jiān)控理論的JAWS(Just Another Watermarking System)水印算法。該算法的思想是將視頻流看作連續(xù)的靜止圖像,將相同的水印信息嵌入到連續(xù)的視頻幀中。該算法的缺點是由于水印信息分布不均勻,因此不利于水印信息的提取,對于MPEG-2視頻來說,魯棒性差。
Hartung等[8]人提出了一種基于擴頻通信技術(shù)的空間域水印算法。嵌入水印信息時,將視頻序列看成是空間上的一維信號,使用擴頻通信技術(shù)將水印信息變?yōu)閭坞S機序列,嵌入到原視頻序列中,輸出含水印的視頻作品;提取水印時,計算偽隨機序列和含水印信息的視頻作品之間的相關(guān)性。
?。?)變換域水印
是指水印的嵌入和提取是在原始視頻的某個變換域中進行的,常用的變換方法包括離散余弦變換DCT(Discrete Cosine Transform)、離散傅里葉變換DFT(Discrete Fourier Transform)和離散小波變換DWT(Discrete Wavelet Transform)。
Deguillaume[9]提出在DFT域中,將視頻序列看成是連續(xù)、無交叉、固定長度的幀序列,對于每個幀序列執(zhí)行相同的水印信息嵌入和提取。
Chen等[10]人提出了一種基于DCT域的水印算法:首先對幀序列進行二維DCT變換,然后提取DC系數(shù)組成一維矩陣并加密,再進行一維DCT變換,選擇每一小組最后一個高頻系數(shù)嵌入水印,令這個系數(shù)為B′jn,則B′jn=B′jn+αWjn。該水印算法抵抗攻擊的能力強,但僅能檢測到水印信息,而不能完整提取水印。
Swanson等[11]人提出一種基于3-D小波變換的視頻水印算法,將視頻序列看作3-D信號,并將視頻序列按場景分類,可以充分考慮時域的冗余。利用HVS掩蔽模型的特性,確保在每個序列幀中,水印信息具有魯棒性和不可感知性。
4.3 基于壓縮視頻的水印算法
(1)嵌入DCT系數(shù)
Chung等[12]人將水印信息嵌入到I幀的亮度系數(shù)中。首先產(chǎn)生一個與I幀維數(shù)相同、含有整數(shù){-1,1}的偽隨機噪聲圖案W(x,y)。將水印信息調(diào)制為擴頻水印信號,并進行適當?shù)目s放,再將擴頻水印信號分成8×8塊,做DCT變換;然后將壓縮視頻流中的I幀VLC進行解碼,得到8×8塊的DCT系數(shù),將每塊水印信號的DCT直流分量加到與I幀亮度相同位置的塊DCT直流分量上。
Biswass等[13]人將灰度圖像水印嵌入到DCT系數(shù)中,先對壓縮視頻流進行部分解碼,采用水印圖像分層思想和自適應(yīng)水印嵌入方式,提高了算法的魯棒性和適用性。其嵌入過程如圖4所示。
Noorkami等[14]人利用H.264視頻壓縮標準的特點提出了一種新穎的、復(fù)雜性低的H.264水印算法,該方法根據(jù)4×4塊的DC系數(shù)產(chǎn)生公鑰,水印嵌入到量化之后的AC系數(shù)中,該系數(shù)的選擇由版權(quán)擁有者的密鑰來控制。
(2)嵌入運動矢量
Jordan等[15]人提出利用運動矢量進行水印信息嵌入的MPEG算法,此算法通過對運動矢量作微小的修正,使運動矢量的某個分量的奇偶性與預(yù)嵌入的水印信息相聯(lián)系,計算復(fù)雜度可以忽略,對于幀比特率的影響也較小。Wang等[16]人提出在P幀的運動矢量中嵌入水印,此算法對視頻質(zhì)量及比特率影響較小,能減少運動估計的時間。
5 人類視覺系統(tǒng)概述
根據(jù)人類視覺系統(tǒng)HAS(Human Visual System)的特性[17],一個好的水印算法應(yīng)該滿足不可見性,嵌入水印后的圖像不能引起視覺上的降質(zhì)。在水印嵌入階段,利用人類視覺掩蔽特性,在滿足透明性的條件下,適當調(diào)節(jié)數(shù)字水印的信息量,以提高局部嵌入水印信息的強度。人眼對圖像信息的分析并不是逐點進行的,而是對提取空間、頻率或色彩特征進行編碼。JND(Just Noticeable Difference)閾值表示數(shù)字水印系統(tǒng)所能支持的最大修改值,使用自適應(yīng)技術(shù)來調(diào)節(jié)數(shù)字水印的嵌入強度,即使根據(jù)人類視覺特性,也無法分辨出由圖像質(zhì)量產(chǎn)生出來的影響。
目前,基于人類視覺系統(tǒng)特性的數(shù)字水印算法是水印研究的熱點??梢詫⑿〔ㄗ儞Q與人類視覺系統(tǒng)相結(jié)合,通過評估權(quán)值來確定魯棒性,最大化水印的嵌入量,提高水印系統(tǒng)的魯棒性。
6 數(shù)字水印的應(yīng)用領(lǐng)域
視頻水印主要應(yīng)用于以下一些領(lǐng)域[18]:
?。?)版權(quán)保護:為了識別視頻內(nèi)容的版權(quán),將由加密技術(shù)產(chǎn)生的水印信息嵌入到原始載體中,并發(fā)行含水印的數(shù)字視頻作品。
(2)拷貝控制:當發(fā)行數(shù)字視頻作品時,使用特殊的機制保護版權(quán)。
?。?)內(nèi)容認證:為了檢測數(shù)字視頻內(nèi)容是否被篡改,可以利用視頻水印進行內(nèi)容認證或完整性校驗,它的特點是認證與內(nèi)容是相關(guān)聯(lián)的。
?。?)廣播監(jiān)控:通過數(shù)字水印技術(shù)可以檢測某些視頻作品在電視臺或廣播電臺上播放的時間和次數(shù),以此保護版權(quán)者的所有權(quán)。
(5)盜版追蹤:當視頻作品授權(quán)給多個用戶時,版權(quán)者可將水印信息(如用戶ID號)嵌入到每個數(shù)字產(chǎn)品中,可以避免未經(jīng)授權(quán)的拷貝和發(fā)行。
?。?)安全隱蔽通信:發(fā)送方可以將水印信息(安全信息)嵌入到視頻流中,接收方根據(jù)已知的公鑰和密鑰來提取水印信息,而未授權(quán)用戶是無法提取的,從而實現(xiàn)了安全傳輸。
由于目前數(shù)字水印技術(shù)難以解決串謀攻擊、機會攻擊以及解釋攻擊等問題,使得數(shù)字水印在版權(quán)保護、訪問與拷貝控制、數(shù)字指紋等方面的應(yīng)用受到了很大的限制,許多研究者正致力于上述問題的解決。另外,在設(shè)計水印算法時,缺少具有指導(dǎo)性意義的一般框架,如果能夠提出實際可行的具有指導(dǎo)意義的魯棒性水印模型框架,將給水印算法設(shè)計帶來很大的方便??梢灶A(yù)見數(shù)字水印用于保護多媒體信息將成為一個越來越流行的熱點問題。
參考文獻
[1] LEE H Y, KIM H S, LEE H K. Robust image watermarking using local invariant features[J]. Optical Engineering,2006,45(3):037002-037011.
[2] PITAS I V. The use of watermarks in the protection of digital multimedia products[J]. Proceedings of the IEEE, 1999, 87(7): 1197-1207.
[3] PODILCHUK C I, DELPE J. Digital watermarking: algorithms and applications[J]. Signal Processing Magazine, 2001, 14(4): 33-46.
[4] 孫圣和,陸哲明,牛夏牧.數(shù)字水印技術(shù)和應(yīng)用[M].北京:科學(xué)出版社,2004:45-50.
[5] HOLLIMAN M, MEMON N. Counterfeiting attacks on oblivious block-wise independent invisible watermarking schemes[J]. IEEE Transactions on image processing, 2000,9(3):432-441.
[6] 施鵬飛,趙立初.數(shù)字水印技術(shù)的研究[J].信息與控制,2000(2):40-45.
[7] KALKER T, DEPOVERE G, HAITSMA J. A video watermarking system for broadcast monitoring[C]. Proceeding of SPIE on Security and Watermarking of Multimedia Contents, San Jose, 1999:103-112.
[8] HARTUNG F, GIROD B. Watermarking of uncompressed and compressed video[J]. Signal Processing, Special Issue on Copyright Protection and Access Control for Multimedia Services, 1998,66(3):283-301.
[9] DEGUILLAUME F, CSURKA G, RUANAIDH J. Robust 3D DFT domain video watermarking[C]. Proceeding of SPIE on Security and Watermarking of Multimedia Contents. San Jose, 1999:113-124.
[10] CHEN T H, LIU S H, YAO H X, et al. Robust video watermarking based on DC coefficients of selected blocks[C]. Proceeding of the Fourth Int conference on Machine Learning and Cybernetics, Guangzhou, 2005:5273-5278.
[11] SWANSON M, ZHU B, TEWFIK A. Multi-resolution Scene-based Video Watermarking Using Perceptual Models[J]. IEEE Journal on Selected Areas in communications,1998,16(4):540-550.
[12] CHUNG T Y, HONG M S, SHIN DH, et al. Digital watermarking for copyright protection of MPEG-2 compressed video[J]. IEEE Transactions on Consumer Electronics, 1998,44(3):895-901.
[13] BISWAS S, DAS S R, PETRIU E M. An adaptive compressed MPEG-2 video watermarking scheme[J]. IEEE Transactions on Instrumentation and Measurement,2005,54(5):1853-1861.
[14] NOORKAMI M, MERSEREAU R M. Compressed-domain video watermarking for H. 264[C]. Proceeding of IEEE International Conference on Image Processing, Genoa,2005:890-893.
[15] JORDAN F, KUTTER M, EBRAHIMI T. Proposal of a watermarking technique for hiding/retrieving data in compressed and decompressed video[C]. MPEG-4 Meeting,Technical Report M2281, ISO/IEC Document,Stockholm,1997:125-130.
[16] WANG P, ZHENG Z D, YING J. A novel video Watermark technique in motion vectors[C]. Proceeding of IEEE International Conference on Audio Language and Image Processing. Shanghai, 2008:1555-1559.
[17] DELAIGLE J F, DEVLEESCHOUWER C. Human visual system features enabling watermarking[C]. Proceeding of ICME 2002,Multimedia and Expo,2002:489-492.
[18] DOERR G, DUGELAY J L. A guide tour of video watermarking [J].Signal Processing:Image Communication, 2003,18:263-282.