摘 要: 介紹了基于數(shù)字圖像的信息隱藏技術(shù)的基本內(nèi)容及方法,著重研究了圖像信息隱藏的反向檢測技術(shù)——隱寫分析技術(shù),總結(jié)了其方法和分類。針對隱寫分析中的RS(Regularand Singular groups method)檢測算法進(jìn)行了深入的研究,提出了改進(jìn)算法,在一定程度上減小了RS檢測算法對統(tǒng)計(jì)假設(shè)的依賴性,并且在不改變像素間相關(guān)特性的同時(shí)可以對圖像進(jìn)行二次檢驗(yàn),增加了檢測結(jié)果的準(zhǔn)確性。在不同的掩碼和嵌入率下進(jìn)行了大量實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果驗(yàn)證了該改進(jìn)算法的有效性,基于該改進(jìn)算法編寫了檢測程序,實(shí)現(xiàn)了對灰度及彩色圖像的LSB(Least Significant Bit)隱藏檢測。
關(guān)鍵詞: 信息隱藏;隱寫分析;RS檢測;LSB隱藏
0 引言
隨著數(shù)字化信息時(shí)代的到來,各種各樣的數(shù)字媒體越來越多,數(shù)字圖像的信息安全問題越來越受到重視,基于圖像的信息隱藏技術(shù)以及其反向檢測技術(shù)——隱寫分析技術(shù),成為了新的研究熱點(diǎn)[1]。
信息隱藏技術(shù)是將隱秘信息隱藏在其他媒體中,通過載體媒體的傳輸,實(shí)現(xiàn)隱秘信息的傳遞甚至達(dá)到跟蹤和校驗(yàn)信息來源的目的。隱寫分析技術(shù)作為信息隱藏的反向技術(shù),目的是檢測載體中是否含有隱藏信息。對該技術(shù)研究,除了可以檢測隱藏信息之外,還可以了解正向隱藏的缺陷,指導(dǎo)研究者設(shè)計(jì)更健壯的信息隱藏技術(shù),確保嵌入信息的抗攻擊性。RS[2-3]檢測算法作為一種重要的反向分析方法,對無損嵌入容量的LSB信息隱藏有很好的檢測效果。本文基于該算法,通過對大量不同掩碼及嵌入率下的數(shù)據(jù)比較,證實(shí)了參數(shù)對檢測結(jié)果的影響,并對該檢測算法提出了改進(jìn),提高了檢測的準(zhǔn)確性。
1 信息隱藏技術(shù)
信息隱藏應(yīng)用主要有隱寫術(shù)、數(shù)字水印技術(shù)[4]。隱寫術(shù)是將秘密信息隱藏到普通的信息(如數(shù)字圖像)中進(jìn)行傳輸。方法主要有利用高空間頻率的圖像數(shù)據(jù)隱藏信息、采用最低有效位(LSB)方法將信息隱藏到宿主信號中、使用信號的色度隱藏信息、在數(shù)字圖像的像素亮度的統(tǒng)計(jì)模型上隱藏信息等。
數(shù)字水印技術(shù)是將一些標(biāo)識信息(數(shù)字水?。┰诓挥绊懺d體的使用并且不易被他人探知和修改的前提下嵌入到數(shù)字載體(圖片、文檔、軟件等)當(dāng)中。數(shù)字水印被廣泛應(yīng)用于防偽溯源、版權(quán)保護(hù)、隱藏標(biāo)識、認(rèn)證和安全隱蔽通信中。數(shù)字水印可以劃分為時(shí)(空)域數(shù)字水印、頻域數(shù)字水印、時(shí)/頻域數(shù)字水印和時(shí)間/尺度域數(shù)字水印。
2 信息隱藏分析技術(shù)
信息隱藏分析技術(shù)也叫隱寫分析技術(shù),是對圖像、音頻、視頻等進(jìn)行檢測,判斷其中是否嵌有秘密信息。原始數(shù)據(jù)由于秘密信息的嵌入,導(dǎo)致自身統(tǒng)計(jì)特性發(fā)生變化,使得分析者可以通過分析載體數(shù)據(jù)的異常變化來檢測秘密信息的存在,即使無法提取出秘密信息,也能破壞其隱秘通信并追查秘密信息的收發(fā)方。由于原始載體很難獲得,因此盲檢測是最常遇到的情況。盲檢測主要是通過統(tǒng)計(jì)和算法來對數(shù)字圖像特征進(jìn)行分析,從特征的改變來判斷是否存在信息的嵌入。
根據(jù)隱寫分析提取特征的不同,可以分為專用隱寫分析和通用隱寫分析。根據(jù)特征所在域的不同又分為時(shí)空域和頻率域隱寫分析。時(shí)空域分析方法主要針對LSB信息隱藏,該方法實(shí)現(xiàn)簡單,但是檢測能力有限。頻率域方法則是通過在頻域檢測特征的變化來判斷信息嵌入,包括傅里葉、拉普拉斯、離散余弦和小波變換等。
針對盲檢測本身難度已較大,要進(jìn)行通用隱寫分析更是很難實(shí)現(xiàn),所以現(xiàn)在的隱寫分析主要是專用隱寫分析。包括下面一些經(jīng)典方法:
?。?)Chi-Square統(tǒng)計(jì)檢測方法。該方法統(tǒng)計(jì)調(diào)色板圖像嵌入信息前后相對顏色對的概率比來檢測秘密信息的嵌入,但是對信息的隨機(jī)嵌入無法檢測。
(2)基于無損嵌入容量的檢測方法,即本文介紹的RS分析法。
?。?)基于JPEG兼容性檢測方法。該方法僅適用于JPEG格式的圖像,有比較高的靈敏度,甚至可以檢測到單個(gè)像素的改變,當(dāng)信息嵌入量較大時(shí),還可以估計(jì)出信息嵌入的長度。
?。?)DCT(Discrete Cosine Transform)系數(shù)分析法。通過估計(jì)隱秘載體圖像的DCT系數(shù)直方圖和原始估計(jì)直方圖的相關(guān)改變量來估計(jì)秘密信息嵌入量,該方法對具有特殊網(wǎng)格結(jié)構(gòu)的圖像檢測無效。
3 數(shù)字圖像RS隱寫分析技術(shù)及改進(jìn)
3.1 RS隱寫分析
假設(shè)有一個(gè)M×N個(gè)像素的圖像,它的像素值用集合P來表示(例如一個(gè)8 bit的灰度圖像,P={0…255})。把圖像分割成像素接近的N個(gè)組:{x1…xn},定義一個(gè)辨別函數(shù)f:
則每一個(gè)像素組G=(x1…xn)對應(yīng)一個(gè)實(shí)數(shù)值f(x1…xn)∈R。像素組G的噪聲越大,辨別函數(shù)f的值就越大。而LSB的信息嵌入等同于疊加了噪聲,這樣會引起f值的增加。
定義一個(gè)基于集合P的可逆操作F,稱之為翻轉(zhuǎn)。翻轉(zhuǎn)可以認(rèn)為是一個(gè)灰度級的置換,它具有以下性質(zhì):
對x∈P有F2=F和F(F(x))=x。
對于8 bit灰度圖像,定義翻轉(zhuǎn)如下:
為保持完備性,還定義一個(gè)恒等翻轉(zhuǎn):
F0(x)=x
以上翻轉(zhuǎn)都滿足:
F-1(x)=F1(x+1)-1 x∈P(2)
用辨別函數(shù)f和翻轉(zhuǎn)操作F就可以將G歸類到三種類型的像素組:R(規(guī)則組)、S(奇異組)、U(無用組),分類規(guī)則如下:
用Rm來表示處理后的規(guī)則組的數(shù)量,Sm表示異常組的數(shù)量,上述翻轉(zhuǎn)等同于模擬疊加了噪聲,導(dǎo)致了f值的增加,因此規(guī)則組的總數(shù)將大于異常組,即:
Rm>Sm(3)
如圖1所示,隨著隱藏信息長度的增加,當(dāng)嵌入率為50%時(shí),Rm和Sm的值趨于相等。
此外,大量的試驗(yàn)表明下面的統(tǒng)計(jì)假設(shè)都是正確有效的:
RS隱寫分析正是建立在式(4)的統(tǒng)計(jì)假設(shè)之上,再利用式(3)來判斷是否有信息嵌入,最后利用二次方程(5):
2(d1+d0)x2+(d-0-d-1-d1-3d0)x+d0-d-0=0(5)
其中:d0=Rm(p/2)-Sm(p/2)
d1=Rm(1-p/2)-Sm(1-p/2)
d-0=R-m(p/2)-S-m(p/2)
d-1=R-m(1-p/2)-S-m(1-p/2)
x的取值為兩個(gè)根中絕對值小的那一個(gè),代入式(6)可得出嵌入信息的長度P:
P=x/(x-1/2)(6)
3.2 算法改進(jìn)
基于RS算法的改進(jìn)方法,可以分為以下幾個(gè)步驟:
?。?)將圖像看成是一個(gè)M×N的像素組,將其分成n個(gè)小的像素組,每個(gè)組的元素個(gè)數(shù)根據(jù)情況指定。
?。?)對每個(gè)小的像素組進(jìn)行式(1)的f運(yùn)算。
(3)對每個(gè)小的像素組進(jìn)行正翻轉(zhuǎn),翻轉(zhuǎn)規(guī)則為:像素值為偶,其值加1;像素值為奇,其值減1。
(4)對翻轉(zhuǎn)后的小像素組重復(fù)步驟(2),比較未翻轉(zhuǎn)的像素組和翻轉(zhuǎn)后的像素組的f運(yùn)算后的值,如果翻轉(zhuǎn)后的值大于翻轉(zhuǎn)前的值,就將該像素組歸為R類,反之歸為S類,相等則歸為U類。
(5)對每個(gè)小的像素組進(jìn)行負(fù)翻轉(zhuǎn),翻轉(zhuǎn)規(guī)則為:像素值為偶數(shù)則減1,奇數(shù)則加1,然后重復(fù)步驟(4)。
(6)對原始圖像整體翻轉(zhuǎn),規(guī)則為:像素值為偶數(shù)則加1奇數(shù)則減1,對得到的新像素組重復(fù)步驟(1)~(5)。
?。?)將上面得到的多個(gè)情況下的R、S組的數(shù)量代入到上面二元方程(5)中求解,由等式(6)就可以得到P值。根據(jù)大量實(shí)驗(yàn)數(shù)據(jù)設(shè)定了一個(gè)閾值為5%,一般P值大于5%就可以認(rèn)為圖像中含有隱藏信息。
上述的步驟(3)和(5)在一定程度上減小了RS檢測算法對統(tǒng)計(jì)假設(shè)的依賴性,步驟(6)對圖像的整體反轉(zhuǎn),使得在不改變像素間相關(guān)特性的同時(shí),可以對圖像進(jìn)行了二次檢驗(yàn),增加了判決結(jié)果的準(zhǔn)確性。
3.3 實(shí)驗(yàn)結(jié)果和分析
通過以上RS算法的改進(jìn),基于數(shù)字圖像處理[5],利用VC編寫了一個(gè)基于RS隱寫檢測算法的檢測工具,該工具可用于檢測BMP格式的灰度和彩色圖像中是否含有隱藏信息,并顯示算法中用到的關(guān)鍵參數(shù)。檢測程序主界面如圖2所示,檢測參數(shù)如圖3所示。
實(shí)驗(yàn)中利用了下面3個(gè)經(jīng)典的信息隱藏工具:eShow、S-Tools和Hide4PGP。在檢測過程中,統(tǒng)計(jì)比較了用不同隱藏工具在不同的嵌入率和不同掩碼下檢測算法的有效性,如表1所示。
通過對大量實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,總結(jié)了下面幾個(gè)影響檢測結(jié)果的因素:
(1)嵌入率越高,檢測的準(zhǔn)確率越高。
(2)掩碼對檢測結(jié)果有影響。比較實(shí)驗(yàn)的兩個(gè)掩碼,低嵌入率情況下,掩碼為0110時(shí),檢測效果更好。
?。?)初始偏差對檢測結(jié)果精確度有影響。初始偏差(表1中第1列數(shù)據(jù))是指原始載體由于隨機(jī)變化而產(chǎn)生的微小初始非零信息長度。初始偏差可能是正或負(fù),它限制了隱寫分析的精確度。統(tǒng)計(jì)數(shù)據(jù)表明初始偏差對JPEG圖像、未壓縮的圖像及高分辨率圖像來說相當(dāng)?shù)?,而且彩色圖的初始偏差大于灰度圖。
?。?)圖像中信息比特的位置。圖像中信息是隨機(jī)分布時(shí),RS隱寫分析的精確度較高;而當(dāng)圖像中信息集中分布在局部區(qū)域時(shí),RS隱寫分析的精確度較低。
4 結(jié)論
本文針對LSB信息隱藏的RS檢測算法提出了改進(jìn),減少了該方法對檢測樣本原始統(tǒng)計(jì)假設(shè)的依賴性,并在不改變圖像元素間相關(guān)性的前提下增加了二次檢驗(yàn),提高了檢測準(zhǔn)確率,實(shí)驗(yàn)結(jié)果也印證了改進(jìn)的有效性。通過比較大量實(shí)驗(yàn)數(shù)據(jù),總結(jié)了影響檢測結(jié)果的因素。由于本文的實(shí)驗(yàn)是基于嵌入率大于30%的BMP圖像,因此在下一步研究中,還需要考慮多種格式和低嵌入率情況下的算法有效性,并針對文中提出的影響檢測準(zhǔn)確性的因素來加以改進(jìn)。
參考文獻(xiàn)
[1] 汪小帆,戴躍偉,茅耀斌.信息隱藏技術(shù)-方法與應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2001.
[2] FRIDRICH J, GOLJAN M, DU R. Detecting LSB steganography in color and gray-scale images[J]. IEEE Multimedia, Special Issue on Security, 2001,8(4):22-27.
[3] FRIDRICH J, DU R, MENG L. Steganalysis of LSB encoding in color Images[C]. IEEE International Conference on Multimedia and Expo, IEEE Press, N.J. 2000.
[4] NAOR M, SHAMIR A. Visual cryptography[C]. EUROCRYPT,1994:1-12.
[5] 阮秋琦.數(shù)字圖像處理學(xué)[M].北京:電子工業(yè)出版社,2001.