《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計應(yīng)用 > 基于Duffing共振的語音真?zhèn)螜z測技術(shù)研究
基于Duffing共振的語音真?zhèn)螜z測技術(shù)研究
2016年微型機(jī)與應(yīng)用第2期
何朝霞, 劉凱
長江大學(xué) 工程技術(shù)學(xué)院, 湖北 荊州 434023
摘要: 在數(shù)字語音真?zhèn)渭夹g(shù)中,基于電網(wǎng)頻率的檢測方法是當(dāng)前研究的熱點。由于數(shù)字錄音設(shè)備在錄音過程中不僅記錄語音內(nèi)容本身,還攜帶微弱的電網(wǎng)電壓或電流信號,利用Duffing共振理論來提取數(shù)字錄音信號中的微弱電網(wǎng)信號,根據(jù)其輸出特征參數(shù)的幅頻特性和相頻特性來判斷錄音文件的真?zhèn)涡浴Mㄟ^實驗分析論證了該方法的可行性和實用性,為數(shù)字錄音真?zhèn)舞b別技術(shù)提供了一條新的研究方向。
Abstract:
Key words :

  劉凱

 ?。ㄩL江大學(xué) 工程技術(shù)學(xué)院, 湖北 荊州 434023)

摘要:在數(shù)字語音真?zhèn)渭夹g(shù)中,基于電網(wǎng)頻率的檢測方法是當(dāng)前研究的熱點。由于數(shù)字錄音設(shè)備在錄音過程中不僅記錄語音內(nèi)容本身,還攜帶微弱的電網(wǎng)電壓或電流信號,利用Duffing共振理論來提取數(shù)字錄音信號中的微弱電網(wǎng)信號,根據(jù)其輸出特征參數(shù)的幅頻特性和相頻特性來判斷錄音文件的真?zhèn)涡?。通過實驗分析論證了該方法的可行性和實用性,為數(shù)字錄音真?zhèn)舞b別技術(shù)提供了一條新的研究方向。

關(guān)鍵詞語音真?zhèn)舞b別;電網(wǎng)頻率;Duffing共振;特征參數(shù)

0引言

  近年來,數(shù)字多媒體技術(shù)飛速發(fā)展,數(shù)字信息已經(jīng)滲透到人們生活的方方面面。在語音處理技術(shù)領(lǐng)域,人們已經(jīng)可以很方便地獲取語音信號,并利用音頻編輯軟件對其進(jìn)行有意或無意的編輯和修改,這種篡改行為對語音數(shù)據(jù)的安全性構(gòu)成了強(qiáng)大的威脅。隨著數(shù)字信息已逐步應(yīng)用于司法取證,語音真?zhèn)螜z測技術(shù)也逐漸成為國內(nèi)外學(xué)術(shù)界研究的熱點。

  電力系統(tǒng)是促進(jìn)國家發(fā)展的基本因素之一,公用的電網(wǎng)信號可以看成是一個正弦波,它有一個固定的頻率,該頻率稱為電網(wǎng)頻率(Eleetrie Network Frequency,ENF)[1]。電網(wǎng)提供的大部分電力都是來自于能產(chǎn)生交流電的渦輪,這些渦輪的轉(zhuǎn)速便決定了電網(wǎng)頻率,正常運行的電網(wǎng)頻率值是50 Hz或60 Hz,中國的電網(wǎng)頻率值是50 Hz。電網(wǎng)頻率變化具有均一性和唯一性,其波動不僅表征系統(tǒng)的動態(tài)行為,而且承載豐富的時間信息。由于數(shù)字錄音的原理與模擬磁帶錄音不同,無法在磁蹤跡和抹音磁頭上找到錄音開始、停頓和終止等物理特征,因而迫切需要尋找其他的鑒別方法。GRIGORAS C將電網(wǎng)頻率變化與數(shù)字錄音真?zhèn)舞b別聯(lián)系起來,提出電網(wǎng)頻率準(zhǔn)則[25]。該方法認(rèn)為數(shù)字錄音設(shè)備在錄音過程中不僅記錄語音內(nèi)容本身,而且還因該設(shè)備由電網(wǎng)直接供電的緣故而捕獲到微弱的電網(wǎng)電壓或電流信號;若錄音設(shè)備采用電池供電,周圍其他的用電設(shè)備產(chǎn)生的電磁場也有可能感應(yīng)出電信號,在錄音記錄中留下感應(yīng)信號的蹤跡[67]。近年來,隨機(jī)共振在信息技術(shù)領(lǐng)域的應(yīng)用已經(jīng)有了相當(dāng)大的發(fā)展,例如基于隨機(jī)共振的信號檢測方法為強(qiáng)噪聲背景下弱信號的提取提供了新的途徑[8]。因此可以考慮利用Duffing共振理論來提取錄音信號中的微弱電網(wǎng)或電壓信號,從而判斷錄音文件的真?zhèn)涡浴?/p>

1Duffing共振理論基礎(chǔ)

  Duffing方程的一般形式為[9]:

  1.png

  其中,γ是阻尼系數(shù);κ、ζ為常數(shù);FcosΩt是系統(tǒng)的外力項;Ω是外力項頻率。式中正、負(fù)號分別表示硬彈簧和軟彈簧兩種情況。理論情況下,在線性系統(tǒng)中當(dāng)強(qiáng)迫力的頻率與系統(tǒng)本身的頻率相同時,系統(tǒng)會出現(xiàn)共振現(xiàn)象,在非線性系統(tǒng)中也會出現(xiàn)類似的情況。

  無阻尼情況下Duffing方程為:

  2.png

  令κ=ω20 ,ζ=εβ20,其中ε>0,引進(jìn)多重時間尺度變量,如多重時間尺度[10],有:

  3.png

  認(rèn)為函數(shù)x不僅依賴于ε和t,還依賴于T0,T1,T2,…,Tn,有:

  x=x0(T0,T1,…,Tn)+εx1(T0,T1,…,Tn)+…(4)

  得到式(2)的一階近似解:

  56.jpg

  考慮有阻尼的Duffing方程:

  7.png

  令α=α(T2,T3,…,Tn),ω=ω0+3β20α28ω0ε ,θ0=θ(T2,T3,…,Tn)

  僅考慮無阻尼Duffing方程的通解,式(7)的通解為:

  x(t)=αexp(-γt)cos(ωt+θ0)(8)

  其中,α為振幅,ω為角頻率,θ0為初始相位。

  考慮有外力驅(qū)動的情況(式(1)),即當(dāng)式(8)中ω=Ω時系統(tǒng)發(fā)生共振。

  當(dāng)在t(0+)時刻輸入一個脈沖響應(yīng)δ(t),系統(tǒng)的時域函數(shù)為h(t),由δ(t)*h(t)=x(t),可以得出H(s)=X(s),即h(t)=x(t)。

2基于Duffing共振的語音真?zhèn)螜z測技術(shù)

  該檢測技術(shù)具有如圖1所示的步驟。

  

001.jpg

 ?。?)首先對待檢測錄音信號進(jìn)行預(yù)處理。預(yù)處理包括抗混疊濾波,預(yù)加重和分幀加窗。

 ?。?)對預(yù)處理的錄音信號進(jìn)行快速傅里葉變換(FFT變換)得到其頻譜特性。

 ?。?)將頻域信號通過一個Duffing共振帶通濾波器,帶通濾波器的中心頻率為50 Hz,該濾波信號即為提取到的電網(wǎng)信號。通過第1章Duffing共振理論的介紹已經(jīng)得出了模擬濾波器的單位沖擊響應(yīng)h(t),對其進(jìn)行拉普拉斯變換就可以得到模擬帶通濾波器的系統(tǒng)函數(shù)H(s),然后通過雙線性變換就可以得到數(shù)字帶通濾波器的系統(tǒng)函數(shù)H(z),該濾波器的幅頻特性如圖2所示。

002.jpg

 ?。?)畫出該濾波信號的幅頻圖和相位圖。

  (5)根據(jù)幅頻圖和相位圖上有無突然的跳變來判斷音頻是否發(fā)生過篡改操作。圖2Duffing共振帶通濾波器的幅頻特性

3實驗和分析

  有4段待檢測錄音音頻,都是由計算機(jī)的麥克風(fēng)錄音,錄音和篡改軟件為Cool Edit Pro V21簡體中文版,分別對應(yīng)音頻1、音頻2、音頻3和音頻4。其中音頻1為女生未經(jīng)過篡改的原始錄音,錄音內(nèi)容為“零”, 音頻2為男生未經(jīng)過篡改的原始錄音,錄音內(nèi)容為“零”,將音頻1復(fù)制粘貼到音頻2為音頻3,內(nèi)容變?yōu)椤傲懔恪?,將音頻1由軟件加入頻率為50 Hz的合音得到音頻4。分別對音頻1、音頻2、音頻3和音頻4用基于Duffing共振的篡改檢測方法進(jìn)行真?zhèn)螜z測,檢測流程如圖1所示。

  圖3~圖6分別為音頻1、音頻2、音頻3和音頻4的時域波形圖,圖7~圖10分別為音頻1、音頻2、音頻3和音頻4經(jīng)系統(tǒng)后的頻譜圖。

005.jpg

  從圖7、圖8可以看出,沒有經(jīng)過篡改的音頻信號經(jīng)過系統(tǒng)后的頻譜圖具有比較好的雙峰性,而且第一個峰的頻率在50 Hz。圖9是經(jīng)過篡改后的音頻信號經(jīng)系統(tǒng)后的頻譜圖,從圖中可看出只有一個峰值,而且峰值處的頻率為100 Hz。

006.jpg

  由此可以得出結(jié)論,經(jīng)過篡改后的音頻信號經(jīng)過系統(tǒng)后的頻譜會發(fā)生較大的突變,頻譜的中心發(fā)生搬移。

  圖9與圖7的幅頻圖完全一致,人為添加計算機(jī)合成的同頻率音頻對音頻信號通過系統(tǒng)后的幅頻特性沒有影響。圖11和圖12分別為音頻1和音頻4通過系統(tǒng)后的相頻圖,從圖中可以看出,音頻4的相頻特性較音頻1相位發(fā)生了很大的變化。

  

008.jpg

4結(jié)論

  本文研究了一種基于Duffing共振的語音數(shù)字語音真?zhèn)舞b別技術(shù),通過實驗,對比實驗結(jié)果,經(jīng)復(fù)制粘貼篡改操作的音頻信號經(jīng)過Duffing共振系統(tǒng),其幅頻特性會發(fā)生較大的變化;而經(jīng)計算機(jī)軟件添加合成音頻的音頻信號經(jīng)過Duffing系統(tǒng)后,其幅頻特性基本不變,變化的是相頻特性。由實驗可以得出:基于Duffing共振的數(shù)字語音真?zhèn)舞b別具有一定的可行性和實用性,在以后的研究過程中,還會進(jìn)一步探討該系統(tǒng)在其他數(shù)字語音篡改技術(shù)中的應(yīng)用。

參考文獻(xiàn)

 ?。?] GUPTA S, CHO S, JAYKUO C C. Current developments and future trends in audio authentication [J]. IEEE Multimedia, 2012,19(1): 5059.

 ?。?] GRIGORAS C. Digital audio recording analysis: The electric network frequency criterion[C]. Diamond Cut Productions, Inc., Applications Notes AN4, 2003.

 ?。?] GRIGORAS C. Digital audio recording analysis: the electric network frequency (ENF) criterion [J]. The International Journal of Speech Language and the Law, 2005, 12(1):6376.

 ?。?] GRIGORAS C. Applications of ENF criterion in forensic audio, video, computer and telecommunication analysis [J]. Forensic Science International, 2007(167):136143.

  [5] GRIGORAS C. Applications of ENF analysis in forensic authentication of digital audio and video recordings [J]. The Journal of Audio Engineering Society, 2009, 57(9):643661.

 ?。?] 楊林國.詞類擴(kuò)充方法在語音識別中的應(yīng)用[J].電子技術(shù)應(yīng)用,2014,40(6):123125,129.

 ?。?] 趙媛媛,王力.基于流形學(xué)習(xí)ISOP算法的語音特征提取及應(yīng)用研究[J].微型機(jī)與應(yīng)用,2014,33(1):4345,49.

  [8] 賴志慧,冷永剛,孫建橋,等.基于Duffing振子的變尺度微弱特征信號檢測方法研究[J].物理學(xué)報,2012,62(5):05050310505039.

  [9] 王海波.Duffing方程非線性振動特性的計算和分析[D].西安:西安建筑科技大學(xué),2009.

 ?。?0] 徐博侯,曲紹興.非線性力學(xué)導(dǎo)論[M].杭州:浙江大學(xué)出版社,2012.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。