《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 業(yè)界動(dòng)態(tài) > 基于DSP的廣播節(jié)目自動(dòng)識(shí)別系統(tǒng)的實(shí)現(xiàn)

基于DSP的廣播節(jié)目自動(dòng)識(shí)別系統(tǒng)的實(shí)現(xiàn)

2009-01-05
作者:鄭仁富,劉 杰

??? 摘 要: 本系統(tǒng)針對廣播節(jié)目信號傳輸時(shí)易受干擾的問題,采用相關(guān)系數(shù)算法判別廣播音頻信號的相似性,實(shí)現(xiàn)在高速數(shù)字信號處理器(DSPs)芯片上對輸入的多路節(jié)目信號進(jìn)行自動(dòng)識(shí)別,并分析其實(shí)現(xiàn)原理。實(shí)驗(yàn)結(jié)果表明了系統(tǒng)的正確性和合理性。
??? 關(guān)鍵詞: 相關(guān)系數(shù);音頻信號;DSP6713;語音識(shí)別

?

??? 目前,國內(nèi)廣播中心節(jié)目傳輸系統(tǒng)是將其所有播出節(jié)目通過傳輸系統(tǒng)送往發(fā)射中心和其他目的地。傳輸方式有地面無線、光纖、微波中繼及衛(wèi)星傳輸?shù)取R纛l廣播節(jié)目通過這四種傳輸方式傳輸?shù)綇V播發(fā)射機(jī)房供發(fā)射機(jī)選擇使用。然而,現(xiàn)今的轉(zhuǎn)播選擇控制過程都要依靠人為來實(shí)現(xiàn),既浪費(fèi)了人力物力,又容易出現(xiàn)誤操作。特別在無人看守的情況下,一旦出現(xiàn)惡意攻擊節(jié)目信號的事件,后果將難以估計(jì)。
??? 在通常情況下,每個(gè)信道同時(shí)受到攻擊的可能性很小,一般是某個(gè)信道受到攻擊或干擾。因此,要把接收到的四路信號進(jìn)行兩兩比較。若四路信號都為同一信息,則說明四路都沒被攻擊;若有一路或兩路信號與其他路信號不同,即可判為被惡意攻擊的信號。
??? 本系統(tǒng)利用瑞泰公司的ICETEK-C6713-A評估板支持多路輸入輸出的特性,同時(shí)對四路廣播節(jié)目信號進(jìn)行采集,然后對采集到的四路信號進(jìn)行同步,再通過相關(guān)系數(shù)算法,對其兩兩的相似性作判決,最終選出一路最佳信號,并做出相應(yīng)操作。該系統(tǒng)從保證節(jié)目安全播出的角度出發(fā),能夠?qū)V播節(jié)目進(jìn)行自動(dòng)識(shí)別,可應(yīng)用于廣播節(jié)目自動(dòng)識(shí)別系統(tǒng),提高廣播機(jī)房工作的有效性、可靠性、安全性。
1 識(shí)別算法的實(shí)現(xiàn)
1.1 互相關(guān)算法

??? 互相關(guān)處理是信號檢測中常用的方法,即求兩個(gè)信號的相似程度,當(dāng)兩個(gè)信號出現(xiàn)互相關(guān)性時(shí)會(huì)產(chǎn)生峰值,而無相關(guān)性信號將被大幅度衰減,從而判斷出被噪聲淹沒的兩路信號的相似程度。這是因?yàn)樾畔⒂辛己玫臅r(shí)間相關(guān)性(即信號是積累的),而噪聲是隨機(jī)的,沒有時(shí)間相關(guān)性(即噪聲不積累)。假設(shè)x(t)為一路信號,y(t)為另一路信號,n(t)為噪聲,則s(t)=x(t)+n(t)為被噪聲干擾的信號。則它們的互相關(guān)函數(shù)為:
????
??? 由于廣播節(jié)目信號與環(huán)境的隨機(jī)噪聲沒有相關(guān)性,所以Rny(τ)=0,故Rsy(τ)=Rxy(τ),可以排除環(huán)境的隨機(jī)噪聲對系統(tǒng)識(shí)別的影響。因此,只要根據(jù)Rxy(τ)的值,就能判斷出接收到的兩路信號是不是同一信號,即有沒有受到惡意攻擊。可以設(shè)一個(gè)門限K來判斷,若Rxy(τ)>K,則認(rèn)為這兩路信號有相關(guān)性,判為同一信號;否則判為不同信號。
??? 但是在實(shí)際應(yīng)用中,由于信號的不同或噪聲等其他因素的影響,Rxy(τ)值的波動(dòng)太大,所以K的值很難確定。針對該問題,本系統(tǒng)采用求兩路信號的相關(guān)系數(shù)ρ的絕對值來解決,因?yàn)棣讶≈捣秶橛?1~1之間。ρ>0為正相關(guān),ρ<0為負(fù)相關(guān),ρ=0表示不相關(guān);ρ的絕對值越大,相關(guān)程度越高。ρ的計(jì)算公式如下:
???
1.2 算法可行性在MATLAB上的驗(yàn)證
??? 首先,通過麥克風(fēng)錄音,隨便保存好幾個(gè)音頻信號,用于下面的語音識(shí)別,如本實(shí)驗(yàn)中,錄入由筆者念的“1”、“2”、“福州大學(xué)”、“信息工程”等音頻信號;接著通過MATLAB打開音頻信號,加入噪聲,再找出信號間的相關(guān)性,并畫出波形圖。實(shí)驗(yàn)結(jié)果如圖1所示。

?


??? 在圖1中,信號一和信號二的信號內(nèi)容都是筆者自己錄制的“福州大學(xué)”四個(gè)字的音頻信號,相關(guān)性為這兩個(gè)信號在加噪后(信噪比為25dB)求出的互相關(guān)程度。其中在X軸為3841的位置有明顯的波峰,峰值為205.8。
??? 在圖2中,信號一的信號內(nèi)容是筆者自己錄制的“福州大學(xué)”四個(gè)字的音頻信號,而信號二的信號內(nèi)容都是 “信息工程”四個(gè)字的音頻信號,其中相關(guān)性也是這兩個(gè)信號在加噪后(信噪比為25dB)求出的互相關(guān)程度。圖中沒有明顯的波峰,且相關(guān)性大小幅值明顯偏?。ㄆ浞底畲笾禐?.947)。
??? 從圖1與圖2可以看出,相同信號在噪聲的影響下具有較大的相關(guān)性,而不同信號之間的相關(guān)性非常小,從而說明了該算法的可行性。

?


1.3 算法在DSP上的實(shí)現(xiàn)
??? 本系統(tǒng)的主要算法是求兩信號的相關(guān)系數(shù),由公式(2)可看出,相關(guān)系數(shù)的計(jì)算,其實(shí)就是用兩信號的互相關(guān)性除以各信號的自相關(guān)的乘積的平方根。因此,求一次相關(guān)系數(shù)就等于求三次互相關(guān)性,如式(1)。
??? 利用DSP6713的浮點(diǎn)運(yùn)算功能的優(yōu)勢,用快速傅立葉(FFT)來計(jì)算兩信號的互相關(guān)性[1]。其步驟如下:
??? (1)假設(shè)截取的用來識(shí)別的信號長度為M,則選擇FFT的變換長度L應(yīng)滿足如下條件:
????
??? (2)將截取的音頻信號x(n)、y(n)也按如下方式補(bǔ)零,形成長度有L的序列:
???
??? (3)用FFT算法分別計(jì)算信號序列的離散傅立葉變換X(k)和Y(k):
?????
??? (4)計(jì)算X(k)和Y(k)的乘積: Z(k)=X*(k)Y(k),其中*表示復(fù)共軛。
??? (5)用FFT算法計(jì)算Z(k)離散傅立葉反變換,得到相關(guān)性z(n):
????
2 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
????本系統(tǒng)主要基于TMS320C6713實(shí)現(xiàn)廣播中心的自動(dòng)識(shí)別,它是基于語音識(shí)別技術(shù)實(shí)現(xiàn)的?;咎幚砹鞒虨椋簩斎氲亩嗦芬纛l信號進(jìn)行采集,對得到的數(shù)據(jù)進(jìn)行信號處理,用相關(guān)算法判別信號的相似性,而后輸出控制信號對多路信號進(jìn)行切換,使輸出的數(shù)據(jù)具有最佳信噪比。系統(tǒng)框圖如圖3所示。

?


2.1 節(jié)目信號的輸入
??? 本系統(tǒng)語音采集主要利用ICETEK-AIC23板上語音codec芯片TLV320AIC23實(shí)現(xiàn)。在語音輸入時(shí)利用了ICETEK-C6713-A EVM支持多路輸入輸出的特點(diǎn)。首先,DSP通過I2C總線將配置命令發(fā)送到AIC23使其初始化,等配置完成后AIC23開始工作。然后AIC23通過其中的AD轉(zhuǎn)換采集輸入的語音信號,每采集完一個(gè)信號后,將數(shù)據(jù)發(fā)送到DSP的McBSP接口上,DSP可以讀取到語音數(shù)據(jù),每個(gè)數(shù)據(jù)為16位無符號整數(shù),左右通道各有一個(gè)數(shù)值。
2.2 分幀
??? 從整體來看語音信號的特性及表征其本質(zhì)特征的參數(shù)均是隨時(shí)間而變化的,是一個(gè)典型的非平穩(wěn)過程,但是在一個(gè)短時(shí)間段內(nèi)(10ms~30ms的短時(shí)間段內(nèi))其特性保持相對穩(wěn)定,因而可以看作是一個(gè)準(zhǔn)平穩(wěn)過程,即語音信號的短時(shí)平穩(wěn)性。目前絕大多數(shù)的語音信號處理技術(shù)均是在“短時(shí)”的基礎(chǔ)上,將語音信號分為許多段來逐段分析其特征參數(shù),其中每一段稱為一“幀”,分段的過程稱為“分幀”處理。根據(jù)不同的處理需求,選取不同的幀長。通常,幀長選取10ms~30ms(當(dāng)FS=22.050kHz時(shí),相應(yīng)于每幀有220~661個(gè)信號樣本值)。在取數(shù)據(jù)時(shí),前一幀的尾和后一幀的頭交疊截取,交疊部分稱為幀移。幀移與幀長的比值一般取為0~1/2。在端點(diǎn)檢測前,選取幀長為240個(gè)信號樣本值,幀移為80個(gè)信號樣本值。
2.3 迭加濾波
??? 由于語音信號具有短時(shí)平穩(wěn)性的特點(diǎn),即語音信號在30ms左右時(shí)間里基本保持不變,而噪聲則具有隨機(jī)性的特點(diǎn),不具備短時(shí)平穩(wěn)性的特點(diǎn),因此,本系統(tǒng)用迭加濾波的方法對輸入的廣播節(jié)目信號進(jìn)行濾波。迭加濾波的實(shí)現(xiàn)步驟如下:
??? (1)語音信號經(jīng)過采樣和量化后,以N點(diǎn)為一幀,對一幀內(nèi)的N點(diǎn)進(jìn)行累加,設(shè)累加后的結(jié)果為SUM。
?? ?(2)將這一幀內(nèi)的平均值(SUM/N)代替該幀的信號采樣值。
?? ?(3)重復(fù)步驟(2)的操作,直到所有的幀均作平均處理。
2.4 端點(diǎn)檢測
??? 語音的端點(diǎn)檢測就是確定語音的起點(diǎn)和終點(diǎn),端點(diǎn)檢測的正確與否對語音識(shí)別的性能有很大的影響,特別是對端點(diǎn)檢測比較敏感的語音識(shí)別算法。漢語語音因?yàn)槁暷付际乔迓暷?,還有送氣與不送氣的塞音和塞擦音,它們與環(huán)境噪聲難以分辨。
??? 常用的端點(diǎn)檢測方法有過零檢測和短時(shí)能量檢測。本系統(tǒng)采用這兩種方法的綜合——雙門限端點(diǎn)檢測法來進(jìn)行語音信號端點(diǎn)檢測,檢測時(shí),先要分別為短時(shí)能量和過零率確定兩個(gè)門限。高門限被超過時(shí),基本可以確定語音的起始端點(diǎn),低門限用于確定語音真正的端點(diǎn)。低門限被超過未必就是語音的起始端點(diǎn),也有可能是短時(shí)噪聲。當(dāng)高門限已經(jīng)確定語音起始端點(diǎn),再返回去利用低門限確定語音的真正起始點(diǎn),語音結(jié)束點(diǎn)的判別方法類似。有時(shí)噪聲的能量也相當(dāng)大,可能超過高門限,但是噪聲一般持續(xù)時(shí)間比較短,可以用持續(xù)時(shí)間來決定是噪聲還是語音。
2.5 識(shí)別判決與相應(yīng)動(dòng)作
??? 因?yàn)楣饫w傳輸?shù)墓?jié)目受到惡意侵入的可能性比較小,因此,可以以這路信號為模板,將其他三路信號與該路信號比較,判決其他三路信號是否遭到惡意侵入。若沒有一路信號與其相同,則說明該路可能受到敵意攻擊,則再選另一路做為模板來做判決。
??? 經(jīng)過語音識(shí)別判決后,在已經(jīng)識(shí)別出的未受干擾的正常廣播節(jié)目信號中,要選取一路最佳節(jié)目作為輸出,即要尋找一路信噪比最高的信號。
??? 在這里,通過計(jì)算信號的平均功率來進(jìn)行判別。具體步驟如下:
??? (1)讀取各路正常信號進(jìn)行分幀后,計(jì)算每一幀的短時(shí)能量;
?? ?(2)對各路信號均取其N幀的短時(shí)能量進(jìn)行累加;
?? ?(3)對它們累加后的結(jié)果取平均,便得到各路信號的平均功率;
?? ?(4)根據(jù)各路信號的平均功率進(jìn)行比較,選擇平均功率最高的那路信號作為輸出。
2.6 實(shí)驗(yàn)結(jié)果
??? 在ICETEK-C6713-A的硬件平臺(tái)下,每次輸入兩路語音信號,并給信號加噪聲(信噪比為13dB),然后對相同信號與不同信號之間進(jìn)行判決。各做了66次實(shí)驗(yàn),其結(jié)果如表1所示。

?


??? 本系統(tǒng)采用相關(guān)性算法,結(jié)合TI公司高速的DSP浮點(diǎn)處理器TMS320C6713嵌入式硬件平臺(tái),實(shí)現(xiàn)對四路廣播節(jié)目的自動(dòng)識(shí)別。系統(tǒng)對提高廣播機(jī)房工作的有效性、可靠性、安全性,并最終實(shí)現(xiàn)無人看守方面有著重大意義。當(dāng)然,系統(tǒng)處理速度和識(shí)別率等方面都有待于優(yōu)化。
參考文獻(xiàn)
[1] 殷福亮,宋愛軍.數(shù)字信號處理C語言程序集[M].遼寧:遼寧科學(xué)技術(shù)出版社,1997.
[2] 李方慧,王飛.TMS320C6000系列DSPs原理與應(yīng)用[M].北京:電子工業(yè)出版社,2003.
[3] 何強(qiáng),何英.MATLAB擴(kuò)展編程[M].北京:清華大學(xué)出版社,2002.
[4] 胡廣書.數(shù)字信號處理理論、算法與實(shí)現(xiàn)[M].北京:清華大學(xué)出版社,2003.
[5] 鄭君理,應(yīng)啟衍,楊為理.信號與系統(tǒng)[M].北京:高等教育出版社,2000.

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。