123,123

基于16位单片机的语音电子门锁系统

日期： 2008-08-25

作者：张成，蒋皓石，林嘉宇

關(guān)鍵詞： 特征参数语音信号说话人识别声纹识别最大

　　摘　要： 介紹采用聲紋識(shí)別" title="聲紋識(shí)別">聲紋識(shí)別技術(shù)、在凌陽(yáng)SPCE061A^[1]單片機(jī)上實(shí)現(xiàn)的一種語(yǔ)音電子門(mén)鎖身份認(rèn)證系統(tǒng)。實(shí)驗(yàn)結(jié)果表明，系統(tǒng)性能穩(wěn)定，識(shí)別效果好，可以推廣使用。
　　關(guān)鍵詞： 聲紋識(shí)別基音周期線性預(yù)測(cè) 模式匹配 DTW

　　生物識(shí)別技術(shù)^[2]是利用人體生物特征進(jìn)行身份認(rèn)證的一種技術(shù)，是目前公認(rèn)的最為方便與安全的識(shí)別技術(shù)。由于每個(gè)人的生物特征具有與其他人不同的惟一性和在一定時(shí)期內(nèi)不變的穩(wěn)定性，不易偽造和假冒，所以利用生物識(shí)別技術(shù)進(jìn)行身份認(rèn)定，安全、準(zhǔn)確、可靠。
　　在生物識(shí)別領(lǐng)域中，聲紋識(shí)別，也稱(chēng)為說(shuō)話人識(shí)別" title="說(shuō)話人識(shí)別">說(shuō)話人識(shí)別，以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢(shì)受到世人矚目，并日益成為人們?nèi)粘Ｉ詈凸ぷ髦兄匾移毡榈陌踩J(rèn)證方式。聲紋識(shí)別是一種根據(jù)說(shuō)話人語(yǔ)音波形中反映說(shuō)話人生理和行為特征的語(yǔ)音參數(shù)，自動(dòng)識(shí)別說(shuō)話人身份的技術(shù)。
　　聲紋識(shí)別技術(shù)可分為兩類(lèi)，即說(shuō)話人辨認(rèn)和說(shuō)話人確認(rèn)。前者用以判斷某段語(yǔ)音是若干人中的哪一個(gè)所說(shuō)的，是多選一的問(wèn)題；而后者用以確認(rèn)某段語(yǔ)音是否是指定的某個(gè)人所說(shuō)的，是一對(duì)一判別的問(wèn)題。從另一方面，聲紋識(shí)別又有與文本有關(guān)和與文本無(wú)關(guān)兩種，根據(jù)特定的任務(wù)和應(yīng)用，應(yīng)用范圍不同。與文本有關(guān)的聲紋識(shí)別系統(tǒng)要求用戶按照規(guī)定的內(nèi)容發(fā)音，每個(gè)人的聲紋模型逐個(gè)被精確地建立，而識(shí)別時(shí)也必須按規(guī)定的內(nèi)容發(fā)音，因此可以達(dá)到較好的識(shí)別效果；而與文本無(wú)關(guān)的識(shí)別系統(tǒng)則不規(guī)定說(shuō)話人的發(fā)音內(nèi)容，模型建立相對(duì)困難，但用戶使用方便，應(yīng)用范圍較寬。
　　本文介紹的語(yǔ)音電子門(mén)鎖是一種在凌陽(yáng)16位單片機(jī)SPCE061A上實(shí)現(xiàn)的與文本有關(guān)的說(shuō)話人確認(rèn)系統(tǒng)。該系統(tǒng)主要由說(shuō)話人識(shí)別模塊、門(mén)鎖控制電機(jī)以及門(mén)鎖等部分組成。在訓(xùn)練時(shí)，說(shuō)話人的聲音通過(guò)麥克風(fēng)進(jìn)入說(shuō)話人語(yǔ)音信號(hào)" title="語(yǔ)音信號(hào)">語(yǔ)音信號(hào)采集前端電路，由語(yǔ)音信號(hào)處理電路對(duì)采集的語(yǔ)音信號(hào)進(jìn)行特征化和語(yǔ)音處理，提取說(shuō)話人的個(gè)性特征參數(shù)" title="特征參數(shù)">特征參數(shù)并進(jìn)行存儲(chǔ)，形成說(shuō)話人特征參數(shù)數(shù)據(jù)庫(kù)。在識(shí)別時(shí)，將待識(shí)別語(yǔ)音與說(shuō)話人特征參數(shù)數(shù)據(jù)庫(kù)進(jìn)行匹配，通過(guò)輸出電路控制門(mén)鎖電機(jī)，最終實(shí)現(xiàn)對(duì)門(mén)鎖的控制。
1 算法原理
　　說(shuō)話人識(shí)別算法原理框圖如圖1所示。

1.1 預(yù)處理
　　(1)去噪
　　對(duì)麥克風(fēng)輸入的模擬語(yǔ)音信號(hào)進(jìn)行量化和采樣，獲得數(shù)字化的語(yǔ)音信號(hào)；再將含噪的語(yǔ)音信號(hào)通過(guò)去噪處理，得到干凈的語(yǔ)音信號(hào)后并通過(guò)預(yù)加重技術(shù)濾除低頻干擾，尤其是50Hz或60Hz的工頻干擾，提升語(yǔ)音信號(hào)的高頻部分，而且它還可以起到消除直流漂移、抑制隨機(jī)噪聲和提升清音部分能量的作用。
　　(2)端點(diǎn)檢測(cè)
　　本系統(tǒng)采用語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)過(guò)零率進(jìn)行端點(diǎn)檢測(cè)。語(yǔ)音信號(hào)的采樣頻率為8kHz，每幀數(shù)據(jù)為20ms，共計(jì)160個(gè)采樣點(diǎn)。每隔20ms計(jì)算一次短時(shí)能量和短時(shí)過(guò)零率。通過(guò)對(duì)語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)過(guò)零率檢測(cè)可以剔除掉靜默幀、白噪聲幀和清音幀，最后保留對(duì)求取基音、LPCC等特征參數(shù)非常有用的濁音信號(hào)。
1.2 特征提取
　　在語(yǔ)音信號(hào)預(yù)處理后，接著是特征參數(shù)的提取。特征提取的任務(wù)就是提取語(yǔ)音信號(hào)中表征人的基本特征。
1.2.1 特征參數(shù)的選取
　　選取的特征必須能夠有效地區(qū)分不同的說(shuō)話人，且對(duì)同一說(shuō)話人的變化保持相對(duì)穩(wěn)定，同時(shí)要求特征參數(shù)計(jì)算簡(jiǎn)便，最好有高效快速算法，以保證識(shí)別的實(shí)時(shí)性。
　　說(shuō)話人特征大體可歸為下述幾類(lèi)：
　　(1)基于發(fā)聲器官如聲門(mén)、聲道和鼻腔的生理結(jié)構(gòu)而提取的參數(shù)。如譜包絡(luò)、基音、共振峰等。其中基音能夠很好地刻畫(huà)說(shuō)話人的聲帶特性，在很大程度上反映了人的個(gè)性特征。
　　(2)基于聲道特征模型，通過(guò)線性預(yù)測(cè)分析得到的參數(shù)。包括線性預(yù)測(cè)系數(shù)(LPC)以及由線性預(yù)測(cè)導(dǎo)出的各種參數(shù)，如線性預(yù)測(cè)倒譜系數(shù)(LPCC)、部分相關(guān)系數(shù)、反射系數(shù)、對(duì)數(shù)面積比、LSP線譜對(duì)、線性預(yù)測(cè)殘差等。根據(jù)前人的工作成果和實(shí)際測(cè)試比較，LPCC參數(shù)不但能較好地反映聲道的共振峰特性，具有較好地識(shí)別效果，而且可以用比較簡(jiǎn)單的運(yùn)算和較快的速度求得。
　　(3)基于人耳的聽(tīng)覺(jué)機(jī)理，反映聽(tīng)覺(jué)特性，模擬人耳對(duì)聲音頻率感知的特征參數(shù)。如美爾倒譜系數(shù)(MFCC)等。MFCC參數(shù)與基于線性預(yù)測(cè)的倒譜分析相比，突出的優(yōu)點(diǎn)是不依賴全極點(diǎn)語(yǔ)音產(chǎn)生模型的假定，在與文本無(wú)關(guān)的說(shuō)話人識(shí)別系統(tǒng)中MFCC參數(shù)能夠比LPCC參數(shù)更好地提高系統(tǒng)的識(shí)別性能^[3]。
　　此外，人們還通過(guò)對(duì)不同特征參量的組合來(lái)提高實(shí)際系統(tǒng)的性能。當(dāng)各組合參量間相關(guān)性不大時(shí)，會(huì)有較好的效果，因?yàn)樗鼈兎謩e反映了語(yǔ)音信號(hào)的不同特征。
　　在計(jì)算機(jī)平臺(tái)的仿真實(shí)驗(yàn)中，通過(guò)各種參數(shù)的實(shí)際比較，采用MFCC參數(shù)比采用LPCC參數(shù)有更好的識(shí)別效果。但在SPCE061A平臺(tái)上做實(shí)時(shí)處理時(shí)，與LPCC系數(shù)相比，MFCC系數(shù)計(jì)算有兩個(gè)缺點(diǎn)：一是計(jì)算時(shí)間長(zhǎng)；二是精度難以保證。由于MFCC系數(shù)的計(jì)算需要FFT變換和對(duì)數(shù)操作，影響了計(jì)算的動(dòng)態(tài)范圍；要保證系統(tǒng)識(shí)別的實(shí)時(shí)性，就只有犧牲參數(shù)精度。而LPCC參數(shù)的計(jì)算有遞推公式，速度和精度都可以保證，識(shí)別效果也滿足實(shí)際需要。
　　本系統(tǒng)采用了基音周期和線性預(yù)測(cè)倒譜系數(shù)(LPCC)共同作為說(shuō)話人識(shí)別的特征參數(shù)。
1.2.2 LPCC參數(shù)的提取
　　基于線性預(yù)測(cè)分析的倒譜參數(shù)LPCC可以通過(guò)簡(jiǎn)單的遞推公式由線性預(yù)測(cè)系數(shù)求得。遞推公式如下：
　　
　　其中p為L(zhǎng)PC模型的階數(shù)，也是模型的極點(diǎn)個(gè)數(shù)。
　　(1)LPC模型階數(shù)p的確定
　　為使模型假定更好地符合語(yǔ)音產(chǎn)生模型，應(yīng)該使LPC模型的階數(shù)p與共振峰個(gè)數(shù)相吻合，其次是考慮聲門(mén)脈沖形狀和口唇輻射影響的補(bǔ)償。通常一對(duì)極點(diǎn)對(duì)應(yīng)一個(gè)共振峰，10kHz采樣的語(yǔ)音信號(hào)通常有5個(gè)共振峰，取p=10，對(duì)于8kHz采樣的語(yǔ)音信號(hào)可取p=8。此外為了彌補(bǔ)鼻音中存在的零點(diǎn)以及其他因素引起的偏差，通常在上述階數(shù)的基礎(chǔ)上再增加兩個(gè)極點(diǎn)，即分別是p=12和p=10。實(shí)驗(yàn)表明，選擇LPC分析階數(shù)p=12，對(duì)絕大多數(shù)語(yǔ)音信號(hào)的聲道模型可以足夠近似地逼近。p值選得過(guò)大雖然可以略微改善逼近效果，但也帶來(lái)一些負(fù)作用，一方面是加大了計(jì)算量，另一方面有可能增添一些不必要的細(xì)節(jié)。
　　(2)線性預(yù)測(cè)系數(shù)的求取
　　自相關(guān)解法主要有杜賓(Durbin)算法、格型(Lattice)算法和舒爾(Schur)算法等幾種遞推算法。其中杜賓算法是目前最常用的算法，而且在求取LPC系數(shù)時(shí)計(jì)算量也最小，本系統(tǒng)采用該遞推算法^[4]。
1.2.3 基音參數(shù)的提取
　　基音估計(jì)的方法很多，主要有基于短時(shí)自相關(guān)函數(shù)和基于短時(shí)平均幅度差函數(shù)(AMDF)等基音估計(jì)方法。
　　(1)基于短時(shí)自相關(guān)函數(shù)的基音估計(jì)^[4]
　　短時(shí)自相關(guān)函數(shù)在基音周期的整數(shù)倍位置存在較大的峰值，只要找出第一最大" title="最大">最大峰值的位置就可以估計(jì)出基音周期。
　　(2)基于短時(shí)平均幅度差函數(shù)(AMDF)的基音估計(jì)^[4]
　　基于短時(shí)平均幅度差函數(shù)(AMDF)在基音周期的整數(shù)倍位置存在較大的谷值，找到第一最大谷值的位置就可以估計(jì)出基音周期。這種方法的缺點(diǎn)是當(dāng)語(yǔ)音信號(hào)的幅度快速變化時(shí)，AMDF函數(shù)的谷值深度會(huì)減小，從而影響基音估計(jì)的精度。
　　實(shí)際上第一最大峰(谷)值點(diǎn)的位置有時(shí)并不能與基音周期吻合，第一最大峰(谷)值點(diǎn)的位置與短時(shí)窗的長(zhǎng)度有關(guān)且會(huì)受到共振峰的干擾。一般窗長(zhǎng)至少應(yīng)大于兩個(gè)基音周期，才可能獲得較好的估計(jì)效果。語(yǔ)音中最長(zhǎng)基音周期值約為20ms，本系統(tǒng)在估計(jì)基音周期時(shí)窗長(zhǎng)選擇40ms。為了減小共振峰的影響，首先對(duì)語(yǔ)音進(jìn)行頻率范圍為[60,900]Hz的帶通濾波。因?yàn)樽罡呋纛l率為450Hz，所以將上限頻率設(shè)為900Hz可以保留語(yǔ)音的一、二次諧波，下限頻率為60Hz是為了濾除50Hz的電源干擾。
　　以上兩種方法都是對(duì)語(yǔ)音信號(hào)本身求相應(yīng)的函數(shù)。本系統(tǒng)采用的基音估計(jì)方法是：首先對(duì)帶通濾波后的短時(shí)語(yǔ)音信號(hào)進(jìn)行線性預(yù)測(cè)，求取預(yù)測(cè)殘差；再對(duì)殘差信號(hào)求自相關(guān)函數(shù)，找出第一最大峰值點(diǎn)的位置，即得到該段語(yǔ)音的基音估計(jì)值。實(shí)驗(yàn)表明，通過(guò)殘差求取的基音軌跡比直接通過(guò)語(yǔ)音求取的基音軌跡效果更好，如圖2所示。圖2中橫坐標(biāo)為語(yǔ)音幀數(shù)，縱坐標(biāo)為8000/f，其中f為基音頻率。

1.3 模式匹配
　　目前針對(duì)各種特征參數(shù)提出的模式匹配方法的研究越來(lái)越深入。典型的方法^[4]有：矢量量化方法、高斯混合模型方法、隱馬爾可夫模型方法、動(dòng)態(tài)時(shí)間規(guī)整(DTW)方法和人工神經(jīng)網(wǎng)絡(luò)方法。
　　這些方法都有各自的優(yōu)點(diǎn)和缺點(diǎn)。其中DTW算法對(duì)于較長(zhǎng)語(yǔ)音的識(shí)別，模板匹配運(yùn)算量太大，但對(duì)短語(yǔ)音(有效語(yǔ)音長(zhǎng)度低于3s)的識(shí)別既簡(jiǎn)單又有效，而且并不比其他方法識(shí)別率低，特別適用于短語(yǔ)音、與文本有關(guān)的說(shuō)話人識(shí)別系統(tǒng)。本系統(tǒng)采用端點(diǎn)松弛兩點(diǎn)的(DTW)算法，端點(diǎn)松弛引起的計(jì)算量增加并不大，還可以放松對(duì)端點(diǎn)檢測(cè)的精度要求。
　　動(dòng)態(tài)時(shí)間規(guī)整(DTW)算法基于動(dòng)態(tài)規(guī)劃的思想，解決了說(shuō)話人不同時(shí)期發(fā)音長(zhǎng)短、語(yǔ)速不一樣的匹配問(wèn)題。DTW算法用于計(jì)算兩個(gè)長(zhǎng)度不同的模板之間的相似程度，用失真距離表示。假設(shè)測(cè)試模板和參考模板分別用T和R表示，按時(shí)間順序含有N幀和M幀的語(yǔ)音參數(shù)(本系統(tǒng)為12維LPCC參數(shù))，失真距離越小，表示T、R越接近。把測(cè)試模板的各個(gè)幀號(hào)n=1~N在一個(gè)二維直角坐標(biāo)系中的橫軸上標(biāo)出，把參考模板的各幀號(hào)m=1~M在縱軸上標(biāo)出，如圖3所示。通過(guò)這些表示幀號(hào)的整數(shù)坐標(biāo)畫(huà)出縱橫線即形成網(wǎng)格，網(wǎng)格中的每一個(gè)交叉點(diǎn)(n,m)表示測(cè)試模板中某一幀與參考模式中某一幀的交會(huì)點(diǎn)，對(duì)應(yīng)兩個(gè)向量的歐氏距離。DTW算法可以歸結(jié)為尋找一條通過(guò)此網(wǎng)格中若干交叉點(diǎn)的路徑，使得該路徑上節(jié)點(diǎn)的距離和(即失真距離)為最小^[4]。對(duì)于端點(diǎn)松弛的情況，路徑搜索原理相同，只是增加了搜索路徑。

2 硬件系統(tǒng)
　　語(yǔ)音電子門(mén)鎖系統(tǒng)的核心是說(shuō)話人識(shí)別模塊。包括按鍵輸入、語(yǔ)音信號(hào)采集、語(yǔ)音信號(hào)處理、FLASH存儲(chǔ)擴(kuò)展、揚(yáng)聲器輸出、控制輸出以及LCD模組等。說(shuō)話人識(shí)別模塊的原理框圖如圖4所示。其核心為語(yǔ)音信號(hào)處理，本系統(tǒng)選用特別適用于數(shù)字語(yǔ)音識(shí)別領(lǐng)域的凌陽(yáng)16位單片機(jī)SPCE061A，并通過(guò)SPCE061A實(shí)現(xiàn)對(duì)其他各組成部分的編程控制。

　　SPCE061A是凌陽(yáng)公司開(kāi)發(fā)的一種性價(jià)比非常高的16位單片機(jī)。在2.6V~3.6V工作電壓范圍內(nèi)，工作頻率范圍為0.32MHz~49.152MHz，較高的處理速度使其能夠非常容易、快速地處理復(fù)雜的數(shù)字信號(hào)；中斷系統(tǒng)支持10個(gè)中斷向量以及14個(gè)可來(lái)自系統(tǒng)時(shí)鐘、定時(shí)器/計(jì)數(shù)器、時(shí)間基準(zhǔn)發(fā)生器、外部中斷、鍵喚醒、通用異步串行通信及軟中斷的中斷源，非常適合實(shí)時(shí)應(yīng)用領(lǐng)域；內(nèi)嵌2K字的SRAM和32K字的FLASH，具有32位可編程的多功能I/O端口；包含有7通道10位通用A/D轉(zhuǎn)換器和內(nèi)置麥克風(fēng)放大器與自動(dòng)增益控制AGC功能的單通道聲音A/D轉(zhuǎn)換器，以及具有音頻輸出功能的雙通道10位D/A轉(zhuǎn)換器；SPCE061A采用CMOS制造工藝，同時(shí)增加了軟件激發(fā)的弱振方式、空閑方式和掉電方式，系統(tǒng)處于備用狀態(tài)下(時(shí)鐘處于停止?fàn)顟B(tài))，耗電僅為2μA 3.6V，極大地降低了其功耗；另外，μ’nSP^TM的指令系統(tǒng)還提供具有較高運(yùn)算速度的16位×16位的乘法運(yùn)算指令和內(nèi)積運(yùn)算指令，為其應(yīng)用增添了DSP功能，在復(fù)雜的數(shù)字信號(hào)處理方面既非常便利，又比專(zhuān)用的DSP芯片便宜得多。
　　說(shuō)話人識(shí)別模塊各組成部分完成的功能如下：
　　(1)按鍵輸入部分：共有數(shù)字鍵、訓(xùn)練鍵、刪除鍵、確認(rèn)鍵和取消鍵等16個(gè)按鍵，用于密碼輸入和工作模式選擇。采用4×4矩陣式鍵盤(pán)輸入，只使用具有鍵喚醒功能IOA的低8位，可以合理利用硬件資源，且編程靈活。
　　(2)語(yǔ)音信號(hào)采集部分：通過(guò)SPCE061A內(nèi)置麥克風(fēng)放大器與自動(dòng)增益控制AGC功能的單通道聲音A/D轉(zhuǎn)換器完成8kHz語(yǔ)音信號(hào)采集。
　　(3)FLASH存儲(chǔ)擴(kuò)展部分：用于存儲(chǔ)說(shuō)話人的個(gè)性特征參數(shù)參考模板。
　　(4)揚(yáng)聲器輸出部分：通過(guò)SPCE061A具有音頻輸出功能的雙通道10位D/A轉(zhuǎn)換器完成用戶訓(xùn)練、識(shí)別等各種操作的語(yǔ)音提示。
　　(5)控制輸出部分：通過(guò)SPCE061A的可編程I/O口控制門(mén)鎖控制電機(jī)。
　　(6)LCD模組部分：用以顯示系統(tǒng)的工作狀態(tài)，該部分根據(jù)成本和實(shí)際需要可選。
　　(7)SPCE061A：說(shuō)話人的語(yǔ)音信號(hào)處理以及各部分的編程控制均由SPCE061A完成。
　　說(shuō)話人識(shí)別模塊有三種工作模式：訓(xùn)練模式、認(rèn)證模式和密碼模式，這三種模式都可通過(guò)工作模式按鍵選擇。
　　(1)訓(xùn)練模式，說(shuō)話人的聲音通過(guò)麥克風(fēng)進(jìn)入語(yǔ)音信號(hào)采集前端電路。第一次語(yǔ)音輸入時(shí)，由16位單片機(jī)SPCE061A對(duì)采集的語(yǔ)音信號(hào)進(jìn)行處理，提取說(shuō)話人的個(gè)性特征參數(shù)，并存儲(chǔ)到外擴(kuò)的FLASH內(nèi)，形成說(shuō)話人特征參數(shù)模板?？梢赃M(jìn)行三次訓(xùn)練，第二語(yǔ)音輸入時(shí)，提取的個(gè)性特征參數(shù)與由第一次語(yǔ)音輸入形成的特征參數(shù)模板進(jìn)行匹配，在匹配距離小于模板更新閾值時(shí)，將說(shuō)話人特征參數(shù)模板更新為兩次特征參數(shù)的平均值。第三次語(yǔ)音輸入時(shí)，提取的個(gè)性特征參數(shù)與由第一、二次語(yǔ)音輸入形成的特征參數(shù)模板進(jìn)行匹配，在匹配距離小于模板更新閾值時(shí)，將說(shuō)話人特征參數(shù)模板更新為三次特征參數(shù)的平均值，形成最后的該說(shuō)話人的特征參數(shù)模板。
　　(2)認(rèn)證模式，同樣通過(guò)麥克風(fēng)錄入說(shuō)話人的聲音，再由SPCE061A對(duì)采集的語(yǔ)音信號(hào)進(jìn)行處理，將提取的說(shuō)話人特征參數(shù)與存儲(chǔ)在外擴(kuò)FLASH內(nèi)的特征參數(shù)模板進(jìn)行匹配，匹配距離小于認(rèn)證閾值時(shí)，通過(guò)認(rèn)證；然后再判斷匹配距離是否小于認(rèn)證模式下的模板更新閾值，決定是否對(duì)模板進(jìn)行更新。
　　(3)密碼工作模式，在說(shuō)話人感冒或其他使其聲音發(fā)生暫時(shí)改變的情況下，可以采用長(zhǎng)密碼方式進(jìn)行認(rèn)證，以免因?yàn)榉浅Ｔ虮痪苤T(mén)外。
　　另外，每個(gè)用戶都有一個(gè)短密碼(用戶可自行修改)，無(wú)論在訓(xùn)練模式還是認(rèn)證模式都要輸入此密碼，以形成或找到與該用戶相對(duì)應(yīng)的特征參數(shù)模板。系統(tǒng)還設(shè)置一個(gè)具有長(zhǎng)密碼的超級(jí)管理員用戶，可以通過(guò)鍵盤(pán)對(duì)用戶模板進(jìn)行添加或刪除。
3 實(shí)驗(yàn)結(jié)果
　　對(duì)于說(shuō)話人確認(rèn)系統(tǒng)，表征其性能的最重要的兩個(gè)參量是拒識(shí)率和誤識(shí)率。前者是拒絕真實(shí)的說(shuō)話人而造成的錯(cuò)誤，后者是接受假冒者而造成的錯(cuò)誤，二者與匹配閾值的設(shè)定相關(guān)。匹配閾值的設(shè)定與語(yǔ)音鎖系統(tǒng)的應(yīng)用場(chǎng)合、功能側(cè)重有關(guān)，對(duì)于家庭、賓館等門(mén)鎖用戶，要求誤識(shí)率盡可能低，甚至為零；若用于公司員工考勤等同類(lèi)功能，就不能有太高的拒識(shí)率。表1是對(duì)以下每種情況各進(jìn)行100次實(shí)時(shí)匹配的結(jié)果，其中設(shè)定的閾值適合門(mén)鎖用戶。

　　由以上實(shí)驗(yàn)結(jié)果可知，對(duì)于同一個(gè)人相同發(fā)音的拒識(shí)率為8％；對(duì)于同一個(gè)人相似發(fā)音情況，因?yàn)橄到y(tǒng)是對(duì)說(shuō)話的人進(jìn)行判別，對(duì)于這種情況，無(wú)論拒絕或接受都是合理的；對(duì)于同一個(gè)人不同發(fā)音和不同人發(fā)音的情況，誤識(shí)率為零。使用錄音機(jī)錄音進(jìn)行多次實(shí)驗(yàn)，通過(guò)認(rèn)證的次數(shù)為零。對(duì)于門(mén)鎖用戶，這個(gè)結(jié)果是十分理想的。若用于考勤等同類(lèi)功能，可通過(guò)修改匹配閾值實(shí)現(xiàn)。
　　聲紋識(shí)別與其他生物識(shí)別技術(shù)相比，除具有不會(huì)遺失和忘記、不需記憶、使用方便等優(yōu)點(diǎn)外，還具有以下特性：用戶接受程度高，由于不涉及隱私問(wèn)題，用戶無(wú)任何心理障礙；聲音輸入設(shè)備造價(jià)低廉，而其他生物識(shí)別技術(shù)的輸入設(shè)備通常造價(jià)昂貴。與利用虹膜、指紋和人臉等技術(shù)的門(mén)鎖相比，基于SPCE061A構(gòu)建的語(yǔ)音電子門(mén)鎖系統(tǒng)具有成本低、使用方便、保密性好等優(yōu)點(diǎn)。經(jīng)大量實(shí)驗(yàn)測(cè)試表明，該系統(tǒng)性能穩(wěn)定、識(shí)別效果好。下一步將進(jìn)行小批量的試用，以發(fā)現(xiàn)問(wèn)題并加以完善。但是，在環(huán)境噪聲或干擾信號(hào)高于語(yǔ)音信號(hào)時(shí)，該系統(tǒng)將無(wú)法進(jìn)行正確的語(yǔ)音識(shí)別，在背景噪聲處理及其工程實(shí)現(xiàn)上還需進(jìn)一步改進(jìn)。
參考文獻(xiàn)
1 http://www.unsp.com.cn
2 孫冬梅，裘正定.生物特征識(shí)別技術(shù)綜述.電子學(xué)報(bào)，2001;(12Ａ)
3 S. Tsekeridou, C. Kotropoulos, A. Xafopoulos, I. Pitas.Com-parative study of speaker verification techniques based on vector quantization, sphericity models and dynamic time war-ping. in Proc. of European Conf. on Circuit Theory and De-sign, Helsinki, Finland, 2001
4 楊行峻，遲惠生.語(yǔ)音信號(hào)數(shù)字處理.北京:電子工業(yè)出版社，1995

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

基于16位单片机的语音电子门锁系统

日期： 2008-08-25

作者：张 成，蒋皓石，林嘉宇

相關(guān)內(nèi)容

作者：张成，蒋皓石，林嘉宇