《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于匹配層融合的識別算法研究與實現(xiàn)
基于匹配層融合的識別算法研究與實現(xiàn)
2020年電子技術(shù)應(yīng)用第7期
李傲梅,胡正豪,周川川
陸軍炮兵防空兵學(xué)院 信息工程系,安徽 合肥230031
摘要: 提出一種基于音視頻匹配層自適應(yīng)加權(quán)融合的身份識別方法。在不同程度的噪聲情況下,圖像與聲音的識別率會隨噪聲的增強(qiáng)而降低,憑借單個生物模態(tài)的識別,難以達(dá)到很好的預(yù)測結(jié)果;而且兩種模態(tài)融合時的權(quán)值不同,融合系統(tǒng)的穩(wěn)定性效果也不同。采用雙模態(tài)的自適應(yīng)加權(quán)融合不僅可以有效地彌補(bǔ)不同生物模態(tài)識別之間的優(yōu)缺點,而且可以自適應(yīng)選擇最優(yōu)的權(quán)值進(jìn)行決策。實驗表明,該方法的理論推測成立,比單模態(tài)的身份識別具有更高的識別率與魯棒性。
中圖分類號: TN06;TP391.4
文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.191426
中文引用格式: 李傲梅,胡正豪,周川川. 基于匹配層融合的識別算法研究與實現(xiàn)[J].電子技術(shù)應(yīng)用,2020,46(7):57-59.
英文引用格式: Li Aomei,Hu Zhenghao,Zhou Chuanchuan. Research and implementation of recognition algorithm based on matching layer fusion[J]. Application of Electronic Technique,2020,46(7):57-59.
Research and implementation of recognition algorithm based on matching layer fusion
Li Aomei,Hu Zhenghao,Zhou Chuanchuan
Department of Information and Communication Engineering,Army and Artillery Air Defense Force College,Hefei 230031,China
Abstract: This paper proposes an adaptive weighted fusion based on audio-video matching layer.In the case of different degree of noise, the recognition degree of image and sound will decrease with the increase of noise.And the weight of the two modes is different, the stability effect of the fusion system is also different.The adaptive weighted fusion of two modes can not only make up the advantages and disadvantages of different biological modes, but also choose the optimal weight to make the decision.Experiments show that the proposed method is feasible and has higher recognition rate and robustness than single mode identification.
Key words : audio and video fusion;matching layer;adaptive weighting;identification;robustness

0 引言

    目前,人工智能迅速崛起,身份識別技術(shù)更是應(yīng)用在生活各個領(lǐng)域之中,如檢票、付款、登錄系統(tǒng)等。但是日常應(yīng)用的環(huán)境都是在條件較好的情況,并不滿足全天候嘈雜的復(fù)雜作戰(zhàn)環(huán)境,如在陰雨天或者夜晚光線不充足時,人臉圖像的采集就會受到影響;在戰(zhàn)車艙內(nèi)進(jìn)行身份識別駕駛時,會因為發(fā)動機(jī)或炮火聲的影響,導(dǎo)致語音信號受噪聲干擾。所以,依靠任何一種單模態(tài)的身份識別都極易受到外部環(huán)境的影響。采用多模態(tài)的身份識別技術(shù)(如人臉、語音、指紋、虹膜等[1-3]),可以通過對來自多種傳感器信號的處理、分析、決策,彌補(bǔ)不同模態(tài)信息的不足,降低單一模態(tài)受干擾產(chǎn)生的誤差,得到更加可靠、準(zhǔn)確的結(jié)果。

    近年來,多模態(tài)的融合識別技術(shù)備受關(guān)注,一般情況下主要分為數(shù)據(jù)層、特征層、匹配層和決策層融合[4-5]。由于圖像屬于二維信號,語音屬于一維信號,數(shù)據(jù)層和特征層融合相容性不強(qiáng),且運(yùn)算復(fù)雜;決策層融合依賴信息匱乏單一,抗噪能力弱。因此,本文主要提出一種針對聲紋和人臉特征的匹配層融合識別算法,首先對不同說話人的無噪聲語音信號建立高斯混合模型,然后對加入噪聲的語音信號進(jìn)行模型匹配獲得匹配分?jǐn)?shù),再對含有噪聲的人臉圖像依次進(jìn)行小波分解、主成分分析(Principal Component Analysis,PCA)降維、支持向量機(jī)(Support Vector Machine,SVM)分類獲取匹配分?jǐn)?shù),最后利用本文提出的自適應(yīng)加權(quán)融合算法進(jìn)行加權(quán)匹配分析,獲得最優(yōu)決策結(jié)果。本文創(chuàng)新點在于規(guī)范一個衡量系統(tǒng)穩(wěn)定性的標(biāo)準(zhǔn)ξ,并利用這個標(biāo)準(zhǔn)選擇最佳的權(quán)值進(jìn)行融合,判斷結(jié)果。實驗結(jié)果驗證表明,該方法比采用單一模態(tài)的識別算法更加有效,具有較高且穩(wěn)定的識別率。




本文詳細(xì)內(nèi)容請下載:http://ihrv.cn/resource/share/2000002902




作者信息:

李傲梅,胡正豪,周川川

(陸軍炮兵防空兵學(xué)院 信息工程系,安徽 合肥230031)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。