123,123,123

基于匹配层融合的识别算法研究与实现

2020年电子技术应用第7期

李傲梅，胡正豪，周川川

陆军炮兵防空兵学院信息工程系，安徽合肥230031

摘要： 提出一种基于音视频匹配层自适应加权融合的身份识别方法。在不同程度的噪声情况下，图像与声音的识别率会随噪声的增强而降低，凭借单个生物模态的识别，难以达到很好的预测结果；而且两种模态融合时的权值不同，融合系统的稳定性效果也不同。采用双模态的自适应加权融合不仅可以有效地弥补不同生物模态识别之间的优缺点，而且可以自适应选择最优的权值进行决策。实验表明，该方法的理论推测成立，比单模态的身份识别具有更高的识别率与鲁棒性。

關(guān)鍵詞： 音视频融合匹配层自适应加权身份识别鲁棒性

中圖分類號(hào)： TN06；TP391.4
文獻(xiàn)標(biāo)識(shí)碼： A
DOI：10.16157/j.issn.0258-7998.191426
中文引用格式： 李傲梅，胡正豪，周川川. 基于匹配層融合的識(shí)別算法研究與實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用，2020，46(7)：57-59.
英文引用格式： Li Aomei，Hu Zhenghao，Zhou Chuanchuan. Research and implementation of recognition algorithm based on matching layer fusion[J]. Application of Electronic Technique，2020，46(7)：57-59.

Research and implementation of recognition algorithm based on matching layer fusion

Li Aomei，Hu Zhenghao，Zhou Chuanchuan

Department of Information and Communication Engineering，Army and Artillery Air Defense Force College，Hefei 230031，China

Abstract： This paper proposes an adaptive weighted fusion based on audio-video matching layer.In the case of different degree of noise, the recognition degree of image and sound will decrease with the increase of noise.And the weight of the two modes is different, the stability effect of the fusion system is also different.The adaptive weighted fusion of two modes can not only make up the advantages and disadvantages of different biological modes, but also choose the optimal weight to make the decision.Experiments show that the proposed method is feasible and has higher recognition rate and robustness than single mode identification.

Key words : audio and video fusion；matching layer；adaptive weighting；identification;robustness

0 引言

目前，人工智能迅速崛起，身份識(shí)別技術(shù)更是應(yīng)用在生活各個(gè)領(lǐng)域之中，如檢票、付款、登錄系統(tǒng)等。但是日常應(yīng)用的環(huán)境都是在條件較好的情況，并不滿足全天候嘈雜的復(fù)雜作戰(zhàn)環(huán)境，如在陰雨天或者夜晚光線不充足時(shí)，人臉圖像的采集就會(huì)受到影響；在戰(zhàn)車艙內(nèi)進(jìn)行身份識(shí)別駕駛時(shí)，會(huì)因?yàn)榘l(fā)動(dòng)機(jī)或炮火聲的影響，導(dǎo)致語(yǔ)音信號(hào)受噪聲干擾。所以，依靠任何一種單模態(tài)的身份識(shí)別都極易受到外部環(huán)境的影響。采用多模態(tài)的身份識(shí)別技術(shù)(如人臉、語(yǔ)音、指紋、虹膜等^[1-3])，可以通過(guò)對(duì)來(lái)自多種傳感器信號(hào)的處理、分析、決策，彌補(bǔ)不同模態(tài)信息的不足，降低單一模態(tài)受干擾產(chǎn)生的誤差，得到更加可靠、準(zhǔn)確的結(jié)果。

近年來(lái)，多模態(tài)的融合識(shí)別技術(shù)備受關(guān)注，一般情況下主要分為數(shù)據(jù)層、特征層、匹配層和決策層融合^[4-5]。由于圖像屬于二維信號(hào)，語(yǔ)音屬于一維信號(hào)，數(shù)據(jù)層和特征層融合相容性不強(qiáng)，且運(yùn)算復(fù)雜；決策層融合依賴信息匱乏單一，抗噪能力弱。因此，本文主要提出一種針對(duì)聲紋和人臉特征的匹配層融合識(shí)別算法，首先對(duì)不同說(shuō)話人的無(wú)噪聲語(yǔ)音信號(hào)建立高斯混合模型，然后對(duì)加入噪聲的語(yǔ)音信號(hào)進(jìn)行模型匹配獲得匹配分?jǐn)?shù)，再對(duì)含有噪聲的人臉圖像依次進(jìn)行小波分解、主成分分析(Principal Component Analysis，PCA)降維、支持向量機(jī)(Support Vector Machine，SVM)分類獲取匹配分?jǐn)?shù)，最后利用本文提出的自適應(yīng)加權(quán)融合算法進(jìn)行加權(quán)匹配分析，獲得最優(yōu)決策結(jié)果。本文創(chuàng)新點(diǎn)在于規(guī)范一個(gè)衡量系統(tǒng)穩(wěn)定性的標(biāo)準(zhǔn)ξ，并利用這個(gè)標(biāo)準(zhǔn)選擇最佳的權(quán)值進(jìn)行融合，判斷結(jié)果。實(shí)驗(yàn)結(jié)果驗(yàn)證表明，該方法比采用單一模態(tài)的識(shí)別算法更加有效，具有較高且穩(wěn)定的識(shí)別率。

本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000002902

作者信息:

李傲梅，胡正豪，周川川

(陸軍炮兵防空兵學(xué)院信息工程系，安徽合肥230031)

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容