文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.200354
中文引用格式: 王高升. 人臉屬性識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].電子技術(shù)應(yīng)用,2021,47(4):112-115,125.
英文引用格式: Wang Gaosheng. Design and implementation of face attribute recognition system[J]. Application of Electronic Technique,2021,47(4):112-115,125.
0 引言
人臉的屬性包含了人的面部相關(guān)重要的信息,如人的年齡、性別、種族等屬性信息。人臉屬性的識(shí)別就是借助提取出的人臉面部的屬性信息然后再進(jìn)行識(shí)別的過程。最近的幾年來,隨著計(jì)算機(jī)視覺技術(shù)、深度學(xué)習(xí)及卷積神經(jīng)網(wǎng)絡(luò)的飛速發(fā)展與應(yīng)用,出現(xiàn)了許多人臉檢測(cè)與識(shí)別相關(guān)的應(yīng)用,其中常見的一些應(yīng)用場景包括:道路上的行人監(jiān)控系統(tǒng)(如檢測(cè)道路上的行人是否佩戴墨鏡或者口罩等)、人臉識(shí)別的門禁系統(tǒng)[1]以及采用人臉識(shí)別的打卡簽到系統(tǒng)等。雖然目前在人臉檢測(cè)與人臉屬性識(shí)別的方面得到了非常大的發(fā)展,不過很多的之前的研究僅僅局限于預(yù)測(cè)單個(gè)的人臉的屬性(例如性別或者年齡)或者為每個(gè)的人臉屬性信息都通過學(xué)習(xí)得到一個(gè)單獨(dú)的用于進(jìn)行識(shí)別的模型。
相比于基于HOG-多尺度LBP特征的人臉性別識(shí)別[2]的93.0%準(zhǔn)確率,本文采用的人臉屬性識(shí)別網(wǎng)絡(luò)在性別屬性識(shí)別的準(zhǔn)確率上有了4.32%的提升。文獻(xiàn)[2]提出了一種方向梯度直方圖和多尺度局部二值模式多特征融合的人臉性別識(shí)別算法。首先,對(duì)輸入圖像進(jìn)行裁剪和縮放得到多個(gè)分辨率的人臉圖像,再分別提取LBP統(tǒng)計(jì)直方圖并合成一個(gè)特征向量;然后提取目標(biāo)圖像頭肩模型的HOG特征得到HOG特征向量;最后,將LBP特征向量與HOG特征向量合成一個(gè)新的特征向量,應(yīng)用支持向量機(jī)進(jìn)行訓(xùn)練。而相比于本文提出的采用深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉檢測(cè)及人臉屬性的識(shí)別,本文的網(wǎng)絡(luò)結(jié)構(gòu)在性別屬性識(shí)別上有著更好的效果。
同時(shí)本文采用的網(wǎng)絡(luò)結(jié)構(gòu)相比于DEPGHAN A[3]提出的基于MTL的DCNN網(wǎng)絡(luò)去識(shí)別人臉的屬性,其網(wǎng)絡(luò)是基于不同的任務(wù)采用不同的數(shù)據(jù)集去訓(xùn)練該DCNN網(wǎng)絡(luò),本文通過采用Resnet50深度殘差卷積神經(jīng)網(wǎng)絡(luò)同時(shí)進(jìn)行人臉多屬性的識(shí)別,使用一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)實(shí)現(xiàn)多個(gè)人臉屬性的識(shí)別而非單一人臉屬性識(shí)別,同時(shí)本文人臉多屬性識(shí)別的準(zhǔn)確率相比于基于MTL的DCNN網(wǎng)絡(luò)在年齡屬性識(shí)別及性別屬性識(shí)別上分別有7.64%和6.32%的提升,提升顯著。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003487
作者信息:
王高升
(華北計(jì)算機(jī)系統(tǒng)工程研究所,北京100083)
