《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 戴口罩人臉識(shí)別,是不是偽命題

戴口罩人臉識(shí)別,是不是偽命題

2020-02-27
來(lái)源:網(wǎng)易科技
關(guān)鍵詞: AI 如意支付

  昨天,雷鋒網(wǎng)AI掘金志其中的一個(gè)安防社群因?yàn)橐粋€(gè)話題引發(fā)了不小的爭(zhēng)論:“AI產(chǎn)品能否高效地實(shí)時(shí)識(shí)別出戴口罩的人是誰(shuí)?”

1.jpg

  過(guò)去一段時(shí)間,受疫情影響,民眾們無(wú)不戴上了口罩,這同時(shí)也給人臉識(shí)別檢測(cè)造成了不小的困擾。就此,部分廠商連夜升級(jí)原有算法,革新固有產(chǎn)品。并聲稱,升級(jí)后的AI系統(tǒng),即使居民戴了口罩,也能做到無(wú)障礙識(shí)別。

  對(duì)于這個(gè)說(shuō)法,有業(yè)內(nèi)人士認(rèn)為:“無(wú)論算法如何升級(jí),這類AI產(chǎn)品很難落地及量產(chǎn),口罩識(shí)別技術(shù)根本不可能做到。”

2.jpg

  但也有人極力反駁:“相關(guān)技術(shù)已經(jīng)比較成熟,口罩識(shí)別沒(méi)有什么問(wèn)題,相關(guān)產(chǎn)品目前已經(jīng)成功商用了?!?/p>

3.jpg

  一時(shí)間,社會(huì)話題之外,“口罩”也成了AI圈的熱議詞匯。

  1

  在討論AI能否識(shí)別戴口罩的群體之前,我們先來(lái)談?wù)勅四樧R(shí)別的使用場(chǎng)景。

  目前,人臉識(shí)別的落地方向大致可以分為兩大類:

  一是消費(fèi)級(jí)場(chǎng)景,譬如手機(jī)解鎖、社區(qū)出入等等;

  二是安防類場(chǎng)景,譬如逃犯抓捕、幼兒尋回等等。

  這兩大類場(chǎng)景對(duì)于技術(shù)的要求維度截然不同,消費(fèi)類場(chǎng)景看中技術(shù)精度,涉及到金融支付的手機(jī)解鎖等場(chǎng)景對(duì)于AI識(shí)別準(zhǔn)確率要求之高讓人咂舌,通常四個(gè)九起步。

  以如意支付PAD為例,該款刷臉支付設(shè)備內(nèi)置了銀行卡檢測(cè)中心認(rèn)證的云從增強(qiáng)級(jí)活體檢測(cè)模組,并已實(shí)現(xiàn)99.99%的防活體攻擊準(zhǔn)確率。

  而安防類場(chǎng)景則更為看中技術(shù)的廣度。以公安抓逃為例,為了逃避天眼追蹤,絕大多數(shù)犯罪嫌疑人在反偵察過(guò)程中都會(huì)選擇戴帽子或者戴口罩,以遮擋部分面部特征。

  考慮到安防場(chǎng)景的現(xiàn)實(shí)所需,部分廠商很久之前就開(kāi)展了對(duì)于面部遮擋技術(shù)的研究工作,在提升技術(shù)可用性方面做了不同程度的嘗試。

  雷鋒網(wǎng)AI掘金志通過(guò)采訪數(shù)位業(yè)內(nèi)資深專家,得到的答案比較一致:

  “口罩、帽子等遮擋物確實(shí)會(huì)對(duì)AI識(shí)別造成精度下降,但還需要考慮遮擋面積,并非完全不能識(shí)別?!?/p>

  在口罩識(shí)別的技術(shù)攻克中,主要會(huì)遇到的技術(shù)難題有三個(gè):

  由于口罩遮擋,人像信息減少,學(xué)習(xí)到的特征的判別性隨之較少。具體的,二維紋理信息會(huì)由于遮擋而丟失、三維形狀信息會(huì)帶有噪聲;

  口罩類型比較多且口罩遮擋程度不一,如何更多地利用非遮擋區(qū)域的信息也是一個(gè)影響因素;

  戴口罩人臉的人臉檢測(cè)和人臉關(guān)鍵點(diǎn)檢測(cè)的精度受到口罩遮擋的影響會(huì)降低。

  2

  此前,華為在這塊便進(jìn)行了多種嘗試,并申請(qǐng)了一項(xiàng)名為“人臉識(shí)別方法、裝置及計(jì)算機(jī)可讀介質(zhì)”的影像重構(gòu)技術(shù)專利。

  該專利顯示,通過(guò)圖像重構(gòu)網(wǎng)絡(luò)可以將戴配件(眼鏡、口罩、帽子等)的人臉圖像重構(gòu)為未戴配件的人臉圖像。

4.jpg

5.jpg

  數(shù)據(jù)來(lái)自:智慧芽全球數(shù)據(jù)庫(kù)

  另外,華為還申請(qǐng)了一項(xiàng)“一種人臉識(shí)別方法及系統(tǒng)”的技術(shù)專利。

  通過(guò)人臉識(shí)別方法實(shí)現(xiàn)了對(duì)人臉上存在遮擋物的人臉圖像進(jìn)行準(zhǔn)確的識(shí)別,提高了人臉識(shí)別的精確性。

6.jpg

  數(shù)據(jù)來(lái)自:智慧芽全球數(shù)據(jù)庫(kù)

  此技術(shù)關(guān)鍵點(diǎn)是建立遮擋人臉圖像庫(kù),具體來(lái)說(shuō)就是在判斷需要識(shí)別的人臉圖像上有遮擋物(例如眼鏡、口罩等)時(shí),將遮擋物提取出來(lái)并增加到參考數(shù)據(jù)庫(kù)中未遮擋的人臉圖像上。

  例如在判斷出待識(shí)別人臉有佩戴眼鏡時(shí),就提取出眼鏡特征并在原圖像庫(kù)的基礎(chǔ)上新建一個(gè)戴眼鏡的參考圖像庫(kù),再將需要識(shí)別的人臉圖像與該庫(kù)中的參考圖像進(jìn)行匹配查找,從而完成識(shí)別。

  華為之外,阿里也申請(qǐng)了相關(guān)專利。

  此前阿里則用“局部特征細(xì)化與整體相似度評(píng)估”的方式來(lái)提高準(zhǔn)確率,他們通過(guò)綜合局部器官圖像匹配技術(shù)完成識(shí)別,此時(shí)局部器官不僅可以是眼睛圖像、鼻子圖像、嘴巴圖像和耳朵圖像等,還可以是下巴區(qū)域、臉部輪廓、胎記或黑痣圖像等等。

  根據(jù)面部多個(gè)局部器官的相似度評(píng)估指標(biāo)和對(duì)應(yīng)的權(quán)重,得到整體相似度評(píng)估指標(biāo),從而獲取更精確的遮擋下的面部識(shí)別結(jié)果。

  當(dāng)然,國(guó)內(nèi)人工智能企業(yè)在人臉識(shí)別領(lǐng)域也有大量專利,比如的盧深視。

  的盧深視是一家專注于計(jì)算機(jī)視覺(jué)和人工智能的創(chuàng)業(yè)公司,為安防、金融、教育等領(lǐng)域提供解決方案,目前他們已經(jīng)在多個(gè)領(lǐng)域拿下數(shù)個(gè)千萬(wàn)級(jí)別的項(xiàng)目訂單。

  “有遮擋面部識(shí)別本來(lái)就屬于技術(shù)研發(fā)規(guī)劃中的既定項(xiàng)目,此前主要針對(duì)墨鏡、大檐帽等?!?/p>

  的盧深視副總裁朱海濤博士告訴雷鋒網(wǎng),在安防領(lǐng)域,遇到識(shí)別口罩等技術(shù)需求再平常不過(guò)了。

  據(jù)悉,此前他們?cè)谀尺吔》萋涞?000多套3D設(shè)備,并建立了省級(jí)規(guī)模的人像數(shù)據(jù)庫(kù),使用將近5年的過(guò)程中,采集得到的實(shí)戰(zhàn)數(shù)據(jù)千億級(jí)別,累計(jì)ID近3000萬(wàn),里邊涉及太多個(gè)性化識(shí)別,在解決部分面部遮擋方面有很多的技術(shù)積累。

  針對(duì)口罩識(shí)別,朱海濤博士提到,短時(shí)間內(nèi)主要通過(guò)模擬生成戴口罩?jǐn)?shù)據(jù),從而優(yōu)化人臉識(shí)別算法模型。期間,主要關(guān)注兩個(gè)點(diǎn):

  一是訓(xùn)練數(shù)據(jù)規(guī)模,通常都是數(shù)十萬(wàn)到百萬(wàn)級(jí)別,在圖像質(zhì)量有保障的前提下,規(guī)模越大,通常優(yōu)化效果越好。

  這就帶來(lái)了第二個(gè)關(guān)注點(diǎn),廠商很難在短時(shí)間內(nèi)采集得到數(shù)十萬(wàn)的戴口罩?jǐn)?shù)據(jù),這個(gè)時(shí)候就要采用模擬的方法,具體而言:

  二維:一般廠商通常的做法是,根據(jù)二維圖片上的人臉關(guān)鍵點(diǎn),將二維的口罩貼圖和二維圖片中的人臉做一個(gè)對(duì)齊,然后根據(jù)口罩的mask圖來(lái)完成填加口罩操作。

  三維:而的盧深視選擇先重建三維人臉模型,再將口罩的三維模板模型與三維人臉模型做非剛性對(duì)齊,從而完成模擬加口罩的操作。

  總結(jié)來(lái)說(shuō),的盧深視基于人臉全局特征及局部特征相結(jié)合的方法,同時(shí)充分利用人臉未遮擋部位的三維幾何信息進(jìn)行三維人臉識(shí)別研究,相對(duì)于普通的二維人臉識(shí)別能夠有效應(yīng)對(duì)戴口罩等遮擋場(chǎng)景的人臉識(shí)別。

  據(jù)悉,依托3D數(shù)據(jù)的豐富特征,針對(duì)戴口罩、戴帽子、戴防護(hù)鏡等嚴(yán)重遮擋情況,通過(guò)算法優(yōu)化,的盧深視的技術(shù)識(shí)別準(zhǔn)確度可以達(dá)到97%以上。

  “目前,我們的技術(shù)方案已經(jīng)在全國(guó)多個(gè)地市落地應(yīng)用。”朱海濤博士提到。

  譬如在溫州,為了平衡居民生活與防疫措施,溫州在全市范圍內(nèi)實(shí)行村(居)民出行管控措施,要求全市每戶家庭每?jī)商熘概梢幻彝コ蓡T采購(gòu)物資。

  為了此項(xiàng)管控舉措更安全有效的實(shí)施,的盧深視利用3D視覺(jué)人臉比對(duì)終端設(shè)備搭配三維人像數(shù)據(jù)平臺(tái),形成人臉比對(duì)及快速建庫(kù)方案,在出入口進(jìn)行刷臉核驗(yàn),實(shí)現(xiàn)出入人員管控,同時(shí)對(duì)新增人員進(jìn)行快速入庫(kù)操作,后臺(tái)大數(shù)據(jù)系統(tǒng)實(shí)時(shí)繪制人員行為軌跡,為疫情排查提供依據(jù)。

  “真正成立口罩識(shí)別相關(guān)研究是在1月中旬啟動(dòng),落地是在一月底,大概2周時(shí)間,落地部署之后,我們一直在持續(xù)調(diào)優(yōu)。”

  朱海濤博士補(bǔ)充道。

  值得一提的是,目前的盧深視該方案已入選由中華人民共和國(guó)應(yīng)急管理部主辦的應(yīng)急裝備綜合信息服務(wù)平臺(tái),第一時(shí)間響應(yīng)國(guó)家和政府的應(yīng)急需求保障。

  無(wú)論是從華為、阿里的技術(shù)專利出發(fā),還是從的盧深視的落地案例來(lái)看,相關(guān)廠商們?cè)诖酥熬鸵呀?jīng)考慮到了人臉識(shí)別遮擋的情況,并做出全方位的技術(shù)突破。

  由此也可以得出結(jié)論:口罩識(shí)別等小眾需求在某些場(chǎng)景已是大眾問(wèn)題,隨著AI使用場(chǎng)景的愈加多元,相關(guān)技術(shù)也定會(huì)不斷革新。

  新技術(shù)的突破與應(yīng)用固然有著諸多不足與弊端,但也是社會(huì)發(fā)展的必然,不加分辨地完全認(rèn)可和全盤(pán)否定都是不可取的。

  找出問(wèn)題、解決問(wèn)題,多一些耐心、少一些戾氣,才是技術(shù)發(fā)展的主旋律和應(yīng)該有的節(jié)奏。

  3

  針對(duì)戴口罩場(chǎng)景下通過(guò)人臉識(shí)別進(jìn)行身份核驗(yàn)這一熱點(diǎn)問(wèn)題,雷鋒網(wǎng)AI掘金志深度采訪了的盧深視相關(guān)專家,以下是全部?jī)?nèi)容,雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))作了不改變?cè)獾恼砼c編輯:

  1、如何定義“戴口罩人臉識(shí)別”?

  戴口罩人臉識(shí)別是指在正確佩戴口罩的情況下,實(shí)現(xiàn)非接觸式的人的身份核驗(yàn),即明確“你是誰(shuí)”。

  戴口罩人臉識(shí)別屬于遮擋人臉識(shí)別,要求在可接受的誤識(shí)別率范圍內(nèi),達(dá)到較好的正確識(shí)別率。戴口罩人臉識(shí)別涉及的算法除了人臉檢測(cè)、關(guān)鍵點(diǎn)檢測(cè)和人臉特征提取算法外,還包括口罩(有無(wú))檢測(cè)或口罩區(qū)域檢測(cè)。

  2、是否需要保障露出多少面部特征?

  由于嘴部區(qū)域和鼻子區(qū)域受到了遮擋,對(duì)人臉識(shí)別帶來(lái)了很大的挑戰(zhàn)。一般而言,口罩遮擋部位越小,人臉識(shí)別模型的性能越高。

  以的盧深視的三維口罩遮擋人臉識(shí)別解決方案為例,在正確佩戴口罩的場(chǎng)景下即可成功識(shí)別。

  3、戴口罩人臉識(shí)別的技術(shù)原理是什么?

  的盧深視基于人臉全局特征及局部特征相結(jié)合的方法,同時(shí)充分利用人臉未遮擋部位的三維幾何信息進(jìn)行三維人臉識(shí)別研究,相對(duì)于普通的二維人臉識(shí)別能夠有效應(yīng)對(duì)戴口罩等遮擋場(chǎng)景的人臉識(shí)別。

  4、戴口罩識(shí)別有哪些技術(shù)難點(diǎn)?

  · 戴口罩人臉的人臉檢測(cè)和人臉關(guān)鍵點(diǎn)檢測(cè)的精度受到口罩遮擋的影響會(huì)降低;

  · 由于口罩遮擋,人像信息減少,學(xué)習(xí)到的特征的判別性隨之較少。具體的,二維紋理信息會(huì)由于遮擋而丟失、三維形狀信息會(huì)帶有噪聲;

  · 口罩類型比較多且口罩遮擋程度不一,如何更多地利用非遮擋區(qū)域的信息也是一個(gè)影響因素。

  5、如何提升戴口罩識(shí)別的準(zhǔn)確率?

  簡(jiǎn)單講講通過(guò)模擬生成戴口罩?jǐn)?shù)據(jù),從而優(yōu)化人臉識(shí)別算法模型這種研究方法。

  的盧主要關(guān)注兩個(gè)點(diǎn),一個(gè)是訓(xùn)練數(shù)據(jù)規(guī)模,通常都是數(shù)十萬(wàn)到百萬(wàn)級(jí)別,在圖像質(zhì)量有保障的前提下,規(guī)模越大,通常優(yōu)化效果越好。

  這就帶來(lái)了第二個(gè)關(guān)注點(diǎn),我們很難在短時(shí)間內(nèi)采集得到數(shù)十萬(wàn)的戴口罩?jǐn)?shù)據(jù),這個(gè)時(shí)候就要采用模擬的方法,具體而言:

  · 二維:通常的做法是,根據(jù)二維圖片上的人臉關(guān)鍵點(diǎn),將二維的口罩貼圖和二維圖片中的人臉對(duì)齊,然后根據(jù)口罩的mask圖來(lái)完成填加口罩操作。

  · 三維:先重建三維人臉模型,再將口罩的三維模板模型與三維人臉模型進(jìn)行非剛性對(duì)齊,從而完成模擬加口罩的操作。

  的盧深視成立5年落地多個(gè)項(xiàng)目,并幫助某邊疆省份建立了省級(jí)規(guī)模的3D人像數(shù)據(jù)庫(kù),積累大量實(shí)戰(zhàn)數(shù)據(jù)。由于實(shí)戰(zhàn)數(shù)據(jù)的豐富性,為的盧深視能夠迅速開(kāi)展更多前沿研究奠定了基礎(chǔ)。

  6、相關(guān)方案對(duì)使用環(huán)境的大小、優(yōu)劣有要求嗎?

  由于3D技術(shù)的優(yōu)勢(shì),我們的方案支持大庫(kù)建庫(kù)以及精準(zhǔn)識(shí)別,可以在學(xué)校、醫(yī)院、校區(qū)等人流量較大的場(chǎng)景使用。

  7、疫情之后,對(duì)于技術(shù)發(fā)展趨勢(shì),你如何判斷?

  省市級(jí)別的人員數(shù)據(jù)庫(kù)建設(shè)會(huì)成為趨勢(shì)。(其實(shí)此次疫情從武漢蔓延到多地,也是由于人員數(shù)據(jù)的跨區(qū)域追蹤不到,加速了疫情蔓延)


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。