引用格式:易旭,白天.基于Star-Gan的人臉互換算法[J].信息技術與網絡安全,2020,39(5):12-16.
隨著深度學習技術的興起,圖像處理相關的研究有了一項強有力的技術支持。人臉互換在圖像處理方面作為一個里程碑式的技術,意味著計算機能夠理解人臉圖像。如何通過對抗生成網絡實現(xiàn)人臉互換,提升生成效果是現(xiàn)如今計算機視覺的一大熱點。
對于傳統(tǒng)的方法Face-swap[1],人臉互換只是把目標人臉截取,粘貼到原始人臉上面,使用圖像融合的相關算法(如泊松融合)消除邊界,后續(xù)的改進一般是在圖像融合方面進行突破。
近年來,隨著深度神經網絡技術的成熟,KORSHUNOVA I[2]提出基于深度學習的人臉互換,將兩個人臉的身份信息看成是兩個不同圖片風格,為一個目標人物訓練一個深度神經網絡提取人臉特征,換臉其實就是替換人臉的高維隱空間向量,而后再用訓練好的人臉生成器進行生成,這種方式要求同一身份大量的人臉數(shù)據(jù),其訓練得到的模型只適用于這兩個身份。YUVAL N[3]提出先使用3DMM模型擬合人臉,再互換人臉,解決了需要大量同一身份人臉圖片的問題,但3DMM仍然有人臉匹配失敗的問題,最終導致模型出錯。NATSUME R[4-5]提出了FSnet和RSGAN,使用編碼器學習整體人臉的編碼,對所有的人臉只學習一個單一的人臉身份編碼器網絡,但由于輸出的編碼是一個高維的人臉身份向量,特征信息依然高度糾纏。
本文借鑒前人的思想,使用Star-Gan模型作為生成器,利用Arcface[6]身份編碼器提取人臉高維身份特征,針對人臉細節(jié)的生成,使用基于U-net[7]的人臉特征編碼器模型為多層級的輸入,解決人臉特征糾纏的問題,使用PatchGan的思想改造判別器網絡結構,引入實例歸一化層提升生成效果。
本文詳細內容請下載:http://ihrv.cn/resource/share/2000003093
作者信息:易旭,白天(中國科學技術大學 軟件學院,安徽 合肥 230026)