文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2021.07.011
引用格式: 曹露濛,楊周旺. 一種應(yīng)用于語義分割的新型親和力監(jiān)督方法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2021,40(7):66-71.
0 引言
語義分割是計(jì)算機(jī)視覺中一項(xiàng)具有挑戰(zhàn)性的任務(wù),在自動(dòng)駕駛、機(jī)器人、衛(wèi)星、農(nóng)業(yè)、醫(yī)療診斷等領(lǐng)域有著廣泛的應(yīng)用。它是一項(xiàng)稠密分類任務(wù),旨在對(duì)圖像進(jìn)行像素點(diǎn)級(jí)別的分類。由于卷積神經(jīng)網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,許多語義分割神經(jīng)網(wǎng)絡(luò)應(yīng)運(yùn)而生。例如,F(xiàn)CN[1]使用卷積層來代替完全連接層,使得神經(jīng)網(wǎng)絡(luò)能夠適應(yīng)任何輸入大小。Deeplab[2],PSPNet[3]采用空間金字塔池化來提取不同尺度的特征,然后合并特征來獲取不同尺度的上下文信息。長期以來,研究者們致力于特征復(fù)用方法和注意機(jī)制來設(shè)計(jì)分割網(wǎng)絡(luò)[4-6]。使用殘差和密集的跳躍連接來聚合和復(fù)用不同層的特征,使得語義分割更加準(zhǔn)確,并使梯度更容易反向傳播。注意力模型[7-9]和非局部模型[10-11]彌補(bǔ)了卷積核的局部局限性,可以捕獲長程依賴。最近的研究顯示了像素分組的重要性[12-15]。Zhong Zilong等人[12]提出語義分割可以分為兩個(gè)子任務(wù):顯式像素預(yù)測和隱式像素分組。Yu Changqian等人[13]使用標(biāo)簽對(duì)類別內(nèi)和類別間的先驗(yàn)知識(shí)進(jìn)行建模,以指導(dǎo)網(wǎng)絡(luò)的學(xué)習(xí)。KE T W等人[14]提出了一種自適應(yīng)親和場(Adaptive Affinity Field,AAF)來捕獲和匹配標(biāo)簽空間中相鄰像素之間的語義關(guān)系。Jiang Peng等人[15]提出了一種擴(kuò)散分支,它由一個(gè)用于得分圖的種子子分支和一個(gè)用于像素級(jí)相似性的子分支組成。條件隨機(jī)場(Conditional Random Fields,CRFs)[16-18,2]方法用于語義分割,利用上下文信息優(yōu)化網(wǎng)絡(luò)輸出,這是一種統(tǒng)計(jì)方法,用于對(duì)相似像素進(jìn)行分組,并通過能量函數(shù)優(yōu)化得分圖(score map)。以前的許多CRFs都是對(duì)網(wǎng)絡(luò)輸出的后處理。VEMULAPALLI R等人[17]和CHANDRA S等人[18]在CNN中引入了高斯條件隨機(jī)場,并取得了很好的效果。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000003680
作者信息:
曹露濛,楊周旺
(中國科學(xué)技術(shù)大學(xué) 大數(shù)據(jù)學(xué)院,安徽 合肥230026)
