引用格式:林承浩,吳麗君.基于CNN-Transformer混合構(gòu)架的輕量圖像超分辨率方法[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2024,43(3):27-33.
引言
圖像超分辨率(Super Resolution, SR)是一項(xiàng)被廣泛關(guān)注的計(jì)算機(jī)視覺(jué)任務(wù),其目的是從低分辨率(Low Resolution, LR)圖像中重建出高質(zhì)量的高分辨率(High Resolution, HR)圖像[1]。由于建出高質(zhì)量的高分辨率圖像具有不適定的性質(zhì),因此極具挑戰(zhàn)性[2]。隨著深度學(xué)習(xí)等新興技術(shù)的崛起,許多基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的方法被引入到圖像超分任務(wù)中[3-6]。SRCNN[3]首次將卷積神經(jīng)網(wǎng)絡(luò)引入到圖像超分任務(wù)中,用卷積神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)圖像的特征表示,并通過(guò)卷積層的堆疊來(lái)逐步提取更高級(jí)別的特征,使得重建出的圖像具有較高的質(zhì)量。在后續(xù)研究中,Kaiming He等人提出了殘差結(jié)構(gòu)ResNet[5],通過(guò)引入跳躍連接,允許梯度能夠跨越層進(jìn)行傳播,有助于減輕梯度消失的問(wèn)題,使得模型在較深的網(wǎng)絡(luò)情況下仍然能保持較好的性能。Bee Lim等人在EDSR[6]中也引入了殘差結(jié)構(gòu),EDSR實(shí)際上是SRResnet[7]的改進(jìn)版,去除了傳統(tǒng)殘差網(wǎng)絡(luò)中的BN層,在節(jié)省下來(lái)的空間中擴(kuò)展模型尺寸來(lái)增強(qiáng)表現(xiàn)力。RCAN[8]中提出了一種基于Residual in Residual結(jié)構(gòu)(RIR)和通道注意力機(jī)制(CA)的深度殘差網(wǎng)絡(luò)。雖然這些模型在當(dāng)時(shí)取得了較好的效果,但本質(zhì)上都是基于CNN網(wǎng)絡(luò)的模型,網(wǎng)絡(luò)中卷積核的大小會(huì)限制可以檢測(cè)的空間范圍,導(dǎo)致無(wú)法捕捉到長(zhǎng)距離的依賴(lài)關(guān)系,意味著它們只能提取到局部特征,無(wú)法獲取全局的信息,不利于紋理細(xì)節(jié)的恢復(fù),使得圖像重建的效果不佳[5]。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://ihrv.cn/resource/share/2000005931
作者信息:
林承浩,吳麗君
福州大學(xué)物理與信息工程學(xué)院,福建福州350108