中文引用格式: 肖飛,孫震笙,金俊杰. 感興趣區(qū)域引導(dǎo)的碼率可變衛(wèi)星遙感圖像壓縮方法[J]. 電子技術(shù)應(yīng)用,2026,52(1):21-27.
英文引用格式: Xiao Fei,Sun Zhensheng,Jin Junjie. Region of interest guided variable-rate compression method for satellite remote sensing images[J]. Application of Electronic Technique,2026,52(1):21-27.
引言
隨著經(jīng)濟(jì)社會(huì)的發(fā)展和國(guó)際形勢(shì)的變化,我國(guó)對(duì)空間信息的需求悄然發(fā)生變化:在觀測(cè)范圍上,隨著我國(guó)綜合國(guó)力的不斷提升,國(guó)家利益的范疇已從領(lǐng)土拓展到全球乃至太空;在響應(yīng)時(shí)間上,對(duì)空間信息的獲取-傳輸-處理的響應(yīng)速度從離線向?qū)崟r(shí)在線轉(zhuǎn)變,用戶對(duì)信息獲取的實(shí)效性提出了更高要求,希望在第一時(shí)間就能夠獲取到所關(guān)注區(qū)域或突發(fā)事件區(qū)域的現(xiàn)場(chǎng)圖像和評(píng)估結(jié)果,這在災(zāi)害應(yīng)急中尤為突出。在此背景下,將傳統(tǒng)星下處理分析任務(wù)轉(zhuǎn)換到星上并結(jié)合遙感任務(wù)的數(shù)據(jù)特點(diǎn)設(shè)計(jì)相應(yīng)的星載壓縮算法,實(shí)現(xiàn)衛(wèi)星服務(wù)的智能化轉(zhuǎn)型,能夠有效提升衛(wèi)星服務(wù)的實(shí)效性。
目前,圖像壓縮按照框架劃分主要包含兩大類方法,即傳統(tǒng)混合框架圖像編碼[1-4]和端到端深度神經(jīng)網(wǎng)絡(luò)圖像壓縮[5-10]。傳統(tǒng)混合編碼框架是使用人工設(shè)計(jì)的算法將預(yù)測(cè)、變換、量化、熵編碼等模塊組合起來(lái),從而得到一套完整的圖像編碼器。而端到端深度神經(jīng)網(wǎng)絡(luò)圖像壓縮方法的性能從最初的低于JPEG[1]已發(fā)展到與最先進(jìn)的H.266[4]幀內(nèi)編碼相當(dāng)。為了適應(yīng)壓縮的需求,端到端圖像編碼在自編碼器的基礎(chǔ)上引入了量化和熵編碼,用于高效編碼提取到的特征。基于所使用的網(wǎng)絡(luò)結(jié)構(gòu),端到端圖像編碼可以分為三類:基于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[5]的壓縮模型、基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[6]的壓縮模型和基于生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)[7]的壓縮模型。
然而,隨著遙感圖像數(shù)據(jù)量的急劇增長(zhǎng)以及應(yīng)用場(chǎng)景不斷變化,遙感圖像壓縮方法已不再局限于更低的碼率和更高的重建質(zhì)量,更要同時(shí)滿足多種處理任務(wù)的要求。Xiang等人[11]結(jié)合壓縮與信息提取,提出了一種引入潛在特征選擇模塊(Latent Feature Selection,LFS)的聯(lián)合模型,但該方法依賴于LFS模塊的魯棒性,需要針對(duì)不同任務(wù)進(jìn)行廣泛調(diào)優(yōu)。Li等人[12]通過(guò)深度神經(jīng)網(wǎng)絡(luò)識(shí)別目標(biāo)與背景區(qū)域,對(duì)背景區(qū)域應(yīng)用雙線性降采樣以節(jié)省比特率,但其對(duì)目標(biāo)-背景分割精度依賴較強(qiáng),并且背景區(qū)域的降采樣處理引入了嚴(yán)重偽影,影響全局分析和視覺(jué)質(zhì)量。Zhang等人[13]開(kāi)發(fā)的遙感圖像機(jī)器編碼框架(Remote Sensing Image Coding for Machines,RSICM)專門針對(duì)語(yǔ)義分割任務(wù),通過(guò)對(duì)比學(xué)習(xí)增強(qiáng)壓縮圖像的特征判別能力,補(bǔ)償壓縮過(guò)程中的特征判別損失。然而,其過(guò)度依賴于對(duì)比學(xué)習(xí)優(yōu)化過(guò)程和特定分割網(wǎng)絡(luò),限制了在其他視覺(jué)任務(wù)中的適用性。Ye等人[14]提出的地圖輔助生成式壓縮(Map-Assisted Generative Compression,MAGC)框架針對(duì)極低比特率場(chǎng)景,結(jié)合預(yù)訓(xùn)練擴(kuò)散模型與矢量地圖提供的語(yǔ)義結(jié)構(gòu)信息實(shí)現(xiàn)高質(zhì)量圖像重建,但它依賴于預(yù)訓(xùn)練擴(kuò)散模型和外部矢量地圖的可用性,這限制了其在某些應(yīng)用場(chǎng)景中的適用性。
此外,在現(xiàn)有的遙感圖像壓縮應(yīng)用領(lǐng)域,由于衛(wèi)星和地面的傳輸帶寬有限,往往需要對(duì)圖像壓縮的碼率進(jìn)行限制。Jia和Shi等人[15-16]通過(guò)至少兩次預(yù)編碼得到真實(shí)碼率與編碼參數(shù)λ的數(shù)據(jù)對(duì)。該方法需要通過(guò)七次預(yù)編碼,耗時(shí)長(zhǎng),僅在特定場(chǎng)景中能夠應(yīng)用。Xue等人[17]在編碼器提取的特征基礎(chǔ)上,利用碼率估計(jì)器來(lái)取代多次預(yù)編碼。該方法在一定程度上節(jié)省了碼率控制的時(shí)間,但也要基于編碼器的特征來(lái)訓(xùn)練碼率估計(jì)器,仍有較長(zhǎng)的處理延遲。因此,如何在實(shí)際應(yīng)用中控制遙感圖像壓縮的碼率,仍是需要進(jìn)一步研究的問(wèn)題。
結(jié)合上述分析,為了進(jìn)一步提高遙感圖像壓縮任務(wù)性能,本文提出了一種感興趣區(qū)域引導(dǎo)的碼率可變壓縮方法,主要貢獻(xiàn)如下:
(1)針對(duì)現(xiàn)有遙感圖像壓縮方法的弊端,提出一種感興趣區(qū)域驅(qū)動(dòng)的碼率可變壓縮方法,在實(shí)現(xiàn)碼率可變壓縮的同時(shí)有效提高感興趣區(qū)域重建質(zhì)量。
(2)提出了基于感興趣區(qū)域引導(dǎo)的重要性圖模塊,在壓縮網(wǎng)絡(luò)前端使用一個(gè)通用檢測(cè)網(wǎng)絡(luò)得到感興趣目標(biāo)分布掩膜,將感興趣區(qū)域分布與原始圖像相結(jié)合,以指導(dǎo)感興趣區(qū)域和背景區(qū)域的碼率分配,提高感興趣區(qū)域的壓縮性能。
(3)提出了針對(duì)遙感圖像的碼率可變策略,實(shí)現(xiàn)在壓縮過(guò)程中靈活的碼率控制,以適應(yīng)遙感圖像傳輸帶寬的要求。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://ihrv.cn/resource/share/2000006907
作者信息:
肖飛,孫震笙,金俊杰
(中國(guó)星網(wǎng)數(shù)字科技有限公司,河北 雄安新區(qū) 071700)

