《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 設計應用 > 基于DSP的數(shù)碼相機中的MPEG-4壓縮方案設計
基于DSP的數(shù)碼相機中的MPEG-4壓縮方案設計
摘要: 雖然數(shù)碼相機(DSC)投入市場僅幾年時間,但已經(jīng)使消費類電子成像業(yè)發(fā)生了翻天覆地的變化。目前,全球售出的相機中大約有三分之一是數(shù)碼相機,而且其份額還在穩(wěn)步上升。隨著多兆象素DSC生成分辨率越來越高的圖像而開始挑戰(zhàn)傳統(tǒng)的膠卷像機,消費類DSC也正提供智能化操作模式,幫助用戶在各種條件下都能拍攝出更好的照片。
Abstract:
Key words :

雖然數(shù)碼相機(DSC)投入市場僅幾年時間,但已經(jīng)使消費類電子成像業(yè)發(fā)生了翻天覆地的變化。目前,全球售出的相機中大約有三分之一是數(shù)碼相機,而且其份額還在穩(wěn)步上升。隨著多兆象素DSC生成分辨率越來越高的圖像而開始挑戰(zhàn)傳統(tǒng)的膠卷像機,消費類DSC也正提供智能化操作模式,幫助用戶在各種條件下都能拍攝出更好的照片。視頻模式也已經(jīng)成為消費類DSC的標準功能,使用戶能夠快速拍攝多個照片,以便選擇更好的快照,同時也使他們能夠保存重大事件的簡短剪輯。此外,DSC也開始與手機集成在一起,實現(xiàn)靜止圖片與剪輯隨時隨地的快速傳輸。

隨著瞬息萬變的DSC市場不斷分化,開發(fā)商必須不斷充分利用技術創(chuàng)新的優(yōu)勢來細分其產(chǎn)品。當今其中一項創(chuàng)新就是在基于高性能數(shù)字信號處理器(DSP)的消費類DSC中引入MPEG-4視頻壓縮技術。MPEG-4標準使DSC能夠有效提供視頻及其他操作模式,增加所存儲視頻剪輯的數(shù)量,并支持視頻圖像強大可靠的傳輸。DSP可以提供低價位相機產(chǎn)品中MPEG-4編碼以及解碼所需要的計算性能,尤其那些具備支持快速圖像處理架構的DSP更是如此??删幊绦允归_發(fā)商在整個DSC產(chǎn)品線中使用相同的DSP平臺,從而通過軟件優(yōu)化不同產(chǎn)品的成像管道(imagepipe)。

新的壓縮標準

DSC傳統(tǒng)依賴于JPEG壓縮標準,其設計用于存儲靜止圖像,并且已通過互聯(lián)網(wǎng)而廣為流行。在壓縮中,JPEG采用離散余弦變換(DCT)與量化技術有效地從包含8×8象素陣列的最小編碼單元(MCU)的數(shù)據(jù)描述中消除大部分空間冗余。然后此算法采用熵或可變長度編碼(VLC)技術進一步減少存儲與傳輸?shù)膱D像數(shù)據(jù)。圖像解壓的步驟則與此相反。根據(jù)圖像內(nèi)容,盡管壓縮比隨圖像的不同而不同,但是JPEG算法一般情況下可以將象素數(shù)據(jù)壓縮一個數(shù)量級而不丟失視覺完整性。

用于動畫與視頻的各種MPEG標準采用與JPEG相同的幀內(nèi)技術入手來壓縮基本的靜止圖像或I幀,然后采用附加的幀間技術以消除隨后幀中的暫時冗余。幀間技術事實上涉及將每個連續(xù)幀的16×16象素宏塊壓縮到上一個幀的宏塊,然后采用運動估計與補償技術來描述宏塊的幀到幀移動。這些預測幀或P幀只需要描述其從上一幀的改變。然后以應用所決定的間隔定期對I幀進行編碼。

圖1說明了一般MPEG視頻壓縮中所涉及的步驟。圖像頂部從輸入到輸出的幀內(nèi)壓縮步驟(DCT、量化與VLC)足以生成I幀。為了創(chuàng)建P幀,剛編碼的幀必須在本地幀緩沖器中被解碼并存儲,以便實現(xiàn)過去幀的逐塊壓縮到未來幀(即運動估計),從而實現(xiàn)幀間壓縮。視頻解碼涉及圖下部的步驟(逆量子化、反向DCT、運動補償)。除了圖中所示之外,MPEG標準還具有采用獨立流程的音頻壓縮-解壓算法。


                                                圖1:MPEG視頻壓縮流程圖。

MPEG-4:多媒體標準

MPEG標準在不斷發(fā)展,以適應新興的視頻應用。最初的MPEG-1標準開發(fā)用于大容量存儲與系統(tǒng)檢索,例如:交互式CD-ROM以及VCD。此后,在MPEG-2中對該標準進行了修改,以支持更高的分辨率、更廣泛的格式以及與HDTV相關的數(shù)字編碼。由于在DVD中的應用,MPEG-2更受青睞。在視頻數(shù)據(jù)庫的要求所驅動下,MPEG-7標準規(guī)定了用于信息搜索的內(nèi)容表述。

MPEG-4開發(fā)用于交互式多媒體應用,其中包括那些通過無線連接提供的多媒體應用。它與基本H。263視頻壓縮標準共享算法。與早期的MPEG標準相比,MPEG-4為更高密度的圖像提供了更好的壓縮,并為更強大可靠的傳輸提供了更高的容錯彈性(errorresilience)。另外,MPEG-4支持在幀中引入對象類型,從而可以獨立規(guī)定、壓縮、傳輸和重新組合不同的圖像及圖形單元。但是,該標準的對象支持功能仍有待開發(fā)切實可行的實施方案。到那時,包括DSC在內(nèi)的大部分MPEG-4應用可以繼續(xù)基于通常情況下與圖像的完整矩形幀對應的單個對象。

高壓縮效率

特定剪輯的壓縮比隨主題的不同而千差萬別,不過一般情況下MPEG壓縮技術可以將JPEG幀的后續(xù)形式-運動JPEG(M-JPEG)的壓縮比在相同分辨率下提高一個數(shù)量級。進一步的壓縮源自幀間技術的采用。視頻幀一般大約為10萬象素(352×288象素,CIF分辨率)或大約2。5萬象素(176×144象素,QCIF分辨率),而不是一般情況下與JPEG相關的2~5兆象素。盡管分辨率的這種降低在高質量照片中是不能接受的,但是對于許多消費類DSC產(chǎn)品來說卻足夠了,尤其是考慮到它實現(xiàn)了寫真視頻的采集。

MPEG-4算法充分利用壓縮技術中的精化功能,將早先的MPEG比率降低了大約20%。高級MPEG-4壓縮可以將每秒15幀(fps)的QCIF視頻圖像從原始視頻數(shù)據(jù)的4。5Mbps壓縮為不到6?kbps,同時還可以保持適當?shù)臑g覽質量。在DSC中,MPEG-4壓縮使相機能夠在內(nèi)存中存儲比M-JEPG大幾倍的視頻圖像。

更佳的容錯彈性

MPEG-4集成了多種提高容錯彈性的新技術,容錯彈性是很有用的特性,因為人們正越來越多地傳輸利用DSC采集的照片與剪輯。隨著DSC手機的日益流行,強大可靠的傳輸成為了必不可少的要求。MPEG-4的容錯彈性技術包括:

1)更多的再同步標記,其可將所傳輸?shù)臄?shù)據(jù)分成小視頻包,從而使接收方能夠在最小化數(shù)據(jù)丟失情況下恢復各種傳輸錯誤;

2)報頭擴展代碼,其指示每個數(shù)據(jù)包的報頭,以防止由于包含重要報頭信息的視頻幀中第一個視頻包的破壞而導致潛在的報頭信息丟失;

3)將視頻數(shù)據(jù)分成運動與紋理(空間)數(shù)據(jù),通過提高該部分數(shù)據(jù)被接收到的幾率而促進從錯誤恢復;

4)可逆VLC,允許接收方從再同步標記后向與前向進行解碼,以便在發(fā)生傳輸錯誤后恢復盡可能多的圖像;

5)用于空間及時間錯誤的差錯隱藏技術(在MPEG-4中規(guī)定了幾種技術,這些技術是對該算法的補充,而并非其組成部分)。

對DSP性能與靈活性的需求

由于幀間運動估計及補償中涉及其他步驟,因此MPEG-4壓縮與解壓算法比JPEG需要強得多的處理能力。所以,DSC中的圖像處理引擎必須能夠達到更高的性能水平。盡管ASIC能夠實現(xiàn)此項任務,但是它不易于結合到不同DSC產(chǎn)品的成像管道中;另一方面,可編程DSP不但能夠提供MPEG-4算法所需的性能,而且還可以通過軟件優(yōu)化不同系統(tǒng)。另外,還可以對相同的DSP進行編程,使其執(zhí)行JPEG算法,以便在更高分辨率的DSC中推廣使用。因此,整個DSC產(chǎn)品線可以基于單個DSP平臺,從而在節(jié)約大量開發(fā)時間與成本的同時還能促進產(chǎn)品的細分。

帶成像架構的DSP示例

TI推出的TMS320DM270數(shù)字媒體處理器就是一種為DSC等成像應用而專門設計的高性能DSP。DM270是基于多處理器架構之上的,其采用一個ARM732位RISC微控制器來處理非成像功能,并用作整個系統(tǒng)的主控制器,同時采用可編程的C54×DSP核心處理音頻編碼與解碼。另外,DM270還集成了專門設計用于處理大部分高計算要求成像任務的可編程協(xié)處理器。其中一個協(xié)處理器-SIMD圖像處理引擎(iM×)執(zhí)行DCT、反向DCT以及眾多其他處理運算中的運動估計與補償。其他協(xié)處理器執(zhí)行可變長度編碼/解碼、量化與逆量子化。

圖2展示了DM270的主要功能塊與流程。除了主要的處理器之外,該器件還通過各種通用I/O引腳集成了高速緩沖存儲器、圖像塊緩沖器、以及用于外部存儲器、CCD、LCD或TV輸出及其他通信接口的控制器。專用的圖像預處理硬件可以消除主處理器的某些任務負擔,如:白平衡、自動曝光以及自動調焦。

                                                                      圖2:DM270架構。

在外部只需要SDRAM來完善DSC的圖像處理引擎。由于MPEG必須保持附加幀以進行運動估計與補償,因而在QCIF(176×144)分辨率下,編碼需要大約110千字節(jié)SDRAM。憑借其高度集成與專用架構,DM270能夠在CIF(352×288)分辨率下處理超過30fps的MPEG-4編碼,同時能夠在HVGA(6?0×240)分辨率、超過30fps的解碼期間處理超過50%的象素。該器件還支持多媒體中所采用的其他主要視頻、音頻與語音標準,而且可以與設計用作手機引擎的DSP一起結合使用。

DSC手機與其他新興應用

在瞬息萬變的視頻成像消費類電子產(chǎn)品市場中,怎么高估編程靈活性的重要性都不為過。DSC正迅速發(fā)展并融入新的應用。其中之一是帶有集成相機的手機,提供靜止圖像與視頻剪輯的采集與傳輸功能。該系統(tǒng)現(xiàn)已投放市場。MPEG-4數(shù)據(jù)可以嵌入多媒體信息服務(MMS)協(xié)議棧中,從而可以采用無線IP網(wǎng)絡信息的行業(yè)標準在無線網(wǎng)中輕松傳輸視頻數(shù)據(jù)包。

開發(fā)商可能也希望具備DSP所帶來的靈活性,以便設計那些在無線產(chǎn)品中也具備的、其他類型的相機系統(tǒng),例如:支持基于H。324的視頻會議的系統(tǒng)。該視頻會議無線電話采用H。263或MPEG-4來對視頻進行編碼與解碼。另外,可能還需要將訊息發(fā)送功能與可視會議融為一體的、對會話初始化協(xié)議(SIP)的支持。MPEG-4的未來發(fā)展,如:對象功能,可能會需要對已經(jīng)投入應用的單元以及正在開發(fā)中的單元進行重新編程。其中一項發(fā)展便是新出現(xiàn)的MPEG-4AVC(高級視頻編碼)標準(又稱為H。26?標準)的更高壓縮密度??删幊痰腄SP實現(xiàn)了對所有這些標準及其他標準的支持,從而可以有助于成像系統(tǒng)開發(fā)商細分其產(chǎn)品,并激發(fā)新的市場需求。

在成像質量方面,DSC仍然需要一定時間才能與最高質量的傳統(tǒng)膠卷相機抗衡。但是,在低端市場中,DSC卻可以提供傳統(tǒng)相機所無法與之匹敵的視頻與其他功能。目前,DSC開發(fā)商正從更高的壓縮比與更高的容錯彈性探索MPEG-4,以幫助其提供消費者所期望的更多功能。而可編程DSP可以提供在低成本DSC上實現(xiàn)MPEG-4算法所需要的性能,在高度分化市場中,它們?yōu)殚_發(fā)商提供了可滿足各種需求而需要的靈活性?;贒SP的MPEG-4壓縮還為在未來把DSC與無線設備集成并支持其他新型應用打開了機遇之門。利用MPEG-4與DSP,低成本消費類DSC將會繼續(xù)迎來輝煌的未來。讓我們放眼展望吧!

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉載。