在消費類視頻市場,通過視頻增強算法進行產(chǎn)品差異化的重要性日益增強。消費者們會通過直接比較畫面質(zhì)量作出購買決定。由于數(shù)字視頻壓縮編解碼技術(shù)在視頻還原領(lǐng)域的核心地位,這些算法已經(jīng)形成標準從而失去了產(chǎn)品差異化的空間,但視頻的預處理和后處理算法,卻可以幫助產(chǎn)品從眾多競爭對手中脫穎而出,而采用可配置處理器正是實現(xiàn)這些算法的簡單快捷的途徑。
數(shù)字視頻技術(shù)的流行使得沉寂多年的電視市場再度活躍起來,視頻產(chǎn)品再次成為了消費電子領(lǐng)域的熱門商品。模擬視頻的數(shù)字化包括不少技術(shù)問題,如電視信號具有不同的制式而且采用復合的YUV信號方式,而計算機工作在RGB空間;電視機是隔行掃描,計算機顯示器大多逐行掃描;電視圖像的分辨率與顯示器的分辨率也不盡相同等等。因此,模擬視頻的數(shù)字化主要包括色彩空間的轉(zhuǎn)換、光柵掃描的轉(zhuǎn)換以及分辨率的統(tǒng)一。
視頻產(chǎn)品的差異化
數(shù)字視頻就是以數(shù)字形式記錄的視頻,和模擬視頻相對的。數(shù)字視頻有不同的產(chǎn)生方式,存儲方式和播出方式。比如通過數(shù)字攝像機直接產(chǎn)生數(shù)字視頻信號,存儲在數(shù)字帶,P2卡,藍光盤或者磁盤上,從而得到不同格式的數(shù)字視頻。然后通過PC,特定的播放器等播放出來。 這對于終端產(chǎn)品設(shè)計者來說有好處,因為它利于芯片設(shè)計人員針對算法作出非常高效的設(shè)計。在用于提高圖像質(zhì)量和色彩還原能力的視頻預處理和后處理模塊提供了產(chǎn)品差異化的機會,同時也對產(chǎn)品的可編程性提出了要求。
視頻預處理算法
毫無疑問的,視頻流不會以來自傳感器的初始狀態(tài)傳輸,在進行編碼之前,會對原始碼流進行一系列的變換處理。主要的預處理操作包括:
像素掃描/數(shù)據(jù)傳輸–這一步操作只是簡單的從傳感器得到圖像。
拜爾格式解交織–現(xiàn)代視頻圖像技術(shù)用三色RGB拜爾濾波器替代了單色的圖像傳感器,因此來自傳感器的數(shù)據(jù)流包括了紅、綠、藍的顏色信息。這些信息被分離后,變換為YCbCr的亮度與色度信息來表示圖像。
噪聲濾波–電子世界中總是會有噪聲存在,而降低或消除噪聲的最佳階段是在進行編碼之前。
抖動檢測與補償–抖動檢測與補償可以減小因相機抖動造成的圖像質(zhì)量下降。
局部動態(tài)范圍補償–在特定的模式下,圖像的動態(tài)范圍可能會超出傳感器的極限。而照相機或攝像機應(yīng)該具備智能調(diào)整曝光量從而擴展傳感器基本動態(tài)范圍的功能。
對焦調(diào)整(銳化)–圖像傳感器無法捕獲連續(xù)的圖像信息。它們將圖像分解為一個個像素,然后根據(jù)不同的分辨率在像素間進行插值并重新組合成新的圖像。這種操作會導致圖像銳度的下降,但通過適當?shù)念A處理算法是可以糾正。
顏色校正–不同色溫下的白光是有所不同的,這會影響到最終獲取的圖像。除此之外,不同的顯示設(shè)備處理顏色的方法也不一樣。
人臉識別–在人物眾多的圖像中,拍攝者通常希望圖像聚焦在人物的面部。
立體圖像–根據(jù)平面圖像的密度信息來構(gòu)建立體圖像,這種預處理常用在融合了虛擬和真實圖像的混合現(xiàn)實系統(tǒng)中。
圖1是四種預處理算法的示例圖像:噪聲濾波、抖動檢測與補償、動態(tài)范圍補償和顏色校正。
圖1: 四種預處理算法示例:噪聲濾波、抖動檢測與補償、動態(tài)范圍補償和顏色校正。