《電子技術應用》
您所在的位置:首頁 > 其他 > 业界动态 > 可配置视频引擎颠覆传统视频方案

可配置视频引擎颠覆传统视频方案

2007-12-27
作者:牛虻

??? 用手機等移動終端作為傳播載體的移動流媒體,在影視、交通、廣告等領域的應用正被越來越看好,同時隨著終端和網絡的升級,以及市場的成熟,價格的走低,多媒體功能" title="多媒體功能">多媒體功能已不再是高端手機的專利,未來多媒體功能將成為主流手機的標準配置?!暗?006年底,全球移動用戶將達到27億,且將繼續(xù)迅速發(fā)展。未來手機將成為一部真正的多媒體移動終端。”全球CMO執(zhí)行副總裁、諾基亞集團執(zhí)行委員會成員Robert Anderson先生表示。據In-Stat公司預測:2010年僅美國就將會有3000萬手機提供移動視頻服務。

??? 同時,消費類電子的另一個熱點PMP,借助于方案供應商和OEM廠商的大力推動以及上游供應商在成本上做出的調整,無論是國際還是國內,PMP市場一改往日“雷聲大,雨點小”的局面。從2005年年末開始, 都出現了一個很高的增長。據水清木華研究中心預測,2007年PMP在中國市場的出貨量將會再一次飛速增長,年增長率將超過200%。

??? 傳統(tǒng)方案遭遇功耗和靈活性瓶頸

??? 伴隨著著兩個市場的不斷拓展,消費者對多媒體功能的要求也在不斷增加。因此終端生產商對多媒體芯片的要求也越來越高,視頻功能作為多媒體功能的標志之一,視頻處理" title="視頻處理">視頻處理的傳統(tǒng)方案正面臨著更大的挑戰(zhàn)。

??? 典型的視頻架構如圖1所示。主要包括主機/系統(tǒng)控制器任務、媒體管理任務、視頻解碼" title="視頻解碼">視頻解碼任務、顯示任務四個層面。

?

?

?? 圖1 典型視頻系統(tǒng)架構

?

??? 其中實現視頻解碼任務的視頻解碼器傳統(tǒng)上有兩種方案,一種是RISC CPU+硬件(RTL)加速器,另一種是RIDC CPU+媒體DSP引擎+硬件(RTL)加速器。兩種方案都需要用CPU來處理網絡抽象層、圖象層、條代層的大部分工作,同時,比特流分析通常會部分采用RTL實現,部分用軟件在主機上實現,這樣一來不僅會增加復雜度,同時,任務的分解也導致了主機處理器和解碼器之間過多的數據交換,這無疑會增加更多的功耗。

??? 兩種傳統(tǒng)方案的最大區(qū)別在熵解碼—去塊濾波器部分,第一種方案全部用RTL來實現,第二種方案則把熵解碼后面的部分采用通用多媒體DSP來實現。前一種方案中,不僅用來專門實現熵編碼(尤其是CABAC)的RTL會帶來更多地功耗,而且系統(tǒng)缺乏靈活性,當標準或者需求變化時必須添加新的硬件模塊,這意味著必須設計新的芯片,而原終端產品必須作廢。后一種方案雖然在一定程度上增加了系統(tǒng)的靈活性,可以適應部分的變化,但是熵解碼部分仍然必須用特定的RTL硬件模塊來實現,這將會要求傳統(tǒng)DSP引擎的頻率高達700-900Mhz——更高的頻率將帶來更多的功耗。同時,當新算法出現時,有時不是僅僅通過修改軟件就能解決的,一方面可能會影響硬件RTL模塊導致重新流片的風險,另外也會造成處理器和RTL模塊之間過多的總線傳輸。

????新方案打破功能和功耗博弈困境

????“消費者一方面要求終端產品功能不斷增加,另一方面又要求盡量降低功耗,傳統(tǒng)方案在這種看似矛盾的雙重壓力下已顯得捉襟見肘?!盩ensilica公司移動多媒體方案市場總監(jiān)Larry Przywara表示,“Tensilica已準備好向那些將開發(fā)高品質視頻產品的半導體制造商和系統(tǒng) OEM公司提供全部經過測試的新產品解決方案?!?

????該公司近期發(fā)布了預定制的四款用于SoC設計的Diamond Standard VDO(ViDeO)處理器引擎,可以支持多標準多分辨率視頻模塊。面向移動手機和個人媒體播放器(PMPs)應用,這些視頻子系統(tǒng)的設計是完全可編程,可以支持所有流行的VGA和SD(也稱D1)視頻編解碼算法。包括H.264 Main Profile、VC-1 Main Profile, MPEG-4 Advanced Simple Profile (ASP)和MPEG-2 Main Profile。其算法的分辨率支持720x480 (NTSC) 和720x576 (PAL),同時也支持較低分辨率,如QCIF、QVGA、 CIF 和VGA。

????Tensilica完整的視頻解決方案如圖2所示。Diamond Standard VDO 引擎在處理器上通過軟件方式幾乎承擔了從讀取編碼流到向幀存儲器寫出的全部視頻解碼任務。包括網絡抽象層、圖像層、條代層(slice layer)、比特流解析、以及熵解編碼,包括在H.264 Main Profile解碼器中進行CABAC(Context-Adaptive Binary Arithmetic Coding)解碼。而大多數其他解決方案都忽略了該功能,或采用獨立的復雜且不可編程的" title="可編程的">可編程的硬件模塊,或利用700MHz普通CPU來實現該功能(這種方法明顯增加功耗)。

?

圖2? Tensilica基于處理器的視頻編解碼架構

?

????由于該方案通過運用Xtensa處理器的一種特征-細粒度門控時鐘再結合可編程的電源管理指令(可以降低各種負載情況下視頻處理的功耗),其動態(tài)功耗被降至最低。同時,由于大部分任務由Tensilica視頻引擎完成,不僅避免了對大體積、大功耗CPU的需求,而且由于很多處理都是在內部完成,而不用在總線上進行反復的數據交換,從而進一步降低了功耗。

????四新品針對不同應用

????Diamond VDO系列包括Diamond 381VDO、Diamond 383VDO、Diamond 385VDO、Diamond 388VDO四款產品,提供Baseline Profile和Main Profile兩種解決方案 –Main Profile提供更佳的數據壓縮率和視頻質量,是面向高級手機和PMP應用的D1或者更高分辨率的更好的編解碼機制。四款Diamond Standard VDO引擎的主要特性如表1所示??蓾M足消費類市場中多變的需求。
???
表1 Diamond VDO系列編解碼功能一覽

?


????Diamond VDO雙核架構如圖3所示。其中包括基于Xtensa架構配置得到的一個流處理" title="流處理">流處理器和一個像素處理器。流處理器指令集對視頻數據(熵解碼、運動向量的預測等等)的串行式處理進行了優(yōu)化。流處理器需要32K字節(jié)的本地數據存儲器,40K本地指令存儲器。其指令的寬度優(yōu)化到32位。像素處理器指令集采用SIMD(單指令多數據)技術,對像素數據的并行式處理進行了優(yōu)化。像素處理器需要40K本地數據存儲器,24K本地指令存儲器。處理器之間的內部通信是通過一個128位的直連接口實現的,而外部視頻引擎接口通信是通過2個32位的總線實現的。

????Tensilica在Diamond VDO系列中定義了400多條視頻專用指令,與通用DSP或通用32位微處理器相比,性能顯著提升。這些指令是針對視頻處理中性能要求苛刻的部分優(yōu)化得到的,這些算法部分包括:CABAC,它可得到H.264 Main profile視頻的更高壓縮效果;CAVLC(Context-adaptive variable-length coding),是一種用于H.264 Baseline Profile和 Main Profile的低復雜度壓縮算法;Deblocking:去塊效應,可減少在高壓縮視頻碼流中的由塊效應所引起的失真;Transforms:各種變換(H.264中有很多種變換,在這是說支持多種變換)進行空間域的壓縮變換,類JPEG處理;運動補償和運動估計,用于在低速碼率條件下得到高質量畫面的算法。

?

?


??? 圖3?? Diamond 38X VDO雙核架構


???????
????獨特架構打造小體積、高靈活性

????從上面分析可以看出,新Diamond VDO引擎相比與基于硬件的視頻加速器和常規(guī)CPU結合的傳統(tǒng)方式在體積和靈活性方面凸現優(yōu)勢。首先,Diamond VDO IP核減少了系統(tǒng)主控CPU的全部視頻解碼任務– 包括全部比特流解析。傳統(tǒng)的硬件加速器僅可減少如運動估計那樣的像素處理工作,而將大部分計算負擔(經常需要100MHz的持續(xù)的主控CPU開銷)交由系統(tǒng)控制器來完成。

????其次,當Diamond VDO引擎沒有被用于進行視頻處理時,可隨時以一種相當于有500多 Dhrystone MIPS處理能力的通用CPU 來執(zhí)行其他系統(tǒng)任務 – 相反一個特定的視頻硬件模塊是不能被重用的。此外,由于Diamond VDO引擎是可編程的,因此可支持今后出現的視頻標準而不必增加硬件或者重新流片。最后,Diamond VDO引擎面積小,其面積在130nm工藝下包括處理器邏輯和內部存儲器在內僅有8mm2。這對備受體積困擾的便攜式消費類產品無疑意義深遠。

????此外,為幫助客戶縮短產品開發(fā)時間,Tensilica還針對新Diamond VDO引擎開發(fā)了編碼器和解碼器,以及全套與之適配的軟件開發(fā)工具鏈,該開發(fā)工具包括一個基于ECLIPSE框架的高級集成開發(fā)環(huán)境、一個世界級編譯器、一個周期精確(cycle-accurate)并兼容SystemC的指令集仿真器、以及完整的工業(yè)標準GNU工具鏈。同時,Tensilica廣泛的合作伙伴網絡還將提供操作系統(tǒng)、調試工具、ICE解決方案、以及其他有助于將Tensilica處理器快速設計進其產品中的支持。

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。