尖端技術(shù)領(lǐng)域永遠(yuǎn)不存在一成不變的情況。復(fù)雜的視覺內(nèi)容、不斷疊加的UI層次以及4K HDR視頻等新興需求層出不窮,無一不在推動著我們不斷突破主流移動設(shè)備的技術(shù)瓶頸,實現(xiàn)更高遠(yuǎn)的目標(biāo)。正因如此,針對數(shù)字電視(DTV)和主流移動市場,Arm推出了包含兩款圖像處理器在內(nèi)的全新Mali多媒體套件,其中一款為顯示處理器,另一款為視頻處理器。
圖形復(fù)雜性主要是GPU處理的領(lǐng)域,而在應(yīng)對上述新興技術(shù)的挑戰(zhàn)時,則是視頻和顯示處理器扮演著重要角色,它們?yōu)橛脩籼峁┱嬲咂焚|(zhì)的視覺體驗。
對顯示的要求越來越高
之前,我們在討論GPU時對數(shù)字電視已有所談及,但從顯示的角度來看,如今的幾代智能電視已遠(yuǎn)遠(yuǎn)超出預(yù)期。過去,當(dāng)我們在觀看節(jié)目時,彈出的純文本菜單很可能覆蓋整個畫面,非常單一。而今天則大不相同。通過大量的預(yù)集成應(yīng)用程序,數(shù)字電視能夠提供不同類型、不同復(fù)雜程度和不同查看選項的內(nèi)容,更不必說語音或手勢識別用戶界面。如此一來,對顯示處理器的挑戰(zhàn)變得非常巨大。加之用戶對畫中畫的需求,甚至還有我們從中國市場上觀察到的獨(dú)特需求,比如用戶希望能夠在4x4的視頻墻中同時看到多達(dá)16個視頻流。這些需求推動Arm再一次邁上新的臺階。
Mali-D51是Arm針對主流市場發(fā)布的首款基于Komeda架構(gòu)設(shè)計的Mali顯示處理器,而Komeda架構(gòu)則在去年隨上一代高端顯示處理器Mali-D71共同發(fā)布。與Mali-D71相比,Mali-D51尺寸縮小30%,專為在更小的硅片面積上提供高品質(zhì)的視覺體驗而設(shè)計。在主流移動設(shè)備中,用戶不太可能需要播放大量4K內(nèi)容(這依舊屬于高端效能領(lǐng)域),但用戶仍然需要設(shè)備擁有播放4K內(nèi)容的能力。因此在主流市場中,我們所需要做的就是如何做出明智的選擇,其中可能包括從4K縮小視頻流大小,以滿足用戶顯示對分辨率的要求。Mali-D51利用這一優(yōu)勢,以60fps顯示高達(dá)2048x4096像素的分辨率并且支持Mali-D71的8層數(shù)據(jù)處理能力。
與上一代主流產(chǎn)品Mali-DP650執(zhí)行雙重顯示相比,Mali-D51在相同面積內(nèi)實現(xiàn)了兩倍的場景復(fù)雜度。當(dāng)驅(qū)動單個顯示時,它利用輔助顯示未充分利用的資源向場景添加第二組四個合成層。除此之外,這些合成層還可以進(jìn)行旋轉(zhuǎn)、阿爾法混合或縮放,從而實現(xiàn)了兩倍于Mali-DP650的圖層數(shù)據(jù)處理能力,這意味著我們可以在不需要GPU的情況下支持UI疊加、畫中畫等所需的所有附加數(shù)據(jù)。
訪問內(nèi)存是顯示技術(shù)中的一項常規(guī)要求。因此,與上一代產(chǎn)品相比,Mali-D51在內(nèi)存延遲性能方面提升了一倍。搭配CoreLink MMU-600,Mali-D51可在整個系統(tǒng)中實現(xiàn)更大的性能增益。為將像素持續(xù)驅(qū)動至顯示面板,處理器需要定期訪問系統(tǒng)總線,而將處理器的內(nèi)存延遲性能提升一倍意味著它只需在總線上花費(fèi)一半的時間就可以將圖像驅(qū)動至面板。此舉加速了整個顯示線程,并大大提高了系統(tǒng)的魯棒性,以防止欠載運(yùn)行,從而提供無縫、實時性能,避免因任何可見故障或人為因素影響用戶的視覺體驗。
增值視頻體驗
Arm全新推出的視頻處理器Mali-V52同樣是為滿足主流市場不斷增長的需求而設(shè)計的。上一代Mali-V61旨在實現(xiàn)最大限度的可擴(kuò)展性,滿足從最小型、最低功耗的監(jiān)控攝像頭到最新款頂級智能手機(jī)的所有設(shè)備要求。相對于上一代支持大范圍用例的特性,Mali-V52則更有針對性,專為主流市場的特定效率加成進(jìn)行了投入。
Mali-V52的可擴(kuò)展性為1-4核(Mali-V61為1-8核),這是特別針對在硅片面積有限的主流設(shè)備上播放4K內(nèi)容流的情況而設(shè)計的,因此比同等性能所需的Mali-V61的尺寸縮小了近40%。顯然,這樣可以為廠商節(jié)省巨大的預(yù)算。需要強(qiáng)調(diào)的是,像Mali-D51一樣,這款全新視頻處理器通過一系列智能權(quán)衡實現(xiàn)了極大優(yōu)化,為我們的所有合作伙伴提供了廣闊的組合和選擇。對于入門級設(shè)備而言,我們已經(jīng)將每個內(nèi)核的解碼性能提高了一倍,這意味著在同等的硅片面積內(nèi),芯片可以執(zhí)行4k60解碼或4k30編碼。使用Mali-V61的一個單核,系統(tǒng)可以解碼1080p60;而Mali-V52的一個單核可支持4k30或1080p120解碼,對于HEVC、H.264和VP9等主流的視頻標(biāo)準(zhǔn),該單核的解碼設(shè)計性能為上一代的兩倍。
Mali-V52的設(shè)計旨在確保整體系統(tǒng)的成本和功耗最優(yōu)化。比如,它能夠支持更長的系統(tǒng)總線響應(yīng)時間而不降低任何性能。搭載Mali-V52,可保證在總線上固定延遲的400個周期內(nèi)不丟幀,這一性能是Mali-V61的兩倍。此外,我們投入了大量的精力來確保該芯片在最高可達(dá)5000個周期內(nèi)的訪存延遲具有恢復(fù)能力,從而使視頻處理器能夠在很多個時鐘周期內(nèi)脫機(jī)工作,讓位給包含顯示處理器在內(nèi)的優(yōu)先級更高的主設(shè)備。
Mali-V52還可以在保持與以往相同品質(zhì)的前提下降低20%的比特率,這對節(jié)省存儲空間作用顯著,并能在相同帶寬內(nèi)實現(xiàn)最高品質(zhì)。當(dāng)我們?yōu)閿U(kuò)大設(shè)備存儲空間支付更多費(fèi)用時,這一性能提升對終端用戶使用視頻功能會產(chǎn)生重大影響。用戶可以選擇特定的品質(zhì)水平,并根據(jù)存儲和功耗的優(yōu)先級進(jìn)行權(quán)衡,這正解釋了為什么在移動設(shè)備中搭載專用的視頻處理器格外重要,而不是讓已經(jīng)超負(fù)荷運(yùn)行的CPU完成所有任務(wù)。
如同許多新興技術(shù)一樣,一項在中國市場的推動下實現(xiàn)的用例:僅僅提供簡單的畫中畫已無法滿足用戶的需求,他們希望能夠預(yù)覽將要觀看的節(jié)目,而中國用戶更是希望能夠從多達(dá)16個不斷更新的流媒體頻道中選擇想看的節(jié)目。這種希望呈現(xiàn)4x4視頻墻的要求來自眾多我們在中國的機(jī)頂盒和數(shù)字電視合作伙伴,并且已經(jīng)明確成為未來的基本要求,而非錦上添花的功能,我們必須開發(fā)出系列IP來解決這一問題。
由此,單個處理器將退居二線,而全套Mali多媒體套件將開始登場。
協(xié)同讓世界更美好
相比獨(dú)立產(chǎn)品,組合兩個及以上Mali多媒體套件處理器可顯著提高工作效率。Arm支持完整的軟件堆棧,以便在顯示上啟用硬件編寫器功能,從而允許安卓系統(tǒng)查看系統(tǒng)的硬件功能,并推斷它可以將內(nèi)容發(fā)送至顯示處理器而非GPU——該堆棧能夠發(fā)現(xiàn)硬件并通過軟件自動與其進(jìn)行交互,工程師甚至都無需考慮硬件。
至于上述討論的視頻墻用例,Mali-V52可以同時對16個高清視頻進(jìn)行解碼,同時將它們作為單幀寫入顯示處理器。憑借卓越的存儲接口,Mali-D51能夠?qū)⒃搯螏崛〕鰜聿⒅苯影l(fā)送到面板,而不會出現(xiàn)任何額外的瓶頸或卡頓。
對于整個系統(tǒng),Mali多媒體套件處理器帶來的實際增益在于大大節(jié)省了GPU的負(fù)荷。如果要在GPU上執(zhí)行旋轉(zhuǎn)、縮放以及伽瑪校正等任務(wù),系統(tǒng)功耗將增加30%以上,這是約束移動設(shè)備的一個重大問題。雖然這并不妨礙用戶欣賞4K內(nèi)容,但Mali多媒體IP套件的優(yōu)越之處在于全新的視頻處理器Mali-V52可以在發(fā)送到顯示處理器之前直接將4K內(nèi)容縮小。這意味著用戶可以在所有消費(fèi)電子設(shè)備上直接觀看那些由Netflix、亞馬遜等發(fā)行的全新超酷4K節(jié)目。不僅僅是4K,Mali-V52支持10bit HDR內(nèi)容,并且通過與Mali-D51和Assertive Display 5完美配合,在任何類型的面板(無論是HDR還是SDR)上均可實現(xiàn)最佳的內(nèi)容顯示。
從數(shù)字電視到智能手機(jī),無論用戶預(yù)算多少,Mali多媒體圖形、視頻和顯示套件都能夠更好地協(xié)同工作,為用戶提供最高品質(zhì)的視覺體驗。