光線追蹤是指在模擬場景中對若干條模擬光線進(jìn)行單獨(dú)追蹤,模擬光線其與場景中物體、物體表面材質(zhì)的交互,從而達(dá)到全局照明場景中更真實(shí)的渲染效果。相比傳統(tǒng)的光柵化渲染的方式,光線追蹤雖然效果更好但同時(shí)對于計(jì)算資源的需求更高,傳統(tǒng)軟件實(shí)現(xiàn)方式并不能大規(guī)模普及開來。英偉達(dá)在2018年推出了通過硬件加速來實(shí)現(xiàn)實(shí)時(shí)光線追蹤的桌面級GPU,這可以看作是GPU領(lǐng)域的一次重大突破。而今時(shí)隔3年之后,Imagination推出了全新的移動(dòng)GPU平臺——C系列,通過全新的“光子”架構(gòu)讓光線追蹤進(jìn)入到了移動(dòng)端,成為GPU史上又一次的重大邁進(jìn)。
圖:Imagination提供的是否開啟實(shí)時(shí)光線追蹤的效果對比*
克服光線追蹤進(jìn)入移動(dòng)端的難點(diǎn)
由于光線追蹤對于計(jì)算資源有著很高的要求,而移動(dòng)端又非常注重功耗的表現(xiàn),所以光線追蹤功耗表現(xiàn)是其進(jìn)入移動(dòng)端的第一難題。據(jù)Imagination技術(shù)前瞻副總裁Kristof Beets分享,移動(dòng)端面臨的限制很多,一方面核心的數(shù)量沒有辦法無限疊加,發(fā)熱和功耗都會(huì)成為很大的問題。Imagination新推出的具有光線追蹤功能的C系列GPU IP,它有專門的硬件部分把光線追蹤相關(guān)的計(jì)算分流到光線追蹤的硬件上,來實(shí)現(xiàn)光線追蹤的效果。其中包括光線的反射、陰影、全局照明和環(huán)境光的遮蔽??傮w上可以達(dá)到整個(gè)顯示效果的極大提升,同時(shí)保留原來非常低的功耗和效率。
Imagination將新的光線追蹤架構(gòu)命名為“光子”。據(jù)Imagination中國區(qū)戰(zhàn)略市場與生態(tài)副總時(shí)昕博士分享,“去創(chuàng)造一個(gè)新的宇宙,大家第一個(gè)想到的概念是什么?我想到上帝說的一句話”要有光“。我們要?jiǎng)?chuàng)造一個(gè)全新的虛擬世界,我們第一個(gè)需要的東西也是光,所以我們把新的光線追蹤的架構(gòu)命名為光子?!毙碌摹肮庾印盙PU架構(gòu)這個(gè)專門用來進(jìn)行光線追蹤處理的硬件單元叫做RAC(光線加速集群),通過該硬件的加速可以實(shí)現(xiàn)傳統(tǒng) 方式數(shù)倍的提升,各項(xiàng)性能幾乎都能提高50%。以32位的CXTRT3舉例:每秒鐘可以計(jì)算13億條光線的折射、反射,每秒算力達(dá)到1.5T,48G像素/s、紋理運(yùn)算1.3G/s、48GBoxTest;如果做AI定點(diǎn)運(yùn)算每秒可以達(dá)到6TOPS。
在場景的渲染上,越真實(shí)的體驗(yàn)需要調(diào)度越多的硬件資源。根據(jù)不同的渲染等級,RAC中的不同硬件加速模塊會(huì)相應(yīng)的被調(diào)用,把光線遍歷、追蹤和監(jiān)控算法通過專用的硬件來實(shí)現(xiàn)。當(dāng)全局光照打開,數(shù)億條光線打到物體上,將會(huì)產(chǎn)生非常大的計(jì)算量。Imagination會(huì)將數(shù)億條光線通過分組的形式來進(jìn)行計(jì)算,從而提高計(jì)算的效率。分組計(jì)算后的結(jié)果通過一致性檢測硬件來進(jìn)行簇化,將畫面提升到最佳。
將全新的RAC與之前B系列中的USC、TPU等放在一起,就可以組成一個(gè)具備光線追蹤能力的移動(dòng)GPU。據(jù)悉,CXT支持多核架構(gòu)來實(shí)現(xiàn)更高的性能表現(xiàn),例如4核架構(gòu)最多可以達(dá)到7.8G Ray/s,同時(shí)還可以選擇用專門神經(jīng)網(wǎng)絡(luò)加速器單元去做降噪的處理,將更多的資源去做圖形相關(guān)的渲染計(jì)算。此外Imagination也開發(fā)了相應(yīng)的軟件工具,開發(fā)者可以查看每秒的光線數(shù),測試的負(fù)載等;另外還有一個(gè)為內(nèi)容開發(fā)者提供的軟件開發(fā)套件,功能類似于跑在PowerVR上模擬出的效果。
光線追蹤的大規(guī)模應(yīng)用之路
光線追蹤的思路很早就已經(jīng)出現(xiàn),但受制于計(jì)算資源的需求較大,一直沒能得到很大規(guī)模應(yīng)用。而且在前期碎片化問題嚴(yán)重,一些方案均來自自有API或軟件方案,這意味著內(nèi)容開發(fā)者并不難在后臺大量應(yīng)用這些技術(shù)。專用的硬件加速的出現(xiàn)使其成為了可能,英偉達(dá)的硬件加速光線追蹤桌面級GPU的發(fā)布是一個(gè)節(jié)點(diǎn),讓硬件方案進(jìn)入市場并得到認(rèn)可。而今Imagination的光線追蹤移動(dòng)GPU的發(fā)布,是一個(gè)更為重要的節(jié)點(diǎn),帶來了光追的大規(guī)模應(yīng)用爆發(fā)的可能。
為了進(jìn)一步推進(jìn)光追的普及,Imagination率先提出了一個(gè)光追的分級體系,如下圖所示:0級為傳統(tǒng)方案,可能是在圖形工作站上進(jìn)行幾個(gè)小時(shí)的畫面渲染,可能也會(huì)有一些專業(yè)的非標(biāo)準(zhǔn)化的硬件來加速。1級是后來業(yè)界在將光追算法向GPU上逐漸遷移,將CPU版本軟件轉(zhuǎn)換成GPU的版本,借助GPU的并行計(jì)算能力來獲得數(shù)量級加速。2級中出現(xiàn)了更多細(xì)致的光線處理的新的方式,3級中出現(xiàn)了硬件BVH處理能力。據(jù)時(shí)昕博士分享,目前行業(yè)中即使是PC上的光追,大概就在2、3級的水平。第4級別是當(dāng)前Imagination所發(fā)布的新產(chǎn)品可以達(dá)到的,這是全球第一次達(dá)到該級別的硬件處理能力。第5級上會(huì)進(jìn)一步將會(huì)更多計(jì)算工作負(fù)荷從原來的GPU的渲染器或著色器中分離出來,轉(zhuǎn)移到專門的硬件上去加速,從而省下更多的GPU資源來做其他動(dòng)態(tài)渲染,這樣可以在性能提升的同時(shí)降低功耗。
其實(shí)Imagination已經(jīng)具備直接推出L5級別光追方案的能力,但由于現(xiàn)在市場并不成熟所以并沒有推出。Kristof表示,沒有選擇現(xiàn)階段推出L5級產(chǎn)品主要為了市場平衡考慮,Imagination跟市面上的光線追蹤開發(fā)者有過溝通,如果現(xiàn)在推出市場上唯一的L5等級光線追蹤硬件設(shè)備,因?yàn)槭袌鰶]有準(zhǔn)備所以不會(huì)有太多開發(fā)者來開發(fā)相應(yīng)的應(yīng)用。所以Imagaination決定先推出L4級別的CXT產(chǎn)品來培育市場,讓游戲3D引擎、游戲開發(fā)者進(jìn)入到生態(tài)中,再慢慢把光線追蹤市場做大。在標(biāo)準(zhǔn)方面,現(xiàn)在市場上已經(jīng)出現(xiàn)了一些光線追蹤技術(shù)趨向于標(biāo)準(zhǔn)化、統(tǒng)一化的趨勢。時(shí)昕表示,處理器的成功離不開整個(gè)生態(tài),包括接口,包括編程的模式、工具等等。整個(gè)光追生態(tài)其中一個(gè)重要因素——API標(biāo)準(zhǔn)已經(jīng)成型,包括Vulkan都有相關(guān)的標(biāo)準(zhǔn)出來,Imagination的硬件提供了可能性,上層內(nèi)容開發(fā)者和工具開發(fā)者,也會(huì)遵循同樣的光線追蹤標(biāo)準(zhǔn),相信很快會(huì)有很多豐富的內(nèi)容出現(xiàn)。Imagination也積極與微軟等合作伙伴進(jìn)行密切的溝通,在此基礎(chǔ)上繼續(xù)提升GPU架構(gòu)追求更好的PPA表現(xiàn)。
###
據(jù)悉諸多客戶已經(jīng)獲得了最新CXT的IP授權(quán),按照正常的產(chǎn)品研發(fā)周期推算,消費(fèi)者有望在2023年在移動(dòng)設(shè)備上體驗(yàn)到硬件光線追蹤方案。