在寄予了很大的期望,并泄漏了不少信息后,NVIDIA終于在今天上午發(fā)布了其下一代視頻卡GeForce RTX 30系列。這系列是基于NVIDIA Ampere架構(gòu)的游戲和圖形變體設(shè)計(jì),并基于三星8nm工藝的優(yōu)化版本打造。NVIDIA方面表示,這些新卡在游戲性能方面取得了重大改進(jìn)。最新一代的GeForce還將具有一些新功能,以進(jìn)一步將這些卡與NVIDIA基于Turing的RTX 20系列分別開來。
NVIDIA新發(fā)布的RTX 30系列的前三張卡分別是:RTX 3090,RTX 3080和RTX3070。這些卡都將在下個(gè)月半的時(shí)間內(nèi)推出。其中RTX 3090和RTX 3080更是必須一提。這兩款顯卡將分別作為NVIDIA GeForce RTX 2080 Ti和RTX 2080 / 2080S的后繼產(chǎn)品,他們創(chuàng)下了圖形性能的新高。當(dāng)然,RTX 3090的價(jià)格也創(chuàng)下了歷史新高。
第一款上市的顯卡是GeForce RTX3080。NVIDIA表示,新顯卡是上一代產(chǎn)品RTX 2080性能的兩倍,該顯卡將于9月17 日以700美元的價(jià)格發(fā)售。一周后,功能更強(qiáng)大的GeFoce RTX 3090將在9月24 日上市,售價(jià)為1500美元。而TX 3070被定位為更多傳統(tǒng)的甜蜜點(diǎn)卡,它將在下個(gè)月將以499美元的價(jià)格上市。
游戲領(lǐng)域的Ampere架構(gòu):GA102
與NVIDIA過往的做法一樣,他們?cè)诮裉焐衔绲墓_演講不是深入探討架構(gòu)。但NVIDIA仍然繼續(xù)其成功的發(fā)布經(jīng)驗(yàn)。這意味著要進(jìn)行大量的演示,推薦和宣傳視頻,并概要介紹最新一代GPU所采用的幾種技術(shù)和工程設(shè)計(jì)決策。最終的結(jié)果是,我們對(duì)RTX 30系列有一個(gè)不錯(cuò)的了解,但是我們必須等待NVIDIA提供一些深入的技術(shù)介紹,才能了解得更透徹。
據(jù)了解,頂級(jí)顯卡中使用的Ampere和GA102 GPU為NVIDIA的產(chǎn)品線帶來了幾項(xiàng)主要的硬件改進(jìn)。其中最大的改進(jìn)是晶體管尺寸的不斷縮小,這要?dú)w功于三星8nm工藝的定制版本。我們對(duì)此工藝的信息有限,因?yàn)樗鼪]有被使用太多的地方,但從較高的層次上講,這是三星公司最密集的傳統(tǒng)非EUV工藝,源自其較早的10nm工藝。
總而言之,NVIDIA在采用更小的工方面已經(jīng)有些遲了,但是由于該公司已經(jīng)重新開發(fā)了首先交付大型GPU的親和力,因此他們需要更高的晶圓產(chǎn)量(更少的缺陷)才能將芯片交付市場(chǎng)。
對(duì)于NVIDIA的產(chǎn)品而言,三星的8nm工藝是對(duì)他們先前工藝的完整升級(jí),臺(tái)積電的12nm“ FFN”本身就是臺(tái)積電16nm工藝的優(yōu)化版本。因此新工藝讓NVIDIA的晶體管密度顯著提高,
就GA102而言,在它里面集成了280億個(gè)晶體管,這在大量的CUDA內(nèi)核和其他可用硬件中得到了體現(xiàn)。圖靈(Turing)和麥克斯韋(Maxwell)等中代架構(gòu)在架構(gòu)水平上獲得了大部分收益,而安培(Ampere)(如之前的帕斯卡(Pascal))則受益于光刻工藝的適當(dāng)改進(jìn)。所有這一切的唯一障礙是Dennard Scaling 它已經(jīng)死了并且不會(huì)回來。因此,盡管NVIDIA可以在芯片中封裝比以往更多的晶體管,但功耗卻在提高,這在顯卡的TDP中得到了體現(xiàn)。
NVIDIA沒有為我們提供GA102的特定die尺寸,但是根據(jù)一些照片,我們有足夠的信心相信它會(huì)超過500平方毫米。它比754平方毫米的 TU102的尺寸要小得多,但它仍然是一個(gè)相當(dāng)大的芯片,并且是三星生產(chǎn)的最大芯片之一。
繼續(xù),讓我們談?wù)凙mpere架構(gòu)本身。作為NVIDIA A100加速器的一部分,這個(gè)架構(gòu)于今年春天推出,直到現(xiàn)在我們也僅是從面向計(jì)算的角度看到了Ampere。GA100缺少幾個(gè)圖形功能,因此NVIDIA可以最大化分配給計(jì)算的芯片空間,因此,像GA102這樣的以圖形為重點(diǎn)的Ampere GPU仍然是Ampere系列的成員,兩者之間有很多區(qū)別。這就是說,到目前為止,NVIDIA一直能夠?qū)mpere的游戲方面的能力保持神秘。
從計(jì)算的角度來看,Ampere看起來與Volta相當(dāng),而從圖形的角度來看也是如此。GA102并未引入任何新奇的功能塊,如RT核或張量核,但已對(duì)其功能和相對(duì)大小進(jìn)行了調(diào)整。此處最顯著的變化是,與Ampere GA100一樣,應(yīng)用在游戲的Ampere繼承并更新了功能更強(qiáng)大的張量?jī)?nèi)核,NVIDIA將其稱為第三代張量?jī)?nèi)核。單個(gè)Ampere SM可以提供比Turing SM兩倍的張量吞吐量,盡管只有一半的張量核心數(shù)量。而且,NVIDIA似乎在GA102上保留了基本的設(shè)置。那就使得NVIDIA的FP16張量核心性能比上一代提高了一倍以上。
同時(shí),NVIDIA已經(jīng)確認(rèn)GA102中使用的張量?jī)?nèi)核,其他Ampere圖形GPU也支持稀疏性以實(shí)現(xiàn)更高的性能,那就意味著NVIDIA在張量?jī)?nèi)核功能方面沒有退步。總體而言,對(duì)張量核心性能的關(guān)注,強(qiáng)調(diào)了NVIDIA對(duì)深度學(xué)習(xí)和AI性能的承諾,因?yàn)樵摴菊J(rèn)為深度學(xué)習(xí)不僅是其數(shù)據(jù)中心業(yè)務(wù)的驅(qū)動(dòng)器,而且也是其游戲業(yè)務(wù)的驅(qū)動(dòng)器。我們只需深入研究NVIDIA的深度學(xué)習(xí)超級(jí)采樣(Deep Learning Super Sampling :DLSS)技術(shù),即可了解原因。DLSS部分依賴于張量?jī)?nèi)核來提供盡可能多的性能,而NVIDIA仍在尋找更多方法來充分利用其張量?jī)?nèi)核。
光線追蹤(RT)核心也得到了增強(qiáng),盡管我們不確定到什么程度。除了具有更多SM的GA102在整體上具有更多的功能外,據(jù)說各個(gè)RT內(nèi)核的速度最高可快2倍,而NVIDIA可能專門引用了光線/三角形相交性能。NVIDIA的演示幻燈片中也有一些關(guān)于RT核心并發(fā)的簡(jiǎn)短說明,但是該公司在簡(jiǎn)短演示中并未對(duì)該主題進(jìn)行任何真正的詳細(xì)介紹,因此我們正在等待技術(shù)簡(jiǎn)介以獲取更多詳細(xì)信息。
總體而言,更快的RT內(nèi)核對(duì)于游戲行業(yè)的光線追蹤野心是一個(gè)好消息,因?yàn)楣饩€追蹤在RTX 20系列卡上的性能成本很高。話雖如此,但NVIDIA所做的任何事情都無(wú)法完全消除這種損失。光線追蹤是一項(xiàng)艱巨的工作,需要一段時(shí)間,但更多且經(jīng)過重新平衡的硬件可以幫助降低成本。
最后但同樣重要的是,我們要關(guān)注一下著色器核心( shader cores)。這是對(duì)游戲性能最重要的領(lǐng)域,也是NVIDIA今天所說得最少的領(lǐng)域。我們知道,新的RTX 30系列卡包含了數(shù)量驚人的FP32 CUDA內(nèi)核,這要?dú)w功于NVIDIA在其SM配置中將其標(biāo)記為“ 2x FP32”。結(jié)果,即使是中端的RTX 3080也提供29.8 TFLOP的FP32著色器性能,是上一代RTX 2080 Ti的兩倍以上。簡(jiǎn)而言之,這些GPU中有數(shù)量驚人的ALU,坦率地說,考慮到晶體管數(shù)量,ALU比我預(yù)期的要多得多。
當(dāng)然,Shading 性能并不是一切,這就是為什么NVIDIA自己對(duì)這些顯卡的性能要求不如僅Shading 性能方面的提高那么高。但是,考慮到計(jì)算機(jī)圖形的令人尷尬的并行性,著色器在很多時(shí)候肯定是瓶頸。這就是為什么在此問題上投入更多的硬件(在這種情況下,更多的CUDA內(nèi)核)是一種有效的策略的原因。
此時(shí)的主要問題是這些附加的CUDA內(nèi)核是如何組織的,以及對(duì)于SM中的執(zhí)行模型意味著什么。我們誠(chéng)然在這里進(jìn)入了更詳細(xì)的技術(shù)細(xì)節(jié),但是Ampere如何輕松地填充這些額外的內(nèi)核將成為其能夠更好地發(fā)揮所有這些teraFLOP性能的關(guān)鍵因素。這是由線程扭曲中額外的IPC提取驅(qū)動(dòng)的嗎?還是運(yùn)行進(jìn)一步的扭曲?
最后一點(diǎn),當(dāng)我們?cè)诘却嘘P(guān)新卡的更多技術(shù)信息時(shí),值得注意的是,NVIDIA的規(guī)格表或其他材料均未提及卡中的任何其他圖形功能。值得稱道的是,圖靈已經(jīng)領(lǐng)先一步,提供的功能將在兩年內(nèi)成為新的DirectX 12 Ultimate /功能級(jí)別12_2,比其他任何供應(yīng)商都要早。因此,隨著Microsoft和其他領(lǐng)域的追趕,NVIDIA并沒有立即追求的更高功能。不過,看到NVIDIA從其廣為人知的帽子中抽出一兩個(gè)新的圖形功能來吸引眾人,還是很不尋常。
I / O:PCI Express4.0,SLI和RTX IO
NVIDIA在 GeForce卡中引入了Ampere,也將Ampere改進(jìn)的I / O功能帶入了消費(fèi)市場(chǎng)。盡管這里沒有什么是開創(chuàng)性的,但這里的一切都有助于保持NVIDIA最新一代顯卡的良好運(yùn)轉(zhuǎn)。
據(jù)了解,I / O前端的功能包括對(duì)PCI-Express 4.0的支持。這是在NVIDIA的A100加速器上引入的,因此,它的加入是在意料之中,但這仍然是自8年前GTX 680推出以來NVIDIA PCIe帶寬的首次增加。借助完整的PCIe 4.0 x16插槽,RTX 30系列卡在每個(gè)方向上的I / O帶寬達(dá)到32GB /s,是RTX 20系列卡訪問速度的兩倍。
至于PCIe 4.0對(duì)性能的影響,我們目前預(yù)計(jì)不會(huì)有太大的不同,因?yàn)楹苌儆凶C據(jù)表明Turing卡受到PCIe 3.0速度的限制,即使PCIe 3.0 x8在大多數(shù)情況下也已足夠使用。安培的更高性能無(wú)疑會(huì)增加對(duì)更多帶寬的需求,但幅度不會(huì)太大。這可能就是為什么甚至NVIDIA都沒有大力推廣PCIe 4.0支持的原因(盡管在這里僅次于AMD可能是一個(gè)因素)。
同時(shí),似乎SLI支持將持續(xù)存在至少至少一代。NVIDIA的RTX 3090卡包括一個(gè)用于SLI和其他多GPU用途的NVLInk連接器。因此,多GPU渲染即使幾乎沒有發(fā)生,也仍然有效。NVIDIA今天的演講沒有對(duì)該功能進(jìn)行任何進(jìn)一步的詳細(xì)介紹,但是值得注意的是,Ampere架構(gòu)引入了NVLink 3,如果NVIDIA將其用于RTX 3090,則意味著3090的NVLink帶寬可能是上一代的RTX 2080 Ti的兩倍,每個(gè)方向的速度為100GB/s。
總體而言,我懷疑RTX 3090上包含NVLInk連接器對(duì)于計(jì)算用戶來說是一個(gè)新玩法,由于知道VRAM容量對(duì)先進(jìn)的深度學(xué)習(xí)模型的重要習(xí)慣,許多用戶將對(duì)擁有24GB VRAM的快速消費(fèi)級(jí)卡感到垂涎三尺……不過,NVIDIA絕不會(huì)放棄在圖形方面進(jìn)行追加銷售的機(jī)會(huì)。
最終,隨著RTX 30系列的發(fā)布,NVIDIA還宣布了他們稱為RTX IO的新I / O功能套件。從高層次看,這似乎是NVIDIA對(duì)Microsoft即將推出的DirectStorage API 的實(shí)現(xiàn),就像在首次啟動(dòng)的XboxSeries X控制臺(tái)上一樣,它允許從存儲(chǔ)到GPU的直接連接,實(shí)現(xiàn)異步assets流的傳輸,通過繞開CPU來完成大部分工作,DirectStorage(以及擴(kuò)展為RTX IO)可以通過讓GPU更直接地獲取所需的資源來改善I / O延遲和GPU的吞吐量。
除了Microsoft為該技術(shù)提供標(biāo)準(zhǔn)化API之外,這里最重要的創(chuàng)新是Ampere GPU能夠直接解壓縮assets。游戲assets經(jīng)常被壓縮以用于存儲(chǔ)目的-至少Flight Simulator 2020占用甚至更多的 SSD空間,并且當(dāng)前將這些assets解壓縮為GPU可以使用的東西是CPU的工作。將其從CPU卸載不僅可以將其釋放給其他任務(wù),而且最終完全擺脫了中間人,這有助于改善assets流性能和游戲加載時(shí)間。
務(wù)實(shí)地說,我們已經(jīng)知道該技術(shù)已經(jīng)應(yīng)用于Xbox Series X和PlayStation 5,因此很大程度上是Microsoft和NVIDIA與下一代游戲機(jī)保持同等水平。但是,它確實(shí)需要在GPU端進(jìn)行一些真正的硬件改進(jìn),以處理所有這些I / O請(qǐng)求并能夠有效地解壓縮各種類型的assets。
Ampere功耗效率改進(jìn):1.9倍?可能不是
除了整體視頻卡性能之外,NVIDIA的第二大技術(shù)支柱是整體功耗效率。功率效率是GPU設(shè)計(jì)的基石,因?yàn)閳D形工作負(fù)載有令人尷尬地并行化,并且GPU性能受到總功耗的限制。功率效率是所有GPU發(fā)布中經(jīng)常關(guān)注的焦點(diǎn)。NVIDIA為確保RTX 30系列的發(fā)布而給予了一定的關(guān)注。
總體而言,NVIDIA聲稱Ampere的功耗效率提高了1.9倍。對(duì)于后Dennard時(shí)代的制造工藝節(jié)點(diǎn)的全面發(fā)展,這實(shí)際上是一個(gè)令人驚訝的說法。請(qǐng)注意,這絕非不可能,但這遠(yuǎn)超NVIDIA從Pascal升級(jí)到Turing所獲得的提升。
但是,如果深入研究NVIDIA的說法,這個(gè)1.9倍的提升就顯得越來越夸張。
此處的直接奇怪之處是,通常功耗效率是以固定的功耗水平而不是固定的性能水平來衡量的。隨著晶體管的功耗大約增加電壓的三次方,像Ampere這樣具有更多功能塊的“更寬”部分可以以更低的頻率進(jìn)行時(shí)鐘輸出,從而達(dá)到與Turing相同的整體性能。本質(zhì)上,這張圖是將最壞的Turing與最好的Ampere進(jìn)行比較,那么問題來了,如果我們將Ampere降頻到與Turing一樣慢,那會(huì)是什么樣?而不是“在相同約束下安培比圖靈快多少?”。
換句話說,在特定的功耗下,NVIDIA的圖表并未向我們展示了直接的性能比較。
如果您實(shí)際上進(jìn)行了固定的功耗比較,那么Ampere在NVIDIA的圖表中看起來就不會(huì)那么好。在此示例中,Turing在240W時(shí)達(dá)到60fps,而Ampere的性能曲線大約為90fps??梢钥隙ǖ氖?,這仍然是一個(gè)很大的改進(jìn),但是每瓦性能僅提高了50%。最終,功耗效率的確切提高將取決于您在圖表中的采樣位置,但是很顯然,按照更常規(guī)的指標(biāo)定義,NVIDIA使用Ampere的功耗效率提高不會(huì)達(dá)到NVIDIA幻燈片所聲稱的90%。
所有這些都反映在新RTX 30系列卡的TDP中。RTX 3090消耗的功耗高達(dá)350瓦,甚至RTX 3080也消耗320W的功率。如果我們信奉NVIDIA的性能要求,RTX 3080提供的性能比RTX 2080高出100%,功耗增加了49%,那么每瓦性能的有效提高僅為34%。而RTX 3090的比較則更加苛刻,NVIDIA宣稱性能提高了50%,功耗增加了25%,那就意味著其凈功耗效率僅增加了20%。
最終,很明顯,NVIDIA在Ampere一代產(chǎn)品中獲得的大部分性能提升將來自更高的功耗限制。有了280億的晶體管,這些卡將變得更快,但是它將需要比以往更多的電源來點(diǎn)亮它們。
支持PAM的GDDR6X
除了核心GPU架構(gòu)本身之外,GA102還引入了對(duì)另一種新內(nèi)存類型的支持:GDDR6X。這是由Micron和NVIDIA開發(fā)的GDDR6演進(jìn)版技術(shù),GDDR6X旨在通過在內(nèi)存總線上使用多級(jí)信令來實(shí)現(xiàn)更高的內(nèi)存總線速度(并因此獲得更大的內(nèi)存帶寬)。通過采用這種策略,NVIDIA和美光科技可以繼續(xù)推動(dòng)具有成本效益的獨(dú)立存儲(chǔ)技術(shù)的發(fā)展,從而繼續(xù)滿足NVIDIA最新一代GPU的要求。這標(biāo)志著NVIDIA在過去幾代產(chǎn)品中的第三種存儲(chǔ)技術(shù),從GDDR5X到GDDR6再到GDDR6X。
美光公司上個(gè)月發(fā)布了有關(guān)該技術(shù)的一些早期技術(shù)文件時(shí)表示,通過采用脈沖幅度調(diào)制4(ulse Amplitude Modulation-4 :PAM4),GDDR6X能夠每個(gè)時(shí)鐘發(fā)送四個(gè)不同的符號(hào),實(shí)質(zhì)上是每個(gè)時(shí)鐘移動(dòng)兩位,而不是通常每個(gè)時(shí)鐘移動(dòng)一位。為了簡(jiǎn)潔起見,我不會(huì)完全重述該討論,但我將重點(diǎn)介紹。
在非常高的水平上,PAM4與NRZ(二進(jìn)制編碼)的區(qū)別是使單個(gè)單元(或在這種情況下為傳輸)將保持的電氣狀態(tài)數(shù)增加一倍。PAM4使用4種信號(hào)電平,而不是傳統(tǒng)的0/1高/低信令,因此一個(gè)信號(hào)可以編碼為四種可能的兩位模式:00/01/10/11。這樣一來,PAM4可以承載的數(shù)據(jù)量是NRZ的兩倍,而不必將傳輸帶寬加倍,這將帶來更大的挑戰(zhàn)。
反過來,PAM4需要更復(fù)雜的存儲(chǔ)控制器和存儲(chǔ)設(shè)備來處理多種信號(hào)狀態(tài),但同時(shí)也會(huì)降低存儲(chǔ)總線頻率,從而簡(jiǎn)化了其他方面。對(duì)于NVIDIA來說,最重要的一點(diǎn)可能是它的電源效率更高,每位帶寬消耗降低約15%??梢钥隙ǖ氖?,總的DRAM功耗仍在上升,因?yàn)檫@遠(yuǎn)遠(yuǎn)超出了帶寬獲得的補(bǔ)償,但是DRAM上節(jié)省的每一焦耳都被應(yīng)用在GPU的其他方面。
根據(jù)美光的文件,該公司設(shè)計(jì)的第一代GDDR6X達(dá)到21Gbps。但是NVIDIA在這里顯得略為保守,RTX 3090的速度為19.5Gbps,RTX 3080的速度為19Gbps。即使在這些速度下,假設(shè)內(nèi)存總線大小相同的情況下,內(nèi)存帶寬仍比上一代卡提高了36%-39%。總體而言,這種進(jìn)展仍然是規(guī)范的例外。從歷史上講,我們通常看不到連續(xù)幾代產(chǎn)品都能獲得如此大的內(nèi)存帶寬。但是,隨著提供更多的SM,我只能想象NVIDIA的產(chǎn)品團(tuán)隊(duì)很高興擁有它。
但是,GDDR6X確實(shí)存在一個(gè)明顯的缺點(diǎn):容量。
盡管美光計(jì)劃在將來開發(fā)16Gbit芯片,但從今天開始,他們將來只會(huì)生產(chǎn)8Gbit芯片。此密度與NVIDIA RTX 20系列卡及其GTX 1000系列卡上的存儲(chǔ)芯片相同。因此,至少對(duì)于這些卡而言,沒有“免費(fèi)”的存儲(chǔ)容量升級(jí)。RTX 3080僅獲得10GB的VRAM,而RTX 2080僅為8GB,這是因?yàn)槭褂昧溯^大的320位內(nèi)存總線(即10個(gè)芯片而不是8個(gè)芯片)。同時(shí),RTX 3090獲得24GB的VRAM,但是只能通過在384位內(nèi)存總線上以clamshell 模式使用12對(duì)芯片,從而使存儲(chǔ)芯片的數(shù)量做到RTX 2080 Ti的兩倍多。
HDMI 2.1和AV1引入,VirtualLink出局
最后,在顯示I / O面板上,Ampere和新的GeForce RTX 30系列卡在此處進(jìn)行了幾個(gè)顯著更改。最重要的是,他們終于有了對(duì)HDMI 2.1的支持。HDMI 2.1已經(jīng)在電視中(并將在今年的主機(jī)中交付)面世,它為桌面帶來了一些功能,其中最引人注目的是支持更大的電纜帶寬。
HDMI 2.1電纜可以傳輸高達(dá)48Gbps的數(shù)據(jù),是HDMI 2.0的2.6倍以上,從而可以提供更高的顯示分辨率和刷新率,例如以165Hz以上的頻率運(yùn)行的8K電視或4K顯示器。帶寬的飛躍甚至使HDMI領(lǐng)先于DisplayPort。DisplayPort 1.4僅提供大約66%的帶寬。雖然DisplayPort 2.0 最終會(huì)擊敗它,但目前看來,Ampere對(duì)于該技術(shù)而言還為時(shí)過早。
綜上所述,我仍在等待NVIDIA確認(rèn)其新GeForce卡是否支持全48Gbps信號(hào)速率。因?yàn)槟承〩DMI 2.1電視已經(jīng)發(fā)貨,支持更低的數(shù)據(jù)速率,因此,NVIDIA在這里做同樣的事情并非不可想象。
從游戲的角度來看,HDMI 2.1的其他功能是通過HDMI支持可變刷新率。但是,此功能不是HDMI 2.1獨(dú)有的,確實(shí)已經(jīng)被移植到NVIDIA的RTX 20卡,因此,隨著電纜帶寬的增加,對(duì)它的支持將在這里變得更加有用,但從技術(shù)上講,它并不是NVIDIA卡的新功能……
同時(shí),RTX 20系列卡上引入的VirtualLink端口即將淘汰。業(yè)界試圖建立一個(gè)端口,以將視頻,數(shù)據(jù)和電源整合起來,用于VR頭戴式耳機(jī)中,但這個(gè)嘗試已經(jīng)失敗了,三大頭戴式VR制造商(Oculus,HTC,Valve)都沒有使用該端口。因此,您不會(huì)在RTX 30系列卡上找到該端口。
最后,當(dāng)我們討論視頻時(shí),NVIDIA還確認(rèn)了新的Ampere GPU包括其NVDEC視頻解碼模塊的更新版本。該芯片制造商將這一功能提高到了NVIDIA所謂的Gen 5,增加了對(duì)新AV1視頻編解碼器的解碼支持。
人們普遍期望,即將出現(xiàn)的免版稅編解碼器將成為H.264 / AVC的事實(shí)上的繼任者,因?yàn)镠EVC進(jìn)入市場(chǎng)已經(jīng)有很多年了(并且最近所有的GPU都已經(jīng)支持了)。編解碼器附近的madcap專利使用費(fèi)情況不利于其采用。相比之下,AV1在分發(fā)中的使用應(yīng)提供與HEVC相似或略好于HEVC的質(zhì)量,但無(wú)需支付版稅,這使其對(duì)內(nèi)容供應(yīng)商的吸引力更大。迄今為止,AV1的一個(gè)缺點(diǎn)是CPU負(fù)擔(dān)很重,即使在高端臺(tái)式機(jī)中,硬件解碼支持也很重要,以便避免占用CPU資源并確保流暢,無(wú)干擾的播放。
NVIDIA在這里沒有詳細(xì)介紹其AV1支持的內(nèi)容,但是另一篇博客文章提到了10位色彩支持和8K解碼,因此聽起來NVIDIA已經(jīng)覆蓋了基礎(chǔ)。
同時(shí),沒有提及對(duì)該公司NVENC區(qū)塊的進(jìn)一步改進(jìn)。最近針對(duì)Turing發(fā)布進(jìn)行了修改,從而擴(kuò)大了NVIDIA HEVC編碼功能的范圍以及整體HEVC和H.264圖像質(zhì)量。否則,對(duì)于硬件AV1編碼,我們還為時(shí)過早,因?yàn)樵摼幗獯a器的某些獨(dú)特屬性正在使硬件編碼更難破解。