受惠于過(guò)去幾年人工智能的爆發(fā),全球GPU領(lǐng)導(dǎo)廠商英偉達(dá)不但成為全球市值最高的半導(dǎo)體企業(yè)。與此同時(shí),公司又收購(gòu)了Mellanox和Arm,打造了完整的數(shù)據(jù)中心芯片產(chǎn)品線,全新的英偉達(dá)儼然成為數(shù)據(jù)中心最炙手可熱的明星。
英偉達(dá)創(chuàng)始人黃仁勛在昨晚開(kāi)幕的GTC大會(huì)上也表示,在其CPU、DPU和GPU這三條產(chǎn)品線,公司未來(lái)在數(shù)據(jù)中心將會(huì)創(chuàng)造更多可能。而在本次大會(huì)上,英偉達(dá)也帶來(lái)了CPU和DPU的更新。尤其是收購(gòu)Arm之后發(fā)布的首款CPU,更吸引了廣泛的關(guān)注。
在筆者看來(lái),這顆芯片的發(fā)布,又一次吹響了英偉達(dá)向英特爾盤(pán)踞的數(shù)據(jù)中心市場(chǎng)進(jìn)攻的號(hào)角。
為什么數(shù)據(jù)中心需要新的xPU?
熟悉數(shù)據(jù)中心構(gòu)造的讀者應(yīng)該知道,傳統(tǒng)的數(shù)據(jù)中心必不可少的一個(gè)芯片那就是英特爾X86架構(gòu)的CPU。然而伴隨著AI的流行,這種傳統(tǒng)的架構(gòu)就不再滿足了新興應(yīng)用的需求,這就給有用并行計(jì)算先天優(yōu)勢(shì)的英偉達(dá)帶來(lái)了機(jī)會(huì),這也是他們過(guò)去幾年在數(shù)據(jù)中心如魚(yú)得水的原因。
但按照黃仁勛的說(shuō)法,隨著數(shù)據(jù)中心訓(xùn)練模型的變大,加上對(duì)芯片處理能力需求的提升,這就給數(shù)據(jù)中心的CPU的數(shù)據(jù)“搬運(yùn)”和網(wǎng)絡(luò)相關(guān)處理帶來(lái)了新的挑戰(zhàn)。換而言之,就是當(dāng)前數(shù)據(jù)中心使用的X86 CPU很難兼顧數(shù)據(jù)在CPU和GPU之間流動(dòng)和網(wǎng)絡(luò)處理的需求,為此這就給DPU和英偉達(dá)自研的Arm架構(gòu)CPU帶來(lái)了機(jī)會(huì)。這也是英偉達(dá)收購(gòu)Mellanox和Arm的原因。
所謂DPU,也就是Data Processing Unit(數(shù)據(jù)處理器)。在英偉達(dá)的產(chǎn)品線布局中,這是一款把ARM處理器核、VLIW矢量計(jì)算引擎和智能網(wǎng)卡的功能集成在了一起的產(chǎn)品,主要應(yīng)用在分布式存儲(chǔ)、網(wǎng)絡(luò)計(jì)算和網(wǎng)絡(luò)安全領(lǐng)域。根據(jù)相關(guān)資料顯示,這款產(chǎn)品是他們基于公司之前收購(gòu)的Mellanox內(nèi)部孵化而成的。
據(jù)介紹,DPU可從CPU上卸載關(guān)鍵的網(wǎng)絡(luò)、存儲(chǔ)和安全任務(wù),使企業(yè)能夠?qū)⑵銲T基礎(chǔ)設(shè)施轉(zhuǎn)變?yōu)樽钕冗M(jìn)的數(shù)據(jù)中心。此類(lèi)數(shù)據(jù)中心可實(shí)現(xiàn)加速、具有完全可編程性,并具有 “零信任”安全功能,防止數(shù)據(jù)泄露和網(wǎng)絡(luò)攻擊。這就減輕了CPU的負(fù)載,讓其只專(zhuān)注于亟需處理的各種企業(yè)應(yīng)用程序。
來(lái)到CPU方面,正如前文所說(shuō),數(shù)據(jù)中心目前幾乎都是X86架構(gòu)的至強(qiáng)處理器的市場(chǎng)。然而黃仁勛指出,正是因?yàn)檫@樣的配置,影響了整個(gè)數(shù)據(jù)中心的數(shù)據(jù)傳輸?!艾F(xiàn)在CPU的存儲(chǔ)和PCIE帶寬,嚴(yán)重影響了GPU能力的釋放”,黃仁勛強(qiáng)調(diào),為此他推出了全新的基于Arm架構(gòu)打造的CPU Grace,希望借助這個(gè)新處理器以及自有的NVlink來(lái)解決這個(gè)數(shù)據(jù)瓶頸問(wèn)題。
英偉達(dá)xPU的強(qiáng)勢(shì)出擊
在上述思路的驅(qū)動(dòng)下,英偉達(dá)推出了全新的DPU Bluefield-3 和新款CPU Grace。
首先看DPU方面,據(jù)介紹,BlueField-3將具有16個(gè)Arm A78內(nèi)核,能提供十倍于BlueField 2的計(jì)算能力,在帶寬方便則可以達(dá)到400Gbit / s,同時(shí)也加上了對(duì)PCIe gen 5的支持,獲得了比PCIe gen 3快四倍的速度。在這個(gè)芯片中,Nvidia還加入了兩個(gè)加速器,為軟件定義存儲(chǔ)、網(wǎng)絡(luò)、安全、流和TLS / IPSEC加密等應(yīng)用提供支持。此外和BlueField-2一樣BLUEFIELD-3能給5G電信和時(shí)間同步數(shù)據(jù)中心的精確定時(shí)。數(shù)據(jù)顯示BlueField-3的額定值為350 SPECINT和1.5 TOPS(TeraOps)。
黃仁勛進(jìn)一步指出,一個(gè)Bluefield-3 DPU約等于300個(gè)x86 cpu內(nèi)核,因此它能夠大大減輕CPU的負(fù)載。BlueField-3同時(shí)還可以充當(dāng)Nvidia的Morpheus云原生網(wǎng)絡(luò)安全框架的監(jiān)視或遙測(cè)代理。據(jù)介紹,公司將于2024年推出性能更強(qiáng)的Bluefield-3 ,進(jìn)一步加強(qiáng)公司在這個(gè)市場(chǎng)的影響力。
以美國(guó)海軍少將、計(jì)算機(jī)編程先驅(qū)Grace Hopper的名字命名的CPU,則開(kāi)啟了英偉達(dá)數(shù)據(jù)中心的新時(shí)代。據(jù)黃仁勛介紹,這個(gè)處理器能夠與常規(guī)GPU產(chǎn)品一起工作,讓公司能夠獲得更全面地垂直集成其硬件堆棧的能力。按照NVIDIA的說(shuō)法,該芯片是專(zhuān)門(mén)為大規(guī)模神經(jīng)網(wǎng)絡(luò)工作負(fù)載設(shè)計(jì)的,預(yù)計(jì)將于2023年在NVIDIA產(chǎn)品中使用。
按照anandtech介紹,Grace的發(fā)布旨在填補(bǔ)NVIDIA AI服務(wù)器產(chǎn)品線中CPU的空白。該公司的GPU非常適合某些類(lèi)的深度學(xué)習(xí)工作負(fù)載,但GPU并不能執(zhí)行數(shù)據(jù)中心里的所有操作,這就是CPU存在的意義,為此NVIDIA當(dāng)前的服務(wù)器產(chǎn)品通常依賴于AMD的EPYC處理器和Intel至強(qiáng)這樣的處理器,
但正如前文所說(shuō),這些處理器對(duì)于一般的計(jì)算而言是非???,但不能滿足NVIDIA所追求的那種高速I(mǎi) / O和深度學(xué)習(xí)優(yōu)化。特別在NVIDIA目前使用PCI Express來(lái)進(jìn)行CPU和GPU連接時(shí),這種連接方式就成為瓶頸。如果引入NVLink,那么系統(tǒng)中的GPU彼此之間就可以直接快速對(duì)話,而不需返回主機(jī)CPU或系統(tǒng)RAM。
“基于Grace的系統(tǒng)與NVIDIA GPU緊密結(jié)合后,性能將比目前基于X86 CPU的,最先進(jìn)的 NVIDIA DG高出十倍”,黃仁勛表示?!敖^大多數(shù)的數(shù)據(jù)中心仍將繼續(xù)使用現(xiàn)有的CPU,而Grace將主要用于計(jì)算領(lǐng)域的細(xì)分市場(chǎng)”,黃仁勛進(jìn)一步指出。
從anandtech的介紹我們可以看到,在之前,NVIDIA為了在數(shù)據(jù)中心使用NVLink,選擇了POWER9處理器作為合作伙伴,但Grace的發(fā)布,從某種程度上宣布了這種合作的終結(jié)。
寫(xiě)在最后
其實(shí)在這次發(fā)布會(huì)上,NVIDIA還發(fā)布了他們新一代的AI自動(dòng)駕駛汽車(chē)處理器NVDIA DRIVE Atlan,它能夠提供約為上代產(chǎn)品Orin四倍的速度。作為一款集成了DPU、下一代架構(gòu)GPU、新型Arm 內(nèi)核和最新深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)加速器的SoC,NVDIA DRIVE Atlan能夠獲得高達(dá)1000TOPS的速度,以及能提供極高的帶寬,為未來(lái)的自動(dòng)駕駛設(shè)計(jì)賦能。
除了芯片以外,NVIDIA還帶來(lái)了各種軟硬件的更新,例如用于仿真、協(xié)作、和自助機(jī)器訓(xùn)練的NVIDIA Omniverse,專(zhuān)為工作組打造的便攜式AI數(shù)據(jù)中心NVIDIA DGX Station,面向企業(yè)級(jí)的NVDIA EGX,用于訓(xùn)練Transformer框架的NVIDIA Megatron,用于計(jì)算藥物研發(fā)加速庫(kù)Clara Discovery的一些模型,能夠?yàn)榱孔与娐纺M器提供加速的cuQuantum,數(shù)據(jù)中心安全平臺(tái)NVIDIA Morpheus,先進(jìn)的深度學(xué)習(xí)對(duì)話式AI Jarvis和推理服務(wù)器Triton等一系列產(chǎn)品。此外,英偉達(dá)還宣布了和Ampere computing和Amazon等一系列Arm服務(wù)器芯片廠商的合作,共同推動(dòng)Arm生態(tài)的發(fā)展。
黃仁勛表示,憑借公司現(xiàn)有的芯片、軟件、AI和各種產(chǎn)品,英偉達(dá)能助力開(kāi)發(fā)者成就畢生的事業(yè)。尤其是在芯片方面,黃仁勛強(qiáng)調(diào),公司數(shù)據(jù)中心路線圖包括CPU、GPU和DPU這三類(lèi)芯片,而Grace和BlueField是其中必不可少的關(guān)鍵組成部分。每個(gè)芯片架構(gòu)歷經(jīng)兩年的打磨周期(周期內(nèi)可能出現(xiàn)轉(zhuǎn)變),一年專(zhuān)注于 x86 平臺(tái),另一年專(zhuān)注于 Arm 平臺(tái)。
“我們每年都會(huì)發(fā)布激動(dòng)人心的新品。三類(lèi)芯片,逐年飛躍,一個(gè)架構(gòu)?!秉S仁勛補(bǔ)充說(shuō)。