近日,Nvidia召開了秋季GTC并發(fā)布了一系列新的芯片和硬件。從GTC發(fā)布的產(chǎn)品來看,我們認(rèn)為Nvidia最近一系列的動作都是在加強(qiáng)數(shù)據(jù)中心服務(wù)器市場的布局。雖然Nvidia占據(jù)了人工智能加數(shù)據(jù)中心的風(fēng)口,但是我們?nèi)匀徽J(rèn)為Nvidia在打入數(shù)據(jù)中心的道路上有不少挑戰(zhàn)需要克服。
Nvidia在數(shù)據(jù)中心的新產(chǎn)品:DPU
在GTC上,Nvidia著重介紹的一個產(chǎn)品是它在數(shù)據(jù)中心網(wǎng)絡(luò)領(lǐng)域的新產(chǎn)品:Data Processing Unit(數(shù)據(jù)處理器,DPU)。DPU把ARM處理器核、VLIW矢量計算引擎和智能網(wǎng)卡的功能集成在了一起,主要應(yīng)用在分布式存儲、網(wǎng)絡(luò)計算和網(wǎng)絡(luò)安全領(lǐng)域。
在數(shù)據(jù)中心的分布式計算中,存儲和網(wǎng)絡(luò)都需要大量的處理器資源。對于存儲,在數(shù)據(jù)中心中大量存儲是分布式的,每個服務(wù)器可以訪問的存儲空間遠(yuǎn)遠(yuǎn)不僅限于本地的硬盤,這一方面大大增加了分布式存儲的靈活性,但是另一方面這類分布式數(shù)據(jù)存儲系統(tǒng)的訪問會需要額外的軟件處理來完成,而傳統(tǒng)上這類分布式存儲的軟件處理會使用CPU來完成。
除了分布式存儲之外,數(shù)據(jù)中心服務(wù)器之間的網(wǎng)絡(luò)互聯(lián)也有一套底層軟件系統(tǒng),這套軟件需要能完成網(wǎng)絡(luò)互聯(lián)協(xié)議,除此之外還需要能跑一套數(shù)據(jù)中心必備的網(wǎng)絡(luò)安全系統(tǒng)。傳統(tǒng)上,這些處理也會跑在CPU上,而隨著智能網(wǎng)卡(SmartNIC)的逐漸普及,智能網(wǎng)卡正在網(wǎng)絡(luò)安全和網(wǎng)絡(luò)協(xié)議處理方面緩慢地取代CPU。
Nvidia的DPU事實上可以看做是SmartNIC的增強(qiáng)版本,一方面加強(qiáng)了SmartNIC對于網(wǎng)絡(luò)協(xié)議和網(wǎng)絡(luò)安全的處理能力,另一方面整合并加強(qiáng)了分布式存儲的處理能力,從而讓DPU能在這兩個領(lǐng)域更多地替代CPU。
事實上,Nvidia這次著重介紹的DPU是由它于近年收購的Mellanox內(nèi)部孵化的。該產(chǎn)品最初的定位就是增強(qiáng)型智能網(wǎng)卡,其第一代產(chǎn)品BlueShield 1已經(jīng)于去年發(fā)布了,只是由于是試水產(chǎn)品因此比較低調(diào)。Nvidia內(nèi)部應(yīng)該是看到了數(shù)據(jù)中心中網(wǎng)絡(luò)和存儲相關(guān)處理的機(jī)會,因此給第二代BlueShield項目傾注了更多資源,同時也提出了DPU的概念。Nvidia這樣的操作有點(diǎn)像20多年前由它提出的GPU——在Nvidia提出GPU之前,大多數(shù)公司對于同類產(chǎn)品的概念一直是顯示加速卡,而Nvidia認(rèn)為顯示卡不僅僅是一種附屬于CPU的顯示加速,而且在計算機(jī)系統(tǒng)中能擔(dān)負(fù)起和CPU接近甚至更重要任務(wù),因此提出了GPU的概念。這次Nvidia提出DPU這個新概念,可以看出Nvidia對于網(wǎng)絡(luò)數(shù)據(jù)處理領(lǐng)域的重視。而在未來,Nvidia計劃繼續(xù)推進(jìn)BlueShield DPU產(chǎn)品線,一方面增強(qiáng)其網(wǎng)絡(luò)互連處理能力,另一方面還計劃加強(qiáng)其AI處理能力,從另一個維度增加產(chǎn)品的功能性。
DPU+ARM是Nvidia替代中低端x86的切入點(diǎn)
自從Nvidia開始收購ARM之后,我們看到Nvidia已經(jīng)在多個場合顯示了其利用ARM處理器進(jìn)一步占領(lǐng)數(shù)據(jù)中心服務(wù)器市場的決心,而DPU則是Nvidia最新的一個布局。
回顧Nvidia在數(shù)據(jù)中心市場的策略,最初Nvidia的立足點(diǎn)在于其在人工智能領(lǐng)域無與倫比的優(yōu)勢,其GPU配合CUDA生態(tài)成功地抓住了數(shù)據(jù)中心最大的增量市場,即人工智能計算。
而在此之后,Nvidia顯然已經(jīng)不滿足于抓住增量市場,更希望能切入數(shù)據(jù)中心的存量市場,即設(shè)法用自己的芯片產(chǎn)品去取代Intel(以及AMD)主導(dǎo)的x86 CPU。目前,唯一能與x86 CPU性能和生態(tài)屬于同一數(shù)量級的唯有ARM,而這也是Nvidia決定收購ARM的重要原因。一旦Nvidia正式完成收購ARM,那么集成了ARM核的DPU將成為Nvidia打入數(shù)據(jù)中心存量市場取代x86 CPU的第一個切入點(diǎn)。如前所述,傳統(tǒng)上會使用低端x86處理器來完成數(shù)據(jù)中心中網(wǎng)絡(luò)協(xié)議處理、網(wǎng)絡(luò)安全和存儲控制等任務(wù),而使用DPU之后,就不再需要再使用CPU來處理這些任務(wù)了。從另一個角度來看,事實上就是Nvidia的DPU在數(shù)據(jù)中心的網(wǎng)絡(luò)協(xié)議處理、網(wǎng)絡(luò)安全和存儲控制市場取代了低端x86 CPU。
事實上,Nvidia選擇使用DPU來打這個市場,而不是推出ARM核直接和低端x86 CPU競爭是一個明智之舉。首先,智能網(wǎng)卡和智能存儲領(lǐng)域CPU逐漸被取代是大勢所趨,Nvidia在這個領(lǐng)域同時也有Mellanox的技術(shù)積累,可以說是順勢而為。此外,DPU在網(wǎng)絡(luò)和存儲領(lǐng)域從概念上來說是CPU的下一代產(chǎn)品,所以說雖然DPU中的ARM核性能未必比同一代對標(biāo)的低端x86 CPU更強(qiáng),但是整體來說由于在DPU SoC上集成了專用的處理加速模塊,因此總體性能一定是超過x86 CPU的。因此,Nvidia雖然第一步想要取代的是低端x86 CPU,但是其推出的對標(biāo)產(chǎn)品并不低端,這從市場定位上來說也很討巧。
Nvidia在中高端數(shù)據(jù)中心處理器市場仍然面臨挑戰(zhàn)
DPU為Nvidia替代低端x86 CPU打開了道路,但是在中高端數(shù)據(jù)中心處理器市場,Nvidia如何把握市場仍然是一個未知數(shù),也面臨不少挑戰(zhàn)。
首先,在中高端市場,目前Nvidia的GPU和x86處理器是標(biāo)準(zhǔn)配置,或者說Nvidia的產(chǎn)品和x86處理器仍然處于互補(bǔ)的關(guān)系。如果想要完全吃下高端市場,即使用Nvidia的GPU加Nvidia基于ARM架構(gòu)的處理器做高端服務(wù)器,目前來看還需要在ARM處理器的性能上更進(jìn)一步。我們知道,ARM基于RISC的架構(gòu)能占領(lǐng)移動市場主要是依靠能效比,而在服務(wù)器市場,尤其是高端服務(wù)器市場,能效比的重要程度較弱,主要還是需要看性能。從技術(shù)上來說,Intel和AMD在高性能服務(wù)器處理器領(lǐng)域一直是領(lǐng)導(dǎo)者,也有數(shù)十年的經(jīng)驗積累,而ARM架構(gòu)做高性能處理器的時間并不久,而直到今天基于ARM架構(gòu)尚沒有公開發(fā)售且成功的服務(wù)器端高性能處理器。當(dāng)然,隨著未來人工智能重要性提升,或許在一些應(yīng)用場景GPU比起CPU來說要更重要,Nvidia因此可以推出圍繞人工智能的GPU+ARM處理器中高端服務(wù)器產(chǎn)品,但是這樣的搭配能實現(xiàn)多高的性能尚不清楚,而且很明顯如果ARM處理器的性能相比x86越弱,那么這樣組合的服務(wù)器的使用場景就越狹窄。
除此之外,Nvidia在中高端數(shù)據(jù)中心處理器可能遇到的另一個挑戰(zhàn)是客戶自研芯片。亞馬遜為AWS已經(jīng)發(fā)布了基于ARM核的自研處理器Graviton。云提供商對于自身的需求最清楚,因此自研芯片非常合乎情理,而且有機(jī)會能為自身的云服務(wù)提供差異化競爭的能力。如果谷歌等其它云服務(wù)商也跟進(jìn)使用ARM架構(gòu)自研芯片,那么這些云廠商就會成為Nvidia的客戶同時也是競爭對手。Nvidia如何在客戶自研芯片和x86之間找到一個中高端服務(wù)器處理器的切入點(diǎn),我們還需拭目以待。