原文作者: 周凱揚(yáng)
本文來(lái)源:電子發(fā)燒友網(wǎng)
原文鏈接:https://mp.weixin.qq.com/s/TjP1Q_bhpBVxGISQgimpsw
隨著近日英偉達(dá)公布2024財(cái)年第一季度的財(cái)報(bào),超過(guò)預(yù)期的成績(jī)?cè)俣茸尨蠹艺J(rèn)識(shí)到了服務(wù)器市場(chǎng)激增的需求。英偉達(dá)憑借其GPU在服務(wù)器領(lǐng)域的主導(dǎo)地位,交出了一份令人滿意的答卷。可在服務(wù)器CPU領(lǐng)域,卻又是另一片光景,英偉達(dá)從過(guò)去的觀戰(zhàn)方變成了如今的參戰(zhàn)方,也陷入了三大架構(gòu)混戰(zhàn)的戰(zhàn)局中去。
x86的你來(lái)我往
由于x86賽道的玩家相當(dāng)有限,且兩家廠商都不愿意放棄這塊蛋糕,所以呈現(xiàn)了一種互相拉扯的局面。盡管英特爾占據(jù)主導(dǎo)地位多年,但這幾年來(lái)AMD已經(jīng)有了迎頭趕上的趨勢(shì),憑借EPYC系列處理器蠶食了英特爾不少份額。
從Mercury Research的統(tǒng)計(jì)數(shù)據(jù)來(lái)看,在服務(wù)器的x86 CPU市場(chǎng),AMD的份額從年初的10.7%增長(zhǎng)至17.6%,而英特爾則從89.3%降低至82.4%。雖然兩者差距依然巨大,但多虧了AMD持續(xù)的戰(zhàn)略投入和穩(wěn)扎穩(wěn)打,AMD有望在今年將這一份額進(jìn)一步提升至20%。
且得益于EPYC處理器上集成的AMD Infinity Guard技術(shù),AMD的處理器在不少CSP那相當(dāng)吃香,包括微軟Azure、谷歌云和Oracle Cloud都將其視為機(jī)密計(jì)算首選方案。加上AMD在AI軟件支持上也取得了長(zhǎng)足的進(jìn)步,包括支持PyTorch 2.0為ROCm軟件提供原生支持,以及TensorFlow 2.12版本開始提供TensorFlow-ZenDNN擴(kuò)展,進(jìn)一步加強(qiáng)EPYC CPU在神經(jīng)網(wǎng)絡(luò)推理上的靈活性。
這有一部分原因則是英特爾在備受期待的Sapphire Rapids上頻繁踩坑,雖說(shuō)今年3月,該處理器已經(jīng)正式開始交付,但可以說(shuō)選了個(gè)最差的時(shí)機(jī)。英特爾表示Sapphire Rapids獲得了400多個(gè)設(shè)計(jì)勝利,可從市場(chǎng)現(xiàn)狀來(lái)看,今年不少CSP都選擇在服務(wù)器CPU上砍單,據(jù)有關(guān)人士透露,微軟在下半年砍掉了50%到70%的Sapphire Rapids訂單。
更不用說(shuō)如今第五代Xeon處理器Emerald Rapids已經(jīng)開始送樣,且計(jì)劃今年第四季度開始交付,意味著Sapphire Rapids在出貨兩個(gè)季度后就要與下一代產(chǎn)品同臺(tái)競(jìng)爭(zhēng)??梢钥闯?,英特爾加快了設(shè)計(jì)步伐,試圖扭轉(zhuǎn)頹勢(shì),所以這一你來(lái)我往的局面應(yīng)該還會(huì)持續(xù)下去??尚枰⒁獾氖?,在整個(gè)服務(wù)器CPU市場(chǎng)中,奪去英特爾市場(chǎng)份額可不僅僅是AMD,還有其他虎視眈眈的非x86架構(gòu),比如Arm。
群雄逐鹿的Arm
曾幾何時(shí)的Arm架構(gòu)想要在服務(wù)器上發(fā)力,卻始終沒(méi)能撼動(dòng)x86分毫,以至于彼時(shí)的高通都決定放棄Arm服務(wù)器市場(chǎng),華芯通的昇龍4800也成了“絕唱”,可這其實(shí)完全可以歸結(jié)為時(shí)運(yùn)不濟(jì)。隨著Arm Neoverse推出后,Arm很快就打了個(gè)漂亮的翻身仗。
隨即面世的Ampere Altra和Graviton2都是基于Neoverse N1打造的,并迅速在市場(chǎng)找到了定位,也終于開始普及商用。之后的Neoverse V1和Neoverse N2更是開啟了大廠角逐之爭(zhēng),英偉達(dá)、Marvell、平頭哥等紛紛入局,為Arm的服務(wù)器生態(tài)添磚加瓦。
由于服務(wù)器處理器不像MCU那樣,基于Arm Neoverse架構(gòu)設(shè)計(jì)需要巨大的人力與財(cái)力支撐,所以目前Arm的服務(wù)器芯片基本是大廠之間的廝殺。在公版核心架構(gòu)相同的情況下,這些Arm服務(wù)器芯片紛紛用上了最先進(jìn)的制造工藝,所以更加考驗(yàn)廠商們的芯片設(shè)計(jì)能力,但Chiplet等技術(shù)的出現(xiàn),其實(shí)也給到了這些廠商快速迭代產(chǎn)品搶占更多市場(chǎng)份額的機(jī)會(huì)。
比如英偉達(dá)選擇了利用其NVLink技術(shù)來(lái)拼接成144個(gè)Neoverse V2核心的Grace Superchip,而Ampere Computing選擇了自研Arm核心推出了192核心的Ampere One處理器。AWS在持續(xù)基于公版Neoverse核心打磨其Graviton系列處理器的同時(shí),也在利用Arm標(biāo)準(zhǔn)核心為其Nitro控制器打造完整的DPU生態(tài)。
在服務(wù)器軟件生態(tài)上,Arm也已經(jīng)開始發(fā)力,無(wú)論是DevOps、虛擬化都已經(jīng)對(duì)Arm架構(gòu)提供了完整的支持。加之此前的日本富岳超算A64FX處理器和不久前公開的印度Aum處理器,Arm在HPC應(yīng)用上的軟件支持也在逐步到位。
進(jìn)展飛速的RISC-V
上文中,我們提到Chiplet等設(shè)計(jì)技術(shù)為Arm服務(wù)器CPU快速迭代提供了便利,可這一通用技術(shù)也為新秀RISC-V提供了縮短TTM的機(jī)會(huì),比如Ventana Micro Systems的Ventana V1。Ventana表示Veyron V1的單槽SPECint2017跑分已經(jīng)高出了Xeon Ice Lake 8380、EPYC Milan 7763、AWS Graviton3等競(jìng)品,但在服務(wù)器CPU領(lǐng)域這類跑分的說(shuō)服力并不強(qiáng),CSP廠商看重的還有擴(kuò)展性、軟件生態(tài)適配程度,而這些恰恰是RISC-V服務(wù)器CPU欠缺的。
除此之外,今年已經(jīng)有了RISC-V服務(wù)器CPU露面,為RISC-V在服務(wù)器領(lǐng)域的沖鋒打頭陣,比如算能的算豐SG2042。SG2042基于64個(gè)高性能RISC-V核心設(shè)計(jì),主頻高達(dá)2GHz,且支持雙路CPU互利。最重要的是,SG2042既是首個(gè)服務(wù)器級(jí)別的RISC-V CPU,也是目前唯一已經(jīng)提供板卡和開發(fā)套件方案的RISC-V服務(wù)器CPU。
同樣不可否認(rèn)的是,在系統(tǒng)及軟件的支持上,RISC-V服務(wù)器進(jìn)展飛速,比如在開源社區(qū)的助力下,Deepin、開源歐拉都已經(jīng)陸續(xù)宣布成功適配SG2042服務(wù)器板卡??蛇@并不代表目前的RISC-V服務(wù)器CPU處于開箱即用的狀態(tài),如今這些系統(tǒng)的桌面環(huán)境上僅僅支持一些文檔辦公、影音娛樂(lè)應(yīng)用,還有大量服務(wù)器軟件與庫(kù)的適配和移植工作需要完成,諸如虛擬化等。
RISC-V潛力巨大,但要想追平x86甚至是Arm如今的進(jìn)度,還有不小的差距。但這也就是開源社區(qū)的優(yōu)勢(shì)和魅力了,Arm花了十?dāng)?shù)年才達(dá)到如此里程,RISC-V或許只需要不到一半的時(shí)間。
戰(zhàn)況展望
從創(chuàng)新性、成本乃至性能等角度來(lái)看,其實(shí)Arm以及未來(lái)的RISC-V都會(huì)是極具競(jìng)爭(zhēng)力的服務(wù)器CPU架構(gòu),可現(xiàn)今的服務(wù)器仍是一個(gè)固執(zhí)且切入周期較長(zhǎng)的市場(chǎng),x86目前尚未觸及設(shè)計(jì)和工藝的瓶頸,即便有了AI加速器、DPU等組件的加入,服務(wù)器架構(gòu)并沒(méi)有發(fā)生劇變,所以x86在未來(lái)的十年內(nèi)依然將占據(jù)主導(dǎo)地位。
只不過(guò)隨著設(shè)計(jì)方法、制造工藝的同步,Arm已經(jīng)在該領(lǐng)域開啟了較為成熟的商業(yè)化進(jìn)程,隨著時(shí)間的推移,市場(chǎng)份額會(huì)逐漸升高。至于RISC-V,目前服務(wù)器生態(tài)尚不成熟,很難獲得大型CSP的青睞,要知道CSP即便選擇自研芯片也會(huì)給到客戶更多選擇,但RISC-V目前還沒(méi)有打入任何一家的跡象。
這也是RISC-V在其他高性能計(jì)算領(lǐng)域的最大弱勢(shì),落地應(yīng)用的欠缺使得其很難作為完善的商業(yè)方案推廣。所以服務(wù)器CPU的戰(zhàn)局依然激烈,任何一方這時(shí)候開始卸力都會(huì)像英特爾一樣,轉(zhuǎn)瞬之間就被吞掉大量市場(chǎng)份額。