基于 Arm 的服務(wù)器的歷史有些曲折,他們曾多次嘗試挑戰(zhàn) X86 處理器霸權(quán),但該公司現(xiàn)在似乎看好其在高性能計(jì)算 (HPC) 領(lǐng)域的機(jī)會(huì),它相信其許可模式、功耗及其架構(gòu)的效率使其具有優(yōu)勢。
Arm 的 HPC 業(yè)務(wù)高級(jí)主管 Brent Gorda 在戴爾主辦的 HPC 社區(qū)活動(dòng)上發(fā)表演講說,該公司“在 HPC 社區(qū)中確實(shí)在努力推動(dòng)”,并強(qiáng)調(diào)了其與 Nvidia、Silicon Pearl 和 Fujitsu 等公司的合作伙伴關(guān)系開發(fā)基于 Arm 的芯片來驅(qū)動(dòng) HPC 和 AI 應(yīng)用程序。
事實(shí)上,Gorda 指出,Arm 已經(jīng)在 HPC 行業(yè)占據(jù)了一席之地,在日本 RIKEN 實(shí)驗(yàn)室的“Fugaku”超級(jí)計(jì)算機(jī) 以 152,064 個(gè) 48 核排名世界第一的富士通A64FX 處理器就是基于Arm架構(gòu)打造的。
然而,富士通走的是從 Arm 獲得架構(gòu)許可的道路,這意味著它能夠設(shè)計(jì)和制造自己的定制 Arm 兼容處理器,幾乎可以滿足自己的要求。這意味著增加了 512 位可擴(kuò)展矢量引擎單元來支持富士通所考慮的那種計(jì)算,以及它自己的 Tofu D 高速互連。
但是很少有 HPC 站點(diǎn)可以從頭開始設(shè)計(jì)自己的芯片。幸運(yùn)的是,Arm 的商業(yè)模式還允許合作伙伴采用現(xiàn)成的核心設(shè)計(jì)并為其添加自定義模塊,Gorda 解釋說。
“有一種叫做核心許可的東西,你可以通過它許可 Arm Neoverse,這是我們的 IP。這為您提供了核心構(gòu)建塊,即邏輯本身,您可以圍繞它定制和構(gòu)建您想要構(gòu)建的芯片,”他說。
圍繞這一切的是 Arm ServerReady 合規(guī)計(jì)劃,該計(jì)劃證明特定芯片符合 Arm 服務(wù)器生態(tài)系統(tǒng)的兼容性要求。
“一旦你通過了這個(gè)認(rèn)證,你就可以使用軟件世界了。它保證了軟件的功能,然后您可以為受支持的操作系統(tǒng)版本(如紅帽)付費(fèi)?!?/p>
Gorda 聲稱,這種為特定應(yīng)用程序或一組應(yīng)用程序定制芯片的能力是 Arm 的優(yōu)勢所在,尤其是在 HPC 和 AI 似乎正在發(fā)展的領(lǐng)域??蛻艨梢允褂?Arm 核心引擎和片上網(wǎng)絡(luò),并為其目標(biāo)工作負(fù)載添加自定義加速器。
“來自 Nvidia 的 Bill Dally 會(huì)說,通過在硅芯片上放置自定義門,您可以獲得三個(gè)數(shù)量級(jí)的性能提升。這正是 Arm 的發(fā)展方向,”他說?!懊總€(gè)人都有關(guān)于加速器的想法。如果你足夠了解你的工作量,你可以優(yōu)化它并獲得瘋狂的良好性能。事實(shí)上,這就是 A64FX 如此出色的原因。他們花了十年時(shí)間,研究了他們擁有的十到十二個(gè)應(yīng)用程序,并且成功了。處理器問世了,它完全將日本人想要的應(yīng)用程序安裝在他們的系統(tǒng)上?!?/p>
Arm 早在 2018 年就推出了 Neoverse,目標(biāo)是數(shù)據(jù)中心基礎(chǔ)設(shè)施,而不是移動(dòng)設(shè)備市場。Neoverse設(shè)計(jì)于去年進(jìn)行了擴(kuò)展,現(xiàn)在包括三個(gè)處理器設(shè)計(jì)系列:強(qiáng)調(diào)性能的 V 系列;專注于云基礎(chǔ)設(shè)施等橫向擴(kuò)展應(yīng)用N系列;還有針對(duì)邊緣應(yīng)用的E系列。
Gorda 透露,參與歐洲處理器倡議 (EPI) 項(xiàng)目的公司Silicon Pearl正在使用 Neoverse V1 設(shè)計(jì)。同時(shí),N1 設(shè)計(jì)已用于英特爾前高管 Renée James 創(chuàng)立的初創(chuàng)公司 Ampere Computing的“Quicksilver”和“Mystique”Altra 服務(wù)器芯片。為某些 AWS EC2 實(shí)例提供支持的 Amazon Graviton2 芯片使用 N1 核心,而Graviton3 使用 V1 核心。Neoverse V 系列內(nèi)核顯然還包含在 Nvidia 計(jì)劃中的旨在超級(jí)計(jì)算的“Grace”芯片 中,以及正在由韓國電子和電信研究所 (ETRI) 開發(fā)的服務(wù)器芯片中。
阻礙 Arm 在服務(wù)器市場的問題之一是軟件支持,許多關(guān)鍵軟件包都是為 X86 處理器平臺(tái)開發(fā)的。當(dāng)被問及是否所有部件現(xiàn)在都可以在 Arm 上部署 HPC 時(shí),Gorda 說,總的來說,答案是肯定的。
“你會(huì)發(fā)現(xiàn)一些地方還是有弱點(diǎn),雖然我相信說所有 ISV 都在開發(fā) Arm 端口是準(zhǔn)確的,但并非所有 ISV 都公開支持 Arm in Silicon。因此,如果您依賴 ISV 許可證和軟件,您將不得不輪詢您的 ISV 以了解事物的狀態(tài),”他解釋道。
然而,Gorda 引用了 Lustre 并行文件系統(tǒng)的示例,該系統(tǒng)廣泛用于 HPC 環(huán)境。多年來,Arm 一直為 Lustre 客戶端提供支持,但“基于 Arm 的存儲(chǔ)服務(wù)器非常少,”Gorda 說,因此用于 Arm 的 Lustre 服務(wù)器組件目前不受 Whamcloud 的支持,Whamcloud 是 DDN 內(nèi)監(jiān)督 Lustre 的部門發(fā)展。他補(bǔ)充說,這是 Arm 試圖解決的問題。
Gorda 還指出,大約五年前,Arm 收購了 HPC 軟件工具的領(lǐng)先供應(yīng)商 Allinea Software,以加強(qiáng) Arm 的 HPC 軟件生態(tài)系統(tǒng)支持。
Gorda 表示,另一個(gè)對(duì) Arm 有利的因素是更高的能效。隨著超級(jí)計(jì)算機(jī)擴(kuò)展到 Exascale 領(lǐng)域并且持續(xù)的能源成本成為 HPC 運(yùn)營商更加關(guān)注的問題,這可能變得更加重要。Gorda 表示,盡管 Arm 的 Neoverse V 架構(gòu)強(qiáng)調(diào)性能而不是功率效率,但基于它的芯片仍然比競爭對(duì)手的 X86 處理器消耗更少的能量。
“X86 的保證是您可以在其上運(yùn)行 286 二進(jìn)制文件,而作為具有 RISC 底層的 CISC 架構(gòu)的所有歷史遺產(chǎn)都需要在解碼重新排序、修復(fù)指令等方面預(yù)先進(jìn)行大量邏輯這是進(jìn)入芯片并消耗能量的開銷,”他說。相比之下,在某種程度上,您可以將 Arm 視為一張白紙。
Gorda 還聲稱,最終用戶不再關(guān)心他們的軟件運(yùn)行在什么芯片上,理由是 AWS 等公司采用了 Arm 驅(qū)動(dòng)的云服務(wù)器。
“市場有新的大玩家來控制架構(gòu)。他們關(guān)心的事情與歷史上一直關(guān)心的事情不同。他們關(guān)心成本,他們關(guān)心能源消耗,他們關(guān)心周轉(zhuǎn)時(shí)間,以及在事物之上運(yùn)行的軟件堆棧,”他說。
“如果你看看亞馬遜在 Graviton2 上做了什么,他們說它便宜了 40%。從最終用戶的角度來看,他們并不關(guān)心芯片是什么,他們關(guān)心的是它便宜 40%,而且周轉(zhuǎn)時(shí)間與他們習(xí)慣的時(shí)間相當(dāng)?!?/p>
HPC 分析公司 Hyperion Research的首席執(zhí)行官 Earl Joseph表示,他預(yù)計(jì)未來幾年基于 Arm 處理器的 HPC 服務(wù)器將出現(xiàn)高速增長。
“我們預(yù)計(jì)五年增長率將超過 31%,而基礎(chǔ)市場的增長率約為 7% 至 8%,”Joseph說。他補(bǔ)充說,這相當(dāng)于到 2025 年基于 Arm 的系統(tǒng)將占 HPC 市場的 10% 左右。
然而,Joseph也警告說,收入數(shù)字可能會(huì)產(chǎn)生誤導(dǎo),因?yàn)榇笮统?jí)計(jì)算機(jī)項(xiàng)目可能會(huì)扭曲數(shù)字,就像 2020 年接近 10 億美元的富岳系統(tǒng)所做的那樣。
因此,由于如此龐大的個(gè)人安裝,市場可能會(huì)發(fā)生巨大變化,Hyperion Research 表示,預(yù)計(jì) 2025 年將有兩臺(tái)基于 Arm 處理器的歐洲百億億級(jí)機(jī)器。
他補(bǔ)充說,許多即將推出的 HPC 系統(tǒng)預(yù)計(jì)將混合使用 Arm 和 X86 以及其他處理器類型的處理器。