隨著更多云廠商越來越需要進行針對系統(tǒng)的專門優(yōu)化,定制化的芯片設(shè)計開始變成普遍流行,基礎(chǔ)設(shè)施芯片市場變得越來越有趣,玩家越來越多。今年以來,包括印度電子和信息技術(shù)部MeitY,法國芯片初創(chuàng)企業(yè) SiPearl,韓國電子通信研究所 ETRI,都宣布開發(fā)基于Neoverse V1的產(chǎn)品。
國內(nèi)廠商奮起直追
包括騰訊和阿里在內(nèi)的一批國內(nèi)系統(tǒng)廠商,正在加速構(gòu)建基于Arm的服務(wù)器的芯片。
騰訊專項測試技術(shù)中心總監(jiān)黃聞欣(Victor Huang)表示:“2020年,騰訊和Arm正式簽署了一份合作協(xié)議,希望通過合作加速Arm Neoverse技術(shù)的測評和適配。后面我們通過TencentBench測試框架發(fā)現(xiàn),得益于更多可擴展的CPU核心數(shù),Arm服務(wù)器比傳統(tǒng)的服務(wù)器性能表現(xiàn)更強勁。非常值得一提的是,其在AI推理和圖片處理領(lǐng)域優(yōu)勢非常明顯?!?/p>
阿里巴巴首席工程師周經(jīng)森(Kingsum Chow)提到:“Arm的CPU資源的話,在我們現(xiàn)有的軟件里會有兩個考慮的點,一個是我們有些軟件是需要重新編譯的,另外一種不需要重新編譯,只需要我們把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在這方面,一年之前,我們就跟Arm的員工一起合作,把JVM的性能提高。過去一年里,我們從JDK8到JDK11,通過OpenJDK, 通過阿里巴巴 Dragonwell(OpenJDK的一個發(fā)行版),就把我們現(xiàn)有一些Java應(yīng)用的一些性能提高了50%?!?/p>
Arm基礎(chǔ)設(shè)施事業(yè)部高級副總裁兼總經(jīng)理Chris Bergey表示:“騰訊在針對基于Arm硬件測試和軟件支持方面持續(xù)投入,他們的硬件測試在性能方面展現(xiàn)了出色的結(jié)果,在每瓦性能方面也有非凡的表現(xiàn)。在軟件的部份,他們既支持已編譯和解譯的代碼庫,也支持為這些代碼庫提供支撐的微服務(wù)框架?!?/p>
而針對阿里巴巴的合作,Bergey說道:“Java 對于阿里巴巴來說是一項至關(guān)重要的工作負載,他們的工程師已經(jīng)編寫了超過十億行的 Java 代碼。阿里巴巴和 Arm正在Java 的工作負載分析和調(diào)試方面持續(xù)合作?!?/p>
解密全新Neoverse路線圖
正因為眾多客戶已經(jīng)開始進行基于Neoverse產(chǎn)品的開發(fā),Arm開始越來越快地公布其產(chǎn)品詳細路線圖。
日前,在Arm年度技術(shù)日上,Arm詳細介紹了Arm Neoverse V1 和 Neoverse N2 平臺。以及Arm Neoverse CMN-700 mesh 互連技術(shù)。
Neoverse路線圖
CMN-700互聯(lián)技術(shù)
Bergey表示,Arm CMN-700互聯(lián)技術(shù)是構(gòu)建V1和N2的關(guān)鍵要素?;贑MN-600而打造,從內(nèi)核的數(shù)量和緩存的大小,到附加內(nèi)存和IO設(shè)備的數(shù)量和類型都鎖有所提升。支持DDR5和HBM。此外,增加了CXL功能,可為內(nèi)存擴展和智能一致性加速。另外則是增加了諸多對于多芯片的支持功能,針對傳統(tǒng)多插槽設(shè)計和新的芯片集或多芯片集成提高性能和優(yōu)化功能?!岸嘈酒蓪橥黄苽鹘y(tǒng)的硅掩模版限制提供新的機遇,并為緊密耦合的異構(gòu)計算提供更大的靈活性。”Bergey說道。
Neoverse V1:增加SVE功能
Bergey表示:“Neoverse V1 的設(shè)計理念是性能至上,因此我們加寬了微架構(gòu),并增加了緩沖區(qū)和隊列的深度,以便在運行中容納更多指令。”
與N1相比,Neoverse V1帶來了 50% 的性能提升、1.8倍的矢量工作負載優(yōu)化、以及4倍的機器學(xué)習(xí)工作負載優(yōu)化,同時,Neoverse V1也是Arm強調(diào)性能優(yōu)先的新型計算系列的第一個平臺。Neoverse N1使芯片合作伙伴能靈活地為高度依賴CPU性能和帶寬的應(yīng)用構(gòu)建計算能力,并為其提供 SoC 設(shè)計的靈活性。
秉持性能至上的思維,Neoverse V1 的設(shè)計理念創(chuàng)造了Arm迄今為止設(shè)計過的最寬微架構(gòu),以便容納更多運行中的指令,支持高性能和百萬兆級計算等市場應(yīng)用。Neoverse V1寬而深的架構(gòu),加上 SVE功能將使其在單核性能和通過SVE延長代碼存活期等方面占據(jù)領(lǐng)先優(yōu)勢,并為芯片設(shè)計人員提供可實現(xiàn)的靈活性。Bergey解釋道:“Arm 現(xiàn)有的 SIMD 指令集 NEON 難以對某些代碼進行矢量化處理,而 SVE 可以直接取用相同的代碼,并很好地對其進行自動矢量化,相比于 NEON,可提速將近 3.5 倍?!?/p>
Neoverse N2:采用Arm V9架構(gòu)
Neoverse N2平臺是第一個基于Armv9架構(gòu)的平臺,在安全性、能耗以及性能方面都有全面的提升,正在為基礎(chǔ)設(shè)施核心鋪平道路?!癗2 效率配置能夠在單插槽線程上具有更大的競爭力,同時提供專屬的內(nèi)核,而非共享線程?!盉ergey說道。
相比于N1,Neoverse N2在保持相同水平的功率和面積效率的基礎(chǔ)上,單線程性能提升了40%。Neoverse N2 具備良好的可擴展性,可以橫跨從高吞吐量計算到功率與尺寸受限的邊緣和5G應(yīng)用場景,并在這些應(yīng)用中帶來優(yōu)于N1的表現(xiàn),例如,在云端上提升 1.3 倍的NGINX,在 5G 和邊緣應(yīng)用上提升 1.2 倍的DPDK 數(shù)據(jù)包處理。
Neoverse N2平臺提供了優(yōu)異的單線程性能和業(yè)界領(lǐng)先且能為用戶減少TCO的每瓦性能表現(xiàn)。Neoverse N2是第一個具備SVE2功能的平臺,該功能可為云到邊緣的性能效率帶來巨大的提升。在諸如機器學(xué)習(xí)、數(shù)字信號處理、多媒體和5G等廣泛應(yīng)用場景中,SVE2除了帶來大幅性能提升外,還帶來了SVE 具備的編程簡易性及可移植性等優(yōu)勢。
Bergey表示:“SVE2 將 SVE 相關(guān)的性能、編程簡易性及可移植性等優(yōu)勢,應(yīng)用到更廣的領(lǐng)域和場景。SVE 意在加速 HPC,而 SVE2 則是將其擴展到 ML、DSP、多媒體和 5G 等應(yīng)用場景。它融合了 NEON 豐富的數(shù)據(jù)操作、邏輯和算術(shù)指令集,以及 SVE 的自動矢量化和可擴展 性等功能?!?/p>
Neoverse與友商的性能對比
Bergey總結(jié)道:“V1 平臺將成為 HPC 的一場變革,而N2將成為云端到邊緣應(yīng)用場景的最佳解決方案?!?/p>