隨著更多云廠商越來越需要進(jìn)行針對(duì)系統(tǒng)的專門優(yōu)化,定制化的芯片設(shè)計(jì)開始變成普遍流行,基礎(chǔ)設(shè)施芯片市場(chǎng)變得越來越有趣,玩家越來越多。今年以來,包括印度電子和信息技術(shù)部MeitY,法國芯片初創(chuàng)企業(yè) SiPearl,韓國電子通信研究所 ETRI,都宣布開發(fā)基于Neoverse V1的產(chǎn)品。
國內(nèi)廠商奮起直追
包括騰訊和阿里在內(nèi)的一批國內(nèi)系統(tǒng)廠商,正在加速構(gòu)建基于Arm的服務(wù)器的芯片。
騰訊專項(xiàng)測(cè)試技術(shù)中心總監(jiān)黃聞欣(Victor Huang)表示:“2020年,騰訊和Arm正式簽署了一份合作協(xié)議,希望通過合作加速Arm Neoverse技術(shù)的測(cè)評(píng)和適配。后面我們通過TencentBench測(cè)試框架發(fā)現(xiàn),得益于更多可擴(kuò)展的CPU核心數(shù),Arm服務(wù)器比傳統(tǒng)的服務(wù)器性能表現(xiàn)更強(qiáng)勁。非常值得一提的是,其在AI推理和圖片處理領(lǐng)域優(yōu)勢(shì)非常明顯?!?/p>
阿里巴巴首席工程師周經(jīng)森(Kingsum Chow)提到:“Arm的CPU資源的話,在我們現(xiàn)有的軟件里會(huì)有兩個(gè)考慮的點(diǎn),一個(gè)是我們有些軟件是需要重新編譯的,另外一種不需要重新編譯,只需要我們把Java applications在JVM(Java Virtual Machine)上跑好就可以了。在這方面,一年之前,我們就跟Arm的員工一起合作,把JVM的性能提高。過去一年里,我們從JDK8到JDK11,通過OpenJDK, 通過阿里巴巴 Dragonwell(OpenJDK的一個(gè)發(fā)行版),就把我們現(xiàn)有一些Java應(yīng)用的一些性能提高了50%?!?/p>
Arm基礎(chǔ)設(shè)施事業(yè)部高級(jí)副總裁兼總經(jīng)理Chris Bergey表示:“騰訊在針對(duì)基于Arm硬件測(cè)試和軟件支持方面持續(xù)投入,他們的硬件測(cè)試在性能方面展現(xiàn)了出色的結(jié)果,在每瓦性能方面也有非凡的表現(xiàn)。在軟件的部份,他們既支持已編譯和解譯的代碼庫,也支持為這些代碼庫提供支撐的微服務(wù)框架。”
而針對(duì)阿里巴巴的合作,Bergey說道:“Java 對(duì)于阿里巴巴來說是一項(xiàng)至關(guān)重要的工作負(fù)載,他們的工程師已經(jīng)編寫了超過十億行的 Java 代碼。阿里巴巴和 Arm正在Java 的工作負(fù)載分析和調(diào)試方面持續(xù)合作?!?/p>
解密全新Neoverse路線圖
正因?yàn)楸姸嗫蛻粢呀?jīng)開始進(jìn)行基于Neoverse產(chǎn)品的開發(fā),Arm開始越來越快地公布其產(chǎn)品詳細(xì)路線圖。
日前,在Arm年度技術(shù)日上,Arm詳細(xì)介紹了Arm Neoverse V1 和 Neoverse N2 平臺(tái)。以及Arm Neoverse CMN-700 mesh 互連技術(shù)。
Neoverse路線圖
CMN-700互聯(lián)技術(shù)
Bergey表示,Arm CMN-700互聯(lián)技術(shù)是構(gòu)建V1和N2的關(guān)鍵要素?;贑MN-600而打造,從內(nèi)核的數(shù)量和緩存的大小,到附加內(nèi)存和IO設(shè)備的數(shù)量和類型都鎖有所提升。支持DDR5和HBM。此外,增加了CXL功能,可為內(nèi)存擴(kuò)展和智能一致性加速。另外則是增加了諸多對(duì)于多芯片的支持功能,針對(duì)傳統(tǒng)多插槽設(shè)計(jì)和新的芯片集或多芯片集成提高性能和優(yōu)化功能?!岸嘈酒蓪橥黄苽鹘y(tǒng)的硅掩模版限制提供新的機(jī)遇,并為緊密耦合的異構(gòu)計(jì)算提供更大的靈活性?!盉ergey說道。
Neoverse V1:增加SVE功能
Bergey表示:“Neoverse V1 的設(shè)計(jì)理念是性能至上,因此我們加寬了微架構(gòu),并增加了緩沖區(qū)和隊(duì)列的深度,以便在運(yùn)行中容納更多指令?!?/p>
與N1相比,Neoverse V1帶來了 50% 的性能提升、1.8倍的矢量工作負(fù)載優(yōu)化、以及4倍的機(jī)器學(xué)習(xí)工作負(fù)載優(yōu)化,同時(shí),Neoverse V1也是Arm強(qiáng)調(diào)性能優(yōu)先的新型計(jì)算系列的第一個(gè)平臺(tái)。Neoverse N1使芯片合作伙伴能靈活地為高度依賴CPU性能和帶寬的應(yīng)用構(gòu)建計(jì)算能力,并為其提供 SoC 設(shè)計(jì)的靈活性。
秉持性能至上的思維,Neoverse V1 的設(shè)計(jì)理念創(chuàng)造了Arm迄今為止設(shè)計(jì)過的最寬微架構(gòu),以便容納更多運(yùn)行中的指令,支持高性能和百萬兆級(jí)計(jì)算等市場(chǎng)應(yīng)用。Neoverse V1寬而深的架構(gòu),加上 SVE功能將使其在單核性能和通過SVE延長代碼存活期等方面占據(jù)領(lǐng)先優(yōu)勢(shì),并為芯片設(shè)計(jì)人員提供可實(shí)現(xiàn)的靈活性。Bergey解釋道:“Arm 現(xiàn)有的 SIMD 指令集 NEON 難以對(duì)某些代碼進(jìn)行矢量化處理,而 SVE 可以直接取用相同的代碼,并很好地對(duì)其進(jìn)行自動(dòng)矢量化,相比于 NEON,可提速將近 3.5 倍?!?/p>
Neoverse N2:采用Arm V9架構(gòu)
Neoverse N2平臺(tái)是第一個(gè)基于Armv9架構(gòu)的平臺(tái),在安全性、能耗以及性能方面都有全面的提升,正在為基礎(chǔ)設(shè)施核心鋪平道路?!癗2 效率配置能夠在單插槽線程上具有更大的競(jìng)爭(zhēng)力,同時(shí)提供專屬的內(nèi)核,而非共享線程?!盉ergey說道。
相比于N1,Neoverse N2在保持相同水平的功率和面積效率的基礎(chǔ)上,單線程性能提升了40%。Neoverse N2 具備良好的可擴(kuò)展性,可以橫跨從高吞吐量計(jì)算到功率與尺寸受限的邊緣和5G應(yīng)用場(chǎng)景,并在這些應(yīng)用中帶來優(yōu)于N1的表現(xiàn),例如,在云端上提升 1.3 倍的NGINX,在 5G 和邊緣應(yīng)用上提升 1.2 倍的DPDK 數(shù)據(jù)包處理。
Neoverse N2平臺(tái)提供了優(yōu)異的單線程性能和業(yè)界領(lǐng)先且能為用戶減少TCO的每瓦性能表現(xiàn)。Neoverse N2是第一個(gè)具備SVE2功能的平臺(tái),該功能可為云到邊緣的性能效率帶來巨大的提升。在諸如機(jī)器學(xué)習(xí)、數(shù)字信號(hào)處理、多媒體和5G等廣泛應(yīng)用場(chǎng)景中,SVE2除了帶來大幅性能提升外,還帶來了SVE 具備的編程簡(jiǎn)易性及可移植性等優(yōu)勢(shì)。
Bergey表示:“SVE2 將 SVE 相關(guān)的性能、編程簡(jiǎn)易性及可移植性等優(yōu)勢(shì),應(yīng)用到更廣的領(lǐng)域和場(chǎng)景。SVE 意在加速 HPC,而 SVE2 則是將其擴(kuò)展到 ML、DSP、多媒體和 5G 等應(yīng)用場(chǎng)景。它融合了 NEON 豐富的數(shù)據(jù)操作、邏輯和算術(shù)指令集,以及 SVE 的自動(dòng)矢量化和可擴(kuò)展 性等功能。”
Neoverse與友商的性能對(duì)比
Bergey總結(jié)道:“V1 平臺(tái)將成為 HPC 的一場(chǎng)變革,而N2將成為云端到邊緣應(yīng)用場(chǎng)景的最佳解決方案?!?/p>