編者按:日前Arm Tech Symposia 年度技術(shù)大會(北京站)圓滿舉行,Arm 高級副總裁兼基礎(chǔ)設(shè)施事業(yè)部總經(jīng)理 Mohamed Awad先生詳細(xì)地介紹了Arm為迎接AI計算新時代所做的一系列創(chuàng)新舉措。
眾所周知,Arm以高性能、低功耗的計算性能和靈活的商業(yè)模式,開創(chuàng)并引領(lǐng)了移動計算時代。如今AI時代已然來臨,人工智能技術(shù)深刻影響著邊緣計算、移動計算和基礎(chǔ)設(shè)施領(lǐng)域的變革。
值得關(guān)注的是,近年來Arm 已成功轉(zhuǎn)型為一家計算平臺公司,在致力于IP 授權(quán)業(yè)務(wù)的同時,也專注于通過完整且全面的解決方案,為合作伙伴帶來選擇的靈活性,幫助他們更快地將產(chǎn)品推向市場。
Arm 為移動、基礎(chǔ)設(shè)施、物聯(lián)網(wǎng),以及汽車領(lǐng)域推出對應(yīng)的計算平臺,可以加速合作伙伴產(chǎn)品上市進(jìn)程
Arm 全面計算解決方案 (Arm Total Compute Solutions)、Arm Neoverse平臺、Arm Corstone 以及 SOAFEE 等,都是 Arm 的計算平臺分別在移動、基礎(chǔ)設(shè)施、物聯(lián)網(wǎng)與汽車等市場當(dāng)中得以廣泛應(yīng)用的例證,這些平臺可以幫助Arm向生態(tài)伙伴提供完整、集成的解決方案,助力客戶快速采用并推出解決方案。
Arm 高級副總裁兼基礎(chǔ)設(shè)施事業(yè)部總經(jīng)理 Mohamed Awad表示,人工智能 (AI) 正處于快速發(fā)展中,對云計算基礎(chǔ)設(shè)施來說,目前最大的挑戰(zhàn)之一是內(nèi)存帶寬發(fā)揮最佳性能,為設(shè)備提供更好的支持。AI時代的基礎(chǔ)設(shè)施需要一個新的系統(tǒng)架構(gòu)來實現(xiàn)更多的內(nèi)存帶寬和內(nèi)存一致性和足夠的靈活性,Arm 憑借其兼具靈活性和設(shè)計的獨(dú)特模式,以及強(qiáng)大的生態(tài)系統(tǒng),正在賦能合作伙伴共贏挑戰(zhàn)。
在傳統(tǒng)的服務(wù)器系統(tǒng)架構(gòu)中(如下圖所示),中間是一個標(biāo)準(zhǔn)的現(xiàn)成 CPU,有標(biāo)準(zhǔn)化的總線,還有幾個連接到同一個 CPU 的不同加速器。這樣的傳統(tǒng)架構(gòu)一直適用了幾十年,但在 AI 時代,這樣的架構(gòu)已經(jīng)不堪重用。
Mohamed Awad表示,由于無法獲得足夠的內(nèi)存,它很難跟上 AI 應(yīng)用所需的數(shù)據(jù)和計算量。而解決方案就是研究如何構(gòu)建一個新的系統(tǒng)架構(gòu),使我們能夠跟上 AI 時代的步伐。只有通過靈活地調(diào)整和重新構(gòu)建系統(tǒng)的各個方面,才能做到這一點(diǎn)。
基礎(chǔ)設(shè)施領(lǐng)域的傳統(tǒng)系統(tǒng)架構(gòu)
Arm協(xié)同合作伙伴正在創(chuàng)新著一種以“定制的 CPU”為核心的現(xiàn)代化系統(tǒng)架構(gòu),以此來滿足AI時代基礎(chǔ)設(shè)施高速率和大帶寬的需求。
面向新的應(yīng)用需求,基礎(chǔ)設(shè)施領(lǐng)域出現(xiàn)了現(xiàn)代化的系統(tǒng)架構(gòu)
在新的架構(gòu)里,圍繞定制的CPU,利用現(xiàn)代強(qiáng)大的軟件生態(tài)系統(tǒng),直接連接到每個加速器,在加速器和 CPU 之間建立高性能連接,并在整個設(shè)備間實現(xiàn)內(nèi)存一致性。
Mohamed Awad表示,基于 Arm 建立的計算平臺,合作伙伴可以創(chuàng)建定制化的 CPU,通過利用所有的投資和龐大的軟件生態(tài)系統(tǒng),可以打造出新的產(chǎn)品來解決各類新的問題,而這正是 AI 世界所需要的。
以NVIDIA GH200 Grace Hopper 超級芯片為例,它基于 72 顆Arm Neoverse內(nèi)核,加上來自 NVIDIA 的 GPU的組合,其AI 性能較基于x86架構(gòu)的系統(tǒng)可提升 10 倍。
NVIDIA GH200 Grace Hopper 超級芯片采用 Arm Neoverse 搭配 NVIDIA GPU,滿足 AI 性能的需求
另一個典型案例來自于亞馬遜(AWS)公司。
AWS 發(fā)布的第四代基于 Arm Neoverse 平臺的處理器——Graviton4。該處理器專為基礎(chǔ)設(shè)施領(lǐng)域設(shè)計。與 Graviton3 相比,Graviton4 的處理速度提高了 30%,核心數(shù)量增加了 50%,內(nèi)存帶寬增加了 75%。
AWS 發(fā)布第四代基于 Arm Neoverse 平臺的處理器 Graviton4
誠然,具備NVIDIA和AWS資源和實力的公司屈指可數(shù),為了推動更多企業(yè)迎接AI計算時代,Arm也想到了解決辦法。
據(jù)Mohamed Awad介紹,為幫助更多中小客戶加速部署基于Neoverse平臺的系統(tǒng),Arm特別推出了Neoverse 計算子系統(tǒng) (CSS) ,合作伙伴可以直接采用,也可按需選用,從而加速產(chǎn)品的上市進(jìn)程。
實際案例證明,Neoverse CSS 能夠幫助合作伙伴進(jìn)一步降低投資,據(jù)其中一個合作伙伴反饋,通過使用 Neoverse CSS,節(jié)省了長達(dá) 80 人/年的工程師時間;也有合作伙伴反饋通過使用Neoverse CSS,助力他們的項目從概念到流片僅耗時 13 個月。
Arm Neoverse 計算子系統(tǒng) (CSS)
在 Neoverse CSS 的基礎(chǔ)之上,Arm 推出了 Arm 全面設(shè)計 (Arm Total Design) 生態(tài)項目,進(jìn)一步結(jié)合生態(tài)系統(tǒng)的力量,包括專用集成電路 (ASIC) 設(shè)計公司、IP 供應(yīng)商、EDA 工具提供商、代工廠和固件開發(fā)廠商等,共同助力簡化定制芯片的開發(fā)流程,并且讓交付變得更加容易、便捷。進(jìn)一步提高了 Neoverse CSS生態(tài)系統(tǒng)中可供合作伙伴使用的可能性,能夠幫助合作伙伴進(jìn)一步加速他們的解決方案開發(fā)。
Arm 全面設(shè)計 (Arm Total Design) 生態(tài)項目助力合作伙伴加速基于 Neoverse CSS 的芯片開發(fā)
Mohamed Awad最后表示,Arm非常高興能夠和中國本地的廠商合作推動AI計算進(jìn)步。阿里巴巴的倚天 710 就是基于 Arm Neoverse 平臺打造的 CPU;鴻鈞微電子、遇賢微電子以及云豹智能,正在基于 Arm 平臺分別打造服務(wù)器 SoC 解決方案與云計算和數(shù)據(jù)中心的DPU解決方案;聯(lián)想將基于Arm架構(gòu)的解決方案部署到 5G 領(lǐng)域。
因此,通過攜手中國本土的強(qiáng)有力的合作伙伴,Arm深度融入中國AI計算產(chǎn)業(yè),將為中國人工智能技術(shù)發(fā)展貢獻(xiàn)力量。