編者按:日前Arm Tech Symposia 年度技術(shù)大會(北京站)圓滿舉行,Arm 高級副總裁兼基礎(chǔ)設(shè)施事業(yè)部總經(jīng)理 Mohamed Awad先生詳細(xì)地介紹了Arm為迎接AI計(jì)算新時(shí)代所做的一系列創(chuàng)新舉措。
眾所周知,Arm以高性能、低功耗的計(jì)算性能和靈活的商業(yè)模式,開創(chuàng)并引領(lǐng)了移動(dòng)計(jì)算時(shí)代。如今AI時(shí)代已然來臨,人工智能技術(shù)深刻影響著邊緣計(jì)算、移動(dòng)計(jì)算和基礎(chǔ)設(shè)施領(lǐng)域的變革。
值得關(guān)注的是,近年來Arm 已成功轉(zhuǎn)型為一家計(jì)算平臺公司,在致力于IP 授權(quán)業(yè)務(wù)的同時(shí),也專注于通過完整且全面的解決方案,為合作伙伴帶來選擇的靈活性,幫助他們更快地將產(chǎn)品推向市場。
Arm 為移動(dòng)、基礎(chǔ)設(shè)施、物聯(lián)網(wǎng),以及汽車領(lǐng)域推出對應(yīng)的計(jì)算平臺,可以加速合作伙伴產(chǎn)品上市進(jìn)程
Arm 全面計(jì)算解決方案 (Arm Total Compute Solutions)、Arm Neoverse平臺、Arm Corstone 以及 SOAFEE 等,都是 Arm 的計(jì)算平臺分別在移動(dòng)、基礎(chǔ)設(shè)施、物聯(lián)網(wǎng)與汽車等市場當(dāng)中得以廣泛應(yīng)用的例證,這些平臺可以幫助Arm向生態(tài)伙伴提供完整、集成的解決方案,助力客戶快速采用并推出解決方案。
Arm 高級副總裁兼基礎(chǔ)設(shè)施事業(yè)部總經(jīng)理 Mohamed Awad表示,人工智能 (AI) 正處于快速發(fā)展中,對云計(jì)算基礎(chǔ)設(shè)施來說,目前最大的挑戰(zhàn)之一是內(nèi)存帶寬發(fā)揮最佳性能,為設(shè)備提供更好的支持。AI時(shí)代的基礎(chǔ)設(shè)施需要一個(gè)新的系統(tǒng)架構(gòu)來實(shí)現(xiàn)更多的內(nèi)存帶寬和內(nèi)存一致性和足夠的靈活性,Arm 憑借其兼具靈活性和設(shè)計(jì)的獨(dú)特模式,以及強(qiáng)大的生態(tài)系統(tǒng),正在賦能合作伙伴共贏挑戰(zhàn)。
在傳統(tǒng)的服務(wù)器系統(tǒng)架構(gòu)中(如下圖所示),中間是一個(gè)標(biāo)準(zhǔn)的現(xiàn)成 CPU,有標(biāo)準(zhǔn)化的總線,還有幾個(gè)連接到同一個(gè) CPU 的不同加速器。這樣的傳統(tǒng)架構(gòu)一直適用了幾十年,但在 AI 時(shí)代,這樣的架構(gòu)已經(jīng)不堪重用。
Mohamed Awad表示,由于無法獲得足夠的內(nèi)存,它很難跟上 AI 應(yīng)用所需的數(shù)據(jù)和計(jì)算量。而解決方案就是研究如何構(gòu)建一個(gè)新的系統(tǒng)架構(gòu),使我們能夠跟上 AI 時(shí)代的步伐。只有通過靈活地調(diào)整和重新構(gòu)建系統(tǒng)的各個(gè)方面,才能做到這一點(diǎn)。
基礎(chǔ)設(shè)施領(lǐng)域的傳統(tǒng)系統(tǒng)架構(gòu)
Arm協(xié)同合作伙伴正在創(chuàng)新著一種以“定制的 CPU”為核心的現(xiàn)代化系統(tǒng)架構(gòu),以此來滿足AI時(shí)代基礎(chǔ)設(shè)施高速率和大帶寬的需求。
面向新的應(yīng)用需求,基礎(chǔ)設(shè)施領(lǐng)域出現(xiàn)了現(xiàn)代化的系統(tǒng)架構(gòu)
在新的架構(gòu)里,圍繞定制的CPU,利用現(xiàn)代強(qiáng)大的軟件生態(tài)系統(tǒng),直接連接到每個(gè)加速器,在加速器和 CPU 之間建立高性能連接,并在整個(gè)設(shè)備間實(shí)現(xiàn)內(nèi)存一致性。
Mohamed Awad表示,基于 Arm 建立的計(jì)算平臺,合作伙伴可以創(chuàng)建定制化的 CPU,通過利用所有的投資和龐大的軟件生態(tài)系統(tǒng),可以打造出新的產(chǎn)品來解決各類新的問題,而這正是 AI 世界所需要的。
以NVIDIA GH200 Grace Hopper 超級芯片為例,它基于 72 顆Arm Neoverse內(nèi)核,加上來自 NVIDIA 的 GPU的組合,其AI 性能較基于x86架構(gòu)的系統(tǒng)可提升 10 倍。
NVIDIA GH200 Grace Hopper 超級芯片采用 Arm Neoverse 搭配 NVIDIA GPU,滿足 AI 性能的需求
另一個(gè)典型案例來自于亞馬遜(AWS)公司。
AWS 發(fā)布的第四代基于 Arm Neoverse 平臺的處理器——Graviton4。該處理器專為基礎(chǔ)設(shè)施領(lǐng)域設(shè)計(jì)。與 Graviton3 相比,Graviton4 的處理速度提高了 30%,核心數(shù)量增加了 50%,內(nèi)存帶寬增加了 75%。
AWS 發(fā)布第四代基于 Arm Neoverse 平臺的處理器 Graviton4
誠然,具備NVIDIA和AWS資源和實(shí)力的公司屈指可數(shù),為了推動(dòng)更多企業(yè)迎接AI計(jì)算時(shí)代,Arm也想到了解決辦法。
據(jù)Mohamed Awad介紹,為幫助更多中小客戶加速部署基于Neoverse平臺的系統(tǒng),Arm特別推出了Neoverse 計(jì)算子系統(tǒng) (CSS) ,合作伙伴可以直接采用,也可按需選用,從而加速產(chǎn)品的上市進(jìn)程。
實(shí)際案例證明,Neoverse CSS 能夠幫助合作伙伴進(jìn)一步降低投資,據(jù)其中一個(gè)合作伙伴反饋,通過使用 Neoverse CSS,節(jié)省了長達(dá) 80 人/年的工程師時(shí)間;也有合作伙伴反饋通過使用Neoverse CSS,助力他們的項(xiàng)目從概念到流片僅耗時(shí) 13 個(gè)月。
Arm Neoverse 計(jì)算子系統(tǒng) (CSS)
在 Neoverse CSS 的基礎(chǔ)之上,Arm 推出了 Arm 全面設(shè)計(jì) (Arm Total Design) 生態(tài)項(xiàng)目,進(jìn)一步結(jié)合生態(tài)系統(tǒng)的力量,包括專用集成電路 (ASIC) 設(shè)計(jì)公司、IP 供應(yīng)商、EDA 工具提供商、代工廠和固件開發(fā)廠商等,共同助力簡化定制芯片的開發(fā)流程,并且讓交付變得更加容易、便捷。進(jìn)一步提高了 Neoverse CSS生態(tài)系統(tǒng)中可供合作伙伴使用的可能性,能夠幫助合作伙伴進(jìn)一步加速他們的解決方案開發(fā)。
Arm 全面設(shè)計(jì) (Arm Total Design) 生態(tài)項(xiàng)目助力合作伙伴加速基于 Neoverse CSS 的芯片開發(fā)
Mohamed Awad最后表示,Arm非常高興能夠和中國本地的廠商合作推動(dòng)AI計(jì)算進(jìn)步。阿里巴巴的倚天 710 就是基于 Arm Neoverse 平臺打造的 CPU;鴻鈞微電子、遇賢微電子以及云豹智能,正在基于 Arm 平臺分別打造服務(wù)器 SoC 解決方案與云計(jì)算和數(shù)據(jù)中心的DPU解決方案;聯(lián)想將基于Arm架構(gòu)的解決方案部署到 5G 領(lǐng)域。
因此,通過攜手中國本土的強(qiáng)有力的合作伙伴,Arm深度融入中國AI計(jì)算產(chǎn)業(yè),將為中國人工智能技術(shù)發(fā)展貢獻(xiàn)力量。