本周三,Arm發(fā)布了最新一代架構(gòu)Armv9,這一架構(gòu)是在目前已經(jīng)廣泛使用的Armv8的基礎(chǔ)上,面向未來十年的新一代架構(gòu)。
雷鋒網(wǎng)了解到,Armv9架構(gòu)有三個系列,分別是針對通用計算的A系列,實時處理器的R系列,微控制器的M系列,預(yù)計未來兩代移動基礎(chǔ)設(shè)施CPU的性能提升將超過30%。首款基于Armv9架構(gòu)CPU的移動處理器最快將在今年底問世,可能來自MediaTek。
Armv9架構(gòu)的初代版本增強了安全性、機器學(xué)習(xí)、DSP性能,Armv9架構(gòu)未來也將持續(xù)增強這些性能,并將加入新特性。
最近幾年,Arm架構(gòu)處理器已經(jīng)從智能手機為代表的終端向?qū)π阅芤蟾叩腜C、數(shù)據(jù)中心延伸。從最新的發(fā)布可以看到,Arm希望Armv9架構(gòu) CPU以及基于其GPU、NPU處理器能夠無處不在。如果Arm的目標(biāo)能夠?qū)崿F(xiàn),是否可以實現(xiàn)CPU計算統(tǒng)治?Arm的第三個1000萬出貨目標(biāo)多久能夠達(dá)成?
安全是發(fā)揮計算架構(gòu)
潛能最大的挑戰(zhàn)
—
Armv9架構(gòu)的發(fā)布會上,安全性被頻頻提及,與安全相關(guān)的技術(shù)和介紹的篇幅也很長。Arm高級副總裁、首席架構(gòu)師兼技術(shù)院士Richard Grisenthwaite解釋稱,“我看來,計算若要充分發(fā)揮潛能,安全是最大的挑戰(zhàn),越來越多的私人數(shù)據(jù)被存放在計算系統(tǒng)中,這讓這些數(shù)據(jù)成為安全攻擊的誘人目標(biāo)。今年網(wǎng)絡(luò)犯罪損失的金額預(yù)估高達(dá)6萬億美元?!?/p>
因此,Armv9架構(gòu)在安全性方面做了多方面的工作。首先是引入了Arm機密計算架構(gòu)(Confidential Compute Architecture, CCA),機密計算通過打造基于硬件的安全運行環(huán)境來執(zhí)行計算,保護部分代碼和數(shù)據(jù),免于被存取或修改,甚至不受特權(quán)軟件的影響。
Arm CCA將引入動態(tài)創(chuàng)建機密領(lǐng)域(Realms)的概念,機密領(lǐng)域面向所有應(yīng)用,運行在獨立于安全或非安全環(huán)境之外的環(huán)境中,實現(xiàn)保護數(shù)據(jù)安全的目的。比如,在商業(yè)應(yīng)用中,機密領(lǐng)域可以保護系統(tǒng)中商用機密數(shù)據(jù)和代碼,無論它們正被使用、閑置或正在傳輸中。
據(jù)悉,Arm會在今年下半年公布Arm CCA的更多信息。
內(nèi)存標(biāo)簽擴展是Armv9架構(gòu)的另一項安全技術(shù)。Richard Grisenthwaite說:“在分析了全球軟件報告的大量安全問題后,我們發(fā)現(xiàn)許多問題的根源實際上與過去內(nèi)存安全的老問題有關(guān)。這些問題已經(jīng)困擾計算領(lǐng)域50年,兩個持續(xù)多年特別常見的內(nèi)存安全問題——緩存溢出和釋放后重用。很大一部分的問題是,這些內(nèi)存安全漏洞被利用之前就能發(fā)現(xiàn)問題,這是提高全球軟件安全至關(guān)重要的一步。”
Arm持續(xù)與谷歌合作開發(fā)的“內(nèi)存標(biāo)簽擴展”技術(shù),可以在軟件中查找空間和時間內(nèi)存安全的問題,允許軟件將指向內(nèi)存的指針與標(biāo)簽建立關(guān)聯(lián),并在使用指針時檢查這個標(biāo)簽是否正確。
Richard稱,內(nèi)存標(biāo)簽擴展是明年上市的第一代Armv9 CPU不可或缺的一部分。支持內(nèi)存標(biāo)簽擴展的軟件也正被引入到安卓11系統(tǒng)和OPENSUSE。
Arm還與劍橋大學(xué)在其CHERI架構(gòu)上合作多年,從架構(gòu)底層來提升安全性。據(jù)介紹,CHERI架構(gòu)定義了可提供這種封裝能力的硬件功能,這在未來將可能促成一個本質(zhì)上更為安全的計算平臺,但這也會使某些系統(tǒng)的變成方式產(chǎn)生重大改變。
不過,這種架構(gòu)Arm已經(jīng)在和其合作伙伴探索,如果成功,會在未來5-6年引入Armv9架構(gòu),成為Armv9架構(gòu)主要的組件之一。
未來兩代Armv9架構(gòu)CPU
性能提升將超過30%
—
安全性是計算架構(gòu)的基礎(chǔ),性能提升則是滿足越來越高的計算需求以及多樣化計算需求的關(guān)鍵。Arm預(yù)計,新一代架構(gòu)Armv9將保持超過業(yè)界CPU性能提升的速度,未來兩代移動和基礎(chǔ)設(shè)施CPU的性能提升將超過30%。
Richard強調(diào):“這個數(shù)據(jù)是根據(jù)業(yè)界標(biāo)準(zhǔn)評測工具來衡量,30%的算力提升完全是憑借于本身架構(gòu)而不是借助于制程工藝來實現(xiàn)。”
計算性能提升非常重要的驅(qū)動力就是AI,Statista Research Department今年1月發(fā)布的最近報告估計,到21世紀(jì)20年代中期,全球?qū)⒂谐^80億臺搭載AI語音輔助的設(shè)備。不同設(shè)備對于AI性能的需求不同,也就需要不同的AI處理器。
Arm與富士通合作開發(fā)了可伸縮矢量擴展(Scalable Vector Extension, SVE)技術(shù)并用在了全球最快的超級計算機“富岳”上。在SVE的基礎(chǔ)上,Armv9中使用了新開發(fā)的SVE2技術(shù),增強了對在CPU上本地運行的5G系統(tǒng)、虛擬和增強現(xiàn)實以及ML工作負(fù)載的處理能力,能夠提供實現(xiàn)增強的機器學(xué)習(xí)和數(shù)字信號處理能力。
“我們還將通過提升頻率、帶寬、緩存大小、并減少內(nèi)存延遲,以最大化CPU 性能?!盧ichard表示。
在解決新問題的過程中,Arm加入了一些復(fù)雜技術(shù),這是否違背了精簡指令集(RISC)的初衷?Richard的觀點是:“Arm架構(gòu)的精簡指令(RISC)核心沒有改變,我們依然遵循著注冊到注冊(registration to registration) 的操作原則,所以從硬件的角度來看,Arm指令集仍然保持著精益性。”
Arm稱,除了大幅增強CPU內(nèi)的矩陣乘法,Mali GPU和Ethos NPU也會持續(xù)進(jìn)行AI創(chuàng)新,擴展Arm的技術(shù)能力。
統(tǒng)治CPU計算
—
目前,CPU領(lǐng)域最成功的架構(gòu)當(dāng)屬x86,不過x86的成功和統(tǒng)治力在于PC和高性能計算市場,在Arm擅長的智能終端市場并不成功。近幾年,Arm架構(gòu)在高性能計算領(lǐng)域取得了一些進(jìn)展,包括上面提到的“富岳”超級計算機,以及推出采用Arm架構(gòu)的多款服務(wù)器。去年,蘋果M1處理器Macbook Pro電腦的推出,也讓業(yè)界看到了x86架構(gòu)在PC市場的統(tǒng)治地位并非牢不可破。
Arm首席執(zhí)行官Simon Segars說,“Arm芯片實現(xiàn)1000億顆的出貨花了26年,如果預(yù)測準(zhǔn)確,接下來一年,我們的合作伙伴出貨的Arm芯片將累計達(dá)到2000億顆。也就是說,我們的第二個1000億的出貨將在短短5年內(nèi)達(dá)成。”
雷鋒網(wǎng)了解到,目前Arm架構(gòu)的芯片出貨已經(jīng)超過1800億顆,Armv9架構(gòu)會成為實現(xiàn)Arm芯片3000億顆芯片出貨的先驅(qū)。沒有人能準(zhǔn)確預(yù)估Arm實現(xiàn)第三個1000億顆芯片出貨的時間,但可以明確的是Arm希望其芯片能夠為所有智能計算提供算力,也就是讓其芯片在未來無處不在。
為了實現(xiàn)這個目標(biāo),同時滿足行業(yè)從通用計算向普遍的專用處理發(fā)展的需求,Arm也開始強調(diào)全面計算的理念。全面計算設(shè)計方法包含Arm的CPU、GPU、NPU,通過將全面計算的設(shè)計原則應(yīng)用在包含汽車、客戶端、基礎(chǔ)設(shè)施和物聯(lián)網(wǎng)解決方案的整個IP組合中。
與此配合,Arm也需要在標(biāo)準(zhǔn)化程度上取得平衡。Richard說:“如果過多的標(biāo)準(zhǔn)化,那么合作伙伴將無法開發(fā)合適的專用解決方案。而如果太少的標(biāo)準(zhǔn)化,我們得承擔(dān)低價值、形同實異的解決方案的風(fēng)險。這將讓軟件生態(tài)系統(tǒng)的成本增加、且毫無益處。”
Arm在服務(wù)器領(lǐng)域中已經(jīng)看到了標(biāo)準(zhǔn)化平衡的價值,推出了“服務(wù)器基礎(chǔ)架構(gòu)SBSA”和相關(guān)的認(rèn)證計劃“服務(wù)器就緒”。
“我們也正在擴大標(biāo)準(zhǔn)化的范圍,Arm SystemReady將服務(wù)器就緒計劃的概念從云端延伸到物聯(lián)網(wǎng)邊緣等廣泛的設(shè)備上,以實現(xiàn)通用操作系統(tǒng)及虛擬機管理程序之間的交互運作?!盧ichard說。
如果Arm的全面計算以及標(biāo)準(zhǔn)化探索成功,從終端到邊緣再到云端,Arm是否就能夠?qū)崿F(xiàn)在未來的計算統(tǒng)治?實現(xiàn)3000億顆甚至更多芯片出貨又會有多快呢?
小結(jié)
—
現(xiàn)在看來,有兩大方面的阻礙,一方面是在復(fù)雜的國際形勢下,同屬精簡指令集的RISC-V正在快速發(fā)展,加上x86陣營intel和AMD也在加強x86的競爭力,Arm要真正撼動x86的優(yōu)勢領(lǐng)域并非易事。
另一方面,中國作為芯片進(jìn)口的大國,Arm與Nvidia的收購交易,以及美國對中國領(lǐng)先芯片設(shè)計公司的出口限制,讓客戶產(chǎn)生擔(dān)憂。
對于Armv9是否以供給包括華為在內(nèi)的中國企業(yè)的問題,Arm的官方回復(fù)是:“Arm既有源于美國的IP,也有非源于美國的IP。經(jīng)過全面的審查,Arm確定其Armv9架構(gòu)不受美國出口管理條例(EAR)的約束。Arm已將此通知美國政府相關(guān)部門,我們將繼續(xù)遵守美國商務(wù)部針對華為及其附屬公司海思的指導(dǎo)方針?!?/p>
這樣的回復(fù),不知你怎么看?