作為在智能終端領(lǐng)域呼風(fēng)喚雨的角色,ARM的崛起在很大程度上構(gòu)筑起了今日終端市場的繁榮。由于采用授權(quán)、版稅和軟件平臺(tái)服務(wù)為主的盈利模式,ARM能夠盡量避免在制造和工廠方面分心,將大部分精力都投入到芯片產(chǎn)品的研發(fā)設(shè)計(jì)和相關(guān)軟件平臺(tái)的開發(fā)上,從而推進(jìn)產(chǎn)品快速進(jìn)步。
而這也正是華為海思、高通、蘋果等企業(yè)能夠在芯片業(yè)務(wù)上一年一旗艦的快速推出產(chǎn)品的核心原因。
當(dāng)然,既然已經(jīng)在智能終端領(lǐng)域只手遮天,下一步就必然是利潤更豐富、前景更好的數(shù)據(jù)中心領(lǐng)域了。
在2011至2013年,以高通、Calxeda、SeaMicro為首的ARM陣營曾向數(shù)據(jù)中心領(lǐng)域發(fā)起了一輪聲勢浩大的進(jìn)攻。希望憑借更好的能效、海量的核心數(shù)量來在云化數(shù)據(jù)中心領(lǐng)域攫取一塊市場。不過面對強(qiáng)大的Intel以及相對貧弱應(yīng)用和生態(tài)系統(tǒng),當(dāng)初信心滿滿的各路ARM英豪最終也都偃旗息鼓。高通數(shù)據(jù)中心業(yè)務(wù)被邊緣化,甚少有新消息傳出,SeaMicro被AMD收購,Calxeda耗盡現(xiàn)金流倒地而亡……
雖然第一批ARM數(shù)據(jù)中心方案的探索者沒有成功,但ARM并沒有放棄自己對數(shù)據(jù)中心市場的野心。被迫退回原有市場的ARM做了兩手準(zhǔn)備,并在5年之后重新殺向數(shù)據(jù)中心市場。
發(fā)力HPC領(lǐng)域
2011年,日本超算Kyo在人類歷史上首次實(shí)現(xiàn)了10petaflops(億億次)的計(jì)算性能。從Kyo開始,人類也就開始了向E級(jí)計(jì)算(百億億次)挑戰(zhàn)的征程。根據(jù)全球各大超算強(qiáng)國公布的下一代E級(jí)超算時(shí)間表來看,美國、中國、日本和歐盟的對應(yīng)產(chǎn)品都將在2020-2023年之間完成組裝和調(diào)試。而除了性能之外,各國對E級(jí)超算的核心需求除了性能之外就是自主可控了。
富士通A64fx處理器
由于沒有自己的專屬處理器架構(gòu)(Intel、AMD及IBM同為美國公司,他們掌握核心專利的x86、POWER架構(gòu)可以理解為美國的專屬產(chǎn)品),中國、日本及歐盟無一例外的將目光投向了更加開放的ARM架構(gòu)。其中,中國的天河3號(hào)將采用飛騰公司研發(fā)的FT2000 Plus 64核ARM芯片(中國另有一套曙光公司的神威E級(jí)方案,處理器采用SW26010,屬于RISC架構(gòu));日本的后京(Post Kyo或Post K)將采用富士通的A64fx ARM架構(gòu)64核心處理器;而歐盟的E級(jí)超算雖還沒有明確具體架構(gòu),但預(yù)計(jì)會(huì)在CPU方面采用ARM架構(gòu)、在加速卡方面采用RISC-V開源指令集。
飛騰公司FT-2000 Plus核心架構(gòu)
巨頭們的選擇雖然有些無奈,但在RISC-V、Open SPARC等開源架構(gòu)中,ARM仍舊是平臺(tái)生態(tài)最好、產(chǎn)品最完善的一種(ARM并非開源,但其授權(quán)模式卻相對開放;而且ARM是英國公司,并被軟銀控股,很難收到國際政治關(guān)系和格局影響)。
另一方面,ARM公司在ARM v8.2A架構(gòu)中加入的SVE(Scalable Vector Extension)技術(shù)也能夠在很大程度上提升對應(yīng)的ARM處理器在大規(guī)模互聯(lián)場景中的性能表現(xiàn),使其更適合應(yīng)用在HPC這種大規(guī)模集群之上。
至此,在象征計(jì)算技術(shù)最前沿的E級(jí)超算領(lǐng)域,ARM架構(gòu)基本占領(lǐng)了五分之三的份額,實(shí)現(xiàn)了對數(shù)據(jù)中心市場的躍鼎打擊。
云化數(shù)據(jù)中心里的ARM
雖然E級(jí)超算對ARM架構(gòu)青睞有加,但這顯然不能給ARM公司貢獻(xiàn)多少有意義的營收。ARM的真正發(fā)力點(diǎn)仍需要放在商用數(shù)據(jù)中心市場上。
而隨著主流Linux系統(tǒng)對ARM處理器支持的越來越好,以Marvell公司ThunderX處理器為代表的ARM陣營也開始了向商用數(shù)據(jù)中心領(lǐng)域的再一次進(jìn)發(fā)。
在大型數(shù)據(jù)中心紛紛完成云化之后,下一步的發(fā)展方向便是容器化及其背后對應(yīng)的serverless模式。在強(qiáng)大的Kubernetes加持下,以往復(fù)雜而臃腫的應(yīng)用和服務(wù)可以被更加輕量化、擴(kuò)展和迭代更方便的微服務(wù)模式所取代。而對于數(shù)據(jù)中心來說,這種更加碎片化的應(yīng)用交付和部署模式顯然可以進(jìn)一步提升硬件的利用率,并進(jìn)一步降低云的成本。
Cavium ThunderX2處理器
(Cavium雇傭了前博通工程師并購買了博通vulcan IP——博通公司的ARM處理器項(xiàng)目,最終被Marvell以60億美元收購)
這種碎片化的應(yīng)用或計(jì)算在很多情況下并不會(huì)產(chǎn)生太高的計(jì)算需求,如果仍以龐大的x86 CPU核心或vCPU來運(yùn)行的話顯然會(huì)產(chǎn)生一定程度的浪費(fèi)。而以ThunderX CN9980 2.5GHz處理器為例,1790美元售價(jià)將包含32個(gè)核心、128線程以及56個(gè)PCIe 3.0通道和8個(gè)DDR4內(nèi)存通道以及高達(dá)2TB的內(nèi)存支持;功耗也只是180W。另一方面,ThunderX處理器內(nèi)部還集成了一個(gè)高性能25Gbps網(wǎng)絡(luò)控制器,相當(dāng)于為服務(wù)器提供了一個(gè)廉價(jià)的高性能網(wǎng)絡(luò)集成方案。
華為鯤鵬920處理器規(guī)格(在不同場合中也可稱為Hi1620)圖片源自mobilemagazinehk
除了Marvell的ThunderX2之外,華為也推出了自己的鯤鵬920處理器及對應(yīng)的泰山服務(wù)器產(chǎn)品。相對于ThunderX2,鯤鵬920直接采用了更先進(jìn)的7nm工藝和ARM v8.2架構(gòu),并在180W的TDP之下提供了64個(gè)運(yùn)行于2.6GHz頻率的核心、8個(gè)DDR4內(nèi)存通道和40個(gè)lane的PCIe 4.0連接。當(dāng)然,華為也發(fā)揮了自身在網(wǎng)絡(luò)技術(shù)方面的優(yōu)勢,為鯤鵬920內(nèi)置了一個(gè)100Gb的RoCE控制器。
目前,AWS已經(jīng)批量部署了自己的基于ThunderX2方案的ARMbased服務(wù)器,并開始對外提供服務(wù)。而各家ARMbased服務(wù)器產(chǎn)品也大多瞄準(zhǔn)云計(jì)算、分布式存儲(chǔ)等數(shù)據(jù)中心的核心應(yīng)用場景以及一些原生Android服務(wù)的新領(lǐng)域。
ARM在數(shù)據(jù)中心市場能成功嗎?
與第一次沖擊不同,此次在助推ARM向數(shù)據(jù)中心市場前進(jìn)的廠商包括了Marvell和華為等資深企業(yè)級(jí)廠商。他們均在數(shù)據(jù)中心市場中擁有廣泛的合作生態(tài)和豐富的商業(yè)經(jīng)驗(yàn),這無疑會(huì)給ARM在數(shù)據(jù)中心市場中的發(fā)展提供強(qiáng)大的支持。
雖然現(xiàn)在來給ARM在數(shù)據(jù)中心市場上的表現(xiàn)定結(jié)論還太早,但在吸取了第一次的教訓(xùn)并獲得了強(qiáng)大的支持后,ARM未來的數(shù)據(jù)中心之路顯然會(huì)走的更好、更遠(yuǎn)。