在昨日舉行的ISC 2019國際超算大會上,全球超算500強(qiáng)出爐,中國超算失榜首但在數(shù)量上以219臺蟬聯(lián)第一,遠(yuǎn)超過美國116臺,而美國Summit以20億億次運(yùn)算速度暫奪世界超級計算機(jī)領(lǐng)域的頭把交椅,據(jù)悉,這臺超級計算機(jī)搭載的近28000塊NVIDIA GPU提供了95%的計算力。
現(xiàn)如今,超級計算機(jī)領(lǐng)域已開始向百萬兆級計算規(guī)模進(jìn)擊。美國目前在建的Aurora及Frontier中包括加速器等主要硬件分別由Intel及AMD提供。NVIDIA也不甘缺席,在本屆超算大會上宣布,將利用其芯片與Arm的處理器打造超級計算機(jī),進(jìn)一步推動英偉達(dá)開發(fā)用于氣候變化預(yù)測和核武器建模的系統(tǒng)。NVIDIA支持Arm CPU,或為高性能計算行業(yè)構(gòu)建節(jié)能、支持AI的百萬兆級超算開辟全新途徑。
Arm具備足夠?qū)嵙M(jìn)擊Exascale超算領(lǐng)域
英國Arm公司是全球領(lǐng)先的半導(dǎo)體知識產(chǎn)權(quán)(IP)供應(yīng)商, 于2016年被日本軟銀集團(tuán)(SoftBank)以234億英鎊(約合310億美元)高價收購,該公司為大多數(shù)手機(jī)芯片提供底層處理器技術(shù)。
但Arm處理器與英特爾或IBM芯片的不同之處在于,Arm本身并不制造芯片。相反,它將底層技術(shù)授權(quán)出去,這樣其他人就可以自主制造芯片。華為、蘋果、三星、高通、飛利浦等各大芯片廠商們都從Arm那里購買授權(quán),全球超90%的智能設(shè)備均采用Arm架構(gòu),包括手機(jī)、平板、手表、電視、無人機(jī)等。
在超大規(guī)模數(shù)據(jù)中心和高性能計算的服務(wù)器市場,英特爾x86處理器長期占據(jù)主導(dǎo)地位, 隨著Arm處理器的崛起,傳統(tǒng)x86 CPU市場面臨著巨大的威脅。
經(jīng)過多年發(fā)展,很多面向高性能計算的應(yīng)用及AI框架也支持了Arm指令集架構(gòu),同時目前Arm內(nèi)核的性能也大幅提高。和其他架構(gòu)相比,Arm的一大特色在于出色的能效,它能夠為超級計算機(jī)提供開放式架構(gòu),因此用戶可以添加各種有益于超級計算的技術(shù),例如緊密集成。
一直以來,Arm都在尋求機(jī)會將其處理器擴(kuò)展至高性能計算領(lǐng)域。2016年8月宣布將與日本富士通公司合作,開發(fā)一個以64位ARMv8-A驅(qū)動的Post K超級計算機(jī);同年12月宣布收購Allinea Software公司,后者主要為超級計算機(jī)提供性能分析工具;2018年6月,美國能源部下屬的桑迪亞國家實驗室宣布建造基于Arm處理器的超算Astra,并于同年11月現(xiàn)身TOP500列表;于此同時,Cray在英國氣象局交付了一臺基于Arm的超級計算機(jī)Isambard;而且日本的下一代超級計算機(jī)Post-K也同樣基于Arm架構(gòu)。
就美國超級計算機(jī)Astra為什么選擇Arm,制造方惠普稱“Arm服務(wù)器在功耗方面更加經(jīng)濟(jì),可以打包的更加緊密,且惠普青睞該平臺的內(nèi)存性能。”
而且如中國的飛騰等公司已經(jīng)使用ARMv8指令集設(shè)計出了FT-2000+/64處理器,Arm加入Exascale超算領(lǐng)域其實力已然足夠。
據(jù)悉,全球眾多涉及超級計算的項目或單位都在尋求Arm的加入,包括歐洲處理器計劃(European Processor Initiative)、日本先進(jìn)情報項目中心 (RIKEN)、美國能源部的先鋒項目(DOE Vanguard project)等。
NVIDIA將支持Arm CPU打造超級計算機(jī)
長期以來,NVIDIA始終以為PC提供圖形芯片而聞名,以使視頻游戲看起來更逼真。近些年來NVIDIA在AI新興領(lǐng)域投入巨大,其CUDA加速計算實力不可小覷,因而日益成長為數(shù)據(jù)中心市場的佼佼者。
NVIDIA的CUDA GPU芯片被用于與英特爾、IBM等公司的中央處理器(CPU)協(xié)同工作,完成大規(guī)模并行計算的加速任務(wù)。昨日發(fā)布的Green500排行榜,在全球最節(jié)能的25款超級計算機(jī)中,有22款都得益于NVIDIA的支持。
而實現(xiàn)這些的關(guān)鍵因素在于:采用NVIDIAGPU的超級計算機(jī)能夠?qū)⒎敝氐奶幚碜鳂I(yè)卸載至更為節(jié)能的并行處理CUDA GPU之上;NVIDIA與Mellanox合作優(yōu)化整體超級計算集群的處理;以及NVIDIA發(fā)明的SXM3D封裝和可實現(xiàn)極密集型擴(kuò)展節(jié)點的NVIDIA NVLink互連技術(shù)。
據(jù)了解,NVIDIA與Arm有10年的合作基礎(chǔ),此前,NVIDIA幾款用于便攜式游戲、自動駕駛汽車、機(jī)器人和嵌入式AI計算的系統(tǒng)級芯片產(chǎn)品都采用了Arm。對于此次雙方推進(jìn)在在超算領(lǐng)域的合作,NVIDIA解決方案架構(gòu)與工程團(tuán)隊副總裁Marc Hamilton表示,NVIDIA和Arm已為這個計劃準(zhǔn)備了兩年左右,現(xiàn)在是最佳的發(fā)布時機(jī)。
盡管英偉達(dá)加速計算部門副總裁伊恩·巴克(Ian Buck)表示,從技術(shù)角度看,建造配有Arm處理器的超級計算機(jī)將是一個“嚴(yán)峻的考驗”。但他坦言,英偉達(dá)之所以這么做,是因為歐洲和日本的研究人員希望利用Arm的技術(shù)開發(fā)超級計算芯片,這實際上為他們提供了超越IBM和英特爾的第三種選擇,他們可以在這方面擁有更多控制權(quán)。
談及Arm的技術(shù)時,巴克表示,“這種開放性使得Arm的技術(shù)非常有吸引力,它能夠為超級計算提供一個開放式架構(gòu),這也是我們宣布支持Arm的原因。”
據(jù)悉,NVIDIA將于今年年底前向Arm生態(tài)系統(tǒng)提供全堆棧的AI、HPC軟件,該堆棧為600多個HPC應(yīng)用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟件開發(fā)工具,比如支持OpenACC的PGI編譯器和性能分析器。
堆棧優(yōu)化完成后,NVIDIA將為所有主要CPU架構(gòu)提供加速,至此,NVIDIA將完成了在x86、POWER(OpenPower)及Arm多種處理器指令集體系結(jié)構(gòu)上構(gòu)建超算。對于Arm而言,通過將NVIDIA軟件棧引入Arm生態(tài)系統(tǒng),將進(jìn)一步助推其在HPC服務(wù)器市場的創(chuàng)新。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“NVIDIA CUDA加速的計算和Arm的高能效CPU架構(gòu)的相結(jié)合,將助力HPC社區(qū)實現(xiàn)大幅提升,以達(dá)到百萬兆級?!?/p>
對于NVIDIA CUDA架構(gòu)向Arm的開放,超級計算中心、系統(tǒng)提供商和系統(tǒng)級芯片制造商,包括Ampere Computing、Cray、CSC、EPI、HPE、Julich、Marvell、Mellanox、日本物理化學(xué)研究所計算科學(xué)研究中心等,均認(rèn)為該舉有利于解決HPC行業(yè)日益不可持續(xù)的功耗水平問題。
作為促進(jìn)科學(xué)發(fā)現(xiàn)的重要工具,超級計算機(jī)已挺進(jìn)“百萬兆級”。在這個賽道上,如今又迎來了一位新的重量級選手。NVIDIA 能否將 CUDA和Arm的軟件生態(tài)無縫銜接, 為高性能計算行業(yè)構(gòu)建節(jié)能、支持AI的百萬兆級超算開辟全新途徑,值得觀望。