計(jì)算思維的提出,最早可以追溯到1996年麻省理工學(xué)院的Seymour Papert教授,而真正將之推到前臺(tái),并且自此備受業(yè)界關(guān)注的,則是卡內(nèi)基梅隆大學(xué)的周以真教授,她對(duì)計(jì)算思維做出了嚴(yán)謹(jǐn)縝密的定義。
即:計(jì)算思維(Computational Thinking)是運(yùn)用計(jì)算機(jī)科學(xué)的基礎(chǔ)概念進(jìn)行問(wèn)題求解、系統(tǒng)設(shè)計(jì)以及人類行為理解等,涵蓋了計(jì)算機(jī)科學(xué)之廣度的一系列思維活動(dòng)。
人類當(dāng)前面臨的計(jì)算場(chǎng)景,主要集中在大數(shù)據(jù)、分布式存儲(chǔ)、數(shù)據(jù)庫(kù)、人工智能等應(yīng)用領(lǐng)域。不難想象,只要擁有足夠強(qiáng)大的算力,困擾人類的諸多難題終將得到破解。
我們知道,至少目前在這個(gè)星球上,超算仍是各種IT技術(shù)的集大成者,意味著人類計(jì)算的最強(qiáng)戰(zhàn)力。
多元化的計(jì)算時(shí)代
對(duì)于超算產(chǎn)業(yè)來(lái)說(shuō),2018年的全球HPC TOP 500榜單(上下半年各發(fā)布了一次),尤其值得玩味。
中美在超算領(lǐng)域的比拼已經(jīng)持續(xù)多年,雖然美國(guó)借Summit的威力重新回到榜首,但是中國(guó)廠商卻以多出一倍的成績(jī)(229套vs109套),占據(jù)了近乎半壁江山的榜單,顯示出中國(guó)超算的無(wú)盡動(dòng)能與潛力。
除去這些不說(shuō),假如細(xì)心或是耐心的話,將排行榜拉到204位,我們會(huì)看到一臺(tái)名為Astra的超算系統(tǒng),它的Linpack排名為1.5 petaflops,距離榜單的頭部玩家們?nèi)杂幸欢ú罹?,不過(guò)它的不同在于,這是世界上第一臺(tái)由Arm微處理器驅(qū)動(dòng)的petascale超級(jí)計(jì)算機(jī)。
在人們的傳統(tǒng)記憶中,ARM主要是駐扎在手機(jī)或是移動(dòng)設(shè)備上面。不過(guò)最近幾年,ARM已經(jīng)開(kāi)始向筆記本電腦,乃至服務(wù)器處理器的方向發(fā)力,因此最終走向高性能計(jì)算也必然是板上釘釘,只不過(guò)我們沒(méi)有想到它的入局如此之快。
星星之火,尚可以燎原,更何況在今年1月的中國(guó)南方城市深圳,華為重磅推出了一款自主研發(fā)設(shè)計(jì)的、基于ARM架構(gòu)的鯤鵬920芯片,具備業(yè)界頂尖的7nm制程、最高64內(nèi)核,并集成8通道DDR4和100G RoCE以太網(wǎng)卡……
這款目前業(yè)界最高性能的ARM架構(gòu)處理器,它的指向不言而喻。
在4月26日杭州舉行的華為智能計(jì)算大會(huì)上,面向大數(shù)據(jù)、分布式存儲(chǔ)、ARM原生、高性能計(jì)算和數(shù)據(jù)庫(kù)等應(yīng)用領(lǐng)域,華為發(fā)布了TaiShan服務(wù)器(基于鯤鵬920芯片)的五大解決方案,為客戶帶來(lái)新一輪的算力加持。
華為中國(guó)智能計(jì)算業(yè)務(wù)部總裁萬(wàn)志表示,應(yīng)用場(chǎng)景的多樣性帶來(lái)數(shù)據(jù)的多樣性,沒(méi)有一個(gè)單一的計(jì)算架構(gòu)能夠滿足所有場(chǎng)景、所有數(shù)據(jù)類型的處理。多種計(jì)算架構(gòu)并存是未來(lái)計(jì)算的發(fā)展之路。華為在計(jì)算芯片領(lǐng)域15年持續(xù)研發(fā)投入,構(gòu)筑了華為智能計(jì)算的核心價(jià)值。
華為并非是自說(shuō)自話,世界正在迎來(lái)一個(gè)以數(shù)據(jù)為中心、更加多元化的計(jì)算時(shí)代。在今年3月的一次媒體活動(dòng)中,英特爾相關(guān)高管也坦稱,“任何單一的因素,都不足以滿足多元化的計(jì)算需求?!?/p>
智能計(jì)算,用“芯”之作
此前多年,ARM處理器一直致力于成為云數(shù)據(jù)中心,乃至關(guān)系到國(guó)計(jì)民生的高性能計(jì)算的重要組成部分。然而一直步履闌珊,表現(xiàn)也不盡如人意。
我們知道,ARM處理器的特點(diǎn)是低功耗和低成本,這種顯而易見(jiàn)的特性使得它贏得了手機(jī)以及各種手持和輕便設(shè)備的青睞,畢竟這些產(chǎn)品的應(yīng)用對(duì)算力的需求并不是非常迫切。
然而高性能計(jì)算則不同,從起初被主要用于密碼學(xué)、氣象學(xué),到后來(lái)延伸至金融、勘探、海洋、核能、電子商務(wù)、交通、人工智能、工業(yè)制造等領(lǐng)域,無(wú)一例外均是“重計(jì)算”的應(yīng)用領(lǐng)域。
由于ARM處理器過(guò)多考慮功耗的層面,早年間無(wú)法在效能表現(xiàn)上滿足應(yīng)用場(chǎng)景的極致計(jì)算需求,因此在市場(chǎng)上總是叫好不叫座。顯然,ARM處理器必須在功耗和效能之間,取得更高的平衡,方能打開(kāi)局面,開(kāi)啟新的時(shí)代。
華為智能計(jì)算TaiShan&Atlas領(lǐng)域總裁張熙偉表示,作為華為智能計(jì)算的最用“芯”之作,TaiShan ARM服務(wù)器是是華為在芯片和計(jì)算領(lǐng)域長(zhǎng)期投資和技術(shù)積累的結(jié)晶,將為客戶提供最佳的計(jì)算體驗(yàn),將高效能計(jì)算帶入每一個(gè)數(shù)據(jù)中心。
我們知道,ARM架構(gòu)采用RISC精簡(jiǎn)指令集,因此有著更高的指令效率,CPU的體積更小,而且繼承了ARM處理器的“節(jié)能”基因,加之華為業(yè)界領(lǐng)先的板級(jí)液冷和機(jī)柜級(jí)全液冷等方案,TaiShan服務(wù)器可以將數(shù)據(jù)中心的PUE降低至1.05。
當(dāng)前全球數(shù)據(jù)中心的耗能已經(jīng)占據(jù)世界用電總量的3%,華為鯤鵬920的推出,勢(shì)必會(huì)得到更多客戶的采納。與此同時(shí),由于采用“眾核”架構(gòu),因此華為鯤鵬920可以做到最高64個(gè)物理CPU核,尤其適合大規(guī)模并行的計(jì)算場(chǎng)景。
基于以上,我們不難得出結(jié)論,華為鯤鵬920具有更好的性能功耗比,完全可以滿足客戶在高性能計(jì)算的需求。
華為為高性能計(jì)算提供的解決方案,是TaiShan X6000高密型服務(wù)器,能夠在一個(gè)機(jī)柜里提供高達(dá)10240核的高密部署,而且支持液冷散熱技術(shù),適合大型數(shù)據(jù)中心和超算中心部署,是構(gòu)建綠色數(shù)據(jù)中心的首選機(jī)型。
ARM HPC應(yīng)用生態(tài)日趨完善
據(jù)悉,在高性能計(jì)算領(lǐng)域,經(jīng)過(guò)兩年的努力,華為已經(jīng)為TaiShan服務(wù)器構(gòu)建了完備的ARM HPC軟件棧,能夠幫助客戶快速部署高性能計(jì)算應(yīng)用環(huán)境,統(tǒng)一進(jìn)行TaiShan HPC集群的高效管理,攜手合作伙伴化解了商業(yè)、醫(yī)療、科學(xué)等領(lǐng)域最為艱巨的挑戰(zhàn)。
以制造仿真、氣象預(yù)測(cè)和基因測(cè)序等典型的高性能計(jì)算應(yīng)用為例,它們無(wú)一例外均需要計(jì)算節(jié)點(diǎn)具有較大的內(nèi)存帶寬能力?;邛H鵬處理器業(yè)界領(lǐng)先的8通道內(nèi)存技術(shù),TaiShan服務(wù)器能夠提供高出業(yè)界33%的系統(tǒng)內(nèi)存帶寬,進(jìn)而發(fā)揮TaiShan多核、高并發(fā)的算力優(yōu)勢(shì)。
事實(shí)上,幾乎所有的高性能計(jì)算應(yīng)用均對(duì)高算力和高內(nèi)存帶寬,有著非常突出的要求。算力越強(qiáng)、內(nèi)存帶寬越大,處理和分析數(shù)據(jù)的能力也就越強(qiáng),才能更好地支撐各個(gè)領(lǐng)域的數(shù)據(jù)運(yùn)營(yíng)與智能運(yùn)行——這本就是計(jì)算的本質(zhì)。
華為TaiShan ARM服務(wù)器支持常見(jiàn)的NFS、Lustre、BeeGFS文件系統(tǒng),其計(jì)算節(jié)點(diǎn)上使用的存儲(chǔ)客戶端和X86節(jié)點(diǎn)的存儲(chǔ)客戶端是完全兼容的,可以無(wú)縫接入到現(xiàn)有HPC集群中,能夠?yàn)橛脩魩?lái)調(diào)度管理、存儲(chǔ)共享等層面的上佳體驗(yàn)。
與此同時(shí),TaiShan ARM服務(wù)器上運(yùn)行業(yè)界廣泛使用的Redhat、SUSE、CentOS等操作系統(tǒng),都是標(biāo)準(zhǔn)發(fā)布的版本,而不是所謂的專用版,用戶登陸服務(wù)器之后所使用的命令和操作,都和x86上一般無(wú)二,這就極大地降低了用戶的上手難度和應(yīng)用成本。
此外,涉及到高性能計(jì)算的基礎(chǔ)軟件,如編譯器、MPI、調(diào)試器、函數(shù)庫(kù)等,經(jīng)過(guò)業(yè)界多年的努力,實(shí)際上已經(jīng)做得很好,均可以在TaiShan ARM服務(wù)器上完美運(yùn)行,華為也將提供對(duì)客戶的全方位支持。
至于ARM HPC的生態(tài),當(dāng)前來(lái)看也已經(jīng)不再是桎梏高性能計(jì)算的主要因素之一。目前各種開(kāi)源或自有源碼的應(yīng)用,絕大多數(shù)是高級(jí)語(yǔ)言編寫(xiě),從過(guò)去兩年華為與ARM公司的測(cè)試來(lái)看,這些應(yīng)用非常容易遷移到ARM平臺(tái)上。
商業(yè)軟件的遷移也不是技術(shù)問(wèn)題,更多取決于各個(gè)公司的商業(yè)策略。通過(guò)與更多芯片、服務(wù)器以及ISV的合作,華為期望推動(dòng)各類商業(yè)軟件向ARM平臺(tái)的移植,致力于建設(shè)一個(gè)合作共贏、日新月異的生態(tài)環(huán)境。
“芯開(kāi)始,讓智能計(jì)算無(wú)所不及?!盩aiShan ARM服務(wù)器的洪荒之力,奮袂而起。