計算思維的提出,最早可以追溯到1996年麻省理工學(xué)院的Seymour Papert教授,而真正將之推到前臺,并且自此備受業(yè)界關(guān)注的,則是卡內(nèi)基梅隆大學(xué)的周以真教授,她對計算思維做出了嚴(yán)謹縝密的定義。
即:計算思維(Computational Thinking)是運用計算機科學(xué)的基礎(chǔ)概念進行問題求解、系統(tǒng)設(shè)計以及人類行為理解等,涵蓋了計算機科學(xué)之廣度的一系列思維活動。
人類當(dāng)前面臨的計算場景,主要集中在大數(shù)據(jù)、分布式存儲、數(shù)據(jù)庫、人工智能等應(yīng)用領(lǐng)域。不難想象,只要擁有足夠強大的算力,困擾人類的諸多難題終將得到破解。
我們知道,至少目前在這個星球上,超算仍是各種IT技術(shù)的集大成者,意味著人類計算的最強戰(zhàn)力。
多元化的計算時代
對于超算產(chǎn)業(yè)來說,2018年的全球HPC TOP 500榜單(上下半年各發(fā)布了一次),尤其值得玩味。
中美在超算領(lǐng)域的比拼已經(jīng)持續(xù)多年,雖然美國借Summit的威力重新回到榜首,但是中國廠商卻以多出一倍的成績(229套vs109套),占據(jù)了近乎半壁江山的榜單,顯示出中國超算的無盡動能與潛力。
除去這些不說,假如細心或是耐心的話,將排行榜拉到204位,我們會看到一臺名為Astra的超算系統(tǒng),它的Linpack排名為1.5 petaflops,距離榜單的頭部玩家們?nèi)杂幸欢ú罹?,不過它的不同在于,這是世界上第一臺由Arm微處理器驅(qū)動的petascale超級計算機。
在人們的傳統(tǒng)記憶中,ARM主要是駐扎在手機或是移動設(shè)備上面。不過最近幾年,ARM已經(jīng)開始向筆記本電腦,乃至服務(wù)器處理器的方向發(fā)力,因此最終走向高性能計算也必然是板上釘釘,只不過我們沒有想到它的入局如此之快。
星星之火,尚可以燎原,更何況在今年1月的中國南方城市深圳,華為重磅推出了一款自主研發(fā)設(shè)計的、基于ARM架構(gòu)的鯤鵬920芯片,具備業(yè)界頂尖的7nm制程、最高64內(nèi)核,并集成8通道DDR4和100G RoCE以太網(wǎng)卡……
這款目前業(yè)界最高性能的ARM架構(gòu)處理器,它的指向不言而喻。
在4月26日杭州舉行的華為智能計算大會上,面向大數(shù)據(jù)、分布式存儲、ARM原生、高性能計算和數(shù)據(jù)庫等應(yīng)用領(lǐng)域,華為發(fā)布了TaiShan服務(wù)器(基于鯤鵬920芯片)的五大解決方案,為客戶帶來新一輪的算力加持。
華為中國智能計算業(yè)務(wù)部總裁萬志表示,應(yīng)用場景的多樣性帶來數(shù)據(jù)的多樣性,沒有一個單一的計算架構(gòu)能夠滿足所有場景、所有數(shù)據(jù)類型的處理。多種計算架構(gòu)并存是未來計算的發(fā)展之路。華為在計算芯片領(lǐng)域15年持續(xù)研發(fā)投入,構(gòu)筑了華為智能計算的核心價值。
華為并非是自說自話,世界正在迎來一個以數(shù)據(jù)為中心、更加多元化的計算時代。在今年3月的一次媒體活動中,英特爾相關(guān)高管也坦稱,“任何單一的因素,都不足以滿足多元化的計算需求?!?/p>
智能計算,用“芯”之作
此前多年,ARM處理器一直致力于成為云數(shù)據(jù)中心,乃至關(guān)系到國計民生的高性能計算的重要組成部分。然而一直步履闌珊,表現(xiàn)也不盡如人意。
我們知道,ARM處理器的特點是低功耗和低成本,這種顯而易見的特性使得它贏得了手機以及各種手持和輕便設(shè)備的青睞,畢竟這些產(chǎn)品的應(yīng)用對算力的需求并不是非常迫切。
然而高性能計算則不同,從起初被主要用于密碼學(xué)、氣象學(xué),到后來延伸至金融、勘探、海洋、核能、電子商務(wù)、交通、人工智能、工業(yè)制造等領(lǐng)域,無一例外均是“重計算”的應(yīng)用領(lǐng)域。
由于ARM處理器過多考慮功耗的層面,早年間無法在效能表現(xiàn)上滿足應(yīng)用場景的極致計算需求,因此在市場上總是叫好不叫座。顯然,ARM處理器必須在功耗和效能之間,取得更高的平衡,方能打開局面,開啟新的時代。
華為智能計算TaiShan&Atlas領(lǐng)域總裁張熙偉表示,作為華為智能計算的最用“芯”之作,TaiShan ARM服務(wù)器是是華為在芯片和計算領(lǐng)域長期投資和技術(shù)積累的結(jié)晶,將為客戶提供最佳的計算體驗,將高效能計算帶入每一個數(shù)據(jù)中心。
我們知道,ARM架構(gòu)采用RISC精簡指令集,因此有著更高的指令效率,CPU的體積更小,而且繼承了ARM處理器的“節(jié)能”基因,加之華為業(yè)界領(lǐng)先的板級液冷和機柜級全液冷等方案,TaiShan服務(wù)器可以將數(shù)據(jù)中心的PUE降低至1.05。
當(dāng)前全球數(shù)據(jù)中心的耗能已經(jīng)占據(jù)世界用電總量的3%,華為鯤鵬920的推出,勢必會得到更多客戶的采納。與此同時,由于采用“眾核”架構(gòu),因此華為鯤鵬920可以做到最高64個物理CPU核,尤其適合大規(guī)模并行的計算場景。
基于以上,我們不難得出結(jié)論,華為鯤鵬920具有更好的性能功耗比,完全可以滿足客戶在高性能計算的需求。
華為為高性能計算提供的解決方案,是TaiShan X6000高密型服務(wù)器,能夠在一個機柜里提供高達10240核的高密部署,而且支持液冷散熱技術(shù),適合大型數(shù)據(jù)中心和超算中心部署,是構(gòu)建綠色數(shù)據(jù)中心的首選機型。
ARM HPC應(yīng)用生態(tài)日趨完善
據(jù)悉,在高性能計算領(lǐng)域,經(jīng)過兩年的努力,華為已經(jīng)為TaiShan服務(wù)器構(gòu)建了完備的ARM HPC軟件棧,能夠幫助客戶快速部署高性能計算應(yīng)用環(huán)境,統(tǒng)一進行TaiShan HPC集群的高效管理,攜手合作伙伴化解了商業(yè)、醫(yī)療、科學(xué)等領(lǐng)域最為艱巨的挑戰(zhàn)。
以制造仿真、氣象預(yù)測和基因測序等典型的高性能計算應(yīng)用為例,它們無一例外均需要計算節(jié)點具有較大的內(nèi)存帶寬能力?;邛H鵬處理器業(yè)界領(lǐng)先的8通道內(nèi)存技術(shù),TaiShan服務(wù)器能夠提供高出業(yè)界33%的系統(tǒng)內(nèi)存帶寬,進而發(fā)揮TaiShan多核、高并發(fā)的算力優(yōu)勢。
事實上,幾乎所有的高性能計算應(yīng)用均對高算力和高內(nèi)存帶寬,有著非常突出的要求。算力越強、內(nèi)存帶寬越大,處理和分析數(shù)據(jù)的能力也就越強,才能更好地支撐各個領(lǐng)域的數(shù)據(jù)運營與智能運行——這本就是計算的本質(zhì)。
華為TaiShan ARM服務(wù)器支持常見的NFS、Lustre、BeeGFS文件系統(tǒng),其計算節(jié)點上使用的存儲客戶端和X86節(jié)點的存儲客戶端是完全兼容的,可以無縫接入到現(xiàn)有HPC集群中,能夠為用戶帶來調(diào)度管理、存儲共享等層面的上佳體驗。
與此同時,TaiShan ARM服務(wù)器上運行業(yè)界廣泛使用的Redhat、SUSE、CentOS等操作系統(tǒng),都是標(biāo)準(zhǔn)發(fā)布的版本,而不是所謂的專用版,用戶登陸服務(wù)器之后所使用的命令和操作,都和x86上一般無二,這就極大地降低了用戶的上手難度和應(yīng)用成本。
此外,涉及到高性能計算的基礎(chǔ)軟件,如編譯器、MPI、調(diào)試器、函數(shù)庫等,經(jīng)過業(yè)界多年的努力,實際上已經(jīng)做得很好,均可以在TaiShan ARM服務(wù)器上完美運行,華為也將提供對客戶的全方位支持。
至于ARM HPC的生態(tài),當(dāng)前來看也已經(jīng)不再是桎梏高性能計算的主要因素之一。目前各種開源或自有源碼的應(yīng)用,絕大多數(shù)是高級語言編寫,從過去兩年華為與ARM公司的測試來看,這些應(yīng)用非常容易遷移到ARM平臺上。
商業(yè)軟件的遷移也不是技術(shù)問題,更多取決于各個公司的商業(yè)策略。通過與更多芯片、服務(wù)器以及ISV的合作,華為期望推動各類商業(yè)軟件向ARM平臺的移植,致力于建設(shè)一個合作共贏、日新月異的生態(tài)環(huán)境。
“芯開始,讓智能計算無所不及?!盩aiShan ARM服務(wù)器的洪荒之力,奮袂而起。