2013年,中國憑借“天河二號(TH-2)”超級計算機成功擊敗美國的“泰坦(Titan,由Cray——美國著名超級計算機制造商于美國橡樹嶺國家實驗室研造)”,成為世界上運算速度最快的超級計算機。隨后,中國乘勝追擊,于2016年憑借“神威·太湖之光(Sunway Taihu Light)”超級計算機以近兩倍于“天河二號”的運算速率與三倍于其的運行效率,坐穩(wěn)了超級計算機領(lǐng)域的頭把交椅。至今,我國包攬了世界頂級超級計算機榜單的前兩位。
今年年初,中國趁熱打鐵,想要率先完成世界第一臺運算速率為“百億億級”的超級計算機的研造。面對中國的威脅,美國能源部向惠普企業(yè)(Hewlett Packard Enterprise,簡稱HPE,2013年于美國惠普公司“HP Inc.”中分離出來,著力發(fā)展云計算解決方案)進行研究撥款,命其根據(jù)The Machine項目現(xiàn)有的技術(shù)來制訂百億億級超級計算機的參考設(shè)計方案。
這個The Machine項目是什么呢?它是由惠普企業(yè)在2014年開啟的一個旨在“徹底改造基礎(chǔ)計算結(jié)構(gòu)”的一個科研項目。然而該項目喜憂參半,以至于惠普企業(yè)后來并不打算將The Machine完整推向市場,而是將其精粹與革新部分融合到其他惠普企業(yè)的商業(yè)服務(wù)器和技術(shù)當(dāng)中。
(The Machine設(shè)備一角)
回到正題??v觀歷史,我們不難發(fā)現(xiàn)世界上絕大多數(shù)的頂級超級計算機都是由美國能源部掌握并操控的。但近年來,中國開始以疾風(fēng)驟雨之勢占據(jù)這份榜單。中國的頂級超級計算機“神威·太湖之光”的最佳性能(每秒93千萬億次浮點運算,peta flops:peta,10的15次方,表千萬億次;flops,每秒浮點運算次數(shù))是美國第一超級計算機“泰坦”運算速率(每秒18千萬億次浮點運算)的五倍。
美國曾“桀驁不馴”地宣稱其將于2021年左右完成世界首個百億億級(相當(dāng)于每秒1000千萬億次浮點運算速率)超級計算機的研發(fā)并將其投入使用,重新奪回美國在超級計算機領(lǐng)域的王座。但中國似要先聲奪人,今年一月份,我國超級計算機中心宣稱中國首臺百億億級超級計算機原型機將會在2017年年底研發(fā)完成,并預(yù)計在2020年之前投入使用。
(“泰坦”超級計算機)
想要從無到有地研制一臺百億億級的超級計算機,研究者們必須解決三個主要問題:一、極大的電力消耗(數(shù)十億瓦特)與極高的冷卻要求;二、計算機的構(gòu)造與連接線必須設(shè)計精巧,以保證成百上千的處理器與內(nèi)存芯片能夠有效運轉(zhuǎn);三、設(shè)計制造一組能夠真正能夠在每秒百億億次運算的狀態(tài)下仍可正常運行的操作系統(tǒng)與客戶端軟件。
要是較起真來,不解決上述三個問題也是可以架構(gòu)一個“所謂的”百億億級超級計算機的——只要把無數(shù)個CPU連接在一起,直到運算速率足夠就行了——但其實,這樣“搭建”起來的“超級計算機”是無法做到每秒進行百億億次運算的。即使可以,它每次的運行成本也都會達到令人咋舌的天文數(shù)字,對其實際應(yīng)用造成了巨大限制。
(“神威·太湖之光”超級計算機)
據(jù)外媒Ars Technica稱,中國現(xiàn)在就是在以這種“累加堆砌”的方式制造超級計算機:先在2017年把所需的硬件安在一起,然后用接下來的幾年試圖使這些硬件運轉(zhuǎn)起來。
Ars Technica同樣稱,美國國家能源局選擇了一種更為“沉著穩(wěn)健”的方式來研制超級計算機,那就是為惠普企業(yè)撥款來研發(fā)百億億級超級計算機的參考設(shè)計方案。撥款的資金來自于美國國家能源局一項名為“Path Forward(前途)”的項目,該項目是ECP項目(Exascale Computing Project,百億億級計算項目)的子項目之一。
ECP項目由當(dāng)時的奧巴馬政府組織建立,已對美國的各項針對百億億級計算機的研究項目給予了數(shù)千萬美元的資金支持?;萜掌髽I(yè)所收到的資金援助也由此可見一斑。
超算是如何架構(gòu)的?它又能做什么?
因此,惠普企業(yè)的計劃是什么?它有希望在美國國家能源局的三輪資金援助申請中過關(guān)斬將,并且在中國之前將百億億級超級計算機研制出來嗎?
惠普企業(yè)稱他們將基于一個稱為“記憶驅(qū)動計算(Memory-Driven Computing)”的架構(gòu)來研制這款百億億級超級計算機?!坝洃涷?qū)動計算”架構(gòu)就是從The Machine中導(dǎo)出的。
簡單說來,惠普企業(yè)已有一整套成型的技術(shù)使得不計其數(shù)的可尋址存儲器(其總存儲量可達4096堯字節(jié),1堯等于2的80次方,4096堯大約是全宇宙原子的數(shù)量)可被一個高速、低能耗的光互聯(lián)器件連接起來。而該光互聯(lián)器件是由一個全新的硅光子芯片驅(qū)動的。
(惠普企業(yè)的X1硅光子互聯(lián)器件)
現(xiàn)在,由此構(gòu)建的整個存儲器還極不穩(wěn)定,但假以時日——一旦惠普企業(yè)將其憶阻器技術(shù)投放市場,或者引入英特爾的3DXPoint內(nèi)存技術(shù)——該存儲器將會穩(wěn)定下來。
更重要的是,惠普企業(yè)宣稱他們已經(jīng)研發(fā)出可以真正使用如此大量存儲空間的軟件工具。該工具可以從龐大的數(shù)據(jù)集(比如:Facebook上所有人發(fā)的所有內(nèi)容;全世界網(wǎng)絡(luò)上的全部內(nèi)容;地球上所有人的健康數(shù)據(jù),等等)中推引出隱含信息和科學(xué)價值。
惠普企業(yè)CTO Mark Potter毫不質(zhì)疑地表示其公司的科技將成為拯救人類的曙光。他說道:“我們堅信記憶驅(qū)動計算是推動科技產(chǎn)業(yè)前進的重要舉措。我們將由此迎來惠及全社會的進步。我們此次揭露的存儲架構(gòu)可以應(yīng)用到所有類型的計算中——從尖端智能設(shè)備到超級計算機,不一而足。”
中美交鋒,奪魁者誰?
實際上,我們還是離Potter的理想有一定距離的,但是惠普企業(yè)的技術(shù)確實是實現(xiàn)研制百億億級超級計算機的重要一步。
如果你是評委,需要為惠普企業(yè)所做的努力點評一二,倘若以本文之前提到的三大問題的解決程度為評判標準,估計“差強人意”或許是你會使用的字眼:他們在軟件使用、能源消耗、和規(guī)模升級上都取得了一定的突破。但前路漫漫,研制超級計算機所需要解決的問題很多,尤其是像提高運算速率這樣的難題,更是復(fù)雜棘手。
美國已全面禁止英特爾、Nvidia、和AMD的超級計算機芯片向中國出口,在此之后,中國國家芯片設(shè)計中心研發(fā)出專為超級計算機設(shè)計的256核RISC(精簡指令集計算機)芯片?;萜掌髽I(yè)目前能提供的就是可用于不同芯片交流的Gen-Z協(xié)議,他們同樣承諾會研制出邏輯芯片,使超級計算機的實現(xiàn)更進一步。
(The Machine原型機,有著核輻射般詭異的綠光)
盡管如此,目前美國超級計算機的研制仍是在最初的籌資階段,惠普企業(yè)對百億億級超級計算機技術(shù)的研發(fā)目前也只是紙上談兵。只有當(dāng)超級計算機項目進入到第二和第三階段,惠普企業(yè)才會真正開始設(shè)計并研制超級計算機。
如果所有程序都按部就班地進行,英特爾最新的72核/288線程Xeon Phi芯片可能會使美國領(lǐng)先一步于中國完成百億億級超級計算機的研造。但是由于其單個芯片的建議零售價為6400美元,而研造一部百億億級的超級計算機大約需要30萬個這樣的芯片,這不菲的價格或許也是美國需要考量的因素。
美國國家能源局的大多數(shù)超級計算機項目撥款針對的都是可應(yīng)用于其上的軟件程序。這次,美國國家能源局還將為加入到“Path Forward”項目中的包括AMD,Cray(“泰坦”超算制造商),IBM,英特爾,以及Nvidia等知名公司提供研發(fā)資金支援。美國國家能源局預(yù)計在三年內(nèi)為PathForward共撥出2億5千8百萬美元。因為此次研究將對受資企業(yè)的發(fā)展大有裨益,受該項撥款資助的企業(yè)在這三年期間也需自付共計至少1億7千2百萬美元的研究經(jīng)費。
雖然美國卷土重來之勢已顯,中國方面并不會束手就擒。我國已將百億億次超級計算機及相關(guān)技術(shù)的研究寫入國家“十三五”規(guī)劃,并采用“三頭并進”的方式,由中科曙光、國防科技大學(xué)及江南計算技術(shù)研究所來牽頭研制百億億級超算的原型系統(tǒng)?!笆飞系谝慌_百億億級超算”究竟花落誰家,且讓我們拭目以待。