2013年,中國(guó)憑借“天河二號(hào)(TH-2)”超級(jí)計(jì)算機(jī)成功擊敗美國(guó)的“泰坦(Titan,由Cray——美國(guó)著名超級(jí)計(jì)算機(jī)制造商于美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室研造)”,成為世界上運(yùn)算速度最快的超級(jí)計(jì)算機(jī)。隨后,中國(guó)乘勝追擊,于2016年憑借“神威·太湖之光(Sunway Taihu Light)”超級(jí)計(jì)算機(jī)以近兩倍于“天河二號(hào)”的運(yùn)算速率與三倍于其的運(yùn)行效率,坐穩(wěn)了超級(jí)計(jì)算機(jī)領(lǐng)域的頭把交椅。至今,我國(guó)包攬了世界頂級(jí)超級(jí)計(jì)算機(jī)榜單的前兩位。
今年年初,中國(guó)趁熱打鐵,想要率先完成世界第一臺(tái)運(yùn)算速率為“百億億級(jí)”的超級(jí)計(jì)算機(jī)的研造。面對(duì)中國(guó)的威脅,美國(guó)能源部向惠普企業(yè)(Hewlett Packard Enterprise,簡(jiǎn)稱(chēng)HPE,2013年于美國(guó)惠普公司“HP Inc.”中分離出來(lái),著力發(fā)展云計(jì)算解決方案)進(jìn)行研究撥款,命其根據(jù)The Machine項(xiàng)目現(xiàn)有的技術(shù)來(lái)制訂百億億級(jí)超級(jí)計(jì)算機(jī)的參考設(shè)計(jì)方案。
這個(gè)The Machine項(xiàng)目是什么呢?它是由惠普企業(yè)在2014年開(kāi)啟的一個(gè)旨在“徹底改造基礎(chǔ)計(jì)算結(jié)構(gòu)”的一個(gè)科研項(xiàng)目。然而該項(xiàng)目喜憂參半,以至于惠普企業(yè)后來(lái)并不打算將The Machine完整推向市場(chǎng),而是將其精粹與革新部分融合到其他惠普企業(yè)的商業(yè)服務(wù)器和技術(shù)當(dāng)中。
(The Machine設(shè)備一角)
回到正題??v觀歷史,我們不難發(fā)現(xiàn)世界上絕大多數(shù)的頂級(jí)超級(jí)計(jì)算機(jī)都是由美國(guó)能源部掌握并操控的。但近年來(lái),中國(guó)開(kāi)始以疾風(fēng)驟雨之勢(shì)占據(jù)這份榜單。中國(guó)的頂級(jí)超級(jí)計(jì)算機(jī)“神威·太湖之光”的最佳性能(每秒93千萬(wàn)億次浮點(diǎn)運(yùn)算,peta flops:peta,10的15次方,表千萬(wàn)億次;flops,每秒浮點(diǎn)運(yùn)算次數(shù))是美國(guó)第一超級(jí)計(jì)算機(jī)“泰坦”運(yùn)算速率(每秒18千萬(wàn)億次浮點(diǎn)運(yùn)算)的五倍。
美國(guó)曾“桀驁不馴”地宣稱(chēng)其將于2021年左右完成世界首個(gè)百億億級(jí)(相當(dāng)于每秒1000千萬(wàn)億次浮點(diǎn)運(yùn)算速率)超級(jí)計(jì)算機(jī)的研發(fā)并將其投入使用,重新奪回美國(guó)在超級(jí)計(jì)算機(jī)領(lǐng)域的王座。但中國(guó)似要先聲奪人,今年一月份,我國(guó)超級(jí)計(jì)算機(jī)中心宣稱(chēng)中國(guó)首臺(tái)百億億級(jí)超級(jí)計(jì)算機(jī)原型機(jī)將會(huì)在2017年年底研發(fā)完成,并預(yù)計(jì)在2020年之前投入使用。
(“泰坦”超級(jí)計(jì)算機(jī))
想要從無(wú)到有地研制一臺(tái)百億億級(jí)的超級(jí)計(jì)算機(jī),研究者們必須解決三個(gè)主要問(wèn)題:一、極大的電力消耗(數(shù)十億瓦特)與極高的冷卻要求;二、計(jì)算機(jī)的構(gòu)造與連接線必須設(shè)計(jì)精巧,以保證成百上千的處理器與內(nèi)存芯片能夠有效運(yùn)轉(zhuǎn);三、設(shè)計(jì)制造一組能夠真正能夠在每秒百億億次運(yùn)算的狀態(tài)下仍可正常運(yùn)行的操作系統(tǒng)與客戶端軟件。
要是較起真來(lái),不解決上述三個(gè)問(wèn)題也是可以架構(gòu)一個(gè)“所謂的”百億億級(jí)超級(jí)計(jì)算機(jī)的——只要把無(wú)數(shù)個(gè)CPU連接在一起,直到運(yùn)算速率足夠就行了——但其實(shí),這樣“搭建”起來(lái)的“超級(jí)計(jì)算機(jī)”是無(wú)法做到每秒進(jìn)行百億億次運(yùn)算的。即使可以,它每次的運(yùn)行成本也都會(huì)達(dá)到令人咋舌的天文數(shù)字,對(duì)其實(shí)際應(yīng)用造成了巨大限制。
(“神威·太湖之光”超級(jí)計(jì)算機(jī))
據(jù)外媒Ars Technica稱(chēng),中國(guó)現(xiàn)在就是在以這種“累加堆砌”的方式制造超級(jí)計(jì)算機(jī):先在2017年把所需的硬件安在一起,然后用接下來(lái)的幾年試圖使這些硬件運(yùn)轉(zhuǎn)起來(lái)。
Ars Technica同樣稱(chēng),美國(guó)國(guó)家能源局選擇了一種更為“沉著穩(wěn)健”的方式來(lái)研制超級(jí)計(jì)算機(jī),那就是為惠普企業(yè)撥款來(lái)研發(fā)百億億級(jí)超級(jí)計(jì)算機(jī)的參考設(shè)計(jì)方案。撥款的資金來(lái)自于美國(guó)國(guó)家能源局一項(xiàng)名為“Path Forward(前途)”的項(xiàng)目,該項(xiàng)目是ECP項(xiàng)目(Exascale Computing Project,百億億級(jí)計(jì)算項(xiàng)目)的子項(xiàng)目之一。
ECP項(xiàng)目由當(dāng)時(shí)的奧巴馬政府組織建立,已對(duì)美國(guó)的各項(xiàng)針對(duì)百億億級(jí)計(jì)算機(jī)的研究項(xiàng)目給予了數(shù)千萬(wàn)美元的資金支持?;萜掌髽I(yè)所收到的資金援助也由此可見(jiàn)一斑。
超算是如何架構(gòu)的?它又能做什么?
因此,惠普企業(yè)的計(jì)劃是什么?它有希望在美國(guó)國(guó)家能源局的三輪資金援助申請(qǐng)中過(guò)關(guān)斬將,并且在中國(guó)之前將百億億級(jí)超級(jí)計(jì)算機(jī)研制出來(lái)嗎?
惠普企業(yè)稱(chēng)他們將基于一個(gè)稱(chēng)為“記憶驅(qū)動(dòng)計(jì)算(Memory-Driven Computing)”的架構(gòu)來(lái)研制這款百億億級(jí)超級(jí)計(jì)算機(jī)?!坝洃涷?qū)動(dòng)計(jì)算”架構(gòu)就是從The Machine中導(dǎo)出的。
簡(jiǎn)單說(shuō)來(lái),惠普企業(yè)已有一整套成型的技術(shù)使得不計(jì)其數(shù)的可尋址存儲(chǔ)器(其總存儲(chǔ)量可達(dá)4096堯字節(jié),1堯等于2的80次方,4096堯大約是全宇宙原子的數(shù)量)可被一個(gè)高速、低能耗的光互聯(lián)器件連接起來(lái)。而該光互聯(lián)器件是由一個(gè)全新的硅光子芯片驅(qū)動(dòng)的。
(惠普企業(yè)的X1硅光子互聯(lián)器件)
現(xiàn)在,由此構(gòu)建的整個(gè)存儲(chǔ)器還極不穩(wěn)定,但假以時(shí)日——一旦惠普企業(yè)將其憶阻器技術(shù)投放市場(chǎng),或者引入英特爾的3DXPoint內(nèi)存技術(shù)——該存儲(chǔ)器將會(huì)穩(wěn)定下來(lái)。
更重要的是,惠普企業(yè)宣稱(chēng)他們已經(jīng)研發(fā)出可以真正使用如此大量存儲(chǔ)空間的軟件工具。該工具可以從龐大的數(shù)據(jù)集(比如:Facebook上所有人發(fā)的所有內(nèi)容;全世界網(wǎng)絡(luò)上的全部?jī)?nèi)容;地球上所有人的健康數(shù)據(jù),等等)中推引出隱含信息和科學(xué)價(jià)值。
惠普企業(yè)CTO Mark Potter毫不質(zhì)疑地表示其公司的科技將成為拯救人類(lèi)的曙光。他說(shuō)道:“我們堅(jiān)信記憶驅(qū)動(dòng)計(jì)算是推動(dòng)科技產(chǎn)業(yè)前進(jìn)的重要舉措。我們將由此迎來(lái)惠及全社會(huì)的進(jìn)步。我們此次揭露的存儲(chǔ)架構(gòu)可以應(yīng)用到所有類(lèi)型的計(jì)算中——從尖端智能設(shè)備到超級(jí)計(jì)算機(jī),不一而足?!?/p>
中美交鋒,奪魁者誰(shuí)?
實(shí)際上,我們還是離Potter的理想有一定距離的,但是惠普企業(yè)的技術(shù)確實(shí)是實(shí)現(xiàn)研制百億億級(jí)超級(jí)計(jì)算機(jī)的重要一步。
如果你是評(píng)委,需要為惠普企業(yè)所做的努力點(diǎn)評(píng)一二,倘若以本文之前提到的三大問(wèn)題的解決程度為評(píng)判標(biāo)準(zhǔn),估計(jì)“差強(qiáng)人意”或許是你會(huì)使用的字眼:他們?cè)谲浖褂?、能源消耗、和?guī)模升級(jí)上都取得了一定的突破。但前路漫漫,研制超級(jí)計(jì)算機(jī)所需要解決的問(wèn)題很多,尤其是像提高運(yùn)算速率這樣的難題,更是復(fù)雜棘手。
美國(guó)已全面禁止英特爾、Nvidia、和AMD的超級(jí)計(jì)算機(jī)芯片向中國(guó)出口,在此之后,中國(guó)國(guó)家芯片設(shè)計(jì)中心研發(fā)出專(zhuān)為超級(jí)計(jì)算機(jī)設(shè)計(jì)的256核RISC(精簡(jiǎn)指令集計(jì)算機(jī))芯片?;萜掌髽I(yè)目前能提供的就是可用于不同芯片交流的Gen-Z協(xié)議,他們同樣承諾會(huì)研制出邏輯芯片,使超級(jí)計(jì)算機(jī)的實(shí)現(xiàn)更進(jìn)一步。
(The Machine原型機(jī),有著核輻射般詭異的綠光)
盡管如此,目前美國(guó)超級(jí)計(jì)算機(jī)的研制仍是在最初的籌資階段,惠普企業(yè)對(duì)百億億級(jí)超級(jí)計(jì)算機(jī)技術(shù)的研發(fā)目前也只是紙上談兵。只有當(dāng)超級(jí)計(jì)算機(jī)項(xiàng)目進(jìn)入到第二和第三階段,惠普企業(yè)才會(huì)真正開(kāi)始設(shè)計(jì)并研制超級(jí)計(jì)算機(jī)。
如果所有程序都按部就班地進(jìn)行,英特爾最新的72核/288線程Xeon Phi芯片可能會(huì)使美國(guó)領(lǐng)先一步于中國(guó)完成百億億級(jí)超級(jí)計(jì)算機(jī)的研造。但是由于其單個(gè)芯片的建議零售價(jià)為6400美元,而研造一部百億億級(jí)的超級(jí)計(jì)算機(jī)大約需要30萬(wàn)個(gè)這樣的芯片,這不菲的價(jià)格或許也是美國(guó)需要考量的因素。
美國(guó)國(guó)家能源局的大多數(shù)超級(jí)計(jì)算機(jī)項(xiàng)目撥款針對(duì)的都是可應(yīng)用于其上的軟件程序。這次,美國(guó)國(guó)家能源局還將為加入到“Path Forward”項(xiàng)目中的包括AMD,Cray(“泰坦”超算制造商),IBM,英特爾,以及Nvidia等知名公司提供研發(fā)資金支援。美國(guó)國(guó)家能源局預(yù)計(jì)在三年內(nèi)為PathForward共撥出2億5千8百萬(wàn)美元。因?yàn)榇舜窝芯繉?duì)受資企業(yè)的發(fā)展大有裨益,受該項(xiàng)撥款資助的企業(yè)在這三年期間也需自付共計(jì)至少1億7千2百萬(wàn)美元的研究經(jīng)費(fèi)。
雖然美國(guó)卷土重來(lái)之勢(shì)已顯,中國(guó)方面并不會(huì)束手就擒。我國(guó)已將百億億次超級(jí)計(jì)算機(jī)及相關(guān)技術(shù)的研究寫(xiě)入國(guó)家“十三五”規(guī)劃,并采用“三頭并進(jìn)”的方式,由中科曙光、國(guó)防科技大學(xué)及江南計(jì)算技術(shù)研究所來(lái)牽頭研制百億億級(jí)超算的原型系統(tǒng)?!笆飞系谝慌_(tái)百億億級(jí)超算”究竟花落誰(shuí)家,且讓我們拭目以待。