今年6月,最新的超算TOP 500榜單公布,美國能源部田納西州橡樹嶺國家實(shí)驗(yàn)室 (Oak Ridge National Lab)推出的超級計(jì)算機(jī)“Summit” (頂點(diǎn))奪得冠軍,此前連續(xù)四屆占據(jù)TOP 500榜首的神威·太湖之光退居第二。數(shù)據(jù)顯示,Summit 20億億次的性能比神威·太湖之光高出60%。雖然我國痛失超算榜首位置,但從上榜的超算總數(shù)上看,中國以206臺位居第一,占比超40%,而美國只有124臺??梢哉f,雙方各有勝負(fù)。
美:長期占據(jù)榜首 芯片競爭優(yōu)勢明顯
在超級計(jì)算機(jī)的發(fā)展歷史中,美國一直獨(dú)占鰲頭,這不容否認(rèn)。只有在近幾年,中國的超級計(jì)算實(shí)力奮起直追,才可與之相爭。盡管如此,在歷屆超級計(jì)算機(jī)榜單上,美國擁有的機(jī)器數(shù)量大部分時(shí)間超過了中國,且美國在超級計(jì)算機(jī)排行榜TOP500中的總數(shù)量也居于全球首位。
除數(shù)量外,在超級計(jì)算機(jī)芯片領(lǐng)域,美國一直以來居于絕對的領(lǐng)先地位。在十幾年前,超級計(jì)算機(jī)芯片供應(yīng)商只有英特爾、IBM兩家公司,英特爾與IBM型成了相對平衡雙寡頭局面。而之后AMD又參與了超級計(jì)算機(jī)芯片競爭,2015年,因美國開始對中國超級計(jì)算機(jī)領(lǐng)域施行芯片禁運(yùn),痛定思痛之后大力投入超級計(jì)算機(jī)研發(fā)工作。然而現(xiàn)狀來看,美國英特爾公司仍是全球芯片領(lǐng)域的老大,在最新TOP500榜單上的500臺超算中,就有476臺使用英特爾的芯片。
中:進(jìn)展神速 以自主研發(fā)突破困局
在2008年的全球500強(qiáng)超級計(jì)算機(jī)榜單里,前幾名被美國包攬,而且前100名里中國一席身影都沒有。這種狀況一直持續(xù)到2010年,深圳國家超算中心星云超級機(jī)實(shí)現(xiàn)了前100名零的突破,一舉取得了世界第二的排名。隨后這一情況勢如破竹,2011年,中國天河1A超級計(jì)算機(jī)超過原排名第一的美國美洲虎系統(tǒng)取得了世界超級計(jì)算機(jī)的第一把交椅。緊接著從2013年起,我國的超級計(jì)算機(jī)就一直占據(jù)著世界超級計(jì)算機(jī)排名的第一位。直至本次被美國“Summit”逆襲。但這一敗績不會持續(xù)太久,此前5月在天津舉辦的第二屆世界智能大會上,中國國家超算天津中心對外展示了我國新一代百億億次超級計(jì)算機(jī)“天河三號”原型機(jī),有望在2020年研制成功并重回超算榜首。
除了TOP500榜單的冠軍的爭奪,在上榜超級計(jì)算機(jī)的數(shù)量上,中國的優(yōu)勢也在持續(xù)擴(kuò)大。最新榜單顯示,500臺超級計(jì)算機(jī)中,中國以206臺位居第一,占比超40%,而美國只有124臺。
而且,我國的超級計(jì)算機(jī),在自主可控方面的發(fā)展取得巨大進(jìn)展。我國超算最高性能的代表,神威·太湖之光全部使用 “申威26010”處理器,搭載神威睿思操作系統(tǒng),實(shí)現(xiàn)軟件和硬件全部國產(chǎn)化;天河一號、天河二號、天河三號全部采用的是國產(chǎn)CPU。(天河一號剛出來奪得世界第一,當(dāng)時(shí)確實(shí)是用英特爾處理器,后來美國對高端芯片禁止出口,天河一號也全換成國產(chǎn)處理器。)
下一代超算:需解決并行計(jì)算和異構(gòu)計(jì)算兩大難題
面對中美在超算上的競爭,歐盟、日本、加拿大等都不愿意屈居人后,紛紛布局下一代超算,做技術(shù)儲備。
不少人認(rèn)為,構(gòu)建超級計(jì)算機(jī)就是在做芯片處理的加法,處理器(CPU)越多,計(jì)算速度也就越快。事實(shí)并非如此。打個(gè)比方,三人共同協(xié)作完成任務(wù),除去正常開展任務(wù)工作外,還需要耗費(fèi)人力進(jìn)行任務(wù)分解、任務(wù)分配、結(jié)果歸總等管理工作。管理工作不科學(xué),總體工作效率會大幅降低。所以,和普通計(jì)算機(jī)相比,超級計(jì)算機(jī)還有并行計(jì)算和異構(gòu)計(jì)算兩大難題需要解決。
并行計(jì)算是指同時(shí)使用多種計(jì)算資源解決計(jì)算問題的過程,是提高計(jì)算機(jī)系統(tǒng)計(jì)算速度和處理能力的一種有效手段。它的基本思想是用多個(gè)處理器來協(xié)同求解同一問題,即將被求解的問題分解成若干個(gè)部分,各部分均由一個(gè)獨(dú)立的處理機(jī)來并行計(jì)算。并行計(jì)算的目的是為了加快求解速度,擴(kuò)大求解規(guī)模。
異構(gòu)計(jì)算是指使用不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式。不同種類的處理器都有適合其處理的任務(wù)類型,比如CPU適合做串行、邏輯復(fù)雜度高的任務(wù);GPU主要用于圖形處理和矩陣運(yùn)算,適合做簡單、并行度高的任務(wù);TPU(Tensor Processing Unit,張量處理單元)是為機(jī)器學(xué)習(xí)定制的芯片,主要用于人工智能領(lǐng)域。