最近美國能源部下屬的橡樹嶺國家實驗室放了一個大招:新一代超級計算機“Summit(頂點)”正式發(fā)布,幫助美國重新奪回超算領(lǐng)域的桂冠。其浮點運算速度峰值可達每秒20億億次,比中國的最強超算“神威太湖之光”快60%。由于6月是每半年公布一次的全球超算500強榜單年中更新的時間,美國搶在這期榜單公布前宣布成功研制“頂點”,可見其重回超算之巔的急迫心情。
美國超級計算機“頂點”拿下頭把交椅
這臺“頂點”超級計算機是由IBM公司作為總承包商,為橡樹嶺國家實驗室開發(fā)的,英偉達公司以及一些技術(shù)專家從旁輔助,耗資2億美元,占地面積有兩個網(wǎng)球場那么大。這臺龐然大物足足由4608臺計算服務(wù)器組成,每個服務(wù)器包含兩個22核的IBM Power9處理器和6臺NVIDIA Tesla V100圖形處理單元加速器。
該實驗室說,它們不僅使“頂點”的浮點運算速度峰值可達每秒20億億次,還能讓“頂點”在執(zhí)行某些科學運算時,“混合精度”運算速度達到每秒330億億次。
橡樹嶺國家實驗室專家杰夫·尼克爾斯說,“頂點”比過去超級計算機的計算能力和存儲能力更強,擁有龐大和高質(zhì)量的文件系統(tǒng)以及快速的數(shù)據(jù)通道,這讓研究人員在使用它時可以更快得到更精確的結(jié)果。
中國目前最強的超算——“神威太湖之光”,峰值運算性能為12.5億億次,“頂點”比“神威太湖之光”快了將近60%。
放眼國際,中美超算實力最強,無論是數(shù)量上還是性能上都甩開其他國家一大截。不過在20年前,和美國爭奪最強超算頭把交椅的一直是日本。
1999年,日本投入400億日元(約合人民幣25億元),開始了名為“地球模擬器”的超級計算機開發(fā)計劃。2002年,日本“地球模擬器”超級計算機成功推出,并將多年來一直獨占鰲頭的美國擠下了“頭把交椅”。但正是“地球模擬器”的橫空出世觸動了美國,美國政府隨后開始加大了在超級計算機研發(fā)方面的投入,并在2004年重新占據(jù)“第一”,而且在前100名中一直占據(jù)大多數(shù)的席位。這種美國占據(jù)霸主地位的情況一直延續(xù)了6年。
而自日本奪下超級計算機第一把交椅之后,利用超級計算機展開研發(fā)業(yè)務(wù)的日本企業(yè)雖然也經(jīng)歷了一個大發(fā)展,多達如今的180家,在諸如新藥的研制和新車型的設(shè)計方面,超級計算機長袖善舞,大有用武之地。但由于日本近年的投入力度不夠,再也沒有后續(xù)的超級計算機問世。
現(xiàn)在,面對中美在超算上的競爭,歐盟、日本、加拿大等都不愿意屈居人后,紛紛布局下一代超算,做技術(shù)儲備。
不少人認為,構(gòu)建超級計算機就是在做芯片處理的加法,處理器(CPU)越多,計算速度也就越快。事實并非如此。打個比方,三人共同協(xié)作完成任務(wù),除去正常開展任務(wù)工作外,還需要耗費人力進行任務(wù)分解、任務(wù)分配、結(jié)果歸總等管理工作。管理工作不科學,總體工作效率會大幅降低。所以,和普通計算機相比,超級計算機還有并行計算和異構(gòu)計算兩大難題需要解決。
并行計算是指同時使用多種計算資源解決計算問題的過程,是提高計算機系統(tǒng)計算速度和處理能力的一種有效手段。它的基本思想是用多個處理器來協(xié)同求解同一問題,即將被求解的問題分解成若干個部分,各部分均由一個獨立的處理機來并行計算。并行計算的目的是為了加快求解速度,擴大求解規(guī)模。
異構(gòu)計算是指使用不同類型指令集和體系架構(gòu)的計算單元組成系統(tǒng)的計算方式。不同種類的處理器都有適合其處理的任務(wù)類型,比如CPU適合做串行、邏輯復(fù)雜度高的任務(wù);GPU主要用于圖形處理和矩陣運算,適合做簡單、并行度高的任務(wù);TPU(Tensor Processing Unit,張量處理單元)是為機器學習定制的芯片,主要用于人工智能領(lǐng)域。
讓氣象預(yù)測間隔從30分鐘縮短到10分鐘
超級計算機可以干什么?據(jù)新華社消息,美國能源部長里克·佩里說,“頂點”超算將給能源研究、科學發(fā)現(xiàn)、經(jīng)濟競爭力和國家安全帶來深遠影響。美能源部今年將啟動遴選科學項目,申請使用“頂點”超算的科學項目已開始排隊。橡樹嶺國家實驗室計算生物學家丹·雅各布森說,“頂點”超算有望憑借強大的計算能力,打開此前人們難以想象的科研空間。
比如,天文學家計劃用它模擬超新星爆發(fā)。橡樹嶺國家實驗室計算天體物理學家布朗森·梅瑟說,“頂點”的計算能力比早先所用的計算機強大很多,因此能使模擬時間延長數(shù)千倍,為研究宇宙中如何出現(xiàn)金和鐵等重元素提供線索。在材料學領(lǐng)域,研究人員需要能在原子層面模擬材料的性質(zhì),但他們在過去的計算機上只能模擬數(shù)十個原子的行為,現(xiàn)在他們計劃用“頂點”模擬數(shù)百個原子的行為,從而幫助尋找超導體等新材料。在人工智能與醫(yī)療的交叉領(lǐng)域,“頂點”也有用武之地。比如將其用于癌癥研究,幫助醫(yī)生找出癌癥發(fā)病過程中基因、生物標記物和環(huán)境等因素間的關(guān)系。還可用它分析蛋白質(zhì)和細胞的功能,幫助防治阿爾茨海默病和心臟病等疾病。
據(jù)了解,目前超級計算機已同理論研究和科學實驗一起成為人類探索未知世界的三大科學手段,被稱為支撐科學發(fā)現(xiàn)的第三個支柱。
知乎網(wǎng)友“小侯飛氘”舉了這樣一個例子,在飛行器制造領(lǐng)域,經(jīng)常要計算飛機附近空氣的流動以及飛行器本身的受力情況。最常用的計算方法是把空氣、機體分割成一個個小塊,分別計算每個小塊的運動和受力,再整合起來得到整體的運動和受力情況。一般來說,分割得越精細,每個小塊越小,計算越準確。而魚與熊掌不可兼得,分割得越精細,計算量也越大。
在科研和工程領(lǐng)域,有許許多多這樣的計算任務(wù),例如原子基本性質(zhì)的量子力學計算、藥物反應(yīng)過程的分子動力學模擬、黑洞碰撞的相對論模擬、大氣運動和天氣變化的預(yù)測、橋梁設(shè)計中的受力計算……這些復(fù)雜的問題,如果用單個CPU核心計算,可能要花上幾個月甚至是幾年才能得到結(jié)果。這么長的計算時間是難以接受的,所以我們需要用多個CPU核心進行并行計算以提高效率,集成大量CPU于一身的超算自然就應(yīng)需而生了。
再比如,在氣象研究領(lǐng)域,1983年研制的第一臺銀河超級計算機,讓中國成為世界上少數(shù)能發(fā)布5-7天天氣預(yù)報的國家,也是發(fā)展中國家里的第一個。
近年來,日本理化學研究所和氣象廳的團隊利用超級計算機“京”分析氣象衛(wèi)星“向日葵8號”的觀測數(shù)據(jù),捕捉曾難以用于天氣預(yù)報的云層高度和厚度,更加準確地預(yù)測臺風和集中暴雨。據(jù)報道,2015年開始運用的“向日葵8號”的觀測間隔從此前的30分鐘變?yōu)?0分鐘,這使得更早發(fā)現(xiàn)危險并促成居民疏散成為可能。
該團隊介紹,“向日葵8號”捕捉從云層頂部發(fā)出的紅外線,探測迄今難以確認的云層高度。然后通過超算“京”模擬附近的氣象信息,推測云層的厚度。使用這些數(shù)據(jù)可預(yù)測隨風飄動的云層動向。
傳統(tǒng)超算功耗高,量子計算是未來發(fā)展方向
以往超級計算機通過增加處理器數(shù)量就能不斷提高性能,但美國勞倫斯·伯克利國家實驗室的豪斯·費姆尼教授認為,最近幾年超算技術(shù)上的發(fā)展,都不足以突破E級超算(即每秒百億億次計算)的障礙。
超算發(fā)展目前面臨的挑戰(zhàn)首先是功耗控制難。目前的集成水平和此前相比并沒有根本性改善,以現(xiàn)有技術(shù),E級超級計算機的功耗會超過20兆瓦,建造費用將超過2億美元,這將帶來一系列技術(shù)和運營問題。例如“天河二號”一年僅電費就要1億元人民幣,全速運算的話,電費更高達1.5億元。如果還是按照老思路,依靠增加規(guī)模制造出的E級超算,功耗可能會達到50-100兆瓦,這需要有一個專門的核電站來給它供電,這樣的超算顯然沒有實用價值。同時這樣密集排列的大功率處理器,也會帶來無法解決的散熱問題。因此國際上公認的E級超算標準是,功耗必須控制在20兆瓦內(nèi),這就要求在制造工藝上有革命性突破。
其次是可靠性問題,將來超級計算機并發(fā)部件將超過10億,以現(xiàn)在的故障率,平均每10-20分鐘系統(tǒng)就會報一次硬件錯誤,而每次處理錯誤需要半個小時。這顯然也是無法容忍的。
此外,超算還面臨數(shù)據(jù)的訪問速度限制。如果按現(xiàn)有設(shè)計方法,通過不斷增加處理器數(shù)量來研制超算,其體型和規(guī)模會越來越大,數(shù)據(jù)在存儲器和處理器之間進出所耗費的功率會越來越多。有人甚至預(yù)測,超算90%的功率將被用于數(shù)據(jù)輸送。
因此,美國也有一些學者認為應(yīng)該反思超算的發(fā)展方向,改變追求峰值運算速度的模式,而注重實用價值。例如放棄通用型超算,根據(jù)實際需求定制超算。Top500榜單創(chuàng)始人、田納西大學計算機科學家杰克·東格拉就認為:“速度并不意味著一切。盡管汽車達到300公里/小時的速度讓人驚嘆,但大多數(shù)情況下汽車的真正價值在于,在日常限速范圍內(nèi)安全可靠地行駛?!?/p>
傳統(tǒng)計算方式的路已經(jīng)快走到盡頭,量子計算正成為各國研發(fā)的重點。量子計算是全新計算模式,它不同于當前數(shù)據(jù)中心、云環(huán)境、PC和其他設(shè)備中的數(shù)字計算。數(shù)字計算需要把數(shù)據(jù)編碼為二進制數(shù)字(比特位),每個比特位處于兩個確定狀態(tài)中的一個(0或1)。然而,量子計算使用量子位,后者可以同時處于多個狀態(tài)。因此,量子位上的操作可以實現(xiàn)并行的大量計算。
從本質(zhì)上說,量子計算就是并行計算的終極目標,有攻克傳統(tǒng)計算機無解難題的巨大潛力。例如,量子計算機可以模擬自然環(huán)境來推進化學、材料科學和分子建模等領(lǐng)域的科研工作。從美國到歐洲,從頂尖科研機構(gòu)到科技企業(yè)巨頭,圍繞量子技術(shù)的攻關(guān)已全面展開,量子革命引發(fā)的新一輪科技競賽如火如荼。
比如,谷歌在2017年4月份宣布推出49量子位處理器。谷歌首席科學家John Martinis曾公開表示:為率先登頂“量子霸權(quán)”,他所帶領(lǐng)的團隊正在利用49量子比特模擬系統(tǒng)攻克經(jīng)典計算機無法解出的難題。