123,123,123

实现每秒20亿亿次后超级计算机的终点在哪里

日期： 2018-07-02

關(guān)鍵詞： 超级计算机 Summit顶点橡树岭国家实验室

　　最近美國(guó)能源部下屬的橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室放了一個(gè)大招:新一代超級(jí)計(jì)算機(jī)“Summit(頂點(diǎn))”正式發(fā)布,幫助美國(guó)重新奪回超算領(lǐng)域的桂冠。其浮點(diǎn)運(yùn)算速度峰值可達(dá)每秒20億億次,比中國(guó)的最強(qiáng)超算“神威太湖之光”快60%。由于6月是每半年公布一次的全球超算500強(qiáng)榜單年中更新的時(shí)間,美國(guó)搶在這期榜單公布前宣布成功研制“頂點(diǎn)”,可見(jiàn)其重回超算之巔的急迫心情。

　　美國(guó)超級(jí)計(jì)算機(jī)“頂點(diǎn)”拿下頭把交椅

　　這臺(tái)“頂點(diǎn)”超級(jí)計(jì)算機(jī)是由IBM公司作為總承包商,為橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室開(kāi)發(fā)的,英偉達(dá)公司以及一些技術(shù)專家從旁輔助,耗資2億美元,占地面積有兩個(gè)網(wǎng)球場(chǎng)那么大。這臺(tái)龐然大物足足由4608臺(tái)計(jì)算服務(wù)器組成,每個(gè)服務(wù)器包含兩個(gè)22核的IBM Power9處理器和6臺(tái)NVIDIA Tesla V100圖形處理單元加速器。

　　該實(shí)驗(yàn)室說(shuō),它們不僅使“頂點(diǎn)”的浮點(diǎn)運(yùn)算速度峰值可達(dá)每秒20億億次,還能讓“頂點(diǎn)”在執(zhí)行某些科學(xué)運(yùn)算時(shí),“混合精度”運(yùn)算速度達(dá)到每秒330億億次。

　　橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室專家杰夫·尼克爾斯說(shuō),“頂點(diǎn)”比過(guò)去超級(jí)計(jì)算機(jī)的計(jì)算能力和存儲(chǔ)能力更強(qiáng),擁有龐大和高質(zhì)量的文件系統(tǒng)以及快速的數(shù)據(jù)通道,這讓研究人員在使用它時(shí)可以更快得到更精確的結(jié)果。

　　中國(guó)目前最強(qiáng)的超算——“神威太湖之光”,峰值運(yùn)算性能為12.5億億次,“頂點(diǎn)”比“神威太湖之光”快了將近60%。

　　放眼國(guó)際,中美超算實(shí)力最強(qiáng),無(wú)論是數(shù)量上還是性能上都甩開(kāi)其他國(guó)家一大截。不過(guò)在20年前,和美國(guó)爭(zhēng)奪最強(qiáng)超算頭把交椅的一直是日本。

　　1999年,日本投入400億日元(約合人民幣25億元),開(kāi)始了名為“地球模擬器”的超級(jí)計(jì)算機(jī)開(kāi)發(fā)計(jì)劃。2002年,日本“地球模擬器”超級(jí)計(jì)算機(jī)成功推出,并將多年來(lái)一直獨(dú)占鰲頭的美國(guó)擠下了“頭把交椅”。但正是“地球模擬器”的橫空出世觸動(dòng)了美國(guó),美國(guó)政府隨后開(kāi)始加大了在超級(jí)計(jì)算機(jī)研發(fā)方面的投入,并在2004年重新占據(jù)“第一”,而且在前100名中一直占據(jù)大多數(shù)的席位。這種美國(guó)占據(jù)霸主地位的情況一直延續(xù)了6年。

　　而自日本奪下超級(jí)計(jì)算機(jī)第一把交椅之后,利用超級(jí)計(jì)算機(jī)展開(kāi)研發(fā)業(yè)務(wù)的日本企業(yè)雖然也經(jīng)歷了一個(gè)大發(fā)展,多達(dá)如今的180家,在諸如新藥的研制和新車型的設(shè)計(jì)方面,超級(jí)計(jì)算機(jī)長(zhǎng)袖善舞,大有用武之地。但由于日本近年的投入力度不夠,再也沒(méi)有后續(xù)的超級(jí)計(jì)算機(jī)問(wèn)世。

　　現(xiàn)在,面對(duì)中美在超算上的競(jìng)爭(zhēng),歐盟、日本、加拿大等都不愿意屈居人后,紛紛布局下一代超算,做技術(shù)儲(chǔ)備。

　　不少人認(rèn)為,構(gòu)建超級(jí)計(jì)算機(jī)就是在做芯片處理的加法,處理器(CPU)越多,計(jì)算速度也就越快。事實(shí)并非如此。打個(gè)比方,三人共同協(xié)作完成任務(wù),除去正常開(kāi)展任務(wù)工作外,還需要耗費(fèi)人力進(jìn)行任務(wù)分解、任務(wù)分配、結(jié)果歸總等管理工作。管理工作不科學(xué),總體工作效率會(huì)大幅降低。所以,和普通計(jì)算機(jī)相比,超級(jí)計(jì)算機(jī)還有并行計(jì)算和異構(gòu)計(jì)算兩大難題需要解決。

　　并行計(jì)算是指同時(shí)使用多種計(jì)算資源解決計(jì)算問(wèn)題的過(guò)程,是提高計(jì)算機(jī)系統(tǒng)計(jì)算速度和處理能力的一種有效手段。它的基本思想是用多個(gè)處理器來(lái)協(xié)同求解同一問(wèn)題,即將被求解的問(wèn)題分解成若干個(gè)部分,各部分均由一個(gè)獨(dú)立的處理機(jī)來(lái)并行計(jì)算。并行計(jì)算的目的是為了加快求解速度,擴(kuò)大求解規(guī)模。

　　異構(gòu)計(jì)算是指使用不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式。不同種類的處理器都有適合其處理的任務(wù)類型,比如CPU適合做串行、邏輯復(fù)雜度高的任務(wù)；GPU主要用于圖形處理和矩陣運(yùn)算,適合做簡(jiǎn)單、并行度高的任務(wù)；TPU(Tensor Processing Unit,張量處理單元)是為機(jī)器學(xué)習(xí)定制的芯片,主要用于人工智能領(lǐng)域。

　　讓氣象預(yù)測(cè)間隔從30分鐘縮短到10分鐘

　　超級(jí)計(jì)算機(jī)可以干什么?據(jù)新華社消息,美國(guó)能源部長(zhǎng)里克·佩里說(shuō),“頂點(diǎn)”超算將給能源研究、科學(xué)發(fā)現(xiàn)、經(jīng)濟(jì)競(jìng)爭(zhēng)力和國(guó)家安全帶來(lái)深遠(yuǎn)影響。美能源部今年將啟動(dòng)遴選科學(xué)項(xiàng)目,申請(qǐng)使用“頂點(diǎn)”超算的科學(xué)項(xiàng)目已開(kāi)始排隊(duì)。橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室計(jì)算生物學(xué)家丹·雅各布森說(shuō),“頂點(diǎn)”超算有望憑借強(qiáng)大的計(jì)算能力,打開(kāi)此前人們難以想象的科研空間。

　　比如,天文學(xué)家計(jì)劃用它模擬超新星爆發(fā)。橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室計(jì)算天體物理學(xué)家布朗森·梅瑟說(shuō),“頂點(diǎn)”的計(jì)算能力比早先所用的計(jì)算機(jī)強(qiáng)大很多,因此能使模擬時(shí)間延長(zhǎng)數(shù)千倍,為研究宇宙中如何出現(xiàn)金和鐵等重元素提供線索。在材料學(xué)領(lǐng)域,研究人員需要能在原子層面模擬材料的性質(zhì),但他們?cè)谶^(guò)去的計(jì)算機(jī)上只能模擬數(shù)十個(gè)原子的行為,現(xiàn)在他們計(jì)劃用“頂點(diǎn)”模擬數(shù)百個(gè)原子的行為,從而幫助尋找超導(dǎo)體等新材料。在人工智能與醫(yī)療的交叉領(lǐng)域,“頂點(diǎn)”也有用武之地。比如將其用于癌癥研究,幫助醫(yī)生找出癌癥發(fā)病過(guò)程中基因、生物標(biāo)記物和環(huán)境等因素間的關(guān)系。還可用它分析蛋白質(zhì)和細(xì)胞的功能,幫助防治阿爾茨海默病和心臟病等疾病。

　　據(jù)了解,目前超級(jí)計(jì)算機(jī)已同理論研究和科學(xué)實(shí)驗(yàn)一起成為人類探索未知世界的三大科學(xué)手段,被稱為支撐科學(xué)發(fā)現(xiàn)的第三個(gè)支柱。

　　知乎網(wǎng)友“小侯飛氘”舉了這樣一個(gè)例子,在飛行器制造領(lǐng)域,經(jīng)常要計(jì)算飛機(jī)附近空氣的流動(dòng)以及飛行器本身的受力情況。最常用的計(jì)算方法是把空氣、機(jī)體分割成一個(gè)個(gè)小塊,分別計(jì)算每個(gè)小塊的運(yùn)動(dòng)和受力,再整合起來(lái)得到整體的運(yùn)動(dòng)和受力情況。一般來(lái)說(shuō),分割得越精細(xì),每個(gè)小塊越小,計(jì)算越準(zhǔn)確。而魚(yú)與熊掌不可兼得,分割得越精細(xì),計(jì)算量也越大。

　　在科研和工程領(lǐng)域,有許許多多這樣的計(jì)算任務(wù),例如原子基本性質(zhì)的量子力學(xué)計(jì)算、藥物反應(yīng)過(guò)程的分子動(dòng)力學(xué)模擬、黑洞碰撞的相對(duì)論模擬、大氣運(yùn)動(dòng)和天氣變化的預(yù)測(cè)、橋梁設(shè)計(jì)中的受力計(jì)算……這些復(fù)雜的問(wèn)題,如果用單個(gè)CPU核心計(jì)算,可能要花上幾個(gè)月甚至是幾年才能得到結(jié)果。這么長(zhǎng)的計(jì)算時(shí)間是難以接受的,所以我們需要用多個(gè)CPU核心進(jìn)行并行計(jì)算以提高效率,集成大量CPU于一身的超算自然就應(yīng)需而生了。

　　再比如,在氣象研究領(lǐng)域,1983年研制的第一臺(tái)銀河超級(jí)計(jì)算機(jī),讓中國(guó)成為世界上少數(shù)能發(fā)布5-7天天氣預(yù)報(bào)的國(guó)家,也是發(fā)展中國(guó)家里的第一個(gè)。

　　近年來(lái),日本理化學(xué)研究所和氣象廳的團(tuán)隊(duì)利用超級(jí)計(jì)算機(jī)“京”分析氣象衛(wèi)星“向日葵8號(hào)”的觀測(cè)數(shù)據(jù),捕捉曾難以用于天氣預(yù)報(bào)的云層高度和厚度,更加準(zhǔn)確地預(yù)測(cè)臺(tái)風(fēng)和集中暴雨。據(jù)報(bào)道,2015年開(kāi)始運(yùn)用的“向日葵8號(hào)”的觀測(cè)間隔從此前的30分鐘變?yōu)?0分鐘,這使得更早發(fā)現(xiàn)危險(xiǎn)并促成居民疏散成為可能。

　　該團(tuán)隊(duì)介紹,“向日葵8號(hào)”捕捉從云層頂部發(fā)出的紅外線,探測(cè)迄今難以確認(rèn)的云層高度。然后通過(guò)超算“京”模擬附近的氣象信息,推測(cè)云層的厚度。使用這些數(shù)據(jù)可預(yù)測(cè)隨風(fēng)飄動(dòng)的云層動(dòng)向。

　　傳統(tǒng)超算功耗高,量子計(jì)算是未來(lái)發(fā)展方向

　　以往超級(jí)計(jì)算機(jī)通過(guò)增加處理器數(shù)量就能不斷提高性能,但美國(guó)勞倫斯·伯克利國(guó)家實(shí)驗(yàn)室的豪斯·費(fèi)姆尼教授認(rèn)為,最近幾年超算技術(shù)上的發(fā)展,都不足以突破E級(jí)超算(即每秒百億億次計(jì)算)的障礙。

　　超算發(fā)展目前面臨的挑戰(zhàn)首先是功耗控制難。目前的集成水平和此前相比并沒(méi)有根本性改善,以現(xiàn)有技術(shù),E級(jí)超級(jí)計(jì)算機(jī)的功耗會(huì)超過(guò)20兆瓦,建造費(fèi)用將超過(guò)2億美元,這將帶來(lái)一系列技術(shù)和運(yùn)營(yíng)問(wèn)題。例如“天河二號(hào)”一年僅電費(fèi)就要1億元人民幣,全速運(yùn)算的話,電費(fèi)更高達(dá)1.5億元。如果還是按照老思路,依靠增加規(guī)模制造出的E級(jí)超算,功耗可能會(huì)達(dá)到50-100兆瓦,這需要有一個(gè)專門(mén)的核電站來(lái)給它供電,這樣的超算顯然沒(méi)有實(shí)用價(jià)值。同時(shí)這樣密集排列的大功率處理器,也會(huì)帶來(lái)無(wú)法解決的散熱問(wèn)題。因此國(guó)際上公認(rèn)的E級(jí)超算標(biāo)準(zhǔn)是,功耗必須控制在20兆瓦內(nèi),這就要求在制造工藝上有革命性突破。

　　其次是可靠性問(wèn)題,將來(lái)超級(jí)計(jì)算機(jī)并發(fā)部件將超過(guò)10億,以現(xiàn)在的故障率,平均每10-20分鐘系統(tǒng)就會(huì)報(bào)一次硬件錯(cuò)誤,而每次處理錯(cuò)誤需要半個(gè)小時(shí)。這顯然也是無(wú)法容忍的。

　　此外,超算還面臨數(shù)據(jù)的訪問(wèn)速度限制。如果按現(xiàn)有設(shè)計(jì)方法,通過(guò)不斷增加處理器數(shù)量來(lái)研制超算,其體型和規(guī)模會(huì)越來(lái)越大,數(shù)據(jù)在存儲(chǔ)器和處理器之間進(jìn)出所耗費(fèi)的功率會(huì)越來(lái)越多。有人甚至預(yù)測(cè),超算90%的功率將被用于數(shù)據(jù)輸送。

　　因此,美國(guó)也有一些學(xué)者認(rèn)為應(yīng)該反思超算的發(fā)展方向,改變追求峰值運(yùn)算速度的模式,而注重實(shí)用價(jià)值。例如放棄通用型超算,根據(jù)實(shí)際需求定制超算。Top500榜單創(chuàng)始人、田納西大學(xué)計(jì)算機(jī)科學(xué)家杰克·東格拉就認(rèn)為:“速度并不意味著一切。盡管汽車達(dá)到300公里/小時(shí)的速度讓人驚嘆,但大多數(shù)情況下汽車的真正價(jià)值在于,在日常限速范圍內(nèi)安全可靠地行駛?！?/p>

　　傳統(tǒng)計(jì)算方式的路已經(jīng)快走到盡頭,量子計(jì)算正成為各國(guó)研發(fā)的重點(diǎn)。量子計(jì)算是全新計(jì)算模式,它不同于當(dāng)前數(shù)據(jù)中心、云環(huán)境、PC和其他設(shè)備中的數(shù)字計(jì)算。數(shù)字計(jì)算需要把數(shù)據(jù)編碼為二進(jìn)制數(shù)字(比特位),每個(gè)比特位處于兩個(gè)確定狀態(tài)中的一個(gè)(0或1)。然而,量子計(jì)算使用量子位,后者可以同時(shí)處于多個(gè)狀態(tài)。因此,量子位上的操作可以實(shí)現(xiàn)并行的大量計(jì)算。

　　從本質(zhì)上說(shuō),量子計(jì)算就是并行計(jì)算的終極目標(biāo),有攻克傳統(tǒng)計(jì)算機(jī)無(wú)解難題的巨大潛力。例如,量子計(jì)算機(jī)可以模擬自然環(huán)境來(lái)推進(jìn)化學(xué)、材料科學(xué)和分子建模等領(lǐng)域的科研工作。從美國(guó)到歐洲,從頂尖科研機(jī)構(gòu)到科技企業(yè)巨頭,圍繞量子技術(shù)的攻關(guān)已全面展開(kāi),量子革命引發(fā)的新一輪科技競(jìng)賽如火如荼。

　　比如,谷歌在2017年4月份宣布推出49量子位處理器。谷歌首席科學(xué)家John Martinis曾公開(kāi)表示:為率先登頂“量子霸權(quán)”,他所帶領(lǐng)的團(tuán)隊(duì)正在利用49量子比特模擬系統(tǒng)攻克經(jīng)典計(jì)算機(jī)無(wú)法解出的難題。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

实现每秒20亿亿次后 超级计算机的终点在哪里

日期： 2018-07-02

相關(guān)內(nèi)容

实现每秒20亿亿次后超级计算机的终点在哪里