6月17日,新一期全球超算500強榜單出爐,入選500強的所有超算浮點運算速度都突破每秒千萬億次,中國超算也在前四占有兩席位置。
普通計算機用指令運算速度衡量計算性能,而超算通常用浮點運算速度來衡量其性能。那么,什么是浮點運算速度,超算榜單為什么會選擇浮點運算速度來進(jìn)行比較?500強特別是前十的超算,科學(xué)家們都在想哪些辦法讓浮點運算速度越來越快?節(jié)能環(huán)保是對超算的另一衡量指標(biāo),超算要節(jié)能環(huán)保,最新的研究思路和實現(xiàn)策略又有哪些?6月19日,科技日報記者帶著這些問題,走訪了業(yè)內(nèi)相關(guān)專家。
浮點運算速度 衡量超算性能的基準(zhǔn)程式之一
“超級計算機被稱為‘國家重器’,屬于國家戰(zhàn)略高技術(shù)領(lǐng)域,是世界各國競相角逐的科技最高點。目前,高性能計算機領(lǐng)域市場競爭日趨激烈,美國、歐洲、日本和中國都在加速超級計算機的研發(fā)。”國家超級計算無錫中心主任楊廣文說。
“浮點運算速度是指計算機系統(tǒng)每秒可以處理的浮點操作,通常用FLOPS來表示。”江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院副院長柴志雷副教授說,超算榜單選擇浮點運算速度作為對比參考,是因為超級計算機主要用于科學(xué)計算領(lǐng)域,而這些領(lǐng)域的計算主要采用浮點數(shù)。
江蘇理工學(xué)院計算機工程學(xué)院副院長范洪輝副教授告訴記者,浮點是指小數(shù)點位置不固定的數(shù),它們執(zhí)行的算術(shù)運算會消耗大量計算資源并可能產(chǎn)生誤差,所以單位時間內(nèi)浮點運算的次數(shù),是衡量超算性能的基準(zhǔn)程式之一。
常州信息職業(yè)技術(shù)學(xué)院軟件與大數(shù)據(jù)學(xué)院錢銀中博士表示,計算機只能存儲和處理整數(shù),通過整數(shù)乘以某個基數(shù)的整數(shù)次冪,是計算機表示實數(shù)尤其是小數(shù)的方法。
“浮點運算在運算數(shù)大小變化范圍很大的場合可以實現(xiàn)很高的計算精度,是科學(xué)研究中的典型運算。大多數(shù)處理器中,都有專門處理浮點運算的浮點運算單元(FPU),F(xiàn)LOPS就是浮點運算單元的執(zhí)行速度。”錢銀中說。
中國高性能計算重點研發(fā)專項總體組組長、中山大學(xué)數(shù)據(jù)科學(xué)計算機學(xué)院院長錢德沛表示,選用浮點運算速度作為超算運算能力的評價標(biāo)準(zhǔn),是因為科學(xué)工程計算軟件中包含了大量的浮點數(shù)運算,浮點運算速度快的計算機通常也能夠更快運行相關(guān)的科學(xué)工程計算軟件。
把復(fù)雜的工作細(xì)分 超算界沒有最快只有更快
超級計算機具有很強的計算和處理數(shù)據(jù)的能力,主要特點表現(xiàn)為高速度和大容量,配有多種外部和外圍設(shè)備及高性能軟件系統(tǒng)。現(xiàn)有的超級計算機運算速度,大都可以達(dá)到每秒一萬億次以上。
常州信息職業(yè)技術(shù)學(xué)院電子工程學(xué)院牛杰博士介紹,超級計算機的創(chuàng)新設(shè)計在于把復(fù)雜的工作細(xì)分并分配給不同的處理器。根據(jù)阿姆達(dá)爾定律,超級計算機的設(shè)計都集中在減少軟件序列化、用硬件在瓶頸上加速。
目前,世界排名前十的超算,基本都是通過優(yōu)化CPU(中央處理器)與GPU(圖形處理器)之間的連接網(wǎng)絡(luò)結(jié)構(gòu)來提升GPU和協(xié)處理器性能,增加內(nèi)存容量、擴充存儲容量、增大網(wǎng)絡(luò)帶寬、借助運算加速卡等方式提升算力,最終在高性能計算系統(tǒng)、網(wǎng)絡(luò)架構(gòu)、系統(tǒng)軟件、應(yīng)用支撐等關(guān)鍵技術(shù)上取得突破。
柴志雷認(rèn)為,提升超級計算機系統(tǒng)的浮點處理能力,不是單純讓浮點運算本身更快,而是從整個系統(tǒng)的角度,提升芯片工藝,優(yōu)化系統(tǒng)架構(gòu)、節(jié)點計算性能、存儲訪問性能、節(jié)點間通信等,從而使得系統(tǒng)的整體能力得到提升。目前,還經(jīng)常采用在系統(tǒng)中增加加速器等方法,來獲得更高計算效率。
錢銀中介紹,實現(xiàn)超算的技術(shù)有大規(guī)模并行計算法,這種方法使多個處理器一起工作,每個處理器處理一個大問題中的不同任務(wù)。這種方法有兩種實現(xiàn)途徑:一種是網(wǎng)格計算法,多個計算機連接成分散的分布式結(jié)構(gòu),分屬不同的控制區(qū)域,當(dāng)需要計算機時從中擇機選擇;另一種是把處理器組織為關(guān)系緊密的集群?,F(xiàn)代超算使用無限帶寬系統(tǒng)、三維環(huán)面互連等技術(shù),在大規(guī)模并行系統(tǒng)中提高集群的速度和靈活性。
國家超級計算無錫中心先進(jìn)制造部部長任虎介紹,目前,提高浮點運算速度的方法主要有:提高芯片計算核心的時鐘頻率,增加芯片中計算核心的數(shù)量,通過多流水線、乘加融合(FMA)等技術(shù)增加單位時間內(nèi)處理浮點運算的能力。
例如,曙光星云采用了自主研發(fā)的超并行處理體系結(jié)構(gòu)、神威藍(lán)光超算采用了大規(guī)模并行處理體系結(jié)構(gòu)、天河一號采用了多陣列可配置協(xié)同并行體系結(jié)構(gòu)、天河二號采用了自創(chuàng)的新型異構(gòu)多態(tài)體系結(jié)構(gòu)。此外,互聯(lián)網(wǎng)絡(luò)、存儲、系統(tǒng)軟件、應(yīng)用軟件、電源和冷卻等系統(tǒng)都對超算的性能有著重要的影響,所以超算的世界里沒有最快,只有更快。
Green500 超算界針對能效的排行榜
“節(jié)能環(huán)保是衡量超算的另一指標(biāo)。超算中心是高性能計算機的規(guī)模應(yīng)用,功率密度高,且長期運行在高負(fù)荷率條件下,耗能極高。通過優(yōu)化軟硬件配置確實能降低一部分功耗,但最根本源頭是要研發(fā)計算性能優(yōu)異且超低功耗的高性能處理器。目前,如何實現(xiàn)低能耗的超算是全球科學(xué)家研究的熱點問題?!?范洪輝告訴記者。
牛杰介紹,超算界還有一種被稱為“Green500”的排行,就是以計算機每瓦功耗可以提供的計算速率為指標(biāo),針對超級計算機能效的排行榜。
從歷年的評測結(jié)果來看,刀片服務(wù)器一般比集群式服務(wù)器更節(jié)能,被廣泛使用在超算系統(tǒng)中。Green500排名靠前的前三大系統(tǒng)都采用了PEZY加速器,而前十大的其余系統(tǒng)則使用NVIDIA GPU作為加速器。其中,PEZY系統(tǒng)采用的是液體冷卻方式,也就是說,整個系統(tǒng)浸沒在液體中,這比透過板載空氣或水更具有節(jié)能效率。
超算深騰7000可以實時定位計算機的熱源分布和結(jié)構(gòu)特點,采用取消全部風(fēng)扇、在每套機柜內(nèi)安裝噴淋蒸發(fā)冷卻循環(huán)系統(tǒng)的方法,完成了產(chǎn)品的實施。該項目與傳統(tǒng)的風(fēng)冷、水冷技術(shù)相比,具有冷卻效率高、溫度分布均勻、低噪音、低功耗、可靠性高等優(yōu)點。
相對風(fēng)冷,中國的“神威藍(lán)光”超算中心,利用復(fù)雜的水冷系統(tǒng),實現(xiàn)CPU、內(nèi)存、元器件的冷卻并帶走熱量,幾乎不損耗水且無噪音,先進(jìn)環(huán)保,就像三明治夾心,水冷板被緊緊地夾在兩塊CPU板中間,無縫同步散熱。
如何讓超算實現(xiàn)低能耗?柴志雷認(rèn)為,低功耗計算也是超級計算機研制的重要方面,從芯片制造、架構(gòu)設(shè)計、軟件設(shè)計多個層次都需要做大量的工作。比如在架構(gòu)設(shè)計上,可以通過增加異構(gòu)加速單元,提升系統(tǒng)的能效比。
范洪輝提出,重點應(yīng)降低每個部件的耗能,尤其是CPU的能耗。同時要改善存儲器件的設(shè)計,減少數(shù)據(jù)行進(jìn)的距離;讓高性能存儲器向三維擴展而不是朝二維延伸;超算要與閃存結(jié)合,來改變電壓或頻率等節(jié)省功率;其次,可以采用包括能模擬大腦內(nèi)神經(jīng)元操作的神經(jīng)形態(tài)電路或量子計算模式,創(chuàng)造出新型的計算機,比如生物計算機和量子計算機。
令人欣慰的是,我國正在通過多方面發(fā)力,讓超級計算機更節(jié)能環(huán)保。例如,曾獲中國專利獎優(yōu)秀獎的“基于物聯(lián)網(wǎng)技術(shù)的數(shù)據(jù)中心動力環(huán)境監(jiān)測系統(tǒng)”,采用超低功耗的無線數(shù)據(jù)采集技術(shù)、三維建模及虛擬仿真技術(shù)、智能分析技術(shù)等,有效消除了機房內(nèi)局部熱點,解決了功耗特別大的難題,實現(xiàn)超算中心安全穩(wěn)定和節(jié)能的目標(biāo)。