超算,超級計算機(jī),是所有計算機(jī)中運(yùn)算速度最快、性能最強(qiáng)的一類,在科研和軍事等尖端領(lǐng)域擁有舉足輕重的地位,是綜合國力的體現(xiàn),堪稱國之重器。或許這些高尖端的龐然大物距離我們尋常百姓的生活很遙遠(yuǎn),所以我們甚至無法感知到它們的存在。但近期一些事件和一些消息則刺痛了很多國人的神經(jīng):美國最新發(fā)布“Summit”超級計算機(jī)在時隔五年之后,終于從中國的“神威·太湖之光”手中奪回“世界第一超算”寶座。
美國“Summit”重奪世界第一超算寶座
what?我們居然在這么高尖端的領(lǐng)先過美國長達(dá)五年之久?一些小伙伴看到這則消息時或許會有這樣的感嘆。沒錯,答案是肯定的。出于好奇,筆者順著這條新聞線索在這個陌生的領(lǐng)域找到了很多有趣的數(shù)據(jù)和有意思的故事,不敢獨(dú)享決定梳理出來分享給大家。
單個Summit超算服務(wù)器的內(nèi)部結(jié)構(gòu)
借著Summit這個狠角色,我們先來進(jìn)行一些科普小知識,超算究竟擁有如何驚世駭俗的計算能力呢?Summit超級計算機(jī)由IBM主導(dǎo)完成,整個超級系統(tǒng)由4608臺計算節(jié)點(diǎn),每個節(jié)點(diǎn)包含2個22核IBM Power9處理器(負(fù)責(zé)協(xié)調(diào))和6個NVIDIA Tesla V100圖形處理單元加速器(負(fù)責(zé)計算),并可提供每秒高達(dá)20億億次的浮點(diǎn)運(yùn)算速度峰值!
27648枚NVIDIA Tesla V100 GPU核心提供超強(qiáng)算力
那么,該如何理解這個每秒20億億次浮點(diǎn)運(yùn)算呢?如果以我們常見的筆記本電腦為參照物的話,Summit超級計算機(jī)的運(yùn)算能力相當(dāng)于100萬臺筆記本;假如一個人每秒可進(jìn)行1次運(yùn)算,他需要活到63億年以上才能與Summit的每一秒運(yùn)算量相當(dāng)。
算力驚人Summit自然也是個大家伙,4608個節(jié)點(diǎn)每個都有如冰箱大小,總重量高達(dá)340噸,它被放置在將近900平米的一個超大房間內(nèi),據(jù)稱連接這些節(jié)點(diǎn)的線纜就有接近300公里的長度。由于算力驚人自然,發(fā)熱量自然巨大,因此全部采用水冷的散熱方式。Summit每運(yùn)行1分鐘,就需要1.5萬升冷卻液的流量,而它消耗的電量足以為超過8000個美國家庭提供照明。
既然我們知道了美國Summit超算的實(shí)力不俗,那么中國的超算水平又在什么段位?
全球超算排排坐 中國實(shí)力并不弱
對于全球超級計算機(jī)的排名情況,全球有一個比較公認(rèn)的“TOP500”榜單,這是由國外權(quán)威的超算專家聯(lián)合編制,在全球具有較高的公信力。在2018年度“超算TOP500榜”中,美國IBM最新發(fā)布的Summit和Sierra已經(jīng)分列榜單的冠第1和第3名,而此前蟬聯(lián)多年榜首的中國的“神威·太湖之光”和“天河2號”已經(jīng)下降至第2和第4名的位置。
全球超算TOP500榜前十位(www.top500.org)
而如果你仔細(xì)查看這個榜單的話,你會發(fā)現(xiàn)他們的排名是按照Rmax(實(shí)測峰值)和Rpeak(理論峰值)來進(jìn)行排序。而對于任何一臺計算機(jī)而言,Rpeak理論性能更多的是一種參考,Rmax實(shí)測性能則顯得更為關(guān)鍵,即使是超級計算機(jī)也是如此。接下來我們將范圍縮小至TOP5,看看這些世界頂級的超級計算機(jī)究竟在實(shí)力上有多大差距。
全球頂級超算TOP5實(shí)力排名
此前榜單的頭把交椅由中國的神威·太湖之光把持?jǐn)?shù)年,美國在五年之后發(fā)布Summit,重新奪回第一個寶座。從數(shù)據(jù)來看,Summit的實(shí)測峰值比神威·太湖之光高出了31%左右。由于我們采用實(shí)測峰值數(shù)據(jù)來進(jìn)行比較,再考慮到兩者創(chuàng)建時間的差別,因此兩者的實(shí)際差距其實(shí)并非像有些媒體宣稱的那樣近乎倍數(shù)的懸殊差距。
中國超算實(shí)力規(guī)模依然全球最強(qiáng)
接下來這組數(shù)據(jù)將會更加有趣,此前有媒體把TOP500榜單中的所有超級計算機(jī)進(jìn)行了國別的歸類,發(fā)現(xiàn)來自中國的超算上榜206臺,比例高達(dá)41%。來自美國的超算上榜124臺,比例是25%,中美兩個超級大國統(tǒng)治了全球超過65%的超級計算機(jī),雖然個體被美國超越,但中國超算的規(guī)模仍為全球當(dāng)之無愧的第一。
那么問題來了,中國如何再次超越美國Summit重奪全球超算性能第一的寶座?有的小伙伴說堆更多的處理器就好了,然而真實(shí)情況卻并非這么簡單!
技術(shù)封鎖下崛起的中國“芯”勢力
構(gòu)建一整套全球頂級的超算系統(tǒng)并非是單純的堆砌處理器這么簡單,首先要有足夠強(qiáng)悍的計算個體芯片、先進(jìn)的運(yùn)算管理技術(shù)、操作系統(tǒng)的支持,以及足夠的財力支持才能夠造的出。當(dāng)然這一切的背后,最核心的因素是還要有國家層面的政策扶持,以及足夠的尖端科技人才儲備。所以說,超算是一個國家綜合實(shí)力的體現(xiàn)一點(diǎn)也不為過。
我國的超算起步比較晚,但是進(jìn)步神速,這和我國高速發(fā)展需求和國家政策支持有著密不可分的關(guān)系。中國的天河二號超級計算機(jī)曾經(jīng)6次蟬聯(lián)世界超算TOP500冠軍,確立了中國在全球超算中的絕對地位。但是由于天河二號早期使用的是intel Xeon的芯片方案,引來了一些質(zhì)疑和非議。中國超算的快速崛起也使得美國政府在2015年頒布了引發(fā)轟動的“限售”事件:美國政府嚴(yán)禁intel等公司向中國四家超算中心出口高性能計算芯片。
國產(chǎn)Matrix-2000加速器替代intel Xeon
最近中美貿(mào)易摩擦和中興事件讓中國“芯”提升到了國家戰(zhàn)略的高度,其實(shí)在很多年以前美國就已經(jīng)對我國的高尖端芯片領(lǐng)域進(jìn)行“技術(shù)封鎖”。2015年美國“限售”事件爆發(fā),中國決定采用國產(chǎn)芯片替代。直至2017年9月份,廣州超算中心宣布年底前升級天河2號超算系統(tǒng),使用國產(chǎn)加速器Matrix-2000取代原本的Intel Xeon Phi加速器。通過國產(chǎn)芯片升級后的天河2A超級計算機(jī)取得了算力翻倍的驚人成績。
國產(chǎn)Matrix-2000賦予天河2A性能翻倍的
國產(chǎn)Matrix-2000的出現(xiàn)打破了美國的“技術(shù)封鎖”,升級后的天河2A超級計算機(jī)的浮點(diǎn)性能從之前的54.9PFLOPS提升到了94.97PFLOPS,互聯(lián)與I/O方面性能指標(biāo)也獲得了較大幅度的技術(shù)進(jìn)步。網(wǎng)絡(luò)帶寬從原來的10Gbps升級到了14Gbps,延遲從1.57us降至1us,內(nèi)存容量從1.4PB升級到了3.4PB,存儲容量從12.4PB升級到了19PB,帶寬翻倍到1TB/s,而功耗則從17.8MW降至16.9MW,能效大幅提升。
天河2A超級計算機(jī)實(shí)現(xiàn)國產(chǎn)芯片替代
略帶神秘色彩的Matrix-2000芯片是由國防科大自主研發(fā)設(shè)計,網(wǎng)傳由天津邁創(chuàng)公司出品。在中國超算白手起家的內(nèi)憂,疊加美國“禁售”的外患的大背景下,中國超算憑借自主研發(fā)的Matrix-2000實(shí)現(xiàn)“絕地反殺”,此舉無疑可以載入史冊。
唯有堅定完全自主研發(fā)才是出路
自中國863計劃實(shí)施以來,超級計算系統(tǒng)的研發(fā)受到了國家的高度重視,但由于基礎(chǔ)薄弱起步較晚,在國際舞臺中一直受制于人。美國商務(wù)部2015年實(shí)施“禁售”高端芯片事件爆發(fā),更是堅定了我國高端芯片自主研發(fā)的路線,并被提升到國家戰(zhàn)略高度。中國目前最強(qiáng)大的超級計算機(jī)——神威·太湖之光就是在這樣的背景下誕生的。
再次實(shí)現(xiàn)超越的神威·太湖之光超級計算機(jī)
神威·太湖之光超級計算機(jī)安裝了40960個中國自主研發(fā)的“申威26010”眾核處理器,該眾核處理器采用64位自主申威指令系統(tǒng),峰值性能為12.5億億次/秒,持續(xù)性能為9.3億億次/秒。2016年,國際TOP500組織發(fā)布的榜單顯示,“神威·太湖之光”超級計算機(jī)系統(tǒng)登頂榜單之首, 不僅速度比第二名“天河二號”快出近兩倍,其效率也提高3倍。
神秘的申威26010眾核處理器
申威26010眾核處理器采用64位自主申威指令系統(tǒng),峰值性能3.168萬億次每秒,核心工作頻率1.5GHz?!吧裢狻崩锇惭b有40960個這樣的處理器。使用中國自主芯片制造的“神威太湖之光”取代“天河二號”登上榜首,中國超算上榜總數(shù)量也有史以來首次超過美國名列第一。
申威26010眾核處理器的出現(xiàn)基本實(shí)現(xiàn)了對Intel Xeon Phi加速卡的替代。雖然在單片的性能上仍舊跟Intel Xeon存在性能上的差距,但是得益于體積和功耗上面的優(yōu)勢,可使得一個小小的機(jī)箱就可放置256個計算節(jié)點(diǎn),同體積計算性能反殺Intel Xeon Phi。
某專題片對申威26010的報道
相比其他國產(chǎn)芯片,申威則要顯得更加低調(diào)和神秘一些,因為申威處理器自誕生之初就背負(fù)著軍工國防和國家信息安全的使命,其研發(fā)單位總參謀部第五十六研究所(無錫江南計算技術(shù)研究所)于2003年開始著手設(shè)計中國人自己的高性能芯片。在國家"核高基"重大專項支持下,申威處理采用自主指令集開發(fā),且具有完全自主知識產(chǎn)權(quán)。
天河三號超級計算機(jī)有望2020年研制成功
雖然目前我國兩臺重量級超級計算機(jī)“神威·太湖之光”和“天河2A”被來自美國的“Summit”和“Sierra”所超越,但兩強(qiáng)交手互有勝負(fù)也在情理之中。據(jù)最新的消息顯示,我國“天河三號”目前正在積極的研發(fā)大眾,并有望在2020年重新奪回第一寶座,并實(shí)現(xiàn)對“神威·太湖之光”高達(dá)八倍的性能超越。更加值得期待的是,“天河三號”有望采用全自主創(chuàng)新設(shè)計,自主飛騰CPU、自主天河高速互聯(lián)通信,以及自主麒麟操作系統(tǒng)。
然而我們必須清醒的意識到,在芯片領(lǐng)域我們所面臨的對手是如此強(qiáng)大,無論IBM、intel、nVIDIA任何一個芯片公司都具有足夠強(qiáng)大的實(shí)力。同時需要特別注意的是,早在5年前,美國政府就已經(jīng)停止為超級計算機(jī)項目的贊助撥款。轉(zhuǎn)而開始大力投資量子計算機(jī)的研發(fā)工作。這也是此前美國超級計算機(jī)止步不前,最終被中國一舉超越的重要原因。
擺在國產(chǎn)芯片面前的挑戰(zhàn)和使命同樣重大,在當(dāng)前的國際局勢下,唯有鑒定的走自主研發(fā)的道路,徹底擺脫受制于人才是唯一出路。無論是2020年即將投入使用的“天河三號”,還是“神威·太湖之光”后續(xù)的升級,在關(guān)乎國家經(jīng)濟(jì)命脈和信息安全的超級計算機(jī)領(lǐng)域,國產(chǎn)芯片將會愈發(fā)壯大,讓我們拭目以待!