《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > 美國超算重奪全球第一,性能超神威·太湖之光60%!

美國超算重奪全球第一,性能超神威·太湖之光60%!

2018-06-10
關(guān)鍵詞: 超級計算機 ORNL 人工智能

微信圖片_20180610215452.jpg

美國Summit超級計算機現(xiàn)在已經(jīng)在美國橡樹嶺國家實驗室運行,峰值運算速度達到200 petaflops,超神威·太湖之光的60%。如無意外,它將在本月底公布的Top 500榜單中名列第一,讓美國重奪“世界上最強大超算”桂冠。而且,它的設(shè)計非常適應(yīng)人工智能技術(shù),被譽為“最聰明超算”。


備受關(guān)注的美國Summit超級計算機現(xiàn)在已經(jīng)在美國橡樹嶺國家實驗室(ORNL)運行。這臺新的超級計算機被非官方地稱為“世界上最強大的計算機”。而且,它的設(shè)計部分是為了擴大人工智能技術(shù)的應(yīng)用范圍。


自2013年6月“世界最強超算”的桂冠被中國的神威·太湖之光超級計算機摘取以來,美國一直沒有擁有奪回這個稱號。Summit超算預(yù)計在本月晚些時候正式發(fā)布,屆時國際“TOP 500”組織將正式發(fā)表世界超級計算機Top 500榜單。除非中國本月爆出大驚喜,否則新的排名公布后,Summit將使美國重回超算Top 500榜單的第一名。


盡管在云計算和大型數(shù)據(jù)中心的時代,超級計算機已經(jīng)失去了一些吸引力。但許多棘手的計算問題仍需要大型的機器。美國政府去年發(fā)布的一份報告提出,美國應(yīng)加大對超級計算機的投資,以便在核武器和高超音速飛機等國防項目,以及航空、石油勘探和制藥等領(lǐng)域的商業(yè)創(chuàng)新等方面趕上中國。


Summit:比普通筆記本電腦快100萬倍,比神威·太湖之光快2倍

微信圖片_20180610215518.jpg


Summit超算由IBM和NVIDIA為美國能源部的橡樹嶺國家實驗室制造,其占地面積相當于兩個網(wǎng)球場大小,為了冷卻其37000個處理器,周圍的循環(huán)系統(tǒng)每分鐘要消耗4000加侖的水。盡管美國能源部(DOE)尚未透露Summit的Linpack測試結(jié)果,但橡樹嶺國家實驗室表示,Summit的峰值運算速度達到200 petaflops,也就是每秒浮點運算次數(shù)達到200千兆次。這比普通筆記本電腦的運算速度快100萬倍,是神威·太湖之光(93.01 PFLOPS)峰值性能的兩倍有多。

200 petaflops是什么概念呢?如《紐約時報》所述,一個人需要花630億年的時間來完成Summit一秒鐘內(nèi)可以完成的計算。而MIT技術(shù)評論說,“地球上的每個人每天每秒鐘進行一次計算,持續(xù)305天,才能完成Summit超算眨眼之間可以做完的事情?!?/p>

微信圖片_20180610215539.jpg

Summit超級計算機的4608臺服務(wù)器內(nèi)部的視圖。圖:橡樹嶺國家實驗室

盡管Summit的基本規(guī)格已經(jīng)公開有一段時間了,但這里還是有必要重新介紹一下:Summit由4608個節(jié)點組成,每個節(jié)點包含兩個Power9 CPU和6個NVIDIA Tesla V100 GPU。節(jié)點與Mellanox雙軌EDR InfiniBand網(wǎng)絡(luò)連接在一起,為每臺服務(wù)器提供200 Gbps的速度。


假設(shè)所有這些節(jié)點都配備齊全,GPU單獨將以雙精度提供峰值215 petaflops。此外,由于每個V100還提供125 teraflops的混合精度 Tensor Core 操作,系統(tǒng)對深度學(xué)習(xí)運算的峰值性能大約為3.3 exaflops。


exaflops級的性能也不僅僅是理論上的。根據(jù)ORNL主任Thomas Zacharia的說法,在早期的測試中,橡樹嶺國家實驗室的研究人員在一個分析人類基因組序列變化的項目中,使用Summit超算每秒進行了超過10的18次方次的計算。他們聲稱這是科學(xué)計算第一次達到這樣的計算規(guī)模。


比以往任何超算都更適合機器學(xué)習(xí)技術(shù)


美國新推出的這臺最強超算不僅僅對計算力的地緣政治意義重大。它的設(shè)計比以前的超級計算機更適合運行谷歌、蘋果等科技公司流行的機器學(xué)習(xí)技術(shù)。

研究人員發(fā)現(xiàn),圖形芯片可以為深度神經(jīng)網(wǎng)絡(luò)技術(shù)提供更多計算力,這也是計算機可以在聲音識別、棋盤游戲等方面打敗人類的一個原因。Facebook最近披露,一個使用數(shù)十億張Instagram照片的人工智能實驗,在近一個月的時間里占據(jù)了數(shù)百張顯卡。


Summit擁有近28000個英偉達(Nvidia)生產(chǎn)的圖形處理器,以及IBM生產(chǎn)的9000多個傳統(tǒng)處理器。對于超級計算機來說,使用大量的圖形芯片是不常見的,因此它應(yīng)該能在部署機器學(xué)習(xí)以處理艱難的科學(xué)問題方面實現(xiàn)突破。橡樹嶺國家實驗室主任Thomas Zacharia說:“我們打造了世界上最強大的超級計算機,但它也是世界上最聰明的超級計算機?!?/p>

微信圖片_20180610215558.jpg

Summit的數(shù)千臺服務(wù)器占地有兩個網(wǎng)球場那么大。圖:Carlos Jones/橡樹嶺國家實驗室


當然,Summit還將支持美國能源部最感興趣的標準科學(xué)規(guī)范,特別是那些與核聚變能源、替代能源、材料科學(xué)、氣候研究、計算化學(xué)和宇宙學(xué)等相關(guān)的科學(xué)規(guī)范。但由于這是開放的科學(xué)系統(tǒng),可用于所有類型的研究,可以與能源無關(guān)。Summit也將用于醫(yī)療保健的應(yīng)用領(lǐng)域,如藥物發(fā)現(xiàn)、癌癥研究、成癮和其他類型的疾病研究。事實上,在宣布該系統(tǒng)投入使用的新聞發(fā)布會上,Zacharia表示,他希望橡樹嶺國家實驗室成為“醫(yī)療數(shù)據(jù)分析領(lǐng)域的歐洲核子研究中心”。


“分析”與Summit的深度學(xué)習(xí)傾向非常吻合,因為前者實際上是后者的疊加。早在2014年,當美國能源部第一次簽約Summit系統(tǒng)時,能源部可能只對他們將得到的AI能力有一個粗略的概念。盡管IBM在將Power9-GPU平臺提交給美國能源部之前一直在宣傳其以數(shù)據(jù)為中心的超級計算方法,但當時人工智能/機器學(xué)習(xí)應(yīng)用領(lǐng)域仍處于初級階段。由于NVIDIA決定將專用的 Tensor Cores 集成到V100中,Summit最終成為了一個AI巨獸,同時也是一個強大的HPC機器。


因此,除了高性能計算的之外,該系統(tǒng)還可能參與大量尖端的人工智能研究。目前,Summit只對經(jīng)選擇的項目開放。到2019年,該系統(tǒng)將變得更加廣泛可用,包括將用于理論與實驗創(chuàng)新計算項目(INCITE)。


到時,Summit的前任Titan超級計算機很可能會退役。Summit的性能約為Titan的8倍,能效提高5倍。當橡樹嶺在2012年安裝Titan時,它是當時世界上最強大的系統(tǒng),也是美國最快的超級計算機(現(xiàn)在是第二快)。Titan也擁有NVIDIA GPU,但這些都是K20X圖形處理器,其機器學(xué)習(xí)能力僅限于每個設(shè)備四個單精度teraflops。幸運的是,為Titan開發(fā)的所有支持GPU的HPC的代碼都應(yīng)該能夠輕松移植到Summit上,并且應(yīng)該能夠充分利用V100更高的計算能力。


伊利諾伊大學(xué)厄巴納-香檳分校國家超級計算應(yīng)用中心的研究員Eliu Huerta將Summit的龐大GPU池描述為“像夢境一樣”。Huerta此前曾在一臺名為Blue Waters的超級計算機上使用機器學(xué)習(xí)技術(shù),在LIGO天文臺的數(shù)據(jù)中探測引力波。LIGO天文臺的兩位創(chuàng)始人因此獲得了2017年諾貝爾物理學(xué)獎。Huerta希望Summit的成果將有助于分析預(yù)計將于2019年啟用的大型天氣觀測望遠鏡每晚接收到的約15 TB的圖像。


Summit還將被用于在化學(xué)和生物學(xué)的問題中利用深度學(xué)習(xí)技術(shù)。 Zacharia說,這項研究可能有助于能源部的一個項目,該項目使用來自2200萬退伍軍人的醫(yī)療記錄,其中包括大約25萬人的完整基因組序列。


有些人擔心美國在超大規(guī)模計算機上的競爭力,他們希望,Summit將激發(fā)對打造其繼任者的更多興趣。


Summit還將發(fā)揮另一個重要作用,即為E級科學(xué)應(yīng)用提供一個發(fā)展平臺。作為橡樹嶺國家實驗室的最后一個petascale系統(tǒng),這臺200 petascale的超算將成為未來幾年一系列HPC代碼向exascale機器轉(zhuǎn)移的墊腳石?,F(xiàn)在,隨著Summit的完成,這似乎不再是一個遙遠的前景了?!爱吘?,(E級計算)離我們現(xiàn)在的超算能力只差5倍,”Zacharia笑著說。


美國、中國、日本和歐盟都宣布了第一臺“E級”(exascale)計算機——每秒計算能力超過千萬億次——這是大規(guī)模計算的下一個里程碑。美國信息技術(shù)與創(chuàng)新基金會全球創(chuàng)新政策副總裁Stephen Ezell說,中國宣稱將在2020年實現(xiàn)這一里程碑,如果Summit的繼任者Aurora按照計劃完成,美國可能會在2021年實現(xiàn)這一目標。但該計劃此前曾被推遲?!案咝阅苡嬎銓τ谝粋€國家的國家安全,經(jīng)濟競爭力和應(yīng)對科學(xué)挑戰(zhàn)的能力來說都是必不可少的,”Ezell說。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。