NVIDIA公布DGX SuperPOD , 全球排名第22位的超級(jí)計(jì)算機(jī)
NVIDIA今日公布的全球速度排名第22位的超級(jí)計(jì)算機(jī) - DGX SuperPOD,清晰地詮釋了為何人工智能的領(lǐng)先地位需要由最佳的計(jì)算能力來(lái)支持。 DGX SuperPOD為滿足企業(yè)的自動(dòng)駕駛汽車(chē)部署項(xiàng)目提供了所需的人工智能基礎(chǔ)設(shè)施。
該超級(jí)計(jì)算機(jī)系統(tǒng)的搭建,僅用時(shí)3個(gè)星期,采用了96臺(tái)NVIDIA DGX-2H超級(jí)計(jì)算機(jī)與Mellanox互聯(lián)技術(shù)。其處理能力高達(dá)9.4 petaflops,能夠用于訓(xùn)練安全自動(dòng)駕駛汽車(chē)所需要的海量深度神經(jīng)網(wǎng)絡(luò)。
基于DGX SuperPOD的設(shè)計(jì),客戶可通過(guò)任意DGX-2合作伙伴購(gòu)買(mǎi)整套超級(jí)計(jì)算機(jī)系統(tǒng),或者其中的一部分。
自動(dòng)駕駛汽車(chē)的人工智能訓(xùn)練可以說(shuō)得上是密集型計(jì)算密的終極挑戰(zhàn)。
一臺(tái)數(shù)據(jù)收集車(chē)輛每小時(shí)能生成1 TB數(shù)據(jù)。整個(gè)車(chē)隊(duì)經(jīng)過(guò)數(shù)年行駛后,其數(shù)據(jù)量將會(huì)很快達(dá)到幾PB(千兆兆字節(jié))的量級(jí)。這些數(shù)據(jù)會(huì)被用來(lái)根據(jù)道路規(guī)則對(duì)算法進(jìn)行訓(xùn)練,并且還會(huì)被用來(lái)找出車(chē)輛內(nèi)運(yùn)行的深度神經(jīng)網(wǎng)絡(luò)的潛在故障,然后在連續(xù)的循環(huán)中再次訓(xùn)練。
NVIDIA人工智能基礎(chǔ)設(shè)施副總裁Clement Farabet表示:“若要保持人工智能領(lǐng)先地位,則需要在計(jì)算基礎(chǔ)設(shè)施方面保持領(lǐng)先。很少有像訓(xùn)練自動(dòng)駕駛汽車(chē)這樣對(duì)人工智能又如此之高的需求,其需要對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)萬(wàn)次的反復(fù)訓(xùn)練,以滿足極高的精度需求。對(duì)于如此大規(guī)模處理能力而言,DGX SuperPOD無(wú)可替代?!?/p>
DGX SuperPOD內(nèi)含1,536顆NVIDIA V100 Tensor Core GPU,由NVIDIA NVSwitch及 Mellanox網(wǎng)絡(luò)結(jié)構(gòu)相聯(lián)接,為其提供強(qiáng)力支持,使其能夠以同等大小的超級(jí)計(jì)算機(jī)所無(wú)可匹敵的性能處理數(shù)據(jù)。
該套系統(tǒng)能夠不間斷運(yùn)行,優(yōu)化自動(dòng)駕駛軟件,并以前所未有的周轉(zhuǎn)時(shí)間(turnaround time)反復(fù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
例如,DGX SuperPOD軟硬件平臺(tái)能夠在不到2分鐘的時(shí)間之內(nèi)完成ResNet-50訓(xùn)練。在2015年,該人工智能模型推出的時(shí)候,即便采用當(dāng)時(shí)最先進(jìn)的系統(tǒng) – 單顆NVIDIA K80 GPU,也需要25天才能了完成訓(xùn)練任務(wù)。而DGX SuperPOD生成結(jié)果的速度較之加快了18,000倍。
具備同等性能的其他TOP500超級(jí)計(jì)算機(jī)系統(tǒng)都由數(shù)千臺(tái)服務(wù)器構(gòu)建而成,而DGX SuperPOD占地面積更少,其體積比這些同等系統(tǒng)小400倍左右。
如今,NVIDIA DGX系統(tǒng)已經(jīng)被眾多有著大規(guī)模計(jì)算需求的企業(yè)機(jī)構(gòu)所采用,例如寶馬、Continental、福特與Zenuity 等汽車(chē)公司,還有Facebook、微軟與富士膠片等公司,以及日本理化學(xué)研究所與美國(guó)能源部實(shí)驗(yàn)室等研究領(lǐng)域的領(lǐng)導(dǎo)者。
參考架構(gòu),構(gòu)建你自己的SuperPOD
DGX SuperPOD不僅能夠快速運(yùn)行深度學(xué)習(xí)模型。
得益于其模塊化和企業(yè)級(jí)設(shè)計(jì),該系統(tǒng)還能夠以極快的速度完成部署。
其他同等規(guī)模的系統(tǒng)通常需要6-9個(gè)月才能完成部署畢,而對(duì)于DGX SuperPOD而言,在工程師采用經(jīng)過(guò)驗(yàn)證的規(guī)范性方法情況下,其僅需3個(gè)星期即可部署完畢。
通過(guò)構(gòu)建像DGX SuperPOD這樣的超級(jí)計(jì)算機(jī),使NVIDIA從中學(xué)會(huì)了如何設(shè)計(jì)面向大規(guī)模人工智能機(jī)器的系統(tǒng)。這是超級(jí)計(jì)算機(jī)技術(shù)領(lǐng)域內(nèi)的一大進(jìn)步,這讓大規(guī)模計(jì)算能力得以跨出學(xué)術(shù)界,為那些想要使用高性能計(jì)算加快其各種計(jì)劃的交通運(yùn)輸公司及其他行業(yè)所用。
對(duì)于那些還沒(méi)有部署人工智能的數(shù)據(jù)中心的企業(yè)機(jī)構(gòu)而言,如果他們希望使用NVIDIA SuperPOD架構(gòu)來(lái)滿足其需求,NVIDIA則可以通過(guò)DGX-Ready Data Center計(jì)劃為其提供簡(jiǎn)單化快速的部署。
NVIDIA的數(shù)據(jù)中心托管服務(wù)提供商將隨時(shí)幫助企業(yè)客戶構(gòu)建并部署基于DGX系統(tǒng)的世界級(jí)人工智能數(shù)據(jù)中心。
創(chuàng)新始于內(nèi)部
在NVIDIA推出的自研系統(tǒng)當(dāng)中,DGX SuperPOD不是其中唯一一個(gè)出現(xiàn)在全球最快速超級(jí)計(jì)算機(jī)TOP500榜單上的系統(tǒng)。
NVIDIA于2016年推出的SATURNV系統(tǒng)此前就曾率先登上了Green500榜首位置,其被視作全球最經(jīng)濟(jì)高效的系統(tǒng),在TOP500榜單排名第28位。
隨后,SATURNV Volta(由NVIDIA DGX-1系統(tǒng)提供支持)與DGX-2H POD也因其強(qiáng)大性能與高能效而得到認(rèn)可。
在Green500最新榜單上的25強(qiáng)超級(jí)計(jì)算機(jī)中,有22套都采用了基于NVIDIA GPU的設(shè)備。