NVIDIA公布DGX SuperPOD , 全球排名第22位的超級計算機
NVIDIA今日公布的全球速度排名第22位的超級計算機 - DGX SuperPOD,清晰地詮釋了為何人工智能的領先地位需要由最佳的計算能力來支持。 DGX SuperPOD為滿足企業(yè)的自動駕駛汽車部署項目提供了所需的人工智能基礎設施。
該超級計算機系統(tǒng)的搭建,僅用時3個星期,采用了96臺NVIDIA DGX-2H超級計算機與Mellanox互聯(lián)技術。其處理能力高達9.4 petaflops,能夠用于訓練安全自動駕駛汽車所需要的海量深度神經網(wǎng)絡。
基于DGX SuperPOD的設計,客戶可通過任意DGX-2合作伙伴購買整套超級計算機系統(tǒng),或者其中的一部分。
自動駕駛汽車的人工智能訓練可以說得上是密集型計算密的終極挑戰(zhàn)。
一臺數(shù)據(jù)收集車輛每小時能生成1 TB數(shù)據(jù)。整個車隊經過數(shù)年行駛后,其數(shù)據(jù)量將會很快達到幾PB(千兆兆字節(jié))的量級。這些數(shù)據(jù)會被用來根據(jù)道路規(guī)則對算法進行訓練,并且還會被用來找出車輛內運行的深度神經網(wǎng)絡的潛在故障,然后在連續(xù)的循環(huán)中再次訓練。
NVIDIA人工智能基礎設施副總裁Clement Farabet表示:“若要保持人工智能領先地位,則需要在計算基礎設施方面保持領先。很少有像訓練自動駕駛汽車這樣對人工智能又如此之高的需求,其需要對神經網(wǎng)絡進行數(shù)萬次的反復訓練,以滿足極高的精度需求。對于如此大規(guī)模處理能力而言,DGX SuperPOD無可替代?!?/p>
DGX SuperPOD內含1,536顆NVIDIA V100 Tensor Core GPU,由NVIDIA NVSwitch及 Mellanox網(wǎng)絡結構相聯(lián)接,為其提供強力支持,使其能夠以同等大小的超級計算機所無可匹敵的性能處理數(shù)據(jù)。
該套系統(tǒng)能夠不間斷運行,優(yōu)化自動駕駛軟件,并以前所未有的周轉時間(turnaround time)反復訓練神經網(wǎng)絡。
例如,DGX SuperPOD軟硬件平臺能夠在不到2分鐘的時間之內完成ResNet-50訓練。在2015年,該人工智能模型推出的時候,即便采用當時最先進的系統(tǒng) – 單顆NVIDIA K80 GPU,也需要25天才能了完成訓練任務。而DGX SuperPOD生成結果的速度較之加快了18,000倍。
具備同等性能的其他TOP500超級計算機系統(tǒng)都由數(shù)千臺服務器構建而成,而DGX SuperPOD占地面積更少,其體積比這些同等系統(tǒng)小400倍左右。
如今,NVIDIA DGX系統(tǒng)已經被眾多有著大規(guī)模計算需求的企業(yè)機構所采用,例如寶馬、Continental、福特與Zenuity 等汽車公司,還有Facebook、微軟與富士膠片等公司,以及日本理化學研究所與美國能源部實驗室等研究領域的領導者。
參考架構,構建你自己的SuperPOD
DGX SuperPOD不僅能夠快速運行深度學習模型。
得益于其模塊化和企業(yè)級設計,該系統(tǒng)還能夠以極快的速度完成部署。
其他同等規(guī)模的系統(tǒng)通常需要6-9個月才能完成部署畢,而對于DGX SuperPOD而言,在工程師采用經過驗證的規(guī)范性方法情況下,其僅需3個星期即可部署完畢。
通過構建像DGX SuperPOD這樣的超級計算機,使NVIDIA從中學會了如何設計面向大規(guī)模人工智能機器的系統(tǒng)。這是超級計算機技術領域內的一大進步,這讓大規(guī)模計算能力得以跨出學術界,為那些想要使用高性能計算加快其各種計劃的交通運輸公司及其他行業(yè)所用。
對于那些還沒有部署人工智能的數(shù)據(jù)中心的企業(yè)機構而言,如果他們希望使用NVIDIA SuperPOD架構來滿足其需求,NVIDIA則可以通過DGX-Ready Data Center計劃為其提供簡單化快速的部署。
NVIDIA的數(shù)據(jù)中心托管服務提供商將隨時幫助企業(yè)客戶構建并部署基于DGX系統(tǒng)的世界級人工智能數(shù)據(jù)中心。
創(chuàng)新始于內部
在NVIDIA推出的自研系統(tǒng)當中,DGX SuperPOD不是其中唯一一個出現(xiàn)在全球最快速超級計算機TOP500榜單上的系統(tǒng)。
NVIDIA于2016年推出的SATURNV系統(tǒng)此前就曾率先登上了Green500榜首位置,其被視作全球最經濟高效的系統(tǒng),在TOP500榜單排名第28位。
隨后,SATURNV Volta(由NVIDIA DGX-1系統(tǒng)提供支持)與DGX-2H POD也因其強大性能與高能效而得到認可。
在Green500最新榜單上的25強超級計算機中,有22套都采用了基于NVIDIA GPU的設備。