123,123,123

Nvidia黄仁勋发布了全球最大GPU

日期： 2018-03-28

關(guān)鍵詞： GPU DGX SSD 数据传输

來源：內(nèi)容來自「鳳凰科技花子健」，謝謝。

北京時間3月28日凌晨00:00，英偉達(dá)GTC 2018（GPU Technology Conference 2018，以下簡稱GTC）在美國圣何塞舉行。英偉達(dá)再一次在提升計(jì)算力的路上越走越遠(yuǎn)。GPU產(chǎn)品依然是主旋律，Tesla V100系列、DGX系列和Quadro GPU系列都進(jìn)行了更新。

微信圖片_20180328175543.jpg

鳳凰網(wǎng)科技花子健發(fā)自美國圣何塞

新產(chǎn)品—全世界最大的GPU只要399

微信圖片_20180312123633.png

全新Tesla V100顯存將從原來的16GB提升至32GB。2017年5月11日，英偉達(dá)正式發(fā)布了全新Volta架構(gòu)GPU——NVIDIA Tesla V100，它擁有超過210億個晶體管，是上代TeslaP100的1.37倍。它的單精度浮點(diǎn)性能高達(dá)15 TFLOPS，雙精度浮點(diǎn)7.5 TFLOPS。

基于此前的NVIDIA NVLink架構(gòu)，英偉達(dá)還推出了全新的NVSwitch架構(gòu)。這一互聯(lián)架構(gòu)的帶寬比PCle交換機(jī)高5倍，足以支持更大規(guī)模和復(fù)雜的數(shù)據(jù)集運(yùn)算，讓開發(fā)者和科學(xué)家可以構(gòu)建更高級的系統(tǒng)。

基于Tesla V100的升級和全新的NVSwitch架構(gòu)，英偉達(dá)將DGX 2的性能較前一代產(chǎn)品有大幅度提升。

在2016年的GTC上英偉達(dá)正式發(fā)布DGX 1，它擁有8顆帕斯卡架構(gòu)GP100核心的Tesla P100 GPU，以及7TB的SSD，由兩顆16核心的Xeon E5-2698v3以及512GB的DDR4內(nèi)存驅(qū)動。售價為129000美元。2017年9月份，英偉達(dá)推出了一款基于Volta架構(gòu)的DGX 1V，擁有8塊Tesla V100。

而DGX 2應(yīng)用了最新的NVSwitch架構(gòu)，通過12個NVSwitch支持16塊全新的Tesla V100共享同一的內(nèi)存空間，總計(jì)512 GB HBM2存儲，能實(shí)現(xiàn)每秒高達(dá)2千萬次的浮點(diǎn)運(yùn)算。此外，基于NVSwitch架構(gòu)的應(yīng)用，16塊GPU可以實(shí)現(xiàn)2.4TB/秒的數(shù)據(jù)傳輸能力。

微信圖片_20180328175553.jpg

DGX 2內(nèi)含16顆Tesla V100芯片

“這是全球最大的GPU?！秉S仁勛表示，他還用“美麗、性感”等詞語來形容這一款最新的DGX系列產(chǎn)品。

DGX 2的售價，黃仁勛首先給出的是150萬美元，最后直接減價為39.9萬美元，將在今年的第三季度正式開放購買。

面向藝術(shù)及設(shè)計(jì)領(lǐng)域，英偉達(dá)還推出了搭載了NVIDIA RTX（實(shí)時光線追蹤）技術(shù)的NVIDIA Quadro GV100 GPU。單塊GPU擁有32GB內(nèi)存，可以基于NVLink技術(shù)將兩塊GV100 GPU并聯(lián)，從而將內(nèi)存提升至64GB。在前一周的游戲開發(fā)者大會上，英偉達(dá)正式推出了NVIDIA RTX技術(shù)。

GV100 GPU基于最新的Volta架構(gòu)，可以提供每秒7.4萬億次浮點(diǎn)運(yùn)算的雙精度性能，每秒14.8萬億次浮點(diǎn)運(yùn)算的單精度性能，以及每秒118.5萬億次浮點(diǎn)運(yùn)算的深度學(xué)習(xí)性能。

微信圖片_20180328175557.jpg

黃仁勛手中的GV100 GPU

這款產(chǎn)品主要針對傳媒娛樂從業(yè)者、產(chǎn)品設(shè)計(jì)師、建筑設(shè)計(jì)師等專業(yè)設(shè)計(jì)與流媒體專業(yè)人員。其中，NVIDIA RTX內(nèi)置的NVIDIA OpitX AI-denoiser可以實(shí)現(xiàn)實(shí)時的AI降噪去噪。

硬件之外，英偉達(dá)還發(fā)布了針對軟件的更新——TensorRT 4軟件。這一軟件可用于優(yōu)化、驗(yàn)證和部署在超大規(guī)模數(shù)據(jù)中心、嵌入式與汽車GPU平臺中經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。

為了籠絡(luò)更多的開發(fā)者，英偉達(dá)與谷歌的工程師將TensorRT集成至谷歌的TensorFlow 1.7中。

自動駕駛—暫停自動駕駛研發(fā)

微信圖片_20180312123633.png

微信圖片_20180328175603.jpg

自動駕駛?cè)栽诒敬蜧TC的討論之列

英偉達(dá)的自動駕駛平臺可以統(tǒng)稱為Drive PX系列。但是其實(shí)，Drive PX只是NVIDIA車載AI平臺的系列名稱。而這個系列目前主要包括兩代產(chǎn)品：已經(jīng)量產(chǎn)的Drive PX 2平臺，以及在2018年初展示的新一代平臺Xavier。

不過黃仁勛卻在GTC 2018上宣布英偉達(dá)將暫停自動駕駛的研發(fā)工作，雖然沒有說明何時能再推進(jìn)這一進(jìn)程，但是他也表示“不會太久?！?/p>

在2018年2月9日對外發(fā)布的2018財(cái)年第四季度及全年財(cái)報中，英偉達(dá)曾經(jīng)提到過與Uber、Aurora合作打造自動駕駛汽車，采用的就是開源的NVIDIA Drive人工智能自動駕駛平臺。

美國當(dāng)?shù)貢r間3月18日晚上，亞利桑那州一名女子被Uber自動駕駛汽車撞傷，之后不幸身亡。這是全球首例自動駕駛車輛致人死亡的事故，隨后Uber宣布將暫停其在美國和加拿大的自動駕駛項(xiàng)目。隨后在26日，亞利桑那州州長宣布暫禁Uber在亞利桑那州公路測試自駕車。

黃仁勛在回答媒體關(guān)于該案件的提問時表示，英偉達(dá)對于這個意外感到悲傷，但是自動駕駛的研究本身是沒有錯的，應(yīng)該從這個案件中吸取經(jīng)驗(yàn)，提升自動駕駛的安全性。作為Uber在自動駕駛領(lǐng)域的合作方之一，英偉達(dá)暫停自動駕駛的研發(fā)可能和Uber的自動駕駛汽車撞人致死案有關(guān)，但其并沒有完全放棄自動駕駛項(xiàng)目。

微信圖片_20180328175607.jpg

英偉達(dá)的DRIVE Constellation仿真系統(tǒng)

英偉達(dá)在GTC上推出了針對自動駕駛汽車測試的仿真系統(tǒng)——DRIVE Constellation。

DRIVE Constellation仿真系統(tǒng)是一套使用照片級真實(shí)感模擬，基于云的自動駕駛汽車測試系統(tǒng)。它基于兩個不同的服務(wù)器，第一臺服務(wù)器運(yùn)行的是DRIVE Sim軟件，可以模擬自動駕駛汽車的傳感器，比如攝像頭、激光雷達(dá)和雷達(dá)等。

DRIVE Sim軟件可以通過生成照片級的數(shù)據(jù)流，從而創(chuàng)建不同的測試環(huán)境，比如晴天、暴雨、暴雪等不同的天氣狀況、日間和夜間等不同的光線狀況、急轉(zhuǎn)彎或陡坡等不同的路面狀況。并且在模擬過程中設(shè)置各種危險和突發(fā)狀況，比如行人突然穿越馬路等，以測試自動駕駛汽車的反應(yīng)能力，以確定其不會對人帶來安全威脅。

第二臺服務(wù)器搭載的是NVIDIA DRIVE Pegasus AI汽車計(jì)算平臺，運(yùn)行完整的自動駕駛汽車軟件堆棧，并能夠處理傳感器搜集模擬數(shù)據(jù)。經(jīng)過處理的數(shù)據(jù)會被反饋給傳感器，一直進(jìn)行數(shù)據(jù)的循環(huán)。

從時間來看，英偉達(dá)推出的這個仿真系統(tǒng)和Uber的自動駕駛汽車撞人致死案并無太大關(guān)聯(lián)，不過在長遠(yuǎn)的未來，它將能有效幫助提升自動駕駛汽車測試的安全性。

新合作—與ARM合作布局IoT

微信圖片_20180312123633.png

英偉達(dá)還宣布與ARM達(dá)成了合作，共同為全球數(shù)十億臺IoT設(shè)備提供深度學(xué)習(xí)的能力。雙方將開源的英偉達(dá)深度學(xué)習(xí)加速器整合到ARM的Project Trillium機(jī)器學(xué)習(xí)平臺上。

2018年2月23日，ARM推出了Project Trillium項(xiàng)目，這是一套包括新的高度可擴(kuò)展處理器的ARM IP組合，這些產(chǎn)品可以提供增強(qiáng)的機(jī)器學(xué)習(xí)(ML)和神經(jīng)網(wǎng)絡(luò)(NN)功能。當(dāng)前的技術(shù)產(chǎn)品主要針對移動設(shè)備市場，將讓全新的搭載機(jī)器學(xué)習(xí)功能的設(shè)備具有先進(jìn)的計(jì)算能力，包括先進(jìn)的目標(biāo)檢測功能。

在將英偉達(dá)深度學(xué)習(xí)加速器整合到Project Trillium之后，全球數(shù)十億臺的消費(fèi)電子設(shè)備上的IoT芯片將具備機(jī)器學(xué)習(xí)能力。

GTC之外—計(jì)算力提升從創(chuàng)新驅(qū)動變?yōu)樾枨篁?qū)動

微信圖片_20180312123633.png

提到英偉達(dá)和黃仁勛，就不得不提到CPU。在2017年的GTC上，黃仁勛曾聲稱摩爾定律已經(jīng)終結(jié)，設(shè)計(jì)人員無法再創(chuàng)造出可以實(shí)現(xiàn)更高指令集并行的GPU架構(gòu)，晶體管數(shù)量每年增長50%，但CPU的性能每年僅增長10%。

在演講中，黃仁勛沒有放過任何一次揶揄CPU的機(jī)會。不管是更新后的Tesla V100、DGX 2，還是最新發(fā)布的GV100 GPU，黃仁勛聲稱“在提供相同的計(jì)算力下，它們都比CPU組成的集群要更節(jié)能、高效，占用更少的空間?！?/p>

“買得越多，省得越多?！币呀?jīng)成了他的口頭禪。然而回歸到英偉達(dá)本身，其本身的高速增長很大一部分是依賴于市場對圖形芯片的巨大需求。

在英偉達(dá)公布的2018財(cái)年第四季度財(cái)報中，雖然數(shù)據(jù)中心業(yè)務(wù)同比實(shí)現(xiàn)了一倍多的增長達(dá)到6.06億美元。但游戲圖形芯片業(yè)務(wù)的營收達(dá)17.4億美元，同比增長29%，占該季度總營收的一半以上。

“加密貨幣市場的強(qiáng)勁需求超出了我們的預(yù)期。” 英偉達(dá)首席財(cái)務(wù)官科萊特·克雷斯表示，“盡管加密貨幣對我們業(yè)務(wù)的總體貢獻(xiàn)仍難以量化，但我們認(rèn)為，其在營收中所比例高于上一季度?！?/p>

從產(chǎn)品本身來說， GPU目前只能是不斷疊加性能，帶來的驚喜越來越少。以DGX系列為例，內(nèi)含的GPU芯片從4顆變成了8顆，今年從8顆增長到了16顆，改變的只不過是互聯(lián)的架構(gòu)。單顆芯片的算力提升越來越難，英偉達(dá)的“橫向發(fā)展”只是另辟蹊徑。

不過，英特爾的Nervana芯片，谷歌的TPU（目前只在谷歌內(nèi)部使用）對于英偉達(dá)來說是潛在的競爭對手。有競爭在，更大的驚喜才有可能會到來。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

Nvidia黄仁勋发布了全球最大GPU

日期： 2018-03-28

相關(guān)內(nèi)容