在英偉達(dá)GTC大會期間的全球媒體/分析師電話會議中,英偉達(dá)CEO黃仁勛首次提出“四大支柱”,并就“與Arm生態(tài)的合作、以及新趨勢下處理器的發(fā)展”等問題回應(yīng)了與非網(wǎng)。
首提“四大支柱”
黃仁勛提出,四大技術(shù)正在影響未來,也正在成為英偉達(dá)重要的發(fā)展支柱。
一是云原生平臺NVIDIA Omniverse
他表示,人類與AI和機(jī)器人共存的虛擬實(shí)時(shí)3D世界不再只是科幻小說中的故事情節(jié),通過Omniverse可以創(chuàng)建共享的虛擬3D世界。為了實(shí)現(xiàn)這一點(diǎn),Omniverse現(xiàn)可擴(kuò)展至多個(gè)GPU、具有高物理精度、能夠充分運(yùn)用RTX實(shí)時(shí)路徑追蹤等技術(shù),并且與NVIDIA AI完全集成。今年夏季開始,英偉達(dá)還將提供Omniverse企業(yè)授權(quán)許可,進(jìn)一步擴(kuò)大應(yīng)用范圍。
二是圍繞云原生AI服務(wù)的計(jì)算需求
英偉達(dá)正在從底層進(jìn)行自下而上的顛覆創(chuàng)新。全新的AI計(jì)算機(jī)DGX雙管齊下,包括便攜式AI數(shù)據(jù)中心DGX Station,以及為密集型AI研發(fā)打造的AI數(shù)據(jù)中心產(chǎn)品NVIDIA DGX SuperPod;搭載Aerial A100的NVIDIA EGX服務(wù)器,是業(yè)界首個(gè)具備云原生技術(shù)、安全性和AI邊緣數(shù)據(jù)中心能力的5G基站;此外,還有量子電路模擬框架CuQuantum,這是專為模擬量子電路而設(shè)計(jì)的加速庫,更適合大GPU顯存、多GPU和多DGX節(jié)點(diǎn)所需。
還有面向數(shù)據(jù)中心的兩款芯片:一款是全球首款專為TB級加速計(jì)算而設(shè)計(jì)的CPU Grace,另一款是專為現(xiàn)代超大規(guī)模云技術(shù)基礎(chǔ)架構(gòu)而生的DPU BlueField。至此,英偉達(dá)的數(shù)據(jù)中心路線圖將由三種芯片組成:CPU、GPU、DPU,三類芯片,每年一次飛躍。
三是將AI擴(kuò)展到邊緣應(yīng)用
我們現(xiàn)在正處于第二輪AI發(fā)展浪潮的起點(diǎn),這波發(fā)展將以企業(yè)和產(chǎn)業(yè)邊緣計(jì)算為主,AI將徹底改變?nèi)虼笮托袠I(yè),包括制造、物流、農(nóng)業(yè)、醫(yī)療健康、金融服務(wù)和運(yùn)輸業(yè)。他表示,英偉達(dá)的AI服務(wù)尚未完全覆蓋每一個(gè)計(jì)算領(lǐng)域,而下一個(gè)重點(diǎn)就是企業(yè)計(jì)算。面向企業(yè)級的NVIDIA EGX,將繼續(xù)擴(kuò)大NVIDIA-Certified認(rèn)證服務(wù)器生態(tài)系統(tǒng),使得企業(yè)用戶的使用和部署更為便捷。
四是自動駕駛
黃仁勛表示,將于2022年投產(chǎn)的NVIDIA自動駕駛汽車計(jì)算系統(tǒng)級芯片NVIDIA DRIVE Orin,旨在成為汽車的中央電腦。最新發(fā)布的新一代車載系統(tǒng)級芯片NVIDIA DRIVE Atlan,將為汽車帶來真正的數(shù)據(jù)中心。對于Atlan,黃仁勛寄予厚望,聲稱“Atlan集英偉達(dá)在AI、汽車、機(jī)器人、安全和BlueField安全數(shù)據(jù)中心領(lǐng)域技術(shù)之大成”,而現(xiàn)在,它已“整裝待發(fā),將帶來新一輪的巨大飛躍?!?/p>
與Arm生態(tài)彼此需要、互相借力
根據(jù)此次GTC上釋出的消息,英偉達(dá)與Arm生態(tài)的合作全面覆蓋了云、高性能計(jì)算、邊緣、企業(yè)級計(jì)算、PC,這是否是并購進(jìn)展順利的一個(gè)訊號?兩個(gè)生態(tài)未來的交融又有哪些計(jì)劃?
“這將是非常的重要一步”,黃仁勛表示,“Arm在嵌入式和移動設(shè)備領(lǐng)域取得了巨大的成功,一是因?yàn)榧夹g(shù)效能非常好,二是因?yàn)槠鋵@S可模式,有很強(qiáng)的可塑性,用戶可以基于其IP打造自己想要的任何產(chǎn)品,來滿足市場上多種多樣的需求。這是Arm的成功之處,可以說Arm打造出了芯片上的城市(SoC)”。
他指出,這兩大驅(qū)動因素發(fā)揮得最好的領(lǐng)域就是嵌入式和移動設(shè)備,SoC的理念對Arm來說非常重要,保證了Arm作為中央處理的核心利益。但是,數(shù)據(jù)中心是截然不同的領(lǐng)域,不論是云數(shù)據(jù)中心、應(yīng)用數(shù)據(jù)中心還是邊緣數(shù)據(jù)中心等,充滿了多個(gè)第三方軟件、第三方外圍設(shè)備。在SoC的世界中,設(shè)計(jì)者擁有軟件和堆棧,但是在數(shù)據(jù)中心,這一切是完全整合的,也更容易被分解開。
也正是如此,黃仁勛表示,在數(shù)據(jù)中心的世界中,需要新的系統(tǒng)、軟件、生態(tài)、合作伙伴以及新的投資組合,而這些都是英偉達(dá)所擅長的。Arm生態(tài)系統(tǒng)中的公司,正在蓄力進(jìn)入云、超級計(jì)算等新領(lǐng)域,而英偉達(dá)致力于將Arm生態(tài)系統(tǒng)擴(kuò)展到移動和嵌入式系統(tǒng)以外的市場。
談到對Arm的收購進(jìn)展,黃仁勛表示目前非常順利,正在配合美國、歐洲和亞洲的監(jiān)管機(jī)構(gòu),進(jìn)一步解釋Arm未來的發(fā)展愿景,以及雙方合作將給市場帶來的更多創(chuàng)新。他補(bǔ)充,Arm將會繼續(xù)保持開放授權(quán)的模式,兩家公司合并,將會加速他在這方面的投資。
不論是黃仁勛對收購一直表現(xiàn)出來的樂觀態(tài)度,還是從兩個(gè)生態(tài)交融目前取得的實(shí)質(zhì)性成果來看,大方向上的進(jìn)展都很順利。
本次GTC上公布的合作包括:NVIDIA GPU與基于AWS Graviton2的Amazon EC2實(shí)例相結(jié)合,雙方將共同在云端部署由GPU加速的基于Arm的實(shí)例;發(fā)布了搭載Arm CPU的開發(fā)者套件,便于開發(fā)者和ISV合作伙伴使用;與Marvell合作,將OCTEON DPU與GPU相結(jié)合,加速云、企業(yè)、運(yùn)營商和邊緣應(yīng)用;在PC領(lǐng)域,與全球最大的基于Arm的SoC供應(yīng)商之一聯(lián)發(fā)科合作,打造支持Chromium、Linux和NVIDIA SDK的參考平臺。
英偉達(dá)推出CPU對全球處理器格局意味著什么?
英偉達(dá)首次發(fā)布了一款CPU——Grace,主要面向大型數(shù)據(jù)密集型HPC和AI應(yīng)用。GPU霸主推出一款高性能CPU,這對英偉達(dá)自身和全球處理器供應(yīng)商意味著什么?它是否會成為一款改變處理器現(xiàn)有游戲格局的產(chǎn)品?
黃仁勛表示,確實(shí)是游戲的玩法在改變,但這款產(chǎn)品肩負(fù)的使命并不是改變游戲規(guī)則,而是要解決問題,當(dāng)前所面臨的根本問題是數(shù)據(jù)處理需求增長太快,超出了現(xiàn)有的系統(tǒng)內(nèi)存、帶寬等負(fù)荷。
“處理大量數(shù)據(jù)是當(dāng)今計(jì)算機(jī)系統(tǒng)面臨的一大挑戰(zhàn),對于transformer和推薦系統(tǒng)等AI模型來說尤為如此,新一代自然語言處理(NLP)模型的訓(xùn)練會有超過一萬億的參數(shù)。但是在實(shí)際應(yīng)用中,GPU受限于數(shù)據(jù)中心系統(tǒng)中現(xiàn)有的CPU內(nèi)存和PCIe帶寬,更快的NVLINK又不被x86 CPU所支持”,黃仁勛指出。
因此,與其說英偉達(dá)推出了一款CPU處理器,不如說,是為自己的GPU系統(tǒng)量身打造了一款高度專用的處理器。
在GTC Keynote中,黃仁勛詳述了這款專用CPU為系統(tǒng)帶來的改變。他以1/2的DGX說明了系統(tǒng)目前的瓶頸所在:每個(gè)Ampere GPU都連接到80GB的超快速顯存,運(yùn)行速度為2TB/秒,加在一起,即4個(gè)Ampere以每秒8TB的速度處理320GB的顯存。與之形成對比的是,CPU內(nèi)存為1TB,但速度僅為每秒0.2TB,CPU內(nèi)存比GPU大3倍,速度比GPU慢40倍。
基于此,英偉達(dá)提出了一個(gè)大膽的設(shè)想:如果能夠用該節(jié)點(diǎn)的全部1320GB內(nèi)存來訓(xùn)練AI模型,需要做什么?答案就是更快的CPU。通過建立四條直連CPU的通道,每個(gè)GPU都有了一個(gè)專用通道。基于Arm下一代服務(wù)器IP的Grace,與英偉達(dá)GPU緊密結(jié)合,性能比目前最先進(jìn)的NVIDIA DGX系統(tǒng)(在x86 CPU上運(yùn)行)還高出10倍。
“未來,絕大多數(shù)數(shù)據(jù)中心仍將使用現(xiàn)有的CPU,x86服務(wù)器架構(gòu)的出色之處在于能夠通過配置不同的CPU、內(nèi)存、PCIe和外圍設(shè)備來服務(wù)所有這些應(yīng)用場景”,黃仁勛強(qiáng)調(diào),“Grace專為加速大量數(shù)據(jù)的應(yīng)用程序而構(gòu)建,主要面向大型數(shù)據(jù)密集型HPC和AI應(yīng)用的細(xì)分市場。”
Grace無疑彰顯了Arm架構(gòu)所帶來的助益,英偉達(dá)的架構(gòu)和平臺通過支持x86和Arm,將能夠滿足市場上的更多需求。
這也意味著,英偉達(dá)與x86的競合之路也進(jìn)入了新階段,以往更多是基于x86架構(gòu)做加速升級,但現(xiàn)在,放眼數(shù)據(jù)暴增的新應(yīng)用,英偉達(dá)可以拍拍Intel的肩膀說,“Hey buddy, now I have my own CPU. ”
The Last One
全球半導(dǎo)體供應(yīng)鏈高度互聯(lián)非常重要
針對當(dāng)前全球半導(dǎo)體芯片的突出問題,黃仁勛也發(fā)表了個(gè)人的觀點(diǎn)。
“半導(dǎo)體技術(shù)對整個(gè)人類社會的重要性比以往任何時(shí)候都要明顯,一顆芯片有可能影響整個(gè)行業(yè),特別是當(dāng)前在汽車領(lǐng)域,”他表示,“顯然,現(xiàn)有的供應(yīng)鏈需要升級、重塑,減少層層責(zé)任,這樣就可以更直接地找到貨源?!?/p>
對于美國的供應(yīng)鏈回遷問題,黃仁勛表示,“世界供應(yīng)鏈的高度互聯(lián)非常重要,誰都不能孤立下去。在現(xiàn)有的供應(yīng)鏈格局中,世界各地廠商已經(jīng)在各自環(huán)節(jié)中發(fā)揮著重要作用。很多電子設(shè)備都是由來自世界不同地方的零部件組合而成,而這需要很多人的工作才能實(shí)現(xiàn)。供應(yīng)鏈已經(jīng)如此復(fù)雜,也正是科技產(chǎn)業(yè)創(chuàng)造出了一個(gè)相互聯(lián)系的地球村?!?/p>
他認(rèn)為,不管產(chǎn)業(yè)鏈如何變遷,但內(nèi)在的聯(lián)系不會消失,影響未來計(jì)算的基本動力應(yīng)該被認(rèn)識到。5G、云計(jì)算、數(shù)據(jù)中心正在對現(xiàn)有的計(jì)算架構(gòu)進(jìn)行升級,所有這些驅(qū)動力使成千上萬的小芯片聚合成一個(gè)個(gè)計(jì)算單元,將重塑現(xiàn)有的行業(yè)應(yīng)用,重塑所有受計(jì)算影響的行業(yè)。