《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 電子元件 > 業(yè)界動(dòng)態(tài) > 英偉達(dá)對(duì)決英特爾:Arm服務(wù)器CPU挑戰(zhàn)至強(qiáng)處理器,AV芯片PK Mobileye

英偉達(dá)對(duì)決英特爾:Arm服務(wù)器CPU挑戰(zhàn)至強(qiáng)處理器,AV芯片PK Mobileye

2021-04-14
來(lái)源: 電子工程專輯

  上周,英特爾發(fā)布采用其10nm工藝的第三代至強(qiáng)可擴(kuò)展處理器Ice Lake。本周一,被英特爾收購(gòu)的以色列自動(dòng)駕駛芯片公司Mobileye宣布與自動(dòng)駕駛(AV)初創(chuàng)公司Udelv 合作,采用其EyeQ 5芯片和全棧AV系統(tǒng)平臺(tái)開發(fā)無(wú)人駕駛貨運(yùn)車Transporters。

  同樣在本周一,英偉達(dá)發(fā)布基于Arm架構(gòu)的數(shù)據(jù)中心處理器Grace,同時(shí)發(fā)布自動(dòng)駕駛(AV)平臺(tái)DRIVE Hyperion 8和AV芯片DRIVE Atlan(號(hào)稱性能高達(dá)1000TOPS)。

  在服務(wù)器CPU市場(chǎng),Intel擁有超過(guò)90%的份額,AMD霄龍系列服務(wù)器CPU始終無(wú)法撼動(dòng)Intel的地位。英偉達(dá)與Arm聯(lián)合開發(fā)的Grace能否對(duì)抗英特爾?英偉達(dá)最高性能的自動(dòng)駕駛芯片和平臺(tái)能否勝過(guò)英特爾旗下的Mobileye?

  在全球兩大最高性能計(jì)算和最熱門需求的市場(chǎng)上—數(shù)據(jù)中心和自動(dòng)駕駛,英偉達(dá)開始正面對(duì)決英特爾。多年生活在英特爾陰影下的英偉達(dá)這次能否與英特爾平分秋色,稱霸全球高性能計(jì)算(HPC)市場(chǎng)?在回答這個(gè)問(wèn)題之前,讓我們先看看兩家公司各自的“當(dāng)家武器”。

  英偉達(dá)AV平臺(tái)Hyperion 8和AV芯片DRIVE Atlan

  英偉達(dá)CEO黃仁勛在GTU虛擬大會(huì)上宣布了DRIVE Atlan,這款計(jì)劃2025年量產(chǎn)的下一代DRIVE SoC將提供高達(dá)1,000 TOPS的性能,集成有CPU、GPU和深度學(xué)習(xí)加速器(DLA),并為下一代AV提供最新的網(wǎng)絡(luò)和安全性。

  2.png

  Nvidia自動(dòng)駕駛芯片DRIVE Atlan。(來(lái)源: Nvidia)

  英偉達(dá)同時(shí)發(fā)布了自動(dòng)駕駛開發(fā)平臺(tái)DRIVE Hyperion 8,以及數(shù)字孿生仿真工具DRIVE Sim。該公司聲稱已經(jīng)簽署價(jià)值80億美元的汽車合作開發(fā)協(xié)議,合作伙伴包括沃爾沃汽車、奔馳、蔚來(lái)、上汽、TuSimple、Zoox、Cruise、法拉第未來(lái)和VinFast等公司傳統(tǒng)車廠及造車新勢(shì)力。

3.png

  DRIVE Hyperion 8 AV平臺(tái)可以支持?jǐn)?shù)據(jù)采集、AV開發(fā)和測(cè)試。(來(lái)源: Nvidia)

  在英偉達(dá)發(fā)布的所有技術(shù)和產(chǎn)品中,EETimes汽車專欄作家和資深汽車行業(yè)分析師Egil Juliussen認(rèn)為Hyperion 8可能是最有價(jià)值的。這個(gè)AV開發(fā)平臺(tái)可能吸引更多汽車OEM廠商、自動(dòng)駕駛初創(chuàng)公司和運(yùn)輸公司因?yàn)樗梢詷O大地簡(jiǎn)化AV系統(tǒng)設(shè)計(jì)流程,并為未來(lái)產(chǎn)品的開發(fā)鋪平道路。這類似于IC設(shè)計(jì)行業(yè)的開發(fā)系統(tǒng),或者基于AI的自動(dòng)駕駛行業(yè)的云計(jì)算平臺(tái)。在主題演講中,黃仁勛確實(shí)提到了分別與亞馬遜AWS和Google Cloud達(dá)成的合作協(xié)議。

  Drive Atlan展示出英偉達(dá)基于GPU持續(xù)提升其自動(dòng)駕駛SoC的一貫做法,但Linley調(diào)研公司高級(jí)分析師Mike Demler注意到,英偉達(dá)似乎越來(lái)越早地宣布其未來(lái)處理器產(chǎn)品,這難道是讓業(yè)界和競(jìng)爭(zhēng)對(duì)手毫無(wú)喘息之力嗎?Orin都還沒(méi)有量產(chǎn),他們現(xiàn)在又發(fā)布了下一代產(chǎn)品Atlan。Atlan原理圖和1,000 TOPS性能規(guī)格可能只是頂層設(shè)計(jì)目標(biāo)罷了。

  4.png

  Nvidia的DRIVE SoC規(guī)劃圖。(Source: Nvidia)

  Mike Demler提出質(zhì)疑,采用320 TOPS Xavier的Drive Pegasus是L5系統(tǒng),然后Orin升級(jí)到400 TOP,現(xiàn)在Atlan更是躍升至1000 TOPS?英特爾旗下的Mobileye提供的同類AV芯片大約是“ TOPS”性能評(píng)級(jí)的1/10,而功耗卻低得多,顯然TOPS不是一個(gè)可靠的衡量標(biāo)準(zhǔn)。他補(bǔ)充道,贏得奔馳和沃爾沃的設(shè)計(jì)是很不錯(cuò)的,但是不到量產(chǎn)階段就毫無(wú)意義。

  Juliussen也表示認(rèn)同,1,000 TOPS固然很好,但這幾乎不可能達(dá)到。他認(rèn)為TOPS應(yīng)該代表極度樂(lè)觀的處理器速度(Totally Optimistic Processor Speed),加上功耗才有意義。

  Demler還對(duì)Atlan的SoC架構(gòu)提出了質(zhì)疑,英偉達(dá)希望Atlan一顆芯片就能集成儀表盤、信息娛樂(lè)、ADAS/AV、駕駛員監(jiān)控(DMS),以及網(wǎng)絡(luò)網(wǎng)關(guān)等全部汽車駕駛功能。在英偉達(dá)看來(lái),汽車就是有輪子的服務(wù)器。但是,與數(shù)據(jù)中心不同的是,自動(dòng)駕駛汽車沒(méi)有無(wú)限的電力供應(yīng)?,F(xiàn)在尚不清楚將所有這些功能都集成在一塊芯片上是否最好的方法,盡管英偉達(dá)會(huì)推出一系列Atlan芯片。

  Mobileye采取系統(tǒng)級(jí)AV策略

  英偉達(dá)如何領(lǐng)先汽車市場(chǎng)?憑借其完善的生態(tài)系統(tǒng)(硬件、軟件和AI模型),以及性能不斷提升的SoC。而Mobileye則采取系統(tǒng)級(jí)AV策略,其秘密武器是“真正的冗余(true redundancy)”。

  與Mobileye合作的AV初創(chuàng)公司Udelv計(jì)劃到2028年生產(chǎn)3.5萬(wàn)輛Transporter無(wú)人駕駛貨運(yùn)車,均采用Mobileye的全棧自動(dòng)駕駛系統(tǒng)。據(jù)Udelv聯(lián)合創(chuàng)始人兼CEO Daniel Laury稱,他們最初采用百度的Apollo平臺(tái),但最終還是選擇了Mobileye,主要是看重后者的“冗余自動(dòng)駕駛”功能,因?yàn)檫@是“真正的冗余”。Mobileye還采用了一種獨(dú)特的方法,將傳感器分離為兩個(gè)通道-一個(gè)用于攝像頭,另一個(gè)用于雷達(dá)和激光雷達(dá)。其理念是讓每個(gè)通道獨(dú)立地證明各自的安全性,然后在將兩個(gè)通道融合。相比之下,競(jìng)爭(zhēng)對(duì)手的方法是部署互補(bǔ)性傳感器,即從一開始就將它們?nèi)诤显谝黄?,以?chuàng)建一個(gè)單一的模型。

  5.png

  Udelv的Transporter無(wú)人駕駛貨運(yùn)車采用Mobileye全棧自動(dòng)駕駛系統(tǒng)。(來(lái)源: Udelv)

  Udelv還喜歡Mobileye“道路體驗(yàn)管理”(REM)眾包地圖方案,可以支持廣泛的地圖覆蓋范圍。Mobileye聲稱,他們每天可以繪制超過(guò)800萬(wàn)公里的道路,而且已經(jīng)繪制了將近10億公里的道路。該公司預(yù)計(jì)到2024年,每天可以繪制100萬(wàn)公里的地圖。

  英特爾至強(qiáng)Xeon處理器通吃云端、網(wǎng)絡(luò)和智能邊緣

  據(jù)英特爾宣傳,與前一代產(chǎn)品相比,最新的第三代至強(qiáng)可擴(kuò)展處理器在主流數(shù)據(jù)中心工作負(fù)載上性能平均提升46%,同時(shí)增加了針對(duì)AI加速的深度學(xué)習(xí)加速技術(shù)(DL Boost)。采用10nm工藝的至強(qiáng)可擴(kuò)展處理器可以加速云端、人工智能、企業(yè)端、高性能計(jì)算、網(wǎng)絡(luò)、安全和邊緣應(yīng)用上的部署。

 6.png

  英特爾執(zhí)行副總裁兼數(shù)據(jù)平臺(tái)事業(yè)部總經(jīng)理Navin Shenoy發(fā)布第三代英特爾至強(qiáng)可擴(kuò)展處理器。(來(lái)源:Intel)

  據(jù)英特爾2021年第一季度業(yè)績(jī)顯示,該處理器出貨量已經(jīng)超過(guò)20萬(wàn)顆。其中,全球范圍內(nèi)大型的云服務(wù)提供商即將部署服務(wù),在50個(gè)獨(dú)立OxM合作伙伴中有超過(guò)250個(gè)基于該處理器的設(shè)計(jì),超過(guò)20個(gè)高性能計(jì)算(HPC)實(shí)驗(yàn)室和HPC即服務(wù)環(huán)境正在利用全新至強(qiáng)可擴(kuò)展處理器。

  英偉達(dá)基于 Arm 架構(gòu)的數(shù)據(jù)中心 CPU 處理器“Grace”

  在GTC2021大會(huì)上,英偉達(dá) 發(fā)布其首款基于 Arm 架構(gòu)的數(shù)據(jù)中心 CPU 處理器“Grace”,在最復(fù)雜的 AI和高性能計(jì)算工作負(fù)載下,可實(shí)現(xiàn) 10 倍于當(dāng)今最快服務(wù)器的超高性能。

  分析認(rèn)為,英偉達(dá)此舉是直接挑戰(zhàn)英特爾在服務(wù)器和數(shù)據(jù)中心計(jì)算領(lǐng)域的主導(dǎo)地位,因?yàn)榘l(fā)布會(huì)后,英特爾和AMD的股價(jià)應(yīng)聲下跌了幾個(gè)百分點(diǎn)。

  7.png

  為什么要做這款CPU?

  英偉達(dá)認(rèn)為,AI模型的數(shù)據(jù)量和規(guī)模正在成倍增長(zhǎng)。當(dāng)今最大的AI模型包括數(shù)十億個(gè)參數(shù),并且每?jī)蓚€(gè)半月就會(huì)翻一番。訓(xùn)練它們需要一個(gè)新的CPU,可以與GPU緊密結(jié)合,以消除系統(tǒng)瓶頸。

  英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,“NVIDIA Grace? CPU 是超過(guò)10,000個(gè)工程年的成果,專為滿足全球最先進(jìn)應(yīng)用的計(jì)算要求而設(shè)計(jì)?!薄?這些應(yīng)用包括自然語(yǔ)言處理、推薦系統(tǒng)、AI 超級(jí)計(jì)算 —— 其所進(jìn)行的海量數(shù)據(jù)分析需要超高速計(jì)算性能和大容量?jī)?nèi)存。

  老黃仍然穿著他標(biāo)志性的皮衣,在他們家標(biāo)志性的廚房開著發(fā)布會(huì)。唯一的變化是頭發(fā)長(zhǎng)了,有人說(shuō)“老黃這都是被缺貨給愁的”

  Grace這個(gè)名字來(lái)自美國(guó)海軍少將、計(jì)算機(jī)編程先驅(qū)Grace Hopper。她是計(jì)算機(jī)科學(xué)的先驅(qū)之一,也是哈佛Mark 1的第一批程序員和第一個(gè)鏈接器的發(fā)明者。

  9.png

  Grace Hopper在20世紀(jì)50年代開創(chuàng)了計(jì)算機(jī)編程,發(fā)明了世界上第一個(gè)編譯器,被稱為“計(jì)算機(jī)軟件工程第一夫人”。

  這款CPU產(chǎn)品采用了Arm Neoverse核心,與低功耗內(nèi)存子系統(tǒng)相結(jié)合,以高能效提供高性能。也有人認(rèn)為,這英偉達(dá)是在收購(gòu)Arm的關(guān)鍵時(shí)刻,英偉達(dá)表達(dá)誠(chéng)意的一款作品。

  “前沿的AI和數(shù)據(jù)科學(xué)正推動(dòng)當(dāng)今的計(jì)算機(jī)架構(gòu)超越其極限,以處理規(guī)模難以想象的海量數(shù)據(jù)。NVIDIA 借助 Arm授權(quán)的 IP設(shè)計(jì)了 Grace,這是一款專為大規(guī)模AI和HPC設(shè)計(jì)的CPU。與GPU和DPU一起, Grace為我們提供了計(jì)算的第三種基礎(chǔ)技術(shù),以及為了推進(jìn)AI發(fā)展重構(gòu)數(shù)據(jù)中心的能力。NVIDIA現(xiàn)在是一家擁有三種芯片的公司。” 黃仁勛說(shuō)到。

  比 x86 CPU如何?

  英偉達(dá)在新聞稿中描述,Grace是高度專業(yè)化的處理器,工作負(fù)載面向例如訓(xùn)練具有超過(guò)1萬(wàn)億個(gè)參數(shù)的新一代NLP模型等。當(dāng)與NVIDIA GPU緊密耦合時(shí),搭載Grace CPU的系統(tǒng)速度比如今基于 NVIDIA DGX ?打造的最先進(jìn)的系統(tǒng)(在 x86 CPU 上運(yùn)行)快 10 倍。

  10.png

  在絕大多數(shù)數(shù)據(jù)中心由現(xiàn)有的CPU提供服務(wù)的同時(shí),Grace將為計(jì)算的細(xì)分市場(chǎng)提供服務(wù)。

  瑞士國(guó)家超級(jí)計(jì)算機(jī)中心 (CSCS) 和美國(guó)能源部洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室 (Los Alamos National Laboratory) 率先宣布計(jì)劃構(gòu)建搭載Grace的超級(jí)計(jì)算機(jī),以支持國(guó)家科學(xué)研究工作。

  NVIDIA推出Grace的背景是數(shù)據(jù)量和 AI 模型規(guī)模呈指數(shù)級(jí)增長(zhǎng)。如今最大的 AI 模型包含數(shù)十億個(gè)參數(shù),并且參數(shù)數(shù)量每?jī)蓚€(gè)半月就會(huì)翻一番。訓(xùn)練這些模型需要一個(gè)與 GPU 緊密耦合的新 CPU,以消除系統(tǒng)瓶頸。

  NVIDIA 利用 Arm 數(shù)據(jù)中心架構(gòu)極大的靈活性構(gòu)建了 Grace。通過(guò)推出新的服務(wù)器級(jí) CPU,NVIDIA正在推進(jìn)在AI和HPC領(lǐng)域中技術(shù)多樣性的目標(biāo)。在這些領(lǐng)域,更多選擇是實(shí)現(xiàn)解決全球最迫切問(wèn)題所需創(chuàng)新的關(guān)鍵。

  Arm 首席執(zhí)行官 Simon Segars 表示:“作為全球授權(quán)范圍最廣的處理器架構(gòu),Arm 每天正在以不可思議的新方式推動(dòng)創(chuàng)新。NVIDIA 推出Grace 數(shù)據(jù)中心 CPU 明確表明Arm的授權(quán)模式如何促進(jìn)一項(xiàng)重要?jiǎng)?chuàng)新,這將進(jìn)一步支持世界各地 AI 研究人員和科學(xué)家們非凡的工作?!?/p>

  Grace 的首批使用者

  CSCS 和洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室計(jì)劃將于 2023 年推出由慧與(Hewlett-Packard Enterprise)構(gòu)建的、搭載Grace的Alps系統(tǒng)。該系統(tǒng)采用新的 HPE Cray EX 超級(jí)計(jì)算機(jī)產(chǎn)品線以及 NVIDIA HGX 超級(jí)計(jì)算平臺(tái),除了全新的Grace CPU,還包括 NVIDIA GPU 和 NVIDIA HPC SDK 。

  11.png

  CSCS 總監(jiān) Thomas Schulthess教授表示:“利用 NVIDIA 全新的 Grace CPU,使得我們能將 AI 技術(shù)和傳統(tǒng)的超級(jí)計(jì)算融合在一起,來(lái)解決計(jì)算科學(xué)領(lǐng)域一些最難的問(wèn)題。我們很高興能夠向我們的瑞士和全球用戶提供這款全新 NVIDIA CPU,用于處理分析海量和復(fù)雜的科學(xué)數(shù)據(jù)集。”

  洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室主任 Thom Mason 表示:“通過(guò)創(chuàng)新地平衡內(nèi)存帶寬和容量,新一代系統(tǒng)將重塑我們機(jī)構(gòu)的計(jì)算策略。憑借 NVIDIA 全新 Grace CPU,我們可以在比以前更大的數(shù)據(jù)集上完成高逼真度3D仿真和分析,從而進(jìn)行先進(jìn)的科學(xué)研究工作。”

  Alps 系統(tǒng)是新一代超級(jí)計(jì)算機(jī)中的一員,將取代 CSCS 現(xiàn)有的 Piz Daint 超級(jí)計(jì)算機(jī)。新一代超級(jí)計(jì)算機(jī)利用 GPU 加速的深度學(xué)習(xí)技術(shù),將超級(jí)計(jì)算擴(kuò)展到傳統(tǒng)的建模和模擬領(lǐng)域之外。

  Thomas Schulthess 表示:“深度學(xué)習(xí)只是我們添加到工具箱中的一組功能非常強(qiáng)大的工具而已?!?/p>

  Alps 利用 NVIDIA CPU 和 GPU 之間的緊密耦合,預(yù)計(jì)僅需兩天就能訓(xùn)練出全球最大的自然語(yǔ)言處理模型 GPT-3,比 NVIDIA 的 2.8-AI exaflops Selene 超級(jí)計(jì)算機(jī)快 7 倍。Selene 超級(jí)計(jì)算機(jī)目前被 MLPerf 認(rèn)定為世界領(lǐng)先的 AI 超級(jí)計(jì)算機(jī)。

  CSCS 用戶能夠?qū)⑦@種超強(qiáng)的 AI 性能廣泛地應(yīng)用到從自然語(yǔ)言理解中獲益的新興科學(xué)研究。例如,這包括分析和理解科學(xué)論文中提供的海量知識(shí),以及生成用于藥物發(fā)現(xiàn)的新分子。

  實(shí)現(xiàn)性能突破

  據(jù)英偉達(dá)方面資料,Grace基于第四代 NVIDIA NVLink? 互聯(lián)技術(shù),該技術(shù)在Grace和 NVIDIA GPU 之間提供創(chuàng)紀(jì)錄的 900 GB/s 連接速度,使總帶寬比當(dāng)今領(lǐng)先的服務(wù)器高 30 倍。從CPU到CPU的速度超過(guò)600GB/s。

  Grace 還將利用創(chuàng)新的 LPDDR5x 內(nèi)存子系統(tǒng),該子系統(tǒng)的帶寬是 DDR4 內(nèi)存的兩倍,能效達(dá) DDR4 的 10 倍。此外,新架構(gòu)提供單一內(nèi)存地址空間的緩存一致性,將系統(tǒng)和 HBM GPU 內(nèi)存相結(jié)合,以簡(jiǎn)化可編程性。

  Grace將獲得 NVIDIA HPC軟件開發(fā)套件以及全套 CUDA? 和 CUDA-X? 庫(kù)的支持,可以對(duì) 2,000 多個(gè) GPU 應(yīng)用程序加速,使得應(yīng)對(duì)全球重大挑戰(zhàn)的科學(xué)家和研究人員探索速度更快。

 

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。