繼在游戲、數(shù)據(jù)中心市場收獲巨額回報(bào)之后,英偉達(dá)希望覆蓋更多的AI計(jì)算領(lǐng)域,而下一個(gè)重點(diǎn)就是企業(yè)計(jì)算。在日前舉辦的COMPUTEX 2021上,英偉達(dá)面向企業(yè)計(jì)算發(fā)布了重大計(jì)劃和創(chuàng)新產(chǎn)品。
黃仁勛在今年4月的GTC大會上,首次強(qiáng)調(diào)了發(fā)展企業(yè)計(jì)算的決心。在他看來,現(xiàn)在正處于第二輪AI發(fā)展浪潮的起點(diǎn),而這波發(fā)展將以企業(yè)和產(chǎn)業(yè)邊緣計(jì)算為主,AI將徹底改變?nèi)虼笮托袠I(yè),包括制造、物流、農(nóng)業(yè)、醫(yī)療健康、金融服務(wù)和運(yùn)輸業(yè)。
在COMPUTEX 2021上,英偉達(dá)企業(yè)計(jì)算負(fù)責(zé)人Manuvir Das也表示,現(xiàn)在是實(shí)現(xiàn)AI大眾化,將其巨大力量帶給企業(yè)用戶及其客戶的好時(shí)機(jī)。
英偉達(dá)企業(yè)計(jì)算負(fù)責(zé)人Manuvir Das
面向企業(yè)級AI計(jì)算,英偉達(dá)在構(gòu)建三個(gè)基本要素:普適性強(qiáng)、可用于制造任何系統(tǒng)的硬件基礎(chǔ),用于AI的軟件平臺,以及用于協(xié)作設(shè)計(jì)的軟件平臺。
擴(kuò)大認(rèn)證服務(wù)器生態(tài)系統(tǒng)
目前,面向企業(yè)級的NVIDIA EGX,英偉達(dá)正在擴(kuò)大NVIDIA-Certified認(rèn)證服務(wù)器生態(tài)系統(tǒng),使得企業(yè)用戶的使用和部署更為便捷。
Das解釋說,為助力系統(tǒng)制造商創(chuàng)建AI優(yōu)化設(shè)計(jì),并確保這些系統(tǒng)能夠得到客戶的信賴,NVIDIA 制定了一項(xiàng)針對GPU加速服務(wù)器的計(jì)劃——NVIDIA 認(rèn)證計(jì)劃。
來自研華科技、Altos、永擎電子、華碩、戴爾科技、技嘉、慧與、聯(lián)想、QCT、超微等公司的 NVIDIA 認(rèn)證系統(tǒng)正在不斷增加,其中包括主流數(shù)據(jù)中心使用的一些主流 x86 服務(wù)器,它們將AI的力量帶了給更多行業(yè),包括醫(yī)療、制造、零售和金融服務(wù)。
憑借NVIDIA認(rèn)證系統(tǒng),企業(yè)能夠支持傳統(tǒng)數(shù)據(jù)中心以及混合云中的各種復(fù)雜工作。其中包括在VMware vSphere上運(yùn)行NVIDIA AI Enterprise和數(shù)據(jù)分析軟件,來部署支持AI的企業(yè)級平臺,從而實(shí)現(xiàn)批量運(yùn)行AI工作負(fù)載;還包括在NVIDIA Omniverse Enterprise上實(shí)現(xiàn)設(shè)計(jì)協(xié)作、高級模擬以及在紅帽O(jiān)penShift平臺上實(shí)現(xiàn)AI部署。系統(tǒng)還可與 Cloudera 數(shù)據(jù)工程和機(jī)器學(xué)習(xí)無縫集成,把交付模型的時(shí)間從幾個(gè)小時(shí)縮短至幾分鐘。
據(jù)了解,NVIDIA 認(rèn)證系統(tǒng)經(jīng)過嚴(yán)格的測試,在性能、安全性和可擴(kuò)展性方面延續(xù)NVIDIA 的設(shè)計(jì)最佳實(shí)踐。這些系統(tǒng)的價(jià)格和性能水平各異,采用NVIDIA A100、A40、A30或A10 Tensor Core GPU以及NVIDIA BlueField-2 DPU或NVIDIA ConnectX-6系列網(wǎng)卡。
目前,在高級AI訓(xùn)練和云計(jì)算服務(wù)領(lǐng)域,戴爾科技、慧與、寧暢和超微已經(jīng)率先推出基于NVIDIA HGX加速計(jì)算平臺、經(jīng)過認(rèn)證的新服務(wù)器。這些產(chǎn)品通過四或八個(gè)NVIDIA A100 GPU、NVIDIA NVLink GPU互連技術(shù)、NVIDIA InfiniBand網(wǎng)絡(luò)以及NVIDIA AI和HPC軟件棧提供領(lǐng)先的AI性能。
首批NVIDIA認(rèn)證系統(tǒng)運(yùn)用BlueField-2 DPU提升安全性
“今后,DPU 將成為所有服務(wù)器、數(shù)據(jù)中心和邊緣的一個(gè)重要組成部分”,Das 表示,“NVIDIA 認(rèn)證系統(tǒng)計(jì)劃將擴(kuò)展至采用 NVIDIA BlueField DPU 的系統(tǒng)。”
今年下半年,幾家系統(tǒng)制造商將首次發(fā)布經(jīng)過新一類NVIDIA認(rèn)證系統(tǒng)的服務(wù)器,將通過BlueField-2 DPU(數(shù)據(jù)處理器)在網(wǎng)絡(luò)、存儲和安全性能上實(shí)現(xiàn)突破。
通過卸載CPU的工作任務(wù),單一BlueField-2 DPU可以提供125個(gè)CPU核才能實(shí)現(xiàn)的數(shù)據(jù)中心服務(wù),從而釋放服務(wù)器CPU周期以支持各種關(guān)鍵業(yè)務(wù)應(yīng)用。
NVIDIA 認(rèn)證將于2022年擴(kuò)展至Arm CPU服務(wù)器
Das 宣布,NVIDIA 認(rèn)證系統(tǒng)計(jì)劃將擴(kuò)展至支持配備 Arm 核主機(jī) CPU 的加速系統(tǒng)。
此外,英偉達(dá)與技嘉科技合作開發(fā)了一款A(yù)rm HPC開發(fā)者套件,為HPC、AI和科學(xué)計(jì)算應(yīng)用開發(fā)提供硬件和軟件一體化的平臺。該平臺經(jīng)NVIDIA驗(yàn)證,可滿足嚴(yán)苛的HPC應(yīng)用要求,包含一個(gè)來自Ampere Computing的基于Arm Neoverse的Ampere Altra處理器、兩個(gè)A100 GPU、兩個(gè)BlueField-2 DPU以及NVIDIA HPC SDK。
Das 表示:“隨著 GPU 和 DPU 加速器承擔(dān)更多的 AI 計(jì)算工作負(fù)載,將主機(jī) CPU 作為編排器比將它作為計(jì)算引擎更有用?!?/p>
下一步,為了將Arm生態(tài)系統(tǒng)擴(kuò)展至企業(yè)以實(shí)現(xiàn)高性能AI計(jì)算,技嘉科技和緯穎科技計(jì)劃將提供新的服務(wù)器,采用基于Arm Neoverse 的CPU、NVIDIA Ampere架構(gòu)GPU/BlueField-2 DPU。這款服務(wù)器預(yù)計(jì)將于明年上市,屆時(shí)將被提交至NVIDIA進(jìn)行認(rèn)證。
云端開發(fā)中心便于企業(yè)AI項(xiàng)目從原型快速投入生產(chǎn)
為了幫助企業(yè)將AI項(xiàng)目從原型快速投入生產(chǎn),英偉達(dá)最新發(fā)布了一款托管在云端的開發(fā)中心NVIDIA Base Command Platform。
多數(shù)企業(yè)現(xiàn)在都知道AI對其數(shù)字化轉(zhuǎn)型計(jì)劃的成功至關(guān)重要,但是目前面臨的一項(xiàng)復(fù)雜挑戰(zhàn)是,如何將其部署并整合到企業(yè)中。NVIDIA Base Command Platform專為大規(guī)模、多用戶和多團(tuán)隊(duì)的 AI 開發(fā)工作流程而設(shè)計(jì),而且這些工作流程既可以在本地也可以在云中托管。憑借這款軟件,研究人員和數(shù)據(jù)科學(xué)家能夠同時(shí)使用加速計(jì)算資源工作,幫助企業(yè)最大程度地提高其專家級開發(fā)者和寶貴 AI 基礎(chǔ)設(shè)施的生產(chǎn)力。
谷歌云成為計(jì)劃在云實(shí)例中啟用Base Command Platform 來管理和編排集群的首批云服務(wù)提供商之一。谷歌云機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施產(chǎn)品管理總監(jiān)Manish Sainani表示:“這款混合型AI產(chǎn)品,可以使得企業(yè)只需編寫一次就能在任何地方運(yùn)行,靈活接入多個(gè)NVIDIA A100 Tensor Core GPU,通過采用按需的加速計(jì)算,企業(yè)可以加快AI開發(fā)速度?!?/p>
據(jù)介紹,Base Command Platform為整個(gè)AI開發(fā)提供了統(tǒng)一的視圖。該視圖通過圖形用戶界面和命令行API以及綜合監(jiān)控和報(bào)告儀表盤來促進(jìn)資源的輕松共享。包括NVIDIA NGC的AI和分析軟件目錄、與MLOps軟件集成的API、Jupyter筆記本等在內(nèi)的一系列豐富的AI和數(shù)據(jù)科學(xué)工具幫助研究人員可以更快的計(jì)劃和安排工作負(fù)載、完善模型和獲得洞察。
3D設(shè)計(jì)/模擬協(xié)作和安全也是布局重點(diǎn)
Das 還宣布,NVIDIA 將與全球領(lǐng)先的系統(tǒng)供應(yīng)商合作提供NVIDIA Omniverse Enterprise,助力各行各業(yè)的團(tuán)隊(duì)輕松開展 3D 設(shè)計(jì)和模擬協(xié)作。屆時(shí),每家公司需支付的費(fèi)用為 14,000 美元起。
安全方面,Das宣布正與紅帽合作,為 OpenShift 和目前企業(yè)級數(shù)據(jù)中心中最常用的商業(yè) Linux 版本——紅帽企業(yè) Linux(Red Hat Enterprise Linux,簡稱RHEL)提供 Morpheus 開發(fā)者套件。Morpheus是今年GTC大會上發(fā)布的,使用機(jī)器學(xué)習(xí)來識別、捕捉和處理威脅與異常的一款軟件套件。
據(jù)Das 介紹,網(wǎng)絡(luò)安全公司現(xiàn)在將能夠在 RHEL 和 OpenShift 上使用 Morpheus,為所有企業(yè)級數(shù)據(jù)中心帶來先進(jìn)的安全措施。
寫在最后
繼在嵌入式領(lǐng)域、邊緣市場布局了五六年后,英偉達(dá)今年明顯針對企業(yè)級計(jì)算加大了投入力度。
任何邊緣端設(shè)備,穩(wěn)定性、長時(shí)間運(yùn)行的故障率等都是非常重要的指標(biāo),英偉達(dá)正在通過其認(rèn)證計(jì)劃在這方面做出支持和保證。
此外,在邊緣計(jì)算領(lǐng)域,某些情況下比數(shù)據(jù)中心更復(fù)雜,比如在面臨各種各樣的設(shè)備和應(yīng)用選件時(shí),如何把不同應(yīng)用融合在一起成為一個(gè)成熟的產(chǎn)品,考驗(yàn)的是平臺完備性。這是英偉達(dá)在邊緣市場面臨的挑戰(zhàn)。
當(dāng)然,邊緣設(shè)備和數(shù)據(jù)中心其實(shí)是緊密結(jié)合的,因?yàn)槟P投际菑脑浦杏?xùn)練所得,這是英偉達(dá)從數(shù)據(jù)中心向邊緣擴(kuò)展的巨大優(yōu)勢。為了幫助合作伙伴的想法快速落地,中間的架構(gòu)統(tǒng)一性、還有各種工具便利性就變得非常重要。這也將是英偉達(dá)下一步在邊緣計(jì)算生態(tài)建設(shè)和產(chǎn)品創(chuàng)新的關(guān)鍵。