《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 显示光电 > 业界动态 > 拥抱Arm,将Quadro性能翻倍,英伟达刚刚还发布了全新DPU战略

拥抱Arm,将Quadro性能翻倍,英伟达刚刚还发布了全新DPU战略

2020-10-08
來(lái)源:机器之心
關(guān)鍵詞: 英伟达 GTC大会 Quadro显卡


  第一次在全球所有時(shí)區(qū)共同開啟的英偉達(dá) GTC 大會(huì),為我們帶來(lái)了全新一代安培架構(gòu)的 Quadro 顯卡,面向服務(wù)器的 DPU 產(chǎn)品線,同時(shí)還有一款價(jià)格超低,堪比樹莓派的 Jetson 芯片。

  「現(xiàn)在軟件已經(jīng)可以自動(dòng)生成軟件了,AI 就是自動(dòng)化過程中的自動(dòng)化力量,」英偉達(dá)創(chuàng)始人黃仁勛在昨天的 GTC 秋季大會(huì)開場(chǎng) Keynote 中說(shuō)道。「AI 編寫的軟件和人類大有不同,它們更加并行化,計(jì)算集中程度更是后者的千百倍。既然構(gòu)建軟件的方式不同,那么構(gòu)建它們的計(jì)算基礎(chǔ)設(shè)施、工具、軟件以及開發(fā)方式也要不同?!?/p>

  人工智能需要人們重新思考計(jì)算的方法,從芯片、系統(tǒng)、算法、工具再到生態(tài)系統(tǒng)。面對(duì)如此挑戰(zhàn),英偉達(dá)給出了自己的最新答案。

微信圖片_20201008093751.png

  安培架構(gòu)的 Quadro 顯卡

  在昨天的 GTC Fall 活動(dòng)中,黃仁勛發(fā)布了安培架構(gòu)的新一代專業(yè)級(jí)顯卡 Quadro RTX Ampere,并宣布將于今年 12 月交付。

  「我知道你們都在急切地想要搶到自己的安培 GPU——這是絕對(duì)可以理解的,我可以保證你的等待是值得的。安培是英偉達(dá)歷史上最大的一次躍升,我們每次放出新貨都是立刻售罄,」黃仁勛表示?!肝覀冋诩影嗉狱c(diǎn),你的新顯卡正在路上。」

  不過這次要發(fā)布的是專業(yè)級(jí)的 GPU。NVIDIA 的新一代 Quadro RTX 顯卡 A6000,與此前推出的 RTX 30 系列一樣使用三星的 8nm 工藝打造,采用 GA102 GPU,最高配備 10752CUDA 核心,比 RTX 3090 還多 256 個(gè)。A6000 的內(nèi)存也達(dá)到了 48GB,不過使用的是 DDR6 而非 GDDR6X,因?yàn)槟壳昂笳邿o(wú)法實(shí)現(xiàn)足夠高的容量。

  在性能方面,英偉達(dá)宣稱 A6000 在一些任務(wù)上的能力是上一代產(chǎn)品 Quadro RTX 8000 的兩倍,這主要是通過制程提升、吞吐量增加、新浮點(diǎn)算法以及內(nèi)存容量提升實(shí)現(xiàn)的。目前英偉達(dá)還未提供 A6000 的更多具體數(shù)據(jù),以及最重要的價(jià)格。已知的是,A6000 的功耗比 3090 要低 50W,僅為 300W。

  另有一款功率相同的被動(dòng)散熱計(jì)算卡 Quadro A40 也將于 2021 年第一季度上市。A40 幾乎具有與主動(dòng)冷卻的 A6000 相同的所有功能,只是采用了純被動(dòng)散熱的形式,適用于高密度服務(wù)器。

  有了 RTX 顯卡的算力,英偉達(dá)還推出了 3D 仿真模擬和協(xié)作平臺(tái) Omniverse,通過這一工具,圖像技術(shù)開發(fā)者們能夠?qū)崟r(shí)模擬出細(xì)節(jié)逼真的現(xiàn)實(shí)世界。它可以讓負(fù)責(zé) 3D 建筑設(shè)計(jì)的建筑師、修改 3D 場(chǎng)景的動(dòng)畫師以及協(xié)作開發(fā)自動(dòng)駕駛汽車的工程師,像線上共同編輯文檔一樣輕松設(shè)計(jì) 3D 虛擬場(chǎng)景。

  目前,Omniverse 已獲得了許多主要專業(yè)軟件的支持,如 Adobe、Autodesk、Bentley Systems、Robert McNeel & Associates 和 SideFX 等。在本次 GTC 上,英偉達(dá)還宣布 Omniverse 進(jìn)入公測(cè)階段,將于今年秋季開放下載。

  最便宜的英偉達(dá) Jetson,59 美元一塊

  「任何動(dòng)起來(lái)的東西,在未來(lái)或多或少都會(huì)是自動(dòng)化的。AI 技術(shù)的突破已經(jīng)讓各種各樣的機(jī)器人形態(tài)成為可能,」黃仁勛說(shuō)道?!傅覀冞€需要 Jetson AI 的算力把這些機(jī)器人實(shí)用化?!?/p>

  和以往一樣,Jetson 擁有一個(gè) Arm 架構(gòu)的 SoC,也支持 CUDA,并擁有自己的 Tensor Core。而更重要的是,昨天新發(fā)布的 Jetson Nano 2GB 價(jià)格已經(jīng)低至 59 美元一塊——這是一個(gè)和樹莓派(Raspberry Pi 4)接近的低價(jià)。現(xiàn)在,英偉達(dá)希望所有人都可以使用 GPU 制造自己的機(jī)器人。

  構(gòu)建機(jī)器人相關(guān)的軟件和 AI 的開發(fā)流程有些類似,人們會(huì)使用 DGX 這樣的設(shè)備編寫和訓(xùn)練,并在 Jetson 這樣的端側(cè)運(yùn)行。在實(shí)踐中,英偉達(dá)研究人員已經(jīng)訓(xùn)練了很多現(xiàn)成模型,使用遷移學(xué)習(xí)工具,任何人都可以把它們應(yīng)用在自己的任務(wù)上。在機(jī)器人領(lǐng)域,現(xiàn)在還可以通過實(shí)時(shí)的 AI 模擬環(huán)境大幅度提高訓(xùn)練的效率。

  圖片來(lái)自 anandtech。

  除了價(jià)格更低之外,Jetson Nano 2GB 的計(jì)算配置和常規(guī) Jetson Nano 相同,有 4 個(gè) Cortex-A57 CPU 內(nèi)核的 CPU,以及 128 個(gè) CUDA 核的 Maxwell 架構(gòu) GPU。不過 2GB 版本相比標(biāo)準(zhǔn)版少了 DisplayPort 輸出,USB 接口也不是 3.0 的。

  還記得剛發(fā)布的奔馳 S 級(jí)嗎?這臺(tái)車是梅賽德斯有史以來(lái)最智能化的車型,其中搭載了三塊帶英偉達(dá) GPU 的計(jì)算芯片。在 GTC Keynote 上,英偉達(dá)還宣布了和奔馳的新合作計(jì)劃:到 2024 年,所有奔馳車系都將搭載英偉達(dá)的 DRIVE AV 芯片。

  推出 DPU,基于 Arm 架構(gòu)的可編程數(shù)據(jù)中心芯片

  我們都知道英偉達(dá)正在收購(gòu) Arm,不過相比商業(yè)行為,英偉達(dá)的技術(shù)進(jìn)展更快一些。這家公司在收購(gòu) Mellanox 之后,共同研發(fā)了新一代計(jì)算單元 DPU。

  英偉達(dá)推測(cè),全球服務(wù)器的算力吞吐總量每?jī)赡暝鲩L(zhǎng)十倍,而在 2020 年中,僅在 AI 推斷任務(wù)中,在所有云服務(wù)器中使用 GPU 的算力數(shù)量已經(jīng)超過了 CPU。「按照這個(gè)趨勢(shì),在幾年之后英偉達(dá)的 GPU 將會(huì)承載超過 90% 的全球 AI 推理算力。任何 AI 的應(yīng)用和服務(wù)現(xiàn)在都可以基于英偉達(dá)芯片,」黃仁勛說(shuō)道。

  AI 和數(shù)據(jù)分析應(yīng)用必須是分布式的,由多個(gè) GPU 和節(jié)點(diǎn)負(fù)責(zé)運(yùn)算,云服務(wù)實(shí)際上也是巨量的「微服務(wù)」,這種新型的工作負(fù)載對(duì)虛擬化、網(wǎng)絡(luò)、存儲(chǔ)和安全提出了新的要求。在數(shù)據(jù)中心的計(jì)算設(shè)備上,人們提出了 DPU(Data Processing Unit)的新概念。這是一種更多通過軟件定義的基礎(chǔ)設(shè)施芯片。

  新發(fā)布的 DPU 名為 Bluefield-2,這種計(jì)算卡是以可編程 Arm 架構(gòu) CPU 為核心運(yùn)作的。

  Bluefield-2 DPU 擁有 70 億晶體管,將可編程的數(shù)據(jù)中心壓縮成芯片大小。與之相對(duì)的,英偉達(dá)也發(fā)布了 DOCA——可編程數(shù)據(jù)中心基礎(chǔ)設(shè)施處理器的軟件架構(gòu),允許開發(fā)者在 DPU 上構(gòu)建自己的應(yīng)用。英偉達(dá)表示,DOCA 可以無(wú)縫兼容所有主流系統(tǒng)。

  Bluefield-2 只是一個(gè)開始,在英偉達(dá)的計(jì)劃中,Bluefield-4 將會(huì)引入 CUDA 和 NVIDIA AI,大大加速網(wǎng)絡(luò)中計(jì)算機(jī)視覺應(yīng)用處理的速度。

  如果用戶現(xiàn)在就對(duì) AI 算力有很高需求,英偉達(dá)也發(fā)布了 Bluefield-2X,其中的安培架構(gòu) GPU 核心可以用于處理所需任務(wù)?!窧luefield-2X 可以讓你就像已經(jīng)擁有了 Bluefield-4 一樣,」黃仁勛說(shuō)道。「在幾年之后,我們將會(huì)帶來(lái)近 1000 倍的吞吐量,并提供 200-400Gbps 的數(shù)據(jù)速度。」

  在推動(dòng)收購(gòu) Arm 的同時(shí),英偉達(dá)也宣布了支持 Arm 架構(gòu)的新三大戰(zhàn)略:提供更多對(duì) Arm 架構(gòu)的 GPU、網(wǎng)絡(luò)、存儲(chǔ)和安全的支持,實(shí)現(xiàn)更完整的加速平臺(tái);與合作伙伴開發(fā)覆蓋從端側(cè)到 HPC 所有平臺(tái)的設(shè)備;接入 NVIDIA AI 和 NVIDIA RTX 技術(shù)到 Arm 架構(gòu)——此前這些支持僅限于 X86。

  英偉達(dá)發(fā)布的這些產(chǎn)品,全部是為了開發(fā)者能夠在構(gòu)建 AI 技術(shù)時(shí)獲得更多力量。在昨天的 GTC 上,英偉達(dá)一口氣升級(jí)和更新了 80 款 SDK,目前旗下工具的總量達(dá)到了 110 款。目前全球使用英偉達(dá) CUDA 等工具的開發(fā)者數(shù)量已達(dá)到 200 萬(wàn)人。

  「在 AI 時(shí)代的新形式計(jì)算中,我們會(huì)為探索前沿方向和技術(shù)民主化親盡全力。」黃仁勛說(shuō)道。

  如何根據(jù)任務(wù)需求搭配恰當(dāng)類型的數(shù)據(jù)庫(kù)?

  在AWS推出的白皮書《進(jìn)入專用數(shù)據(jù)庫(kù)時(shí)代》中,介紹了8種數(shù)據(jù)庫(kù)類型:關(guān)系、鍵值、文檔、內(nèi)存中、關(guān)系圖、時(shí)間序列、分類賬、領(lǐng)域?qū)捔校⒅鹨环治隽嗣糠N類型的優(yōu)勢(shì)、挑戰(zhàn)與主要使用案例。

  

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。