123,123

AMD发布Vega产品说明会打进机器学习领域厮杀战场

日期： 2016-12-17

關(guān)鍵詞： GPU AMD

近十年來， GPGPU（通用計算 GPU，用 GPU 處理運算任務(wù)）的浪潮完全由英偉達帶領(lǐng)，把他們的 GPU 定位于 AI 和神經(jīng)網(wǎng)絡(luò)開發(fā)的首選運算平臺。英偉達甚至已開始轉(zhuǎn)型，把自己定位于 AI 計算公司，而不僅僅是 PC 用戶眼中的游戲顯卡開發(fā)商。

英偉達在 AI 計算的強勢，使英特爾感到強烈壓力——它一方面在憋大招，將在 2017 年把深度學(xué)習(xí)推理加速器和 72 核至強 Xeon Phi 芯片推向市場，構(gòu)成英特爾 AI 產(chǎn)品線的“絕代雙驕”。另一方面，在 GPU 專利技術(shù)上，轉(zhuǎn)向與老對手 AMD 合作，頗有那么點“聯(lián)蜀抗曹”的意思——似乎英偉達才是公司長遠發(fā)展的頭號對手。

反觀 AMD 這邊，不但手握新 CPU 架構(gòu) Zen（“禪”）、號稱明年要在 PC 和服務(wù)器市場讓英特爾難堪；同時還在緊鑼密鼓地籌備新 GPU 架構(gòu) Vega （“織女星”），準備明年打破英偉達對高端顯卡市場的壟斷。然而，準備翻身的“農(nóng)企”并不滿足在 CPU 和游戲顯卡這兩個傳統(tǒng)領(lǐng)域和老對手們較量，而是追著他們的腳后跟進入 AI 運算領(lǐng)域。

傳統(tǒng)芯片巨頭紅、藍、綠廠將在新戰(zhàn)場開啟三國殺。

AMD發(fā)布Vega產(chǎn)品說明會打進<a class=

12 月 9 日，AMD 召集行業(yè)人士秘密進行了一場關(guān)于 Vega 的產(chǎn)品說明會。現(xiàn)在，該會議的部分內(nèi)容終于曝光——AMD 發(fā)布全新 AI 計算子品牌 “Radeon Instinct”，以及隸屬該品牌的兩大產(chǎn)品線：硬件加速器產(chǎn)品，和 ROCm 軟件平臺。AMD 將利用它們?yōu)槌憧蛻籼峁┸?、硬件結(jié)合的解決方案。

AMD發(fā)布Vega產(chǎn)品說明會打進機器學(xué)習(xí)領(lǐng)域廝殺戰(zhàn)場

Radeon Instinct 旗下兩大產(chǎn)品：硬件加速器和軟件 ROCm

三款硬件加速器

AMD發(fā)布Vega產(chǎn)品說明會打進機器學(xué)習(xí)領(lǐng)域廝殺戰(zhàn)場

在硬件方面，AMD 共有三款產(chǎn)品發(fā)布——分別是基于 Polaris （“北極星”）、Fiji（“斐濟”）和 Vega 的深度學(xué)習(xí)加速器 MI6、MI8 以及 MI25。其中，運算能力最強的 MI25 是 AI 訓(xùn)練加速器，前兩者是推理加速器。

AMD發(fā)布Vega產(chǎn)品說明會打進機器學(xué)習(xí)領(lǐng)域廝殺戰(zhàn)場

MI6 采用降頻的 Polaris 10 核心（RX 480 的核心），但顯存增加至 16 GB ，并采取無風(fēng)扇的被動散熱（但利用服務(wù)器的散熱系統(tǒng)），浮點計算能力每秒 5.7 萬億次。

MI8 體積小巧一些，這是因為它基于 Fiji 架構(gòu)的 R9 Fury Nano 顯卡。它采用和 Nano 一致的頻率，同樣的 4 GB 顯存，這是因為 Nano 搭載的初代 HBM 顯存最多只能支持 4GB。雷鋒網(wǎng)獲悉，已有外媒提出質(zhì)疑，但目前還不清楚這是否會為深度學(xué)習(xí)應(yīng)用帶來運算瓶頸。它浮點計算能力為每秒 8.2 萬億次

基于下代 Vega 架構(gòu)的 MI25 吸引了全球媒體的目光。但遺憾的是，AMD 并沒有給出多少信息，只表示它采用了 Vega 10 核心，與會媒體推斷它的浮點運算能力約為每秒 12.5 萬億次。但也有人猜測這是一個雙 GPU 核心的加速器卡，就好比 Pro Duo。這樣就能解釋它的命名為什么是 MI25 ：兩個核心相加得 25 TFLOPS。這也解釋了高達 300W 的熱功耗。雷鋒網(wǎng)提醒各位讀者，對于這些傳言審慎看待。

MI6 和 MI8 預(yù)計在明年上半年發(fā)貨，而 MI25 可能會更遲。另外，與游戲顯卡交給 OEM 廠商（藍寶石、XFX、華碩等）生產(chǎn)的做法不同，Radeon Instinct 旗下的深度學(xué)習(xí)硬件將由 AMD 自家生產(chǎn)和進行售后維護。這效仿了英偉達的做法，目的是加強與業(yè)界的聯(lián)系和對產(chǎn)品、品牌的控制力。

對于不太了解 AMD 顯卡產(chǎn)品線的讀者，F(xiàn)iji 是上一代GPU 架構(gòu)，Polaris 是當前 RX 480/470/460 所采用的架構(gòu)，而 Vega 是極有可能應(yīng)用于 RX 490、新 Fury，或者是 RX 5 系的下一代架構(gòu)。Vega 又分為 Vega 10 和 Vega 11 兩種規(guī)格，目前已確定 Vega 10 是采用 HBM2（第二代 HBM 顯存）的高端核心。據(jù)悉，傳說中即將發(fā)布的 RX 490 或者新 Fury 將采用 Vega 10。

AMD發(fā)布Vega產(chǎn)品說明會打進機器學(xué)習(xí)領(lǐng)域廝殺戰(zhàn)場

AMD 的 GPU 路線圖：從 28 納米工藝到 Polaris 再到 Vega

軟件平臺 ROCm

在深度學(xué)習(xí)計算軟件方面，AMD 發(fā)布了 ROCm。它全稱為“Radeon Open Compute platform”（“Radeon 開源計算平臺”），如同它的名字，是 AMD 為超算和超大規(guī)模運算開發(fā)的開源 GPU 運算平臺，它獨立于程序設(shè)計語言。AMD 表示：ROCm 是他們把 UNIX 哲學(xué)中的選擇、極簡主義和模塊化軟件開發(fā)帶到 GPU 計算的結(jié)果。新的 ROCm 允許開發(fā)者選擇工具和語言運行時（ language run time ），甚至進行開發(fā)。

如同所有合理的機器學(xué)習(xí)市場項目， ROCm 能支持多個 GPU，包括同個系統(tǒng)內(nèi)的 GPU 和多服務(wù)器場景。它能利用 RDMA peer-sync 技術(shù)簡化多 GPU“交火”。ROCm 的設(shè)計不但考慮了大規(guī)模服務(wù)器擴展，還內(nèi)置了編譯器（compilers）、語言運行時和對 CUDA 應(yīng)用的支持。

另外，AMD 還為深度學(xué)習(xí)開發(fā)了 MIOpen 庫，以充分利用 GCN 架構(gòu)。MIOpen 與 C++ STL， NCCL 處在同個層級，它的功能是連接程序設(shè)計語言和 ROCm 平臺，成為類似 Caffe 和 TensorFlow 的通用架構(gòu)。

AMD發(fā)布Vega產(chǎn)品說明會打進機器學(xué)習(xí)領(lǐng)域廝殺戰(zhàn)場

MIOpen 的定位，最下層是 ROCm。中間是 MIOpen、 C++ 、STL、NCCL 等，最上層是 Caffe 和 TensorFlow 等框架

AMD 宣稱，有了 MIOpen， MI8 加速器的性能相當于英偉達泰坦 X （Titan X Pascal），而 MI25 更是超出后者 30% 之多。

AMD發(fā)布Vega產(chǎn)品說明會打進機器學(xué)習(xí)領(lǐng)域廝殺戰(zhàn)場

左： MIOpen 與基于 GEMM 的卷積對比。右：兩代泰坦與 MI8、MI25 在 MIOpen 下性能對比。

看來，這次 AMD 進軍機器學(xué)習(xí)計算市場是認真的。未來，AMD 的愿景應(yīng)該是，MI 系列硬件加速器、ROCm 軟件平臺和基于 Zen 的 32 核以及 64 核服務(wù)器 CPU 三者合力，為超算客戶提供一整套基于 AMD 產(chǎn)品線的解決方案。但相比在 AI 領(lǐng)域經(jīng)營已久的藍、綠兩廠，AMD 根基薄弱、資源有限，而且入場時間已經(jīng)極大落后。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

AMD发布Vega产品说明会 打进机器学习领域厮杀战场

日期： 2016-12-17

相關(guān)內(nèi)容

AMD发布Vega产品说明会打进机器学习领域厮杀战场