《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 電子元件 > 業(yè)界動(dòng)態(tài) > CDNA架構(gòu)Instinct MI100加速顯卡 逼近百億億次級(jí)計(jì)算時(shí)代

CDNA架構(gòu)Instinct MI100加速顯卡 逼近百億億次級(jí)計(jì)算時(shí)代

2020-11-18
來(lái)源:至頂網(wǎng)
關(guān)鍵詞: CDNA 顯卡 計(jì)算時(shí)代 AMD

AMD不止一次表示:Zen奠定了AMD未來(lái)幾年產(chǎn)品的路線圖,現(xiàn)如今,“Zen”這把火已經(jīng)在CPU市場(chǎng)越燒越旺。

對(duì)比CPU架構(gòu)Zen,AMD的GPU 架構(gòu)則顯得沒(méi)有那么亮眼,曾經(jīng)的“GCN”已經(jīng)慢慢退出歷史舞臺(tái),而AMD在GPU領(lǐng)域的新一輪布局才剛剛開(kāi)始。去年,AMD推出了為游戲所設(shè)計(jì)的專用圖形架構(gòu)RDNA;今年,AMD則推出了專門(mén)為高性能計(jì)算所打造CDNA架構(gòu),并且在近期發(fā)布了首款基于全新CDNA架構(gòu)的Instinct MI100加速顯卡。

z1.png

眾所周知,AMD是世界上唯一一家在CPU跟GPU上都做到行業(yè)標(biāo)桿的企業(yè),在高性能計(jì)算領(lǐng)域,AMD的CPU與GPU的產(chǎn)品組合又會(huì)給客戶帶來(lái)哪些驚喜呢?

AMD高級(jí)副總裁兼服務(wù)器業(yè)務(wù)總經(jīng)理Dan McNamara表示,在高性能計(jì)算方面,整個(gè)行業(yè)發(fā)展十分迅速。我們看到的趨勢(shì)是,工作負(fù)載的多樣性在不斷增加,高性能計(jì)算已經(jīng)進(jìn)入到很多領(lǐng)域,包括從傳統(tǒng)科研,氣象研究,生命科學(xué),電子設(shè)計(jì)自動(dòng)化到商業(yè)應(yīng)用,從AI、機(jī)器學(xué)習(xí)到算法培訓(xùn)等等,如何通過(guò)CPU和GPU方面的組合更好地服務(wù)于客戶、為客戶帶來(lái)更多單位成本性能和減少總體擁有成本,將是AMD極其重要的戰(zhàn)略之一。

CDNA架構(gòu)Instinct MI100加速顯卡 逼近百億億次級(jí)計(jì)算時(shí)代

在整個(gè)過(guò)去20年里,整個(gè)高性能計(jì)算經(jīng)歷了三個(gè)階段,分別是TERASCALE、PETASCALE和現(xiàn)在的EXASCALE。在這個(gè)過(guò)程中我們需要一系列技術(shù)來(lái)支持EXASCALE這樣一個(gè)百億億次級(jí)計(jì)算。

z2.png

AMD平臺(tái)解決方案工程研發(fā)全球副總裁Brad Mccredie表示,(如上圖所示)我們可以看到接近EXASCALE的時(shí)候,所需性能速度是放慢的趨勢(shì),沒(méi)有辦法用很快的速度達(dá)到百億億次級(jí)的發(fā)展?;诖耍珹MD推出了CDNA架構(gòu)Instinct MI100加速顯卡,這款GPU產(chǎn)品能夠?qū)崿F(xiàn)10TF(十萬(wàn)億次雙精度計(jì)算速度),具備Matrix核心技術(shù),它能夠進(jìn)一步逼近百億億次級(jí)的運(yùn)算時(shí)代。

與AMD上一代產(chǎn)品相比有著巨大的性能提升,AMD Instinct MI100能夠?qū)崿F(xiàn)高達(dá)70%的AI計(jì)算加強(qiáng);而與競(jìng)爭(zhēng)對(duì)手相比,在每單位性能上也是對(duì)方的兩倍。特別是在搭配第二代AMD EPYC處理器使用時(shí),還可為系統(tǒng)提供更強(qiáng)的加速性能。

z3.png

以AMD Instinct MI100為例,CDNA架構(gòu)可在同一晶片上放入了兩倍數(shù)量的計(jì)算單元,并可以嵌入微架構(gòu)以更好的適應(yīng)AI和高性能計(jì)算的工作負(fù)載。同時(shí)在16位浮點(diǎn)計(jì)算和混合精度計(jì)算方面也能實(shí)現(xiàn)7倍以上的性能提升,另外通過(guò)Infinity架構(gòu)還可以將GPU的帶寬提升4倍、通過(guò)HBM2內(nèi)存來(lái)實(shí)現(xiàn)20%的位寬提升。

據(jù)Brad Mccredie介紹,AMD與4家頂級(jí)系統(tǒng)廠商在密切配合,將于本月開(kāi)始陸續(xù)發(fā)貨。

開(kāi)源軟件站ROCm 4.0 為百億億次級(jí)計(jì)算提供了新基礎(chǔ)

z4.png

世界級(jí)硬件(AMD Instinct MI100),也需要世界級(jí)生態(tài)來(lái)做配套,AMD推出了開(kāi)源軟件站ROCm 4.0。該平臺(tái)不僅相較上兩代產(chǎn)品,可實(shí)現(xiàn)MI100高達(dá)5-8倍的性能提升,還可為開(kāi)發(fā)者們提供簡(jiǎn)單快捷的代碼遷移功能,甚至最短1天就可完成某些代碼的遷移工作。

Brad Mccredie表示,它(開(kāi)源軟件站ROCm 4.0)是一套不斷壯大的生態(tài)系統(tǒng),從功能上來(lái)說(shuō)也非常完善,已經(jīng)做好了企業(yè)級(jí)客戶的部署就緒,為百億億次級(jí)計(jì)算提供了新基礎(chǔ)。

AMD Instinct MI100落地應(yīng)用 還有與霄龍的搭配組合

z5.png

AMD分享了一系列AMD Instinct MI100落地應(yīng)用。據(jù)介紹,橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室就通過(guò)使用MI100來(lái)進(jìn)行相關(guān)工作負(fù)載,在分子動(dòng)力學(xué)負(fù)載中,與v100加速顯卡相比速度提升3倍。而在Fluid Turbulence的工作負(fù)載中,也比v100加速顯卡有2.6倍的速度優(yōu)勢(shì)。

Dan McNamara補(bǔ)充了CGG以及ECMWF的應(yīng)用,CGG是一家地球科學(xué)公司,他們使用霄龍CPU和MI100 GPU來(lái)幫助他們做地震成效以及更好的決策。在氣象建模方面,歐洲的ECMWF利用霄龍?zhí)幚砥鞔蛟焓澜缱顝?qiáng)的氣象建模的超算之一。他表示,AMD近期有很多客戶成功案例,也顯示了霄龍?zhí)幚砥骱虯MD GPU產(chǎn)品在整個(gè)高性能計(jì)算市場(chǎng)的巨大成功。

打造出偉大的產(chǎn)品——這是蘇姿豐博士在上任之初為AMD規(guī)劃出的未來(lái)戰(zhàn)略之一,AMD也一直朝著既定的目標(biāo)前進(jìn),在企業(yè)級(jí)市場(chǎng),不管是CPU(霄龍)還是GPU(MI100),AMD都拿出了讓客戶滿意的產(chǎn)品。AMD也一直踐踏實(shí)地,用產(chǎn)品贏得客戶的心,這才是AMD的制勝之道。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。