AMD不止一次表示:Zen奠定了AMD未來(lái)幾年產(chǎn)品的路線圖,現(xiàn)如今,“Zen”這把火已經(jīng)在CPU市場(chǎng)越燒越旺。
對(duì)比CPU架構(gòu)Zen,AMD的GPU 架構(gòu)則顯得沒(méi)有那么亮眼,曾經(jīng)的“GCN”已經(jīng)慢慢退出歷史舞臺(tái),而AMD在GPU領(lǐng)域的新一輪布局才剛剛開(kāi)始。去年,AMD推出了為游戲所設(shè)計(jì)的專用圖形架構(gòu)RDNA;今年,AMD則推出了專門(mén)為高性能計(jì)算所打造CDNA架構(gòu),并且在近期發(fā)布了首款基于全新CDNA架構(gòu)的Instinct MI100加速顯卡。
眾所周知,AMD是世界上唯一一家在CPU跟GPU上都做到行業(yè)標(biāo)桿的企業(yè),在高性能計(jì)算領(lǐng)域,AMD的CPU與GPU的產(chǎn)品組合又會(huì)給客戶帶來(lái)哪些驚喜呢?
AMD高級(jí)副總裁兼服務(wù)器業(yè)務(wù)總經(jīng)理Dan McNamara表示,在高性能計(jì)算方面,整個(gè)行業(yè)發(fā)展十分迅速。我們看到的趨勢(shì)是,工作負(fù)載的多樣性在不斷增加,高性能計(jì)算已經(jīng)進(jìn)入到很多領(lǐng)域,包括從傳統(tǒng)科研,氣象研究,生命科學(xué),電子設(shè)計(jì)自動(dòng)化到商業(yè)應(yīng)用,從AI、機(jī)器學(xué)習(xí)到算法培訓(xùn)等等,如何通過(guò)CPU和GPU方面的組合更好地服務(wù)于客戶、為客戶帶來(lái)更多單位成本性能和減少總體擁有成本,將是AMD極其重要的戰(zhàn)略之一。
CDNA架構(gòu)Instinct MI100加速顯卡 逼近百億億次級(jí)計(jì)算時(shí)代
在整個(gè)過(guò)去20年里,整個(gè)高性能計(jì)算經(jīng)歷了三個(gè)階段,分別是TERASCALE、PETASCALE和現(xiàn)在的EXASCALE。在這個(gè)過(guò)程中我們需要一系列技術(shù)來(lái)支持EXASCALE這樣一個(gè)百億億次級(jí)計(jì)算。
AMD平臺(tái)解決方案工程研發(fā)全球副總裁Brad Mccredie表示,(如上圖所示)我們可以看到接近EXASCALE的時(shí)候,所需性能速度是放慢的趨勢(shì),沒(méi)有辦法用很快的速度達(dá)到百億億次級(jí)的發(fā)展?;诖耍珹MD推出了CDNA架構(gòu)Instinct MI100加速顯卡,這款GPU產(chǎn)品能夠?qū)崿F(xiàn)10TF(十萬(wàn)億次雙精度計(jì)算速度),具備Matrix核心技術(shù),它能夠進(jìn)一步逼近百億億次級(jí)的運(yùn)算時(shí)代。
與AMD上一代產(chǎn)品相比有著巨大的性能提升,AMD Instinct MI100能夠?qū)崿F(xiàn)高達(dá)70%的AI計(jì)算加強(qiáng);而與競(jìng)爭(zhēng)對(duì)手相比,在每單位性能上也是對(duì)方的兩倍。特別是在搭配第二代AMD EPYC處理器使用時(shí),還可為系統(tǒng)提供更強(qiáng)的加速性能。
以AMD Instinct MI100為例,CDNA架構(gòu)可在同一晶片上放入了兩倍數(shù)量的計(jì)算單元,并可以嵌入微架構(gòu)以更好的適應(yīng)AI和高性能計(jì)算的工作負(fù)載。同時(shí)在16位浮點(diǎn)計(jì)算和混合精度計(jì)算方面也能實(shí)現(xiàn)7倍以上的性能提升,另外通過(guò)Infinity架構(gòu)還可以將GPU的帶寬提升4倍、通過(guò)HBM2內(nèi)存來(lái)實(shí)現(xiàn)20%的位寬提升。
據(jù)Brad Mccredie介紹,AMD與4家頂級(jí)系統(tǒng)廠商在密切配合,將于本月開(kāi)始陸續(xù)發(fā)貨。
開(kāi)源軟件站ROCm 4.0 為百億億次級(jí)計(jì)算提供了新基礎(chǔ)
世界級(jí)硬件(AMD Instinct MI100),也需要世界級(jí)生態(tài)來(lái)做配套,AMD推出了開(kāi)源軟件站ROCm 4.0。該平臺(tái)不僅相較上兩代產(chǎn)品,可實(shí)現(xiàn)MI100高達(dá)5-8倍的性能提升,還可為開(kāi)發(fā)者們提供簡(jiǎn)單快捷的代碼遷移功能,甚至最短1天就可完成某些代碼的遷移工作。
Brad Mccredie表示,它(開(kāi)源軟件站ROCm 4.0)是一套不斷壯大的生態(tài)系統(tǒng),從功能上來(lái)說(shuō)也非常完善,已經(jīng)做好了企業(yè)級(jí)客戶的部署就緒,為百億億次級(jí)計(jì)算提供了新基礎(chǔ)。
AMD Instinct MI100落地應(yīng)用 還有與霄龍的搭配組合
AMD分享了一系列AMD Instinct MI100落地應(yīng)用。據(jù)介紹,橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室就通過(guò)使用MI100來(lái)進(jìn)行相關(guān)工作負(fù)載,在分子動(dòng)力學(xué)負(fù)載中,與v100加速顯卡相比速度提升3倍。而在Fluid Turbulence的工作負(fù)載中,也比v100加速顯卡有2.6倍的速度優(yōu)勢(shì)。
Dan McNamara補(bǔ)充了CGG以及ECMWF的應(yīng)用,CGG是一家地球科學(xué)公司,他們使用霄龍CPU和MI100 GPU來(lái)幫助他們做地震成效以及更好的決策。在氣象建模方面,歐洲的ECMWF利用霄龍?zhí)幚砥鞔蛟焓澜缱顝?qiáng)的氣象建模的超算之一。他表示,AMD近期有很多客戶成功案例,也顯示了霄龍?zhí)幚砥骱虯MD GPU產(chǎn)品在整個(gè)高性能計(jì)算市場(chǎng)的巨大成功。
打造出偉大的產(chǎn)品——這是蘇姿豐博士在上任之初為AMD規(guī)劃出的未來(lái)戰(zhàn)略之一,AMD也一直朝著既定的目標(biāo)前進(jìn),在企業(yè)級(jí)市場(chǎng),不管是CPU(霄龍)還是GPU(MI100),AMD都拿出了讓客戶滿意的產(chǎn)品。AMD也一直踐踏實(shí)地,用產(chǎn)品贏得客戶的心,這才是AMD的制勝之道。