本文作者: 李壽鵬
本文來源: 半導(dǎo)體行業(yè)觀察
原文鏈接:https://mp.weixin.qq.com/s/RmVrg5LynNKFxwoCCDUvcA
在生成式AI浪潮的推動下,AMD也成為半導(dǎo)體市場的一個贏家。
根據(jù)最新的數(shù)據(jù)顯示,自今年年初以來,AMD的市值大漲超過90%。如果將時間線拉長到五年,AMD的市值大漲超過660%。在這背后,除了文章開頭談到的生成式AI推動外,AMD所推動的基于ZEN架構(gòu)CPU和專為數(shù)據(jù)中心專用GPU設(shè)計的CDNA架構(gòu)產(chǎn)品,收購Xilinx和Pensando所獲得的的FPGA和DPU,以及公司在Chiplet和3D V-Cache等技術(shù)的投入功不可沒。
在今天于舊金山舉辦的產(chǎn)品發(fā)布會上,AMD CEO Lisa Su更是直言,我們?nèi)蕴幱?AI 生命周期的非常、非常早的階段。而根據(jù)他們的預(yù)估,數(shù)據(jù)中心AI加速器的TAM到2027年將會達到1500億美元,這意味著未來四年的CAGR將會超過50%。
正是在這樣龐大市場需求的推動下,AMD帶來了公司最新的,極具競爭力的AMD Instinct MI300系列的產(chǎn)品更多細節(jié)和更新。與此同時,AMD還帶來了第四代的Epyc產(chǎn)品的更新,全面擁抱數(shù)據(jù)中心新時代。
1530億晶體管的怪獸芯片,震撼登場
在AMD今天的發(fā)布會上,最受人關(guān)注的毫無疑問是公司的Instinct MI 300系列。因為在英偉達GPU把持的AI時代,大家希望AMD的這系列芯片能成為萬億芯片巨頭的最強競爭者。而從Lisa提供的參數(shù)看來,MI 300系列的新芯片擁有極強的競爭力。
“人工智能是塑造下一代計算的決定性技術(shù),也是 AMD 最大的戰(zhàn)略增長機會?!盠isa Su強調(diào)。
對AMD有了解的讀者應(yīng)該知道,MI 300是他們在去年六月發(fā)布的,面向AI和HPC推出的一個重要產(chǎn)品。通過將CPU和GPU以chiplet的方式集成到一個芯片,并采用統(tǒng)一的內(nèi)存架構(gòu),AMD希望這個市場能夠給AI市場帶來不一樣的產(chǎn)品。
而在今日,AMD帶來了公司的AMD Instinct MI 300X,一款專門面向生成式AI推出的加速器。和AMD Instinct MI 300A不一樣,AMD Instinct MI 300X并沒有集成CPU內(nèi)核,而是采用了8 個 GPU chiplet(基于CDNA 3架構(gòu))和另外 4 個 IO 內(nèi)存chiplet的設(shè)計,這讓其集成的晶體管數(shù)量達到了驚人的1530億。而為了緩解AI 大型語言模型 (LLM) 所面臨的內(nèi)存制約,AMD為這款芯片集成了192GB的HBM 3,其存儲帶寬也高達5.2 TB/s,可以處理的參數(shù)高達400億。
作為一款對標(biāo)英偉達H100的產(chǎn)品,如圖所示,AMD Instinct MI 300X的HMB密度是前者的2.4倍,帶寬則為前者的1.6倍。這讓AMD的這顆產(chǎn)品在當(dāng)前的AI時代競爭力大增。同時,據(jù)AMD方面透露,基于帶寬高達896GB/s的AMD Infinity架構(gòu),我們可以將八個 M1300X 加速器組合在一個系統(tǒng)中,這樣就能為開發(fā)帶來更強大的計算能力,為 AI 推理和訓(xùn)練提供不一樣的解決方案。據(jù)AMD介紹,該芯片會在今年三季度送樣,值得一提的是,這種設(shè)計方法也是英偉達的 8 路 HGX 和英特爾Ponte Vecchio 的X8 UBB的選擇。
如前面所說,AMD同期還推出了AMD Instinct MI300A,這是全球首款面向AI和HPC的APU,采用了集成24 個 Zen 4 內(nèi)核、CDNA3 GPU 內(nèi)核和 128GB HBM3的設(shè)計。換而言之,和MI 300X只是集成GPU內(nèi)核不一樣,AMD Instinct MI300A在設(shè)計上同時集成了CPU和GPU。與 MI250 相比,該產(chǎn)品提供了 8 倍的性能和 5 倍的效率。在半導(dǎo)體行業(yè)觀察之前的文章《AMD最大的芯片:13個chiplet,1460億晶體管》中,我們有介紹了這款初代的產(chǎn)品。
據(jù)外媒seminalysis所說,MI300A 憑借異構(gòu) CPU+GPU 計算成為頭條新聞,而El Capitan Exascale 超級計算機正在使用該版本。他們指出,MI300A 在 72 x 75.4mm 基板上采用集成散熱器封裝的設(shè)計,適合插槽 SH5 LGA 主板,每塊板有 4 個處理器,能有效地支付開發(fā)成本。seminalysis透露,該芯片已經(jīng)出貨,但真正在第三季度出現(xiàn)增長,這和AMD的說法也是一致的。他們進一步指出,標(biāo)準(zhǔn)服務(wù)器/節(jié)點將是 4 個 MI300A。不需要主機 CPU,因為它是內(nèi)置的。
“這是迄今為止市場上最好的 HPC 芯片,并將保持一段時間?!眘eminalysis強調(diào)。
在發(fā)布這些面向AI應(yīng)用芯片的同時,我們自然就繞不開AMD在軟件方面的投入,這在很多分析人士看來,會是AMD在這個市場發(fā)力的一個短板。但從AMD總裁Victor Peng的介紹我們可以看到,他們也在這個市場訂下了一個目標(biāo),那就是Open(software approach)、Proven(AI capability)和Ready(support for AI models)。
據(jù)Victor Peng介紹,AMD 擁有一套完整的庫和工具ROCm,可以用于其優(yōu)化的 AI 軟件堆棧。與專有的 CUDA 不同,這是一個開放平臺。而在過去的發(fā)展中,公司也一直在不斷優(yōu)化 ROCm 套件。AMD同時還在與很多合作伙伴合作,希望進一步完善其軟件,方便開發(fā)者的AI開發(fā)和應(yīng)用。
“我們在構(gòu)建可與模型、庫、框架和工具的開放生態(tài)系統(tǒng)協(xié)同工作的強大軟件堆棧方面取得了真正的巨大進步。”Victor Peng說。
備受關(guān)注的Bergamo,如約而至
在介紹了MI300的同時,AMD在今天還介紹公司了另一款重頭戲產(chǎn)品——新一代的EPYC。這是一系列為數(shù)據(jù)中心設(shè)計的芯片,到了第四代,AMD則準(zhǔn)備了四條針對不同市場的產(chǎn)品線,當(dāng)中更是包括了備受關(guān)注的、以云原生計算需求為目的的Bergamo系列以及代號為Genoa-X的第二代 EPYC 3D V-Cache CPU。
據(jù)Lisa Su 介紹,新一代的AMD EPYC Genoa 在云工作負載中的性能是英特爾競爭處理器的 1.8 倍,在企業(yè)工作負載中的速度是英特爾競爭處理器的 1.9 倍。Lisa同時談到,絕大多數(shù)人工智能都在 CPU 上運行,而AMD 的產(chǎn)品在這方面性能方面比競爭對手的至強 8490H 具有絕對領(lǐng)先優(yōu)勢,性能高出 1.9 倍,效率也同樣是競爭對手的1.8 倍。
在介紹了EPYC Genoa之后,Lisa著重介紹了公司的云原生產(chǎn)品Bergamo,一款讓開發(fā)者期待已久的高密度服務(wù)器 CPU。據(jù)介紹,該芯片基于 AMD 的密度優(yōu)化 Zen 4c 架構(gòu),提供多達 128 個 CPU 內(nèi)核,比 AMD 當(dāng)前一代旗艦 EPYC 9004 “Geona”芯片多 32 個內(nèi)核。在AMD CTO Mark Papermaster看來,Zen 4c是AMD緊湊密度的補充,是公司核心路線圖的新泳道,它在大約一半的核心區(qū)域提供與 Zen 4 相同的功能。
在分析人士看來,Zen 4c 和 Bergamo 設(shè)計的目的是提供盡可能多的計算資源,這也是AMD在摩爾定律失效的情況下,為滿足盡客戶需要繼續(xù)增加核心數(shù)量需求而做出的一個決定。根據(jù)AMD提供的數(shù)據(jù),全新的Zen 4C核心可以減少35%的面積,在每個CCD中可以提供的核心數(shù)量是Zen 4的兩倍,在每個Socket中則能增加33%的核心。換而言之,Zen 4 每個 CCD 有 8 個內(nèi)核,而 Zen 4c 每個 CCD 有 16 個內(nèi)核。這也意味著 Zen 4c EPYC 芯片的 CCD 總體上少于其原始 Zen 4 芯片。
據(jù)AMD介紹, 這次發(fā)布的Bergamo僅使用八個 Zen 4C Chiplet和中央 IO Chiplet,這和標(biāo)準(zhǔn)EPYC 芯片最多使用十二個 Zen 4 Chiplet設(shè)計略有不同。得益于這個設(shè)計,Bergamo成為了一個擁有820億晶體管的設(shè)計,低于完整 Genoa 芯片中的約900億個晶體管。這個更高的內(nèi)核數(shù)量和更小的時鐘速度設(shè)計使得該芯片比 Genoa 設(shè)計更節(jié)能——這是AMD定義該產(chǎn)品所專注市場時考慮的重要因素。AMD也透露,Bergamo在性能和效率方面的表現(xiàn)也非常出色。
依賴于其高核心密度和高能效,AMD 希望Bergamo在該領(lǐng)域能與基于 Arm 的Ampere、Amazon 和其他使用Arm 架構(gòu)內(nèi)核的公司競爭,AMD 也希望這款芯片會成為Intel于2024 年推出的,具備144核心的Sierra Forest的有力競爭者。
除了上述產(chǎn)品之外,AMD還帶來了具有1.1GB L3緩存的“Genoa-X”EPYC 處理器。據(jù)了解,Genoa-X是 AMD 第一代 V-cache Milan-X的繼任者。與上一代產(chǎn)品一樣,AMD 正在使用緩存芯片堆疊為其他常規(guī)的 Genoa Zen 4 CCD 添加更多的 L3 緩存。在這種設(shè)計下,Genoa/Genoa-X 芯片上有 12 個 CCD,這允許 AMD 向芯片添加 768MB 的額外 L3 緩存。
更多芯片在路上
在這次的盛會上,AMD還披露了全新的DPU規(guī)劃,這是他們通過收購 Pensando所獲得的技術(shù)。在他們看來,AMD 的 Pensando SmartNIC 是新數(shù)據(jù)中心架構(gòu)不可或缺的一部分。按照AMD的規(guī)劃,他們接下來會將P4 DPU 卸載集成到網(wǎng)絡(luò)交換機,從而在機架級別提供服務(wù)。為此,他們正在與HPE Aruba Networks 一起開發(fā)智能交換機。
AMD 同時強調(diào)了其代號為“Giglio”的下一代 DPU 路線圖,與當(dāng)前一代產(chǎn)品相比,該路線圖旨在為客戶帶來更高的性能和能效,預(yù)計將于 2023 年底上市。AMD 還發(fā)布了 AMD Pensando Software-in-Silicon Developer Kit (SSDK),使客戶能夠快速開發(fā)或遷移服務(wù)以部署在 AMD Pensando P4 可編程 DPU 上,與 AMD 上已經(jīng)實現(xiàn)的現(xiàn)有豐富功能集相協(xié)調(diào)Pensando 平臺。AMD Pensando SSDK 使客戶能夠發(fā)揮領(lǐng)先的 AMD Pensando DPU 的強大功能,并在其基礎(chǔ)架構(gòu)中定制網(wǎng)絡(luò)虛擬化和安全功能,與 Pensando 平臺上已實施的現(xiàn)有豐富功能集相協(xié)調(diào)。
依賴于這些豐富的產(chǎn)品,AMD正在沖擊數(shù)據(jù)中心的下一個高峰。
更多精彩內(nèi)容歡迎點擊==>>電子技術(shù)應(yīng)用-AET<<