123,123,123

1530亿晶体管芯片发布，AMD正式叫板英伟达

日期： 2023-06-14

作者：李寿鹏

來源：半导体行业观察

關鍵詞： AMD 晶体管芯片英伟达

　本文作者：李壽鵬

本文來源：半導體行業(yè)觀察

原文鏈接：https://mp.weixin.qq.com/s/RmVrg5LynNKFxwoCCDUvcA

　在生成式AI浪潮的推動下，AMD也成為半導體市場的一個贏家。

　　根據最新的數據顯示，自今年年初以來，AMD的市值大漲超過90%。如果將時間線拉長到五年，AMD的市值大漲超過660%。在這背后，除了文章開頭談到的生成式AI推動外，AMD所推動的基于ZEN架構CPU和專為數據中心專用GPU設計的CDNA架構產品，收購Xilinx和Pensando所獲得的的FPGA和DPU，以及公司在Chiplet和3D V-Cache等技術的投入功不可沒。

　　在今天于舊金山舉辦的產品發(fā)布會上，AMD CEO Lisa Su更是直言，我們仍處于 AI 生命周期的非常、非常早的階段。而根據他們的預估，數據中心AI加速器的TAM到2027年將會達到1500億美元，這意味著未來四年的CAGR將會超過50%。

微信截圖_20230614105947.png

　　正是在這樣龐大市場需求的推動下，AMD帶來了公司最新的，極具競爭力的AMD Instinct MI300系列的產品更多細節(jié)和更新。與此同時，AMD還帶來了第四代的Epyc產品的更新，全面擁抱數據中心新時代。

　　1530億晶體管的怪獸芯片，震撼登場

　　在AMD今天的發(fā)布會上，最受人關注的毫無疑問是公司的Instinct MI 300系列。因為在英偉達GPU把持的AI時代，大家希望AMD的這系列芯片能成為萬億芯片巨頭的最強競爭者。而從Lisa提供的參數看來，MI 300系列的新芯片擁有極強的競爭力。

　　“人工智能是塑造下一代計算的決定性技術，也是 AMD 最大的戰(zhàn)略增長機會。”Lisa Su強調。

　　對AMD有了解的讀者應該知道，MI 300是他們在去年六月發(fā)布的，面向AI和HPC推出的一個重要產品。通過將CPU和GPU以chiplet的方式集成到一個芯片，并采用統(tǒng)一的內存架構，AMD希望這個市場能夠給AI市場帶來不一樣的產品。

微信截圖_20230614110005.png

　　而在今日，AMD帶來了公司的AMD Instinct MI 300X，一款專門面向生成式AI推出的加速器。和AMD Instinct MI 300A不一樣，AMD Instinct MI 300X并沒有集成CPU內核，而是采用了8 個 GPU chiplet（基于CDNA 3架構）和另外 4 個 IO 內存chiplet的設計，這讓其集成的晶體管數量達到了驚人的1530億。而為了緩解AI 大型語言模型 (LLM) 所面臨的內存制約，AMD為這款芯片集成了192GB的HBM 3，其存儲帶寬也高達5.2 TB/s，可以處理的參數高達400億。

微信截圖_20230614110033.png

　　作為一款對標英偉達H100的產品，如圖所示，AMD Instinct MI 300X的HMB密度是前者的2.4倍，帶寬則為前者的1.6倍。這讓AMD的這顆產品在當前的AI時代競爭力大增。同時，據AMD方面透露，基于帶寬高達896GB/s的AMD Infinity架構，我們可以將八個 M1300X 加速器組合在一個系統(tǒng)中，這樣就能為開發(fā)帶來更強大的計算能力,為 AI 推理和訓練提供不一樣的解決方案。據AMD介紹，該芯片會在今年三季度送樣，值得一提的是，這種設計方法也是英偉達的 8 路 HGX 和英特爾Ponte Vecchio 的X8 UBB的選擇。

微信截圖_20230614110049.png

　　如前面所說，AMD同期還推出了AMD Instinct MI300A，這是全球首款面向AI和HPC的APU，采用了集成24 個 Zen 4 內核、CDNA3 GPU 內核和 128GB HBM3的設計。換而言之，和MI 300X只是集成GPU內核不一樣，AMD Instinct MI300A在設計上同時集成了CPU和GPU。與 MI250 相比，該產品提供了 8 倍的性能和 5 倍的效率。在半導體行業(yè)觀察之前的文章《AMD最大的芯片：13個chiplet，1460億晶體管》中，我們有介紹了這款初代的產品。

　　據外媒seminalysis所說，MI300A 憑借異構 CPU+GPU 計算成為頭條新聞，而El Capitan Exascale 超級計算機正在使用該版本。他們指出，MI300A 在 72 x 75.4mm 基板上采用集成散熱器封裝的設計，適合插槽 SH5 LGA 主板，每塊板有 4 個處理器，能有效地支付開發(fā)成本。seminalysis透露，該芯片已經出貨，但真正在第三季度出現增長，這和AMD的說法也是一致的。他們進一步指出，標準服務器/節(jié)點將是 4 個 MI300A。不需要主機 CPU，因為它是內置的。

　　“這是迄今為止市場上最好的 HPC 芯片，并將保持一段時間。”seminalysis強調。

微信截圖_20230614110137.png

　　在發(fā)布這些面向AI應用芯片的同時，我們自然就繞不開AMD在軟件方面的投入，這在很多分析人士看來，會是AMD在這個市場發(fā)力的一個短板。但從AMD總裁Victor Peng的介紹我們可以看到，他們也在這個市場訂下了一個目標，那就是Open（software approach）、Proven（AI capability）和Ready（support for AI models）。

微信截圖_20230614110223.png

　　據Victor Peng介紹，AMD 擁有一套完整的庫和工具ROCm，可以用于其優(yōu)化的 AI 軟件堆棧。與專有的 CUDA 不同，這是一個開放平臺。而在過去的發(fā)展中，公司也一直在不斷優(yōu)化 ROCm 套件。AMD同時還在與很多合作伙伴合作，希望進一步完善其軟件，方便開發(fā)者的AI開發(fā)和應用。

微信截圖_20230614110242.png

　　“我們在構建可與模型、庫、框架和工具的開放生態(tài)系統(tǒng)協(xié)同工作的強大軟件堆棧方面取得了真正的巨大進步?！盫ictor Peng說。

　　備受關注的Bergamo，如約而至

　　在介紹了MI300的同時，AMD在今天還介紹公司了另一款重頭戲產品——新一代的EPYC。這是一系列為數據中心設計的芯片，到了第四代，AMD則準備了四條針對不同市場的產品線，當中更是包括了備受關注的、以云原生計算需求為目的的Bergamo系列以及代號為Genoa-X的第二代 EPYC 3D V-Cache CPU。

微信截圖_20230614110342.png

　　據Lisa Su 介紹，新一代的AMD EPYC Genoa 在云工作負載中的性能是英特爾競爭處理器的 1.8 倍，在企業(yè)工作負載中的速度是英特爾競爭處理器的 1.9 倍。Lisa同時談到，絕大多數人工智能都在 CPU 上運行，而AMD 的產品在這方面性能方面比競爭對手的至強 8490H 具有絕對領先優(yōu)勢，性能高出 1.9 倍，效率也同樣是競爭對手的1.8 倍。

微信截圖_20230614110403.png

　　在介紹了EPYC Genoa之后，Lisa著重介紹了公司的云原生產品Bergamo，一款讓開發(fā)者期待已久的高密度服務器 CPU。據介紹，該芯片基于 AMD 的密度優(yōu)化 Zen 4c 架構，提供多達 128 個 CPU 內核，比 AMD 當前一代旗艦 EPYC 9004 “Geona”芯片多 32 個內核。在AMD CTO Mark Papermaster看來，Zen 4c是AMD緊湊密度的補充，是公司核心路線圖的新泳道，它在大約一半的核心區(qū)域提供與 Zen 4 相同的功能。

微信截圖_20230614110418.png

　　在分析人士看來，Zen 4c 和 Bergamo 設計的目的是提供盡可能多的計算資源，這也是AMD在摩爾定律失效的情況下，為滿足盡客戶需要繼續(xù)增加核心數量需求而做出的一個決定。根據AMD提供的數據，全新的Zen 4C核心可以減少35%的面積，在每個CCD中可以提供的核心數量是Zen 4的兩倍，在每個Socket中則能增加33%的核心。換而言之，Zen 4 每個 CCD 有 8 個內核，而 Zen 4c 每個 CCD 有 16 個內核。這也意味著 Zen 4c EPYC 芯片的 CCD 總體上少于其原始 Zen 4 芯片。

微信截圖_20230614110428.png

　　據AMD介紹，這次發(fā)布的Bergamo僅使用八個 Zen 4C Chiplet和中央 IO Chiplet，這和標準EPYC 芯片最多使用十二個 Zen 4 Chiplet設計略有不同。得益于這個設計，Bergamo成為了一個擁有820億晶體管的設計，低于完整 Genoa 芯片中的約900億個晶體管。這個更高的內核數量和更小的時鐘速度設計使得該芯片比 Genoa 設計更節(jié)能——這是AMD定義該產品所專注市場時考慮的重要因素。AMD也透露，Bergamo在性能和效率方面的表現也非常出色。

微信截圖_20230614110434.png

　　依賴于其高核心密度和高能效，AMD 希望Bergamo在該領域能與基于 Arm 的Ampere、Amazon 和其他使用Arm 架構內核的公司競爭，AMD 也希望這款芯片會成為Intel于2024 年推出的，具備144核心的Sierra Forest的有力競爭者。

　　除了上述產品之外，AMD還帶來了具有1.1GB L3緩存的“Genoa-X”EPYC 處理器。據了解，Genoa-X是 AMD 第一代 V-cache Milan-X的繼任者。與上一代產品一樣，AMD 正在使用緩存芯片堆疊為其他常規(guī)的 Genoa Zen 4 CCD 添加更多的 L3 緩存。在這種設計下，Genoa/Genoa-X 芯片上有 12 個 CCD，這允許 AMD 向芯片添加 768MB 的額外 L3 緩存。

　　更多芯片在路上

　　在這次的盛會上，AMD還披露了全新的DPU規(guī)劃，這是他們通過收購 Pensando所獲得的技術。在他們看來，AMD 的 Pensando SmartNIC 是新數據中心架構不可或缺的一部分。按照AMD的規(guī)劃，他們接下來會將P4 DPU 卸載集成到網絡交換機，從而在機架級別提供服務。為此，他們正在與HPE Aruba Networks 一起開發(fā)智能交換機。

微信截圖_20230614110515.png

　　AMD 同時強調了其代號為“Giglio”的下一代 DPU 路線圖，與當前一代產品相比，該路線圖旨在為客戶帶來更高的性能和能效，預計將于 2023 年底上市。AMD 還發(fā)布了 AMD Pensando Software-in-Silicon Developer Kit (SSDK)，使客戶能夠快速開發(fā)或遷移服務以部署在 AMD Pensando P4 可編程 DPU 上，與 AMD 上已經實現的現有豐富功能集相協(xié)調Pensando 平臺。AMD Pensando SSDK 使客戶能夠發(fā)揮領先的 AMD Pensando DPU 的強大功能，并在其基礎架構中定制網絡虛擬化和安全功能，與 Pensando 平臺上已實施的現有豐富功能集相協(xié)調。

　　依賴于這些豐富的產品，AMD正在沖擊數據中心的下一個高峰。

　　微信截圖_20230614110534.png

　更多精彩內容歡迎點擊==>>電子技術應用-AET<<

微信圖片_20210517164139.jpg

版權聲明：本站內容除特別聲明的原創(chuàng)文章之外，轉載內容只為傳遞更多信息，并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

1530亿晶体管芯片发布，AMD正式叫板英伟达

日期： 2023-06-14

作者： 李寿鹏

來源：半导体行业观察

相關內容

作者：李寿鹏