4月12日消息,Intel日前發(fā)布了新一代AI加速器Gaudi 3,本來美國政府是不會允許賣給中國的,但是沒想到Intel已經(jīng)同步準(zhǔn)備好了中國特供版本!
Gaudi 3采用臺積電5nm工藝,配備了8個矩陣引擎、64個張量核心、96MB SRAM緩存、1024-bit 128GB HBM2E內(nèi)存(帶寬3.7TB/s),還有16個PCIe 5.0通道、24個2000GbE網(wǎng)絡(luò)、JPEG/VP9/H.264/H.265解碼器,提供OAM兼容夾層卡、通用基板、PCIe擴展卡三種形態(tài)。
Intel聲稱,它相比上代擁有2倍的FP8 AI算力、4倍的BF16 AI算力、2倍的網(wǎng)絡(luò)功耗為600W帶寬、1.5倍的內(nèi)存帶寬,而對比NVIDIA H100 LLM推理性能領(lǐng)先50%、訓(xùn)練時間快40%。
Gaudi 3的首發(fā)版本編號HL-325L,OAM形態(tài),已經(jīng)出貨,功耗900W,風(fēng)冷散熱。
它的中國特供版將在6月份推出,編號HL-328,功耗減半至450W,HMB內(nèi)存、緩存、解碼器等完全保留,但既然功耗少了一半,算力差不多也會被腰斬。
10月份還會有個液冷版本HL-335,支持雙路并聯(lián),但不能賣給中國,也沒有特供版。
PCIe擴展卡形態(tài)將在9月份出貨,風(fēng)冷,滿血版編號HL-338,,中國特供版編號HL-388,功耗又被限制在450W。
通用基板形態(tài)的編號為HLB-325,但具體規(guī)格和出貨時間暫時不詳。
說起來,NVIDIA是最早做中國特供版AI加速器的,也就是H800、A800,后來也被禁售了,最近又拿出了H20、L20、L2、RTX 4090D,都能賣。
AMD也設(shè)計了特供版Instinct MI309、MI388X,但都被美政府以算力還是太強為由給打回,而年底將要升級到MI350。