8 月 26 日消息,科技媒體 WccfTech 昨日(8 月 25 日)發(fā)布博文,報(bào)道稱(chēng)在 Hot Chips 2025 大會(huì)上,谷歌詳細(xì)披露第七代 TPU 架構(gòu)“Ironwood”超級(jí)計(jì)算平臺(tái)。
援引博文介紹,谷歌于今年 4 月官宣第 7 代 TPU 架構(gòu),代號(hào)為 Ironwood,號(hào)稱(chēng)其性能是當(dāng)前最強(qiáng)大超級(jí)計(jì)算機(jī)的 24 倍。
本次披露主要聚焦單個(gè) Superpod 的硬件構(gòu)成與架構(gòu)設(shè)計(jì)。相比 2022 年的 TPU v4(4096 芯片、32GB HBM、275 TFLOPs)和 2023 年的 TPU v5p(8960 芯片、95GB HBM、459 TFLOPs),Ironwood 在核心規(guī)格上大幅躍升。
單個(gè) Ironwood Superpod 集成 9216 枚芯片,每片配備 192GB、帶寬 7.4TB/s 的高帶寬存儲(chǔ),峰值算力高達(dá) 4614 TFLOPs,意味著其單芯片性能較 TPU v4 提升超過(guò) 16 倍。
每四顆芯片組成一塊 PCBA 主板,16 塊主板構(gòu)成一個(gè)機(jī)架,共 64 芯片節(jié)點(diǎn),谷歌采用 InterChip Interconnect(ICI)技術(shù),將多達(dá) 43 個(gè) 64 芯片模塊互連,構(gòu)建出擁有 1.8PB/s 網(wǎng)絡(luò)帶寬的集群。
在物理布局上,Ironwood 沿用過(guò)去三代的 3D Torus(立方環(huán)網(wǎng))拓?fù)洌總€(gè)邏輯單元為 4×4×4 節(jié)點(diǎn)陣列,即 64 芯片,封裝于單個(gè)機(jī)架。
一個(gè) Superpod 包含 144 個(gè)機(jī)架,還配備光學(xué)交換機(jī)機(jī)箱以實(shí)現(xiàn)跨模塊互連,以及用于液冷的冷卻分配單元(CBU)機(jī)架,互連方面為提高靈活性與可擴(kuò)展性,采用 PCB 走線(xiàn)、銅纜和光纖的混合方式。
在機(jī)架設(shè)計(jì)上,頂部設(shè)有泄漏檢測(cè)盤(pán)以監(jiān)控液冷系統(tǒng),下方是供電模塊,具備兩路電源域,將 416V 交流電經(jīng)整流轉(zhuǎn)換為直流電。整套系統(tǒng)支持液冷散熱,滿(mǎn)載運(yùn)行功率可超過(guò) 100kW。
注:
· TPU(Tensor Processing Unit)張量處理單元:谷歌專(zhuān)為機(jī)器學(xué)習(xí)任務(wù)設(shè)計(jì)的專(zhuān)用芯片,優(yōu)化矩陣運(yùn)算性能。
· Superpod,就是一組連續(xù)的 TPU,通過(guò)專(zhuān)用網(wǎng)絡(luò)組合在一起。
· HBM(High Bandwidth Memory)高帶寬存儲(chǔ):一種集成在芯片附近的高速顯存,顯著提升數(shù)據(jù)傳輸速率。
· TFLOPs(Tera Floating Point Operations per Second)萬(wàn)億次浮點(diǎn)運(yùn)算 / 秒:衡量芯片浮點(diǎn)運(yùn)算性能的指標(biāo)。