12月24日消息,近日,光通信行業(yè)市場研究機(jī)構(gòu)LightCounting發(fā)布最新關(guān)于AOC、DAC、LPO及CPO的報(bào)告。
今年3月,英偉達(dá)率先宣布在其InfiniBand和以太網(wǎng)交換機(jī)中采用單通道200G的CPO技術(shù)。9月底,Meta公布的測試數(shù)據(jù)顯示了博通前兩代CPO產(chǎn)品的卓越可靠性。10月,博通推出了其第三代單通道200G的CPO產(chǎn)品。
今年12月初,由以太網(wǎng)聯(lián)盟舉辦的TEF大會上,英偉達(dá)報(bào)告稱,基于CPO交換機(jī)的AI集群在可靠性方面相比采用可插拔光模塊的系統(tǒng)提升了10倍。如下圖所示,高可靠性轉(zhuǎn)化為集群運(yùn)行時(shí)間5倍的提升。

值得一提的是,近期,Ciena收購Nubis Communications,Marvell收購Celestial AI,進(jìn)一步印證了包括亞馬遜、Meta和微軟在內(nèi)的行業(yè)龍頭對CPO的高度關(guān)注。LightCounting預(yù)計(jì)2026年初將出現(xiàn)更多相關(guān)并購活動(dòng)。
目前,CPO的應(yīng)用僅限于面向Scale-Out網(wǎng)絡(luò)設(shè)計(jì)的交換機(jī)。英偉達(dá)及其他公司面臨的下一個(gè)挑戰(zhàn)是如何將Scale-Up互連突破單個(gè)機(jī)架的限制。將GPU集群從128-144顆芯片擴(kuò)展到500-1000顆,是加速AI訓(xùn)練的最佳路徑。甚至在未來3年內(nèi),推理集群也可能需要多達(dá)1000顆GPU以支持更大規(guī)模的模型。
目前,亞馬遜正使用AEC在兩個(gè)機(jī)架之間互連Trainium加速器(每個(gè)機(jī)架32顆XPU),但這種方案可能難以擴(kuò)展到更多機(jī)架。華為則在其縱向Scale-Up網(wǎng)絡(luò)中采用了800G可插拔LPO光模塊,每顆XPU最多連接18個(gè)LPO。
對于4-8個(gè)機(jī)架組成的系統(tǒng)而言,若需實(shí)現(xiàn)數(shù)萬個(gè)高速互連,CPO可能是唯一可行的選擇。因此,LightCounting上調(diào)了CPO的市場預(yù)測,涵蓋用于Scale-Up場景、傳輸距離小于50米的1.6T和3.2T端口。下圖對比了可插拔以太網(wǎng)光模塊(含AOC、ACC、AEC和DAC)與CPO(僅包含100G及以上速率產(chǎn)品)的市場情況。

LightCounting預(yù)計(jì),博通和英偉達(dá)都將在2026年推出集成CPO的Scale-Up交換機(jī)、GPU或XPU。Marvell也將利用收購來的Celestial AI技術(shù)推出類似產(chǎn)品。這些產(chǎn)品的出貨將于2027年開始。到2030年,包括Scale-Up和Scale-Out場景的CPO引擎的市場規(guī)模預(yù)計(jì)將達(dá)100億美元,CPO端口出貨量接近1億個(gè)。

