2 月 28 日消息,當?shù)貢r間 2 月 27 日,據(jù)《The Information》援引知情人士消息稱,Meta 在自研 AI 芯片方面遭遇重大挫折,已放棄其最先進的訓練芯片項目,并將開發(fā)重點轉(zhuǎn)向結(jié)構(gòu)更簡單的替代方案。
由于芯片設(shè)計難度超出預(yù)期,Meta 上周決定取消正在開發(fā)的高端 AI 訓練芯片,并已向 AI 基礎(chǔ)設(shè)施部門員工通報這一調(diào)整。
Meta 調(diào)整芯片戰(zhàn)略的同時,也在加強與現(xiàn)有芯片供應(yīng)商的合作。據(jù)報道,Meta 已簽署價值數(shù)十億美元的協(xié)議,從谷歌租用 AI 芯片。AMD 本周表示,將與 Meta 合作部署最多 6GW 的 Instinct AI 芯片,以支持 Meta 下一代 AI 基礎(chǔ)設(shè)施。此外,Meta 本月還宣布與英偉達建立跨多代合作關(guān)系,將繼續(xù)在數(shù)據(jù)中心部署英偉達芯片。
Meta 自研芯片屬于“Meta 訓練和推理加速器”(MTIA)項目,目標是降低對外部供應(yīng)商的依賴,同時減少數(shù)據(jù)中心運營成本并增強基礎(chǔ)設(shè)施控制能力。
Meta 已放棄其第二代訓練芯片 Iris 的一個版本,并隨后啟動更先進芯片 Olympus 的開發(fā),但該項目同樣遭到了夭折的命運。一名參與芯片開發(fā)的人員表示,公司內(nèi)部對能否開發(fā)出可與英偉達性能匹敵的芯片持懷疑態(tài)度,原因包括開發(fā)周期長、設(shè)計復(fù)雜以及功耗控制難度高。如果功耗無法有效控制,將削弱芯片相對于英偉達產(chǎn)品的競爭力。
在技術(shù)架構(gòu)方面,Iris 采用單指令多數(shù)據(jù)(SIMD)架構(gòu),這種架構(gòu)更易于硬件設(shè)計,但軟件開發(fā)難度較高。Olympus 則采用單指令多線程(SIMT)架構(gòu),與英偉達芯片類似。這種架構(gòu)更適合 AI 訓練軟件,但硬件實現(xiàn)復(fù)雜度更高。
Meta 原計劃最早于 2026 年第四季度完成 Olympus 設(shè)計,而芯片設(shè)計完成后通常仍需至少 9 個月才能實現(xiàn)量產(chǎn)。Olympus 的 GPU 原計劃采用 Meta 去年收購的 Rivos 的技術(shù),該技術(shù)可兼容英偉達的 Cuda 軟件生態(tài),而 Cuda 是當前 AI 訓練的行業(yè)標準。
Meta 最初計劃基于 Olympus 構(gòu)建大規(guī)模 AI 訓練服務(wù)器集群,但管理層認為,這一方案存在風險,可能影響公司在與 OpenAI 和谷歌競爭過程中訓練新模型的進度。此外,軟件成熟度可能不及英偉達生態(tài),而復(fù)雜設(shè)計也可能增加量產(chǎn)難度。
因此,Meta 目前計劃繼續(xù)依賴外部供應(yīng)商提供的 AI 訓練芯片,因為這些芯片的軟件生態(tài)更加成熟,風險更低。

