OpenAI正在減少對英偉達的依賴,本周四發(fā)布了首個運行在Cerebras Systems芯片上的AI模型,標志著這家AI明星在供應商多元化策略上邁出關鍵一步。此舉正逢OpenAI與英偉達關系微妙,雙方去年秋季宣布的千億美元合作如今據(jù)稱陷入停滯。
GPT-5.3-Codex-Spark專為實時編碼設計,是OpenAI最新代碼自動化軟件Codex的精簡版,旨在提供更快響應速度以換取部分性能。OpenAI稱該模型生成速度比前代產(chǎn)品快15倍,每秒可輸出超過1000個token。這是OpenAI 2026年1月與Cerebras簽署超過100億美元協(xié)議后的首個成果。
該模型率先向ChatGPT Pro訂閱用戶開放研究預覽版,并通過Codex應用、命令行界面和Visual Studio Code擴展提供服務。OpenAI表示,Codex目前擁有超過100萬周活躍用戶,過去十天下載量超過100萬次。
這一發(fā)布凸顯了OpenAI在AI編碼助手市場的競爭壓力。該公司正面臨來自谷歌、Anthropic等對手的激烈競爭,同時還需應對內部安全團隊解散、研究人員離職以及在ChatGPT中引入廣告等爭議。
速度提升伴隨性能妥協(xié)
Codex-Spark代表OpenAI首個專為實時編碼協(xié)作打造的模型。該公司聲稱生成速度提升15倍,但拒絕提供具體延遲指標,如首token時間或每秒token數(shù)。
"我們無法分享具體延遲數(shù)字,但Codex-Spark經(jīng)過優(yōu)化,能夠提供近乎即時的感受——在保持真實編碼任務高度能力的同時,實現(xiàn)15倍更快的生成速度,"OpenAI發(fā)言人表示。
這種速度提升以能力妥協(xié)為代價。在SWE-Bench Pro和Terminal-Bench 2.0這兩個評估AI系統(tǒng)自主執(zhí)行復雜軟件工程任務能力的行業(yè)基準測試中,Codex-Spark的表現(xiàn)不及完整版GPT-5.3-Codex模型。OpenAI將此定位為可接受的權衡:開發(fā)者能夠獲得足夠快的響應以保持創(chuàng)作流暢性,即使底層模型無法處理最復雜的多步驟編程挑戰(zhàn)。
該模型配備128000個token的上下文窗口,僅支持文本輸入,不支持圖像或多模態(tài)輸入。小部分企業(yè)合作伙伴將獲得API訪問權限以評估集成可能性。OpenAI計劃在未來幾周根據(jù)實際工作負載調整后擴大訪問范圍。
Cerebras硬件消除傳統(tǒng)GPU集群瓶頸
Codex-Spark背后的技術架構反映出推理經(jīng)濟學在AI公司擴展面向消費者產(chǎn)品時日益重要。Cerebras的第三代晶圓級引擎是一塊約餐盤大小的單芯片,包含4萬億個晶體管,消除了AI工作負載分散到多個小型處理器集群時產(chǎn)生的大量通信開銷。
對于訓練大規(guī)模模型,分布式方法仍然必要,英偉達GPU在此表現(xiàn)出色。但對于推理——即生成用戶查詢響應的過程——Cerebras認為其架構可以以顯著更低的延遲交付結果。Cerebras首席技術官兼聯(lián)合創(chuàng)始人Sean Lie將這一合作視為重塑開發(fā)者與AI系統(tǒng)交互方式的機會。
"GPT-5.3-Codex-Spark最令我們興奮的是與OpenAI及開發(fā)者社區(qū)合作,探索快速推理帶來的可能性——新的交互模式、新的用例,以及根本不同的模型體驗,"Lie在聲明中表示。"這次預覽僅僅是開始。"
OpenAI的基礎設施團隊并未將優(yōu)化工作局限于Cerebras硬件。該公司宣布在整個推理堆棧中實現(xiàn)延遲改進,使所有Codex模型受益,包括持久WebSocket連接和Responses API內的優(yōu)化。結果顯示:每次客戶端-服務器往返開銷減少80%,每token開銷減少30%,首token時間減少50%。
與英偉達千億美元協(xié)議似乎停滯
鑒于OpenAI與英偉達之間日益復雜的關系,Cerebras合作意義重大。
2025年9月,英偉達與OpenAI宣布簽署意向書確立達成戰(zhàn)略合作,OpenAI將利用英偉達的系統(tǒng)打造和部署至少10千兆瓦(GW)的AI數(shù)據(jù)中心,使用數(shù)百萬塊英偉達的圖形處理器(GPU)訓練和部署OpenAI的下一代AI模型,英偉達則計劃對OpenAI投資最高1000億美元。這是英偉達迄今為止做出的最大手筆投資承諾。
以上戰(zhàn)略合作聲明似乎鞏固了全球最有價值AI公司與主導芯片供應商之間的戰(zhàn)略聯(lián)盟。
五個月后,據(jù)多個報道,上述巨額交易已實質性停滯。英偉達CEO黃仁勛公開否認存在緊張關系,1月下旬告訴記者"沒有戲劇性",英偉達仍致力于參與OpenAI當前融資輪。但雙方關系已明顯降溫,評論認為摩擦源于多個方面。
OpenAI積極尋求與替代芯片供應商的合作,包括與Cerebras的交易以及分別與AMD和博通簽署協(xié)議。2025年10月,OpenAI與英偉達競爭對手AMD達成重磅協(xié)議,將在多年內部署6GW的AMD GPU。同月晚些時候,OpenAI同意從博通購買定制芯片和網(wǎng)絡組件。
從英偉達角度看,OpenAI可能正在利用其影響力將使其AI突破成為可能的硬件商品化。從OpenAI角度看,減少對單一供應商的依賴代表著審慎的商業(yè)策略。
OpenAI發(fā)言人本周四告訴媒體,“將繼續(xù)與生態(tài)系統(tǒng)合作,持續(xù)評估所有用例中性價比最高的芯片”,“對于研究和推理等對成本敏感且以吞吐量為先的應用場景,GPU 仍然是我們的首選。”
這一聲明體現(xiàn)出避免激怒英偉達同時保留靈活性的謹慎努力,也反映出訓練前沿AI模型仍需要英偉達GPU提供的大規(guī)模并行處理能力。
OpenAI發(fā)言人在周四的聲明中表示,OpenAI與英偉達的合作關系是“基礎性的”,OpenAI最強大的AI模型是兩家公司“多年來在硬件和軟件工程方面并肩合作”的結果?!斑@就是為什么我們將英偉達作為訓練和推理堆棧的核心,同時通過與Cerebras、AMD和博通的合作有意擴展其周圍的生態(tài)系統(tǒng)?!?/p>
內部動蕩加劇外界審視
Codex-Spark發(fā)布之際,OpenAI正應對一系列內部挑戰(zhàn),加劇了外界對該公司方向和價值觀的審視。據(jù)本周報道,OpenAI解散了其使命對齊團隊,該團隊于2024年9月成立,旨在推動公司確保通用人工智能造福人類的既定目標。團隊七名成員已被重新分配到其他崗位,負責人Joshua Achiam獲得"首席未來學家"的新頭銜。
OpenAI此前在2024年解散了另一個關注安全的團隊——超級對齊團隊,該團隊專注于AI帶來的長期存在性風險。解散安全導向團隊的模式招致研究人員批評,他們認為OpenAI的商業(yè)壓力正在壓倒其最初的非營利使命。
該公司還面臨在ChatGPT中引入廣告決定帶來的后果。研究員Zo? Hitzig本周因她所描述的廣告支持AI的"滑坡效應"而辭職,在《紐約時報》撰文警告稱,ChatGPT存檔的親密用戶對話記錄為操縱創(chuàng)造了前所未有的機會。Anthropic在超級碗廣告中趁機打出標語:"廣告正進入AI。但不會進入Claude。"
另外,該公司同意通過Genai.mil向五角大樓提供ChatGPT,這是美國國防部的新項目,要求OpenAI允許"所有合法使用"而不受公司施加的限制——據(jù)報道Anthropic拒絕了這些條款。還有報道稱,曾對計劃中的露骨內容功能表達擔憂的OpenAI產(chǎn)品政策副總裁Ryan Beiermeister在1月份因歧視指控被解雇,她否認該指控。
AI編碼助手市場競爭加劇
盡管周圍動蕩不安,OpenAI針對Codex的技術路線圖仍顯示出雄心勃勃的計劃。OpenAI設想推出一種編碼助手,能夠無縫融合快速交互式編輯與長期運行的自主任務——一個既能處理快速修復,又能同時協(xié)調多個代理在后臺處理更復雜問題的AI。
OpenAI發(fā)言人告訴媒體:“隨著時間推移,這些模式將融合——Codex可以讓你保持緊密的交互循環(huán),同時將長期運行的工作委派給后臺子代理,或者在你需要廣度和速度時將任務并行分配給多個模型,這樣你就不必預先選擇單一模式。”
這一愿景不僅需要更快的推理速度,還需要復雜的任務分解以及不同規(guī)模和能力模型之間的協(xié)調。Codex-Spark為該體驗的交互部分建立了低延遲基礎;未來版本需要提供自主推理和多代理協(xié)調能力,才能實現(xiàn)完整愿景。
目前,Codex-Spark采用與其他OpenAI模型分開的速率限制,反映出研究預覽期間Cerebras基礎設施容量受限。"因為它運行在專門的低延遲硬件上,使用受單獨速率限制管控,在研究預覽期間可能根據(jù)需求調整,"發(fā)言人指出。這些限制被設計為"慷慨的",OpenAI在決定如何擴展時監(jiān)控使用模式。
Codex-Spark的發(fā)布正值AI驅動開發(fā)工具激烈競爭之際。Anthropic的Claude Cowork產(chǎn)品上周引發(fā)傳統(tǒng)軟件股拋售,因投資者考慮AI助手是否可能取代傳統(tǒng)企業(yè)應用。微軟、谷歌和亞馬遜繼續(xù)在與各自云平臺集成的AI編碼能力上大舉投資。
OpenAI的Codex應用自推出十天以來展現(xiàn)出快速采用勢頭,周活躍用戶周環(huán)比增長60%。目前超過32.5萬開發(fā)者在免費和付費層級積極使用Codex。但OpenAI及更廣泛AI行業(yè)面臨的根本問題是,像Codex-Spark承諾的速度改進是否能轉化為有意義的生產(chǎn)力提升,還是僅僅創(chuàng)造更愉快的體驗而不改變結果。
Cerebras交易是一個經(jīng)過計算的賭注:專用硬件可以解鎖通用GPU無法經(jīng)濟高效服務的用例。對于一家同時與競爭對手作戰(zhàn)、管理緊張供應商關系并應對內部對其商業(yè)方向異議的公司而言,這也提醒人們,在AI競賽中,原地不動不是選項。OpenAI通過快速行動和打破常規(guī)建立了聲譽?,F(xiàn)在它必須證明自己可以行動得更快——而不會破壞自己。

