OpenAI正在減少對(duì)英偉達(dá)的依賴,本周四發(fā)布了首個(gè)運(yùn)行在Cerebras Systems芯片上的AI模型,標(biāo)志著這家AI明星在供應(yīng)商多元化策略上邁出關(guān)鍵一步。此舉正逢OpenAI與英偉達(dá)關(guān)系微妙,雙方去年秋季宣布的千億美元合作如今據(jù)稱陷入停滯。
GPT-5.3-Codex-Spark專為實(shí)時(shí)編碼設(shè)計(jì),是OpenAI最新代碼自動(dòng)化軟件Codex的精簡(jiǎn)版,旨在提供更快響應(yīng)速度以換取部分性能。OpenAI稱該模型生成速度比前代產(chǎn)品快15倍,每秒可輸出超過(guò)1000個(gè)token。這是OpenAI 2026年1月與Cerebras簽署超過(guò)100億美元協(xié)議后的首個(gè)成果。
該模型率先向ChatGPT Pro訂閱用戶開放研究預(yù)覽版,并通過(guò)Codex應(yīng)用、命令行界面和Visual Studio Code擴(kuò)展提供服務(wù)。OpenAI表示,Codex目前擁有超過(guò)100萬(wàn)周活躍用戶,過(guò)去十天下載量超過(guò)100萬(wàn)次。
這一發(fā)布凸顯了OpenAI在AI編碼助手市場(chǎng)的競(jìng)爭(zhēng)壓力。該公司正面臨來(lái)自谷歌、Anthropic等對(duì)手的激烈競(jìng)爭(zhēng),同時(shí)還需應(yīng)對(duì)內(nèi)部安全團(tuán)隊(duì)解散、研究人員離職以及在ChatGPT中引入廣告等爭(zhēng)議。
速度提升伴隨性能妥協(xié)
Codex-Spark代表OpenAI首個(gè)專為實(shí)時(shí)編碼協(xié)作打造的模型。該公司聲稱生成速度提升15倍,但拒絕提供具體延遲指標(biāo),如首token時(shí)間或每秒token數(shù)。
"我們無(wú)法分享具體延遲數(shù)字,但Codex-Spark經(jīng)過(guò)優(yōu)化,能夠提供近乎即時(shí)的感受——在保持真實(shí)編碼任務(wù)高度能力的同時(shí),實(shí)現(xiàn)15倍更快的生成速度,"OpenAI發(fā)言人表示。
這種速度提升以能力妥協(xié)為代價(jià)。在SWE-Bench Pro和Terminal-Bench 2.0這兩個(gè)評(píng)估AI系統(tǒng)自主執(zhí)行復(fù)雜軟件工程任務(wù)能力的行業(yè)基準(zhǔn)測(cè)試中,Codex-Spark的表現(xiàn)不及完整版GPT-5.3-Codex模型。OpenAI將此定位為可接受的權(quán)衡:開發(fā)者能夠獲得足夠快的響應(yīng)以保持創(chuàng)作流暢性,即使底層模型無(wú)法處理最復(fù)雜的多步驟編程挑戰(zhàn)。
該模型配備128000個(gè)token的上下文窗口,僅支持文本輸入,不支持圖像或多模態(tài)輸入。小部分企業(yè)合作伙伴將獲得API訪問(wèn)權(quán)限以評(píng)估集成可能性。OpenAI計(jì)劃在未來(lái)幾周根據(jù)實(shí)際工作負(fù)載調(diào)整后擴(kuò)大訪問(wèn)范圍。
Cerebras硬件消除傳統(tǒng)GPU集群瓶頸
Codex-Spark背后的技術(shù)架構(gòu)反映出推理經(jīng)濟(jì)學(xué)在AI公司擴(kuò)展面向消費(fèi)者產(chǎn)品時(shí)日益重要。Cerebras的第三代晶圓級(jí)引擎是一塊約餐盤大小的單芯片,包含4萬(wàn)億個(gè)晶體管,消除了AI工作負(fù)載分散到多個(gè)小型處理器集群時(shí)產(chǎn)生的大量通信開銷。
對(duì)于訓(xùn)練大規(guī)模模型,分布式方法仍然必要,英偉達(dá)GPU在此表現(xiàn)出色。但對(duì)于推理——即生成用戶查詢響應(yīng)的過(guò)程——Cerebras認(rèn)為其架構(gòu)可以以顯著更低的延遲交付結(jié)果。Cerebras首席技術(shù)官兼聯(lián)合創(chuàng)始人Sean Lie將這一合作視為重塑開發(fā)者與AI系統(tǒng)交互方式的機(jī)會(huì)。
"GPT-5.3-Codex-Spark最令我們興奮的是與OpenAI及開發(fā)者社區(qū)合作,探索快速推理帶來(lái)的可能性——新的交互模式、新的用例,以及根本不同的模型體驗(yàn),"Lie在聲明中表示。"這次預(yù)覽僅僅是開始。"
OpenAI的基礎(chǔ)設(shè)施團(tuán)隊(duì)并未將優(yōu)化工作局限于Cerebras硬件。該公司宣布在整個(gè)推理堆棧中實(shí)現(xiàn)延遲改進(jìn),使所有Codex模型受益,包括持久WebSocket連接和Responses API內(nèi)的優(yōu)化。結(jié)果顯示:每次客戶端-服務(wù)器往返開銷減少80%,每token開銷減少30%,首token時(shí)間減少50%。
與英偉達(dá)千億美元協(xié)議似乎停滯
鑒于OpenAI與英偉達(dá)之間日益復(fù)雜的關(guān)系,Cerebras合作意義重大。
2025年9月,英偉達(dá)與OpenAI宣布簽署意向書確立達(dá)成戰(zhàn)略合作,OpenAI將利用英偉達(dá)的系統(tǒng)打造和部署至少10千兆瓦(GW)的AI數(shù)據(jù)中心,使用數(shù)百萬(wàn)塊英偉達(dá)的圖形處理器(GPU)訓(xùn)練和部署OpenAI的下一代AI模型,英偉達(dá)則計(jì)劃對(duì)OpenAI投資最高1000億美元。這是英偉達(dá)迄今為止做出的最大手筆投資承諾。
以上戰(zhàn)略合作聲明似乎鞏固了全球最有價(jià)值A(chǔ)I公司與主導(dǎo)芯片供應(yīng)商之間的戰(zhàn)略聯(lián)盟。
五個(gè)月后,據(jù)多個(gè)報(bào)道,上述巨額交易已實(shí)質(zhì)性停滯。英偉達(dá)CEO黃仁勛公開否認(rèn)存在緊張關(guān)系,1月下旬告訴記者"沒有戲劇性",英偉達(dá)仍致力于參與OpenAI當(dāng)前融資輪。但雙方關(guān)系已明顯降溫,評(píng)論認(rèn)為摩擦源于多個(gè)方面。
OpenAI積極尋求與替代芯片供應(yīng)商的合作,包括與Cerebras的交易以及分別與AMD和博通簽署協(xié)議。2025年10月,OpenAI與英偉達(dá)競(jìng)爭(zhēng)對(duì)手AMD達(dá)成重磅協(xié)議,將在多年內(nèi)部署6GW的AMD GPU。同月晚些時(shí)候,OpenAI同意從博通購(gòu)買定制芯片和網(wǎng)絡(luò)組件。
從英偉達(dá)角度看,OpenAI可能正在利用其影響力將使其AI突破成為可能的硬件商品化。從OpenAI角度看,減少對(duì)單一供應(yīng)商的依賴代表著審慎的商業(yè)策略。
OpenAI發(fā)言人本周四告訴媒體,“將繼續(xù)與生態(tài)系統(tǒng)合作,持續(xù)評(píng)估所有用例中性價(jià)比最高的芯片”,“對(duì)于研究和推理等對(duì)成本敏感且以吞吐量為先的應(yīng)用場(chǎng)景,GPU 仍然是我們的首選?!?/p>
這一聲明體現(xiàn)出避免激怒英偉達(dá)同時(shí)保留靈活性的謹(jǐn)慎努力,也反映出訓(xùn)練前沿AI模型仍需要英偉達(dá)GPU提供的大規(guī)模并行處理能力。
OpenAI發(fā)言人在周四的聲明中表示,OpenAI與英偉達(dá)的合作關(guān)系是“基礎(chǔ)性的”,OpenAI最強(qiáng)大的AI模型是兩家公司“多年來(lái)在硬件和軟件工程方面并肩合作”的結(jié)果?!斑@就是為什么我們將英偉達(dá)作為訓(xùn)練和推理堆棧的核心,同時(shí)通過(guò)與Cerebras、AMD和博通的合作有意擴(kuò)展其周圍的生態(tài)系統(tǒng)?!?/p>
內(nèi)部動(dòng)蕩加劇外界審視
Codex-Spark發(fā)布之際,OpenAI正應(yīng)對(duì)一系列內(nèi)部挑戰(zhàn),加劇了外界對(duì)該公司方向和價(jià)值觀的審視。據(jù)本周報(bào)道,OpenAI解散了其使命對(duì)齊團(tuán)隊(duì),該團(tuán)隊(duì)于2024年9月成立,旨在推動(dòng)公司確保通用人工智能造福人類的既定目標(biāo)。團(tuán)隊(duì)七名成員已被重新分配到其他崗位,負(fù)責(zé)人Joshua Achiam獲得"首席未來(lái)學(xué)家"的新頭銜。
OpenAI此前在2024年解散了另一個(gè)關(guān)注安全的團(tuán)隊(duì)——超級(jí)對(duì)齊團(tuán)隊(duì),該團(tuán)隊(duì)專注于AI帶來(lái)的長(zhǎng)期存在性風(fēng)險(xiǎn)。解散安全導(dǎo)向團(tuán)隊(duì)的模式招致研究人員批評(píng),他們認(rèn)為OpenAI的商業(yè)壓力正在壓倒其最初的非營(yíng)利使命。
該公司還面臨在ChatGPT中引入廣告決定帶來(lái)的后果。研究員Zo? Hitzig本周因她所描述的廣告支持AI的"滑坡效應(yīng)"而辭職,在《紐約時(shí)報(bào)》撰文警告稱,ChatGPT存檔的親密用戶對(duì)話記錄為操縱創(chuàng)造了前所未有的機(jī)會(huì)。Anthropic在超級(jí)碗廣告中趁機(jī)打出標(biāo)語(yǔ):"廣告正進(jìn)入AI。但不會(huì)進(jìn)入Claude。"
另外,該公司同意通過(guò)Genai.mil向五角大樓提供ChatGPT,這是美國(guó)國(guó)防部的新項(xiàng)目,要求OpenAI允許"所有合法使用"而不受公司施加的限制——據(jù)報(bào)道Anthropic拒絕了這些條款。還有報(bào)道稱,曾對(duì)計(jì)劃中的露骨內(nèi)容功能表達(dá)擔(dān)憂的OpenAI產(chǎn)品政策副總裁Ryan Beiermeister在1月份因歧視指控被解雇,她否認(rèn)該指控。
AI編碼助手市場(chǎng)競(jìng)爭(zhēng)加劇
盡管周圍動(dòng)蕩不安,OpenAI針對(duì)Codex的技術(shù)路線圖仍顯示出雄心勃勃的計(jì)劃。OpenAI設(shè)想推出一種編碼助手,能夠無(wú)縫融合快速交互式編輯與長(zhǎng)期運(yùn)行的自主任務(wù)——一個(gè)既能處理快速修復(fù),又能同時(shí)協(xié)調(diào)多個(gè)代理在后臺(tái)處理更復(fù)雜問(wèn)題的AI。
OpenAI發(fā)言人告訴媒體:“隨著時(shí)間推移,這些模式將融合——Codex可以讓你保持緊密的交互循環(huán),同時(shí)將長(zhǎng)期運(yùn)行的工作委派給后臺(tái)子代理,或者在你需要廣度和速度時(shí)將任務(wù)并行分配給多個(gè)模型,這樣你就不必預(yù)先選擇單一模式。”
這一愿景不僅需要更快的推理速度,還需要復(fù)雜的任務(wù)分解以及不同規(guī)模和能力模型之間的協(xié)調(diào)。Codex-Spark為該體驗(yàn)的交互部分建立了低延遲基礎(chǔ);未來(lái)版本需要提供自主推理和多代理協(xié)調(diào)能力,才能實(shí)現(xiàn)完整愿景。
目前,Codex-Spark采用與其他OpenAI模型分開的速率限制,反映出研究預(yù)覽期間Cerebras基礎(chǔ)設(shè)施容量受限。"因?yàn)樗\(yùn)行在專門的低延遲硬件上,使用受單獨(dú)速率限制管控,在研究預(yù)覽期間可能根據(jù)需求調(diào)整,"發(fā)言人指出。這些限制被設(shè)計(jì)為"慷慨的",OpenAI在決定如何擴(kuò)展時(shí)監(jiān)控使用模式。
Codex-Spark的發(fā)布正值A(chǔ)I驅(qū)動(dòng)開發(fā)工具激烈競(jìng)爭(zhēng)之際。Anthropic的Claude Cowork產(chǎn)品上周引發(fā)傳統(tǒng)軟件股拋售,因投資者考慮AI助手是否可能取代傳統(tǒng)企業(yè)應(yīng)用。微軟、谷歌和亞馬遜繼續(xù)在與各自云平臺(tái)集成的AI編碼能力上大舉投資。
OpenAI的Codex應(yīng)用自推出十天以來(lái)展現(xiàn)出快速采用勢(shì)頭,周活躍用戶周環(huán)比增長(zhǎng)60%。目前超過(guò)32.5萬(wàn)開發(fā)者在免費(fèi)和付費(fèi)層級(jí)積極使用Codex。但OpenAI及更廣泛AI行業(yè)面臨的根本問(wèn)題是,像Codex-Spark承諾的速度改進(jìn)是否能轉(zhuǎn)化為有意義的生產(chǎn)力提升,還是僅僅創(chuàng)造更愉快的體驗(yàn)而不改變結(jié)果。
Cerebras交易是一個(gè)經(jīng)過(guò)計(jì)算的賭注:專用硬件可以解鎖通用GPU無(wú)法經(jīng)濟(jì)高效服務(wù)的用例。對(duì)于一家同時(shí)與競(jìng)爭(zhēng)對(duì)手作戰(zhàn)、管理緊張供應(yīng)商關(guān)系并應(yīng)對(duì)內(nèi)部對(duì)其商業(yè)方向異議的公司而言,這也提醒人們,在AI競(jìng)賽中,原地不動(dòng)不是選項(xiàng)。OpenAI通過(guò)快速行動(dòng)和打破常規(guī)建立了聲譽(yù)?,F(xiàn)在它必須證明自己可以行動(dòng)得更快——而不會(huì)破壞自己。

