123,123,123

减少英伟达依赖 OpenAI首次发布Cerebras芯片支持模型

日期： 2026-02-13

來(lái)源：华尔街见闻

關(guān)鍵詞： OpenAI 英伟达 Cerebras AI模型

OpenAI正在減少對(duì)英偉達(dá)的依賴(lài)，本周四發(fā)布了首個(gè)運(yùn)行在Cerebras Systems芯片上的AI模型，標(biāo)志著這家AI明星在供應(yīng)商多元化策略上邁出關(guān)鍵一步。此舉正逢OpenAI與英偉達(dá)關(guān)系微妙，雙方去年秋季宣布的千億美元合作如今據(jù)稱(chēng)陷入停滯。

GPT-5.3-Codex-Spark專(zhuān)為實(shí)時(shí)編碼設(shè)計(jì)，是OpenAI最新代碼自動(dòng)化軟件Codex的精簡(jiǎn)版，旨在提供更快響應(yīng)速度以換取部分性能。OpenAI稱(chēng)該模型生成速度比前代產(chǎn)品快15倍，每秒可輸出超過(guò)1000個(gè)token。這是OpenAI 2026年1月與Cerebras簽署超過(guò)100億美元協(xié)議后的首個(gè)成果。

該模型率先向ChatGPT Pro訂閱用戶(hù)開(kāi)放研究預(yù)覽版，并通過(guò)Codex應(yīng)用、命令行界面和Visual Studio Code擴(kuò)展提供服務(wù)。OpenAI表示，Codex目前擁有超過(guò)100萬(wàn)周活躍用戶(hù)，過(guò)去十天下載量超過(guò)100萬(wàn)次。

這一發(fā)布凸顯了OpenAI在AI編碼助手市場(chǎng)的競(jìng)爭(zhēng)壓力。該公司正面臨來(lái)自谷歌、Anthropic等對(duì)手的激烈競(jìng)爭(zhēng)，同時(shí)還需應(yīng)對(duì)內(nèi)部安全團(tuán)隊(duì)解散、研究人員離職以及在ChatGPT中引入廣告等爭(zhēng)議。

速度提升伴隨性能妥協(xié)

Codex-Spark代表OpenAI首個(gè)專(zhuān)為實(shí)時(shí)編碼協(xié)作打造的模型。該公司聲稱(chēng)生成速度提升15倍，但拒絕提供具體延遲指標(biāo)，如首token時(shí)間或每秒token數(shù)。

"我們無(wú)法分享具體延遲數(shù)字，但Codex-Spark經(jīng)過(guò)優(yōu)化，能夠提供近乎即時(shí)的感受——在保持真實(shí)編碼任務(wù)高度能力的同時(shí)，實(shí)現(xiàn)15倍更快的生成速度，"OpenAI發(fā)言人表示。

這種速度提升以能力妥協(xié)為代價(jià)。在SWE-Bench Pro和Terminal-Bench 2.0這兩個(gè)評(píng)估AI系統(tǒng)自主執(zhí)行復(fù)雜軟件工程任務(wù)能力的行業(yè)基準(zhǔn)測(cè)試中，Codex-Spark的表現(xiàn)不及完整版GPT-5.3-Codex模型。OpenAI將此定位為可接受的權(quán)衡：開(kāi)發(fā)者能夠獲得足夠快的響應(yīng)以保持創(chuàng)作流暢性，即使底層模型無(wú)法處理最復(fù)雜的多步驟編程挑戰(zhàn)。

該模型配備128000個(gè)token的上下文窗口，僅支持文本輸入，不支持圖像或多模態(tài)輸入。小部分企業(yè)合作伙伴將獲得API訪問(wèn)權(quán)限以評(píng)估集成可能性。OpenAI計(jì)劃在未來(lái)幾周根據(jù)實(shí)際工作負(fù)載調(diào)整后擴(kuò)大訪問(wèn)范圍。

Cerebras硬件消除傳統(tǒng)GPU集群瓶頸

Codex-Spark背后的技術(shù)架構(gòu)反映出推理經(jīng)濟(jì)學(xué)在AI公司擴(kuò)展面向消費(fèi)者產(chǎn)品時(shí)日益重要。Cerebras的第三代晶圓級(jí)引擎是一塊約餐盤(pán)大小的單芯片，包含4萬(wàn)億個(gè)晶體管，消除了AI工作負(fù)載分散到多個(gè)小型處理器集群時(shí)產(chǎn)生的大量通信開(kāi)銷(xiāo)。

對(duì)于訓(xùn)練大規(guī)模模型，分布式方法仍然必要，英偉達(dá)GPU在此表現(xiàn)出色。但對(duì)于推理——即生成用戶(hù)查詢(xún)響應(yīng)的過(guò)程——Cerebras認(rèn)為其架構(gòu)可以以顯著更低的延遲交付結(jié)果。Cerebras首席技術(shù)官兼聯(lián)合創(chuàng)始人Sean Lie將這一合作視為重塑開(kāi)發(fā)者與AI系統(tǒng)交互方式的機(jī)會(huì)。

"GPT-5.3-Codex-Spark最令我們興奮的是與OpenAI及開(kāi)發(fā)者社區(qū)合作，探索快速推理帶來(lái)的可能性——新的交互模式、新的用例，以及根本不同的模型體驗(yàn)，"Lie在聲明中表示。"這次預(yù)覽僅僅是開(kāi)始。"

OpenAI的基礎(chǔ)設(shè)施團(tuán)隊(duì)并未將優(yōu)化工作局限于Cerebras硬件。該公司宣布在整個(gè)推理堆棧中實(shí)現(xiàn)延遲改進(jìn)，使所有Codex模型受益，包括持久WebSocket連接和Responses API內(nèi)的優(yōu)化。結(jié)果顯示：每次客戶(hù)端-服務(wù)器往返開(kāi)銷(xiāo)減少80%，每token開(kāi)銷(xiāo)減少30%，首token時(shí)間減少50%。

與英偉達(dá)千億美元協(xié)議似乎停滯

鑒于OpenAI與英偉達(dá)之間日益復(fù)雜的關(guān)系，Cerebras合作意義重大。

2025年9月，英偉達(dá)與OpenAI宣布簽署意向書(shū)確立達(dá)成戰(zhàn)略合作，OpenAI將利用英偉達(dá)的系統(tǒng)打造和部署至少10千兆瓦（GW）的AI數(shù)據(jù)中心，使用數(shù)百萬(wàn)塊英偉達(dá)的圖形處理器（GPU）訓(xùn)練和部署OpenAI的下一代AI模型，英偉達(dá)則計(jì)劃對(duì)OpenAI投資最高1000億美元。這是英偉達(dá)迄今為止做出的最大手筆投資承諾。

以上戰(zhàn)略合作聲明似乎鞏固了全球最有價(jià)值A(chǔ)I公司與主導(dǎo)芯片供應(yīng)商之間的戰(zhàn)略聯(lián)盟。

五個(gè)月后，據(jù)多個(gè)報(bào)道，上述巨額交易已實(shí)質(zhì)性停滯。英偉達(dá)CEO黃仁勛公開(kāi)否認(rèn)存在緊張關(guān)系，1月下旬告訴記者"沒(méi)有戲劇性"，英偉達(dá)仍致力于參與OpenAI當(dāng)前融資輪。但雙方關(guān)系已明顯降溫，評(píng)論認(rèn)為摩擦源于多個(gè)方面。

OpenAI積極尋求與替代芯片供應(yīng)商的合作，包括與Cerebras的交易以及分別與AMD和博通簽署協(xié)議。2025年10月，OpenAI與英偉達(dá)競(jìng)爭(zhēng)對(duì)手AMD達(dá)成重磅協(xié)議，將在多年內(nèi)部署6GW的AMD GPU。同月晚些時(shí)候，OpenAI同意從博通購(gòu)買(mǎi)定制芯片和網(wǎng)絡(luò)組件。

從英偉達(dá)角度看，OpenAI可能正在利用其影響力將使其AI突破成為可能的硬件商品化。從OpenAI角度看，減少對(duì)單一供應(yīng)商的依賴(lài)代表著審慎的商業(yè)策略。

OpenAI發(fā)言人本周四告訴媒體，“將繼續(xù)與生態(tài)系統(tǒng)合作，持續(xù)評(píng)估所有用例中性?xún)r(jià)比最高的芯片”，“對(duì)于研究和推理等對(duì)成本敏感且以吞吐量為先的應(yīng)用場(chǎng)景，GPU 仍然是我們的首選?！?/p>

這一聲明體現(xiàn)出避免激怒英偉達(dá)同時(shí)保留靈活性的謹(jǐn)慎努力，也反映出訓(xùn)練前沿AI模型仍需要英偉達(dá)GPU提供的大規(guī)模并行處理能力。

OpenAI發(fā)言人在周四的聲明中表示，OpenAI與英偉達(dá)的合作關(guān)系是“基礎(chǔ)性的”，OpenAI最強(qiáng)大的AI模型是兩家公司“多年來(lái)在硬件和軟件工程方面并肩合作”的結(jié)果?！斑@就是為什么我們將英偉達(dá)作為訓(xùn)練和推理堆棧的核心，同時(shí)通過(guò)與Cerebras、AMD和博通的合作有意擴(kuò)展其周?chē)纳鷳B(tài)系統(tǒng)?！?/p>

內(nèi)部動(dòng)蕩加劇外界審視

Codex-Spark發(fā)布之際，OpenAI正應(yīng)對(duì)一系列內(nèi)部挑戰(zhàn)，加劇了外界對(duì)該公司方向和價(jià)值觀的審視。據(jù)本周報(bào)道，OpenAI解散了其使命對(duì)齊團(tuán)隊(duì)，該團(tuán)隊(duì)于2024年9月成立，旨在推動(dòng)公司確保通用人工智能造福人類(lèi)的既定目標(biāo)。團(tuán)隊(duì)七名成員已被重新分配到其他崗位，負(fù)責(zé)人Joshua Achiam獲得"首席未來(lái)學(xué)家"的新頭銜。

OpenAI此前在2024年解散了另一個(gè)關(guān)注安全的團(tuán)隊(duì)——超級(jí)對(duì)齊團(tuán)隊(duì)，該團(tuán)隊(duì)專(zhuān)注于AI帶來(lái)的長(zhǎng)期存在性風(fēng)險(xiǎn)。解散安全導(dǎo)向團(tuán)隊(duì)的模式招致研究人員批評(píng)，他們認(rèn)為OpenAI的商業(yè)壓力正在壓倒其最初的非營(yíng)利使命。

該公司還面臨在ChatGPT中引入廣告決定帶來(lái)的后果。研究員Zo? Hitzig本周因她所描述的廣告支持AI的"滑坡效應(yīng)"而辭職，在《紐約時(shí)報(bào)》撰文警告稱(chēng)，ChatGPT存檔的親密用戶(hù)對(duì)話(huà)記錄為操縱創(chuàng)造了前所未有的機(jī)會(huì)。Anthropic在超級(jí)碗廣告中趁機(jī)打出標(biāo)語(yǔ)："廣告正進(jìn)入AI。但不會(huì)進(jìn)入Claude。"

另外，該公司同意通過(guò)Genai.mil向五角大樓提供ChatGPT，這是美國(guó)國(guó)防部的新項(xiàng)目，要求OpenAI允許"所有合法使用"而不受公司施加的限制——據(jù)報(bào)道Anthropic拒絕了這些條款。還有報(bào)道稱(chēng)，曾對(duì)計(jì)劃中的露骨內(nèi)容功能表達(dá)擔(dān)憂(yōu)的OpenAI產(chǎn)品政策副總裁Ryan Beiermeister在1月份因歧視指控被解雇，她否認(rèn)該指控。

AI編碼助手市場(chǎng)競(jìng)爭(zhēng)加劇

盡管周?chē)鷦?dòng)蕩不安，OpenAI針對(duì)Codex的技術(shù)路線圖仍顯示出雄心勃勃的計(jì)劃。OpenAI設(shè)想推出一種編碼助手，能夠無(wú)縫融合快速交互式編輯與長(zhǎng)期運(yùn)行的自主任務(wù)——一個(gè)既能處理快速修復(fù)，又能同時(shí)協(xié)調(diào)多個(gè)代理在后臺(tái)處理更復(fù)雜問(wèn)題的AI。

OpenAI發(fā)言人告訴媒體：“隨著時(shí)間推移，這些模式將融合——Codex可以讓你保持緊密的交互循環(huán)，同時(shí)將長(zhǎng)期運(yùn)行的工作委派給后臺(tái)子代理，或者在你需要廣度和速度時(shí)將任務(wù)并行分配給多個(gè)模型，這樣你就不必預(yù)先選擇單一模式?！?/p>

這一愿景不僅需要更快的推理速度，還需要復(fù)雜的任務(wù)分解以及不同規(guī)模和能力模型之間的協(xié)調(diào)。Codex-Spark為該體驗(yàn)的交互部分建立了低延遲基礎(chǔ)；未來(lái)版本需要提供自主推理和多代理協(xié)調(diào)能力，才能實(shí)現(xiàn)完整愿景。

目前，Codex-Spark采用與其他OpenAI模型分開(kāi)的速率限制，反映出研究預(yù)覽期間Cerebras基礎(chǔ)設(shè)施容量受限。"因?yàn)樗\(yùn)行在專(zhuān)門(mén)的低延遲硬件上，使用受單獨(dú)速率限制管控，在研究預(yù)覽期間可能根據(jù)需求調(diào)整，"發(fā)言人指出。這些限制被設(shè)計(jì)為"慷慨的"，OpenAI在決定如何擴(kuò)展時(shí)監(jiān)控使用模式。

Codex-Spark的發(fā)布正值A(chǔ)I驅(qū)動(dòng)開(kāi)發(fā)工具激烈競(jìng)爭(zhēng)之際。Anthropic的Claude Cowork產(chǎn)品上周引發(fā)傳統(tǒng)軟件股拋售，因投資者考慮AI助手是否可能取代傳統(tǒng)企業(yè)應(yīng)用。微軟、谷歌和亞馬遜繼續(xù)在與各自云平臺(tái)集成的AI編碼能力上大舉投資。

OpenAI的Codex應(yīng)用自推出十天以來(lái)展現(xiàn)出快速采用勢(shì)頭，周活躍用戶(hù)周環(huán)比增長(zhǎng)60%。目前超過(guò)32.5萬(wàn)開(kāi)發(fā)者在免費(fèi)和付費(fèi)層級(jí)積極使用Codex。但OpenAI及更廣泛AI行業(yè)面臨的根本問(wèn)題是，像Codex-Spark承諾的速度改進(jìn)是否能轉(zhuǎn)化為有意義的生產(chǎn)力提升，還是僅僅創(chuàng)造更愉快的體驗(yàn)而不改變結(jié)果。

Cerebras交易是一個(gè)經(jīng)過(guò)計(jì)算的賭注：專(zhuān)用硬件可以解鎖通用GPU無(wú)法經(jīng)濟(jì)高效服務(wù)的用例。對(duì)于一家同時(shí)與競(jìng)爭(zhēng)對(duì)手作戰(zhàn)、管理緊張供應(yīng)商關(guān)系并應(yīng)對(duì)內(nèi)部對(duì)其商業(yè)方向異議的公司而言，這也提醒人們，在AI競(jìng)賽中，原地不動(dòng)不是選項(xiàng)。OpenAI通過(guò)快速行動(dòng)和打破常規(guī)建立了聲譽(yù)?，F(xiàn)在它必須證明自己可以行動(dòng)得更快——而不會(huì)破壞自己。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà)：010-82306118；郵箱：aet@chinaaet.com。

减少英伟达依赖 OpenAI首次发布Cerebras芯片支持模型

日期： 2026-02-13

來(lái)源：华尔街见闻

相關(guān)內(nèi)容