123,123,123

SuperCLUE发布2026年3月中文大模型基准测评结果

日期： 2026-03-30

來(lái)源：快科技

關(guān)鍵詞： 大模型 Anthropic Gemini OpenAI 字节跳动

3月30日消息，中文大模型基準(zhǔn)測(cè)評(píng)SuperCLUE發(fā)布2026年3月最新結(jié)果，22款國(guó)內(nèi)外主流模型參與角逐。

字節(jié)跳動(dòng)旗下豆包（Doubao-Seed-2.0-pro-260215(high)）以71.53分拿下國(guó)內(nèi)第一，成功躋身全球第一梯隊(duì)；小米集團(tuán)的MiMo-V2系列兩款模型均順利上榜。

本次測(cè)評(píng)覆蓋數(shù)學(xué)推理、科學(xué)推理、代碼生成等六大核心任務(wù)，全面檢驗(yàn)?zāi)Ｐ途C合能力。海外閉源模型依舊占據(jù)總分前列，Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。

豆包則緊隨其后，總分僅與GPT-5.4相差0.95分，實(shí)現(xiàn)全方位追趕，在智能體任務(wù)規(guī)劃維度更是反超部分海外模型，躋身全球前五。

小米此次有兩款模型入選測(cè)評(píng)榜單，其中MiMo-V2-Pro以60.67分位列閉源模型前列，在數(shù)學(xué)推理任務(wù)中取得84.03分的亮眼成績(jī)；開(kāi)源版本MiMo-V2-Flash雖以49.97分排名靠后，但在代碼生成等細(xì)分場(chǎng)景中表現(xiàn)出一定潛力。

測(cè)評(píng)還顯示，國(guó)產(chǎn)模型整體表現(xiàn)亮眼，開(kāi)源賽道尤為突出，Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等國(guó)產(chǎn)開(kāi)源模型包攬開(kāi)源榜前三，大幅領(lǐng)先海外同類模型。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

SuperCLUE发布2026年3月中文大模型基准测评结果

日期： 2026-03-30

來(lái)源：快科技

相關(guān)內(nèi)容