3月31日消息,近日,比利時(shí)布魯塞爾自由大學(xué)(VUB)數(shù)據(jù)分析實(shí)驗(yàn)室發(fā)布重磅研究成果,證實(shí)商用大型語(yǔ)言模型已具備獨(dú)立生成原創(chuàng)數(shù)學(xué)證明的能力。
OpenAI旗下ChatGPT-5.2(Thinking)成功破解了一項(xiàng)此前懸而未決的數(shù)學(xué)猜想,同時(shí)催生了名為“vibe-proving”的全新AI推理方法,相關(guān)預(yù)印本論文已于2026年2月21日發(fā)表在arXiv平臺(tái)。
此次研究聚焦的核心命題,是數(shù)學(xué)家Ran與Teng在2024年提出的一項(xiàng)數(shù)學(xué)猜想。在數(shù)學(xué)領(lǐng)域,猜想是基于規(guī)律與重復(fù)驗(yàn)證被認(rèn)為成立,但尚未經(jīng)過(guò)嚴(yán)謹(jǐn)形式化證明的命題,只有完成完整有效的邏輯論證,猜想才能正式升格為定理。
研究團(tuán)隊(duì)介紹,整個(gè)證明過(guò)程歷經(jīng)7輪與ChatGPT的對(duì)話(huà)交互,形成了4版逐步迭代完善的論證版本。其中,ChatGPT核心承擔(dān)了證明路徑探索、核心結(jié)構(gòu)搭建的工作,人類(lèi)研究人員則全程把控推理的正確性與邏輯完整性。
研究團(tuán)隊(duì)將這種大模型輔助梳理、探索復(fù)雜理論構(gòu)想的模式,命名為“vibe-proving”,并提出這一方法有望復(fù)刻AI輔助編程(vibe-coding)的快速發(fā)展路徑,從基礎(chǔ)工具快速向近自動(dòng)化的理論探索演進(jìn)。
“此前很多人認(rèn)為,AI系統(tǒng)的創(chuàng)造力本質(zhì)上只能局限于對(duì)訓(xùn)練數(shù)據(jù)的重新組合,我們的研究恰好打破了這一誤解?!盫UB教授VincentGinis表示。參與研究的博士后研究員BrechtVerbeken也坦言,雖早已預(yù)判ChatGPT能助力數(shù)學(xué)難題證明,但其實(shí)際表現(xiàn)出的效率仍遠(yuǎn)超預(yù)期。
盡管AI在此次證明中發(fā)揮了核心作用,研究團(tuán)隊(duì)仍反復(fù)強(qiáng)調(diào),人類(lèi)的參與與最終驗(yàn)證不可或缺,尤其是補(bǔ)全證明邏輯缺口、完成最終嚴(yán)謹(jǐn)校驗(yàn)的環(huán)節(jié)。
VUB教授Andres Algaba指出,AI將大幅加快數(shù)學(xué)猜想候選證明的生成速度,未來(lái)行業(yè)的核心瓶頸會(huì)轉(zhuǎn)向人類(lèi)驗(yàn)證環(huán)節(jié),而語(yǔ)言模型同樣有望在這一領(lǐng)域提供助力。
這項(xiàng)成果也標(biāo)志著,大語(yǔ)言模型的能力邊界已從輔助編程、文本創(chuàng)作,正式拓展至需要深度原創(chuàng)推理的理論數(shù)學(xué)研究領(lǐng)域。

