3月31日消息,近日,比利時布魯塞爾自由大學(xué)(VUB)數(shù)據(jù)分析實驗室發(fā)布重磅研究成果,證實商用大型語言模型已具備獨立生成原創(chuàng)數(shù)學(xué)證明的能力。
OpenAI旗下ChatGPT-5.2(Thinking)成功破解了一項此前懸而未決的數(shù)學(xué)猜想,同時催生了名為“vibe-proving”的全新AI推理方法,相關(guān)預(yù)印本論文已于2026年2月21日發(fā)表在arXiv平臺。
此次研究聚焦的核心命題,是數(shù)學(xué)家Ran與Teng在2024年提出的一項數(shù)學(xué)猜想。在數(shù)學(xué)領(lǐng)域,猜想是基于規(guī)律與重復(fù)驗證被認為成立,但尚未經(jīng)過嚴謹形式化證明的命題,只有完成完整有效的邏輯論證,猜想才能正式升格為定理。
研究團隊介紹,整個證明過程歷經(jīng)7輪與ChatGPT的對話交互,形成了4版逐步迭代完善的論證版本。其中,ChatGPT核心承擔了證明路徑探索、核心結(jié)構(gòu)搭建的工作,人類研究人員則全程把控推理的正確性與邏輯完整性。
研究團隊將這種大模型輔助梳理、探索復(fù)雜理論構(gòu)想的模式,命名為“vibe-proving”,并提出這一方法有望復(fù)刻AI輔助編程(vibe-coding)的快速發(fā)展路徑,從基礎(chǔ)工具快速向近自動化的理論探索演進。
“此前很多人認為,AI系統(tǒng)的創(chuàng)造力本質(zhì)上只能局限于對訓(xùn)練數(shù)據(jù)的重新組合,我們的研究恰好打破了這一誤解。”VUB教授VincentGinis表示。參與研究的博士后研究員BrechtVerbeken也坦言,雖早已預(yù)判ChatGPT能助力數(shù)學(xué)難題證明,但其實際表現(xiàn)出的效率仍遠超預(yù)期。
盡管AI在此次證明中發(fā)揮了核心作用,研究團隊仍反復(fù)強調(diào),人類的參與與最終驗證不可或缺,尤其是補全證明邏輯缺口、完成最終嚴謹校驗的環(huán)節(jié)。
VUB教授Andres Algaba指出,AI將大幅加快數(shù)學(xué)猜想候選證明的生成速度,未來行業(yè)的核心瓶頸會轉(zhuǎn)向人類驗證環(huán)節(jié),而語言模型同樣有望在這一領(lǐng)域提供助力。
這項成果也標志著,大語言模型的能力邊界已從輔助編程、文本創(chuàng)作,正式拓展至需要深度原創(chuàng)推理的理論數(shù)學(xué)研究領(lǐng)域。

