123,123

OpenAI发布全新o1模型

开启 AI 通用复杂推理新篇章，模拟人类思考、处理问题

日期： 2024-09-13

來源：IT之家

關(guān)鍵詞： OpenAI AI模型 o1

9 月 13 日消息，OpenAI 傳聞中的“草莓”（Strawberry）AI 模型現(xiàn)已面世，正式名稱為“o1”，是該公司首款具備“推理”能力的模型。

o1 和 o1-mini

OpenAI 表示對該模型進行特殊訓練，能夠比人類更快地回答更復雜的問題。與之同時發(fā)布的還有 o1-mini，一個更小、成本更低的版本。

OpenAI 表示 o1 模型的發(fā)布，是其邁向類人 AI 宏偉目標的關(guān)鍵一步。

IT之家注：o1 模型目前處于“預覽”階段，官方強調(diào)該模型相關(guān)開發(fā)尚處于初期階段，相比較 GPT-4o 模型，使用成本更高且速度更慢，但在編寫代碼和解決多步驟問題方面表現(xiàn)更為優(yōu)秀。

價格

OpenAI 公司表示從今天起，ChatGPT Plus 和 Team 用戶將可訪問 o1-preview 和 o1-mini，而 Enterprise 和 Edu 用戶則將在下周初獲得訪問權(quán)限。

OpenAI 表示計劃將 o1-mini 的訪問權(quán)限擴展至所有 ChatGPT 免費用戶，但尚未確定發(fā)布日期。

開發(fā)者獲取 o1 的訪問權(quán)限成本相當高昂：如果調(diào)用 API，o1-preview 的輸入詞元（tokens）費用為每百萬個成本 15 美元（IT之家備注：當前約 107 元人民幣），輸出詞元費用為每百萬個 60 美元（當前約 427 元人民幣）。

相比之下，GPT-4o 的輸入詞元費用為每百萬個 5 美元（當前約 35.6 元人民幣），輸出詞元費用為每百萬個 15 美元（當前約 107 元人民幣）。因此 o1 模型輸入詞元費用提高了 2 倍，輸出詞元費用提高了 3 倍。

訓練方式

OpenAI 的研究負責人 Jerry Tworek 表示，o1 采用了有別于當前模型的訓練方法，并他并未透露具體細節(jié)。

他提到，o1“采用了全新的優(yōu)化算法和專門為其定制的訓練數(shù)據(jù)集進行訓練。”

報道稱 OpenAI 在訓練 o1 模型中使用一種稱為強化學習（reinforcement learning）的技術(shù)，來自行解決問題，該技術(shù)通過獎勵和懲罰來教導系統(tǒng)。隨后，o1 采用“思維鏈”來處理查詢，類似于人類通過逐步推理來解決問題的方式。

由于采用了這種新的訓練方法，OpenAI 表示模型應該會更加準確。

Tworek 表示：“我們不能說已經(jīng)解決了幻覺問題，但至少從觀測的結(jié)果來看，這個模型產(chǎn)生的幻覺明顯減少”。

o1 模型優(yōu)勢

o1 模型與 GPT-4o 的主要區(qū)別在于，它能夠比前代更好地處理復雜的編程和數(shù)學問題，并能解釋其推理過程，這是 OpenAI 所強調(diào)的。

OpenAI 的首席研究官 Bob McGrew 表示：

這款模型在解答 AP 數(shù)學考試題目上的表現(xiàn)無疑比我更出色，而我大學時還輔修了數(shù)學。

他提到，OpenAI 還讓 o1 參加了國際數(shù)學奧林匹克競賽的資格考試，GPT-4o 僅正確解決了 13% 的問題，o1 模型能夠解決 83% 的問題。

在名為 Codeforces 競賽的在線編程比賽中，這一新型模型達到了參賽者中的第 89 位，OpenAI 聲稱該模型的下一次更新將在物理、化學和生物學中的挑戰(zhàn)性基準任務上表現(xiàn)“與博士生相當”。

同時，o1 在許多領(lǐng)域的能力不及 GPT-4o。它在世界事實知識方面的表現(xiàn)也不如后者。此外，它不具備瀏覽網(wǎng)頁、處理文件和圖像的能力。盡管如此，該公司認為它代表了一類全新的功能。將其命名為 o1，意在表明“將計數(shù)器重置回 1”。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

OpenAI发布全新o1模型

日期： 2024-09-13

來源：IT之家

相關(guān)內(nèi)容