5月21日消息,IBM 在年度 THINK 大會(huì)上宣布,IBM 現(xiàn)已開源其“最先進(jìn)”和高性能的 Granite(花崗巖)代碼模型。
Granite 代碼模型的參數(shù)范圍從 3B 到 34B,并且有基礎(chǔ)模型和指令跟隨模型兩種變體,適用于復(fù)雜應(yīng)用現(xiàn)代化、代碼生成、修復(fù)錯(cuò)誤、解釋和記錄代碼、維護(hù)數(shù)據(jù)庫(kù)等任務(wù)。這些代碼模型在 116 種編程語(yǔ)言上進(jìn)行訓(xùn)練,在各種代碼相關(guān)任務(wù)中始終達(dá)到開源代碼大模型 的“最先進(jìn)”性能。
▲ Granite-8B-Code 與其他類似規(guī)模的開源代碼大模型進(jìn)行比較
IBM 表示,Granite 代碼模型在所有模型尺寸和基準(zhǔn)測(cè)試中整體表現(xiàn)非常出色,通常優(yōu)于其他開源代碼模型,盡管這些模型的規(guī)模是 Granite 的兩倍。Granite 代碼模型在代碼合成、修復(fù)、解釋、編輯和翻譯方面表現(xiàn)出色,涵蓋了包括 Python、JavaScript、Java、Go、C++ 和 Rust 在內(nèi)的大多數(shù)主要編程語(yǔ)言。
此外,20B 參數(shù)的 Granite 基礎(chǔ)代碼模型被用于訓(xùn)練 IBM watsonx Code Assistant(WCA)以適應(yīng)專業(yè)領(lǐng)域。20B 參數(shù)的 Granite 基礎(chǔ)代碼模型經(jīng)過調(diào)優(yōu),可以從自然語(yǔ)言問題生成 SQL,以便轉(zhuǎn)換結(jié)構(gòu)化數(shù)據(jù)并從中提取見解(extracting insights)。