阿里通義千問(wèn)發(fā)布Qwen2-Math開(kāi)源AI模型
2024-08-09
來(lái)源:IT之家
8 月 9 日消息,阿里通義千問(wèn) Qwen2 開(kāi)源家族迎來(lái)新成員 Qwen2-Math,共有 15 億參數(shù)、70 億參數(shù)和 720 億參數(shù)三個(gè)版本,是基于 Qwen2 LLM 構(gòu)建、專(zhuān)門(mén)用于數(shù)學(xué)解題的語(yǔ)言模型。
簡(jiǎn)介
Qwen2-Math 是一系列基于 Qwen2 LLM 構(gòu)建的專(zhuān)門(mén)用于數(shù)學(xué)解題的語(yǔ)言模型,其數(shù)學(xué)能力顯著超越了開(kāi)源模型,甚至超過(guò)了閉源模型(如 GPT-4o),官方希望為科學(xué)界解決需要復(fù)雜多步邏輯推理的高級(jí)數(shù)學(xué)問(wèn)題做出貢獻(xiàn)。
性能
團(tuán)隊(duì)在一系列數(shù)學(xué)基準(zhǔn)評(píng)測(cè)上評(píng)估了我們的數(shù)學(xué)專(zhuān)用模型 Qwen2-Math。在 Math 上的評(píng)測(cè)結(jié)果表明,其最大的數(shù)學(xué)專(zhuān)用模型 Qwen2-Math-72B-Instruct 超越了最先進(jìn)的模型,包括 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro 和 Llama-3.1-405B。
Qwen2-Math 指令微調(diào)模型
正開(kāi)發(fā)多語(yǔ)言模型
從報(bào)道中獲悉,新模型系列 Qwen2-Math 專(zhuān)注于數(shù)學(xué)能力,目前僅支持英文,團(tuán)隊(duì)計(jì)劃推出支持英文和中文的雙語(yǔ)模型,并且開(kāi)發(fā)多語(yǔ)言模型。