1月24日消息,今日,中國(guó)聯(lián)通宣布,聯(lián)通數(shù)據(jù)智能有限公司日前發(fā)布元景思維鏈大模型。
目前,元景思維鏈模型已在GitHub、魔搭、始智等社區(qū)全面開源。
作為央企首個(gè)開源的通用思維鏈大模型,元景思維鏈大模型既擁有強(qiáng)大慢思考能力,又具備不限于數(shù)學(xué)的多學(xué)科、多場(chǎng)景通用推理能力,且能做到針對(duì)不同任務(wù)和難度的自適應(yīng)慢思考,大幅降低資源消耗。
中國(guó)聯(lián)通表示,主流榜單的測(cè)評(píng)結(jié)果顯示,元景思維鏈大模型的表現(xiàn)超過(guò)了目前最好的通用語(yǔ)言模型(OpenAI GPT-4o和Deepseek V3)以及開源思維鏈模型通義千問(wèn)QwQ。
據(jù)介紹,元景思維鏈大模型通過(guò)任務(wù)自適應(yīng)和難度自適應(yīng)兩種策略來(lái)實(shí)現(xiàn)模型的“自適應(yīng)慢思考”。
在非推理任務(wù)測(cè)評(píng)集上對(duì)比,元景思維鏈模型在保證正確率的情況下明顯傾向于生成更短的答案(長(zhǎng)度小于100和200個(gè)token的數(shù)量明顯多于通義千問(wèn)QwQ):
該大模型在評(píng)估模型生成的長(zhǎng)思維鏈數(shù)據(jù)時(shí),除了考慮生成的答案正確與否,還綜合考慮了問(wèn)題的難度以及生成答案的長(zhǎng)度,通過(guò)強(qiáng)化學(xué)習(xí)讓模型將答案長(zhǎng)度與當(dāng)前問(wèn)題的難度相匹配。
根據(jù)官方演示,元景思維鏈模型可順利解答物理、化學(xué)高考真題、24點(diǎn)游戲、邏輯推理等問(wèn)題。