《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 中國(guó)聯(lián)通發(fā)布元景思維鏈大模型

中國(guó)聯(lián)通發(fā)布元景思維鏈大模型

央企首個(gè)開源的通用思維鏈大模型
2025-01-24
來(lái)源:快科技

1月24日消息,今日,中國(guó)聯(lián)通宣布,聯(lián)通數(shù)據(jù)智能有限公司日前發(fā)布元景思維鏈大模型。

目前,元景思維鏈模型已在GitHub、魔搭、始智等社區(qū)全面開源。

作為央企首個(gè)開源的通用思維鏈大模型,元景思維鏈大模型既擁有強(qiáng)大慢思考能力,又具備不限于數(shù)學(xué)的多學(xué)科、多場(chǎng)景通用推理能力,且能做到針對(duì)不同任務(wù)和難度的自適應(yīng)慢思考,大幅降低資源消耗。

中國(guó)聯(lián)通表示,主流榜單的測(cè)評(píng)結(jié)果顯示,元景思維鏈大模型的表現(xiàn)超過(guò)了目前最好的通用語(yǔ)言模型(OpenAI GPT-4o和Deepseek V3)以及開源思維鏈模型通義千問(wèn)QwQ。 

1.png

2.png

據(jù)介紹,元景思維鏈大模型通過(guò)任務(wù)自適應(yīng)和難度自適應(yīng)兩種策略來(lái)實(shí)現(xiàn)模型的“自適應(yīng)慢思考”。

在非推理任務(wù)測(cè)評(píng)集上對(duì)比,元景思維鏈模型在保證正確率的情況下明顯傾向于生成更短的答案(長(zhǎng)度小于100和200個(gè)token的數(shù)量明顯多于通義千問(wèn)QwQ):

該大模型在評(píng)估模型生成的長(zhǎng)思維鏈數(shù)據(jù)時(shí),除了考慮生成的答案正確與否,還綜合考慮了問(wèn)題的難度以及生成答案的長(zhǎng)度,通過(guò)強(qiáng)化學(xué)習(xí)讓模型將答案長(zhǎng)度與當(dāng)前問(wèn)題的難度相匹配。

根據(jù)官方演示,元景思維鏈模型可順利解答物理、化學(xué)高考真題、24點(diǎn)游戲、邏輯推理等問(wèn)題。

3.png

4.png

5.png

6.png

7.png

8.png


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。