《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 阿里千問成新加坡國家AI項(xiàng)目技術(shù)底座

阿里千問成新加坡國家AI項(xiàng)目技術(shù)底座

預(yù)訓(xùn)練階段即涵蓋119種語言
2025-11-27
來源:IT之家

11 月 27 日消息,據(jù)阿里云官方公眾號,新加坡國家人工智能計(jì)劃近日發(fā)布了一款名為 Qwen-SEA-LION-v4 的東南亞多語言大模型。該模型的核心技術(shù)底座基于阿里巴巴的“通義千問開源模型構(gòu)建。

format,f_avif.avif.jpg

從官方介紹獲悉,這款由中新合作打造的模型迅速在“東南亞語言模型全面評估基準(zhǔn)”(SEA-HELM)的開源模型榜單(參數(shù)量 2000 億以下)中登頂。

東南亞地區(qū)擁有超過 1200 種語言,日常交流中普遍存在多種語言混用等復(fù)雜情況,而全球主流的 AI 模型大多以英語為中心,難以有效服務(wù)本地市場,形成了巨大的“AI 鴻溝”。此次合作旨在解決這一長期困擾當(dāng)?shù)?AI 發(fā)展的難題。目前,Qwen-SEA-LION-v4 模型已通過 AISingapore 官網(wǎng)和 HuggingFace 開源社區(qū)向全球免費(fèi)提供下載。

Qwen3 模型在預(yù)訓(xùn)練階段就已涵蓋 119 種語言,為理解東南亞小語種打下基礎(chǔ)。通義千問團(tuán)隊(duì)還在后訓(xùn)練中增加了跨語言訓(xùn)練任務(wù)的比重,以更好地處理現(xiàn)實(shí)世界中的多語言混合輸入。


subscribe.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。