《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > 微軟推出首款自研AI模型

微軟推出首款自研AI模型

2025-08-29
來源:IT之家
關(guān)鍵詞: 微軟 AI模型 MAI-Voice-1

8 月 29 日消息,周四,微軟人工智能部門正式推出其首批兩款自研 AI 模型 ——MAI-Voice-1 語音模型與 MAI-1-preview 通用模型。據(jù)微軟介紹,全新的 MAI-Voice-1 語音模型僅需單塊 GPU,就能在 1 秒內(nèi)生成時(shí)長 1 分鐘的音頻;而 MAI-1-preview 模型則“讓用戶提前窺見 Copilot 未來功能的發(fā)展方向”。

20250828_095257_2.jpg

目前,微軟已將 MAI-Voice-1 應(yīng)用于多項(xiàng)功能中:例如在“Copilot Daily”功能里,AI 主持人會(huì)通過該模型播報(bào)當(dāng)日熱點(diǎn)新聞;同時(shí),它還能生成播客風(fēng)格的對(duì)話內(nèi)容,幫助用戶理解各類話題。

普通用戶可在 Copilot Labs 平臺(tái)親自體驗(yàn) MAI-Voice-1:不僅能輸入希望 AI 表達(dá)的內(nèi)容,還可自定義語音音色與說話風(fēng)格。除這款語音模型外,微軟此次同步推出的 MAI-1-preview 模型,訓(xùn)練過程動(dòng)用了約 1.5 萬塊英偉達(dá) H100 GPU。該模型專為特定需求用戶設(shè)計(jì),具備遵循指令的能力,可“為日常咨詢提供實(shí)用回應(yīng)”。

微軟 AI 負(fù)責(zé)人穆斯塔法?蘇萊曼去年在《Decoder》播客某期節(jié)目中表示,公司內(nèi)部研發(fā)的 AI 模型并未將企業(yè)級(jí)應(yīng)用場(chǎng)景作為核心方向,他解釋道:“我的思路是,我們必須打造一款對(duì)消費(fèi)者而言體驗(yàn)極佳的產(chǎn)品,并針對(duì)自身應(yīng)用場(chǎng)景進(jìn)行深度優(yōu)化。在廣告業(yè)務(wù)、消費(fèi)者行為數(shù)據(jù)等領(lǐng)域,我們擁有海量高預(yù)測(cè)性、高實(shí)用性的數(shù)據(jù),因此我的工作重點(diǎn)是構(gòu)建真正適配‘消費(fèi)者伙伴’定位的模型?!?/p>

據(jù)悉,微軟 AI 計(jì)劃將 MAI-1-preview 模型應(yīng)用于 Copilot 助手的特定文本使用場(chǎng)景(目前 Copilot 主要依賴 OpenAI 的大型語言模型)。同時(shí),該模型已開始在 AI 基準(zhǔn)測(cè)試平臺(tái) LMArena 上進(jìn)行公開測(cè)試。

微軟 AI 團(tuán)隊(duì)在博客文章中寫道:“我們對(duì)未來發(fā)展有著宏大規(guī)劃。接下來,我們不僅會(huì)持續(xù)推進(jìn)技術(shù)突破,更相信通過整合一系列針對(duì)不同用戶需求與應(yīng)用場(chǎng)景的專業(yè)模型,將釋放出巨大價(jià)值?!?/p>


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。