123,123,123

AMD发布首个AI小语言模型AMD-135M

6900亿token、推测解码提速3.88倍

日期： 2024-10-08

來(lái)源：快科技

關(guān)鍵詞： AMD AMD-135M AI小语言模型

10月1日消息，AMD發(fā)布了自己的首個(gè)小語(yǔ)言模型(SLM)，名為“AMD-135M”。

相比于越來(lái)越龐大的大語(yǔ)言模型(LLM)，它體積小巧，更加靈活，更有針對(duì)性，非常適合私密性、專業(yè)性很強(qiáng)的企業(yè)部署。

AMD-135小模型隸屬于Llama家族，有兩個(gè)版本：

一是基礎(chǔ)型“AMD-Llama-135M”，擁有多達(dá)6700億個(gè)token，在八塊Instinct MIM250 64GB加速器上訓(xùn)練了六天。

二是延伸型“AMD-Llama-135M-code”，額外增加了專門針對(duì)編程的200億個(gè)token，同樣硬件訓(xùn)練了四天。

創(chuàng)建與部署流程

它使用了一種名為“推測(cè)解碼”(speculative decoding)的方法，通過(guò)較小的草稿模型，在單次前向傳播中生成多個(gè)候選token，然后發(fā)送給更大的、更精確的目標(biāo)模型，進(jìn)行驗(yàn)證或糾正。

這種方法可以同時(shí)生成多個(gè)token，不會(huì)影響性能，還可以降低內(nèi)存占用，但因?yàn)閿?shù)據(jù)交易更多，功耗也會(huì)增加。

AMD還使用AMD-Llama-135M-code作為CodeLlama-7b的草案模型，測(cè)試了推測(cè)解碼使用與否的性能。

比如在MI250加速器上，性能可提升最多約2.8倍，銳龍AI CPU上可提升最多約3.88倍，銳龍AI NPU上可提升最多約2.98倍。

推測(cè)解碼

AMD-135M小模型的訓(xùn)練代碼、數(shù)據(jù)集等資源都已經(jīng)開(kāi)源，遵循Apache 2.0。

按照AMD的說(shuō)法，它的性能與其他開(kāi)源小模型基本相當(dāng)或略有領(lǐng)先，比如Hellaswag、SciQ、ARC-Easy等任務(wù)超過(guò)Llama-68M、LLama-160M，Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任務(wù)則基本類似GTP2-124MN、OPT-125M。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

AMD发布首个AI小语言模型AMD-135M

日期： 2024-10-08

來(lái)源：快科技

相關(guān)內(nèi)容