《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 剛完硬件剛軟件 AMD確認(rèn)AI軟件3倍性能提升

剛完硬件剛軟件 AMD確認(rèn)AI軟件3倍性能提升

2025-08-11
來(lái)源:快科技
關(guān)鍵詞: AMD AI軟件 ROCm 英偉達(dá) CUDA

8月9日消息,在AI市場(chǎng)上NVIDIA占據(jù)了95%的份額,這不僅是他們的AI顯卡硬件性能強(qiáng)大,還得益于CUDA的軟件生態(tài)更完善,畢竟16年來(lái)積累了400多萬(wàn)開發(fā)者,這是NVIDIA最大的護(hù)城河。

AMD在AI市場(chǎng)上想搶占更多份額,除了明年推出性能40PFlops(4億億次每秒)的MI400加速卡之外,還要在軟件生態(tài)上取得突破,這方面就得靠AMD的ROCm軟件了,而且還是開源開放的生態(tài)。

S18ab8cdf-88ef-4714-a5be-3a562d54516b.png

今年6月份AMD官宣了最新的ROCm 7軟件,專為性能、兼容性和靈活性而設(shè)計(jì),在推理和訓(xùn)練方面提供了重大增強(qiáng),支持許多開箱即用的最新AI模型,并將AMD開放生態(tài)系統(tǒng)從云擴(kuò)展到邊緣。

在日前的財(cái)報(bào)會(huì)議上,CEO蘇姿豐也提到了ROCm 7的諸多優(yōu)點(diǎn),強(qiáng)調(diào)在這一財(cái)季中AMD取得了重大進(jìn)展,提高了ROCm7的性能、易用性并擴(kuò)大了其采用范圍。

蘇姿豐表示,我們發(fā)布了 ROCm7,對(duì)整個(gè)軟件棧的每一層都進(jìn)行了重大升級(jí),與上一代相比,推理和訓(xùn)練性能提升了3倍以上,并增加了對(duì)大規(guī)模訓(xùn)練、分布式推理和低精度數(shù)據(jù)類型的支持。

為了加強(qiáng)與開發(fā)者的合作,AMD推出了 ROCm夜間構(gòu)建版本,并擴(kuò)大了即時(shí)計(jì)算基礎(chǔ)設(shè)施的訪問(wèn)范圍,包括推出了AMD首個(gè)開發(fā)者云,該云提供預(yù)配置的容器,可即時(shí)訪問(wèn) AMD GPU。

在此前的發(fā)布會(huì)上,AMD還提供了ROCm7的實(shí)測(cè)結(jié)果,在Llama 3.1 70B模型上性能提升 3.2倍,Qwen2-72B上性能提升3.4倍,而DeepSeek R1性能提升3.8倍。

在訓(xùn)練任務(wù)上,Llama 2 70B、Llama 3.1 8B、Qwen 1.5 7B模型上平均性能提升3倍。

今年內(nèi)ROCm7還會(huì)不斷提升生態(tài)支持,加入對(duì)銳龍平臺(tái)筆記本/工作站的支持,完整支持Linux系統(tǒng),還會(huì)正式加入對(duì)Windows系統(tǒng)的支持,可以說(shuō)之前備受開發(fā)者吐槽的問(wèn)題正在逐步解決。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。