《電子技術應用》
您所在的位置:首頁 > EDA與制造 > 業(yè)界動態(tài) > 英偉達:Arm處理器的重要里程碑

英偉達:Arm處理器的重要里程碑

2021-09-23
來源:半導體行業(yè)觀察
關鍵詞: ARM 人工智能

  人工智能的興起,讓英偉達GPU在服務器中的受重視程度日益提升,但他們不滿足于此。通過收購Arm公司和發(fā)表基于Arm 架構的Grace處理器,英偉達走出了在服務器市場替代英特爾X86的前兩部。

  而最近,他們發(fā)布了最新的數(shù)據,對英特爾步步緊逼。

  英偉達表示,它已經證明,當與用于 AI 應用程序(特別是機器學習推理)的 GPU 搭配使用時,基于 Arm 的 CPU 可以提供與基于 x86 的 CPU 幾乎相同的性能水平。

  這家總部位于加利福尼亞州圣克拉拉的這家公司本周做出了這一斷言,并使用了周三發(fā)布的同行評審性能數(shù)據作為支持,該數(shù)據是多家 OEM 和芯片制造商針對新的 MLPerf Inference v1.1 機器學習推理基準套件的測試結果的一部分。

  在與記者和分析師的簡報中,英偉達人工智能推理和云計算高級產品經理 Dave Salvator 表示,該公司通過采用基于 Arm 的 CPU 的 MLPerf 結果,確定了基于 Arm 的 CPU 和基于 x86 GPU 系統(tǒng)和基于 x86 的 GPU 系統(tǒng),并在每個加速器的基礎上比較它們。

  “我們能夠提供您在這里看到的與配置非常相似的 x86 服務器并駕齊驅的結果,”他說。

  在查看一個加速器提供的性能時,Nvidia 發(fā)現(xiàn)基于 Arm 的系統(tǒng)和基于 x86 的系統(tǒng)之間的測試結果相似。在離線設置中進行測試,基于 x86 的系統(tǒng)僅在六個機器學習模型中的五個中顯示出較小的優(yōu)勢,其中包括用于自然語言處理的 BERT-Large 和用于語音識別的 RRN-T。對于 3D U-Net 醫(yī)學成像模型,基于 Arm 的系統(tǒng)具有更明顯的優(yōu)勢。

  當涉及到需要在線連接的測試時,基于 Arm 的系統(tǒng)在 ResNet-50 圖像分類模型上有輕微的性能優(yōu)勢,而基于 X86 的系統(tǒng)在 SSD-Large object detection 和 DLRM 推薦模型上有類似的優(yōu)勢。但是,對于 RNN-T 和 BERT-Large 模型,基于 x86 的系統(tǒng)具有更大的優(yōu)勢。

  根據 Salvator 的說法,基于 Arm 的系統(tǒng)和基于 x86 的系統(tǒng)之間的性能結果基本相似,這是“一個重要的里程碑”。

  “首先,它表明 Arm 作為加速平臺可以提供與類似配置的 x86 服務器差不多的性能,”他說。“這也是關于我們的軟件堆棧準備好能夠在數(shù)據中心環(huán)境中運行 Arm 架構的聲明?!?/p>

  在上述的測試中,基于 Arm 的系統(tǒng)是一臺 Gigabyte 服務器,系統(tǒng)中運行了來自半導體初創(chuàng)公司 Ampere Computing的Altra CPU和四個通過 PCIe 連接的 Nvidia A100 GPU。基于 x86 的系統(tǒng)是 Nvidia 的 DGX A100,配備了兩個 AMD EPYC 7742 CPU 和八個通過 SXM 連接連接的 Nvidia A100 GPU。Nvidia 還展示了相同的基于 Arm 的系統(tǒng)與使用相同 CPU 和 GPU 但使用 PCIe 的不同基于 x86 的系統(tǒng)之間的類似性能比較。

  Salvator 在給 CRN 的一份聲明中表示,在每個加速器的基礎上比較系統(tǒng)是使數(shù)據直接可比的最佳方式,因為基于 Arm 的系統(tǒng)和基于 x86 的系統(tǒng)具有不同數(shù)量的 CPU 和 GPU。他補充說,鑒于“推理性能與 GPU 數(shù)量成線性關系”,這是進行比較的一種公平方式。

  “通過對每個加速器或每個處理器進行比較,我們能夠直接比較一個和另一個,并真正了解相對性能,”他說。

  審查和發(fā)布 MLPerf 測試結果的聯(lián)盟 MLCommons 的執(zhí)行董事 David Kanter 告訴 CRN,在基于 CPU 的系統(tǒng)的情況下測量每個處理器的性能或在基于 GPU 的系統(tǒng)的情況下測量每個加速器的性能是“相當普遍的使用”指標。

  “每個處理器的性能數(shù)字是有道理的,因為推理通常是一個明確的并行工作負載,”他在一封電子郵件中說?!懊總€推理都是獨立的,因此 [它] 理論上可以轉到單獨的處理器,因此歸一化是合理的?!?/p>

  但是,他指出,MLCommons“僅正式認可測得的 MLPerf 分數(shù)”,該分數(shù)基于整個系統(tǒng)的性能,而不是單個加速器或處理器的性能。

  英偉達在數(shù)據中心提出了關于 Arm 的新論點,因為它希望讓替代芯片架構成為其未來的重要組成部分。這家芯片制造商正試圖以 400 億美元的價格收購 Arm,盡管它面臨著監(jiān)管機構的嚴格審查以及一些競爭對手和生態(tài)系統(tǒng)參與者的反對。該公司還計劃制造自己的基于 Arm 的數(shù)據中心 CPU。

  位于馬薩諸塞州普利茅斯的 Nvidia 合作伙伴 Microway 的戰(zhàn)略客戶和高性能計算計劃副總裁 Eliot Eshelman 告訴 CRN,他的 HPC 客戶需要看到主要的性能優(yōu)勢才能從 x86 躍升到 Arm,這還沒有發(fā)生。表明兩種芯片架構僅具有可比性對他們來說是不夠的。

  “在我們的客戶中,需要有一些大的、明確的賣點,說明他們?yōu)槭裁葱枰挠眯录軜?,”他說。

  Eshelmen 表示,Arm 最終可能會推出架構改進,這將使其在人工智能方面優(yōu)于英特爾和 AMD,但他認為性能提升更有可能來自英偉達計劃在 CPU 和 GPU 之間進行的互連工作這家芯片制造商即將推出的基于 Arm 的數(shù)據中心 CPU。

  他說:“我不知道 Arm 是否會在 x86 上提供如此巨大的乘數(shù),或者這只是 Nvidia 為實現(xiàn)目標而采取的道路。”




電子技術圖片.png

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。