《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 電子元件 > 業(yè)界動(dòng)態(tài) > AI推理性能最高提升20倍,IBM首款7nm商用處理器POWER10面世

AI推理性能最高提升20倍,IBM首款7nm商用處理器POWER10面世

2020-08-18
來(lái)源:機(jī)器之心
關(guān)鍵詞: 7nm AI IBM POWER10

微信圖片_20200818170037.png

  歷時(shí) 5 年,制程由 14nm 減至 7nm,更加重視 AI 推理性能,IBM 最新 POWER10 處理器將在商用領(lǐng)域打出一片天地。

  在今年的 Hot Chips 2020 會(huì)議上,IBM 正式宣布了新一代 CPU POWER10。作為 Power 9 的繼任者,POWER10 的處理效率是前者的三倍,同時(shí)又提供了更高的工作負(fù)載量和容器密度。

  基于 Power 9 處理器并使用 Nvidia Tesla GPU 作為加速器的 Summit,就是世界上最快的超級(jí)計(jì)算機(jī)之一。目前看來(lái),繼任者 POWER10 更加值得期待。

  POWER10 的設(shè)計(jì)歷時(shí)五年,擁有數(shù)百項(xiàng)新型以及正在申請(qǐng)的專利。早在 2015 年,IBM、三星和 IBM 研究聯(lián)盟的其他成員生產(chǎn)了第一批測(cè)試芯片。它的獨(dú)特之處在于,這是 IBM 的首款商用 7 nm 處理器。

  POWER10 架構(gòu)師 William Starke 表示,單芯片模塊產(chǎn)品最多不超過(guò) 15 個(gè) SMT8 核心,雙芯片模塊產(chǎn)品最多不超過(guò) 30 個(gè) SMT8 核心。

  IBM POWER 系列芯片的發(fā)展路線圖。

  制程由 14nm 縮減至 7nm,更加重視 AI 推理性能

  吞吐量和功率效率的提升部分得益于硅制程技術(shù),該技術(shù)使得 POWER9 中使用的 14nm GlobalFoundries 制程縮減為三星的 7nm EUV。制程微縮使得 IBM 可以添加更多的核心和更多的緩存。

  設(shè)計(jì)方法也有重大更改。新的設(shè)計(jì)更加模塊化,具有新的核心核心微架構(gòu)和新的 AI 指令。POWER10 還添加了更多的安全硬件。內(nèi)存受到全內(nèi)存加密保護(hù),同時(shí)也沒(méi)有降低速度。

  此外,POWER10 還為多租戶(multi-tenant)云工作負(fù)載內(nèi)置了「嘈雜的鄰居(noisy neighbor)」保護(hù)功能。為了確保云工作負(fù)載的安全性,處理器支持安全的 container。該架構(gòu)通過(guò)其 PowerVM 虛擬機(jī)來(lái)管理程序和內(nèi)存池聚合功能,以提升靈活性,通過(guò) PB 級(jí)系統(tǒng)內(nèi)存支持來(lái)處理各種工作負(fù)載。

  考慮到 AI 越來(lái)越重要,IBM 增加了對(duì)其他指令和數(shù)據(jù)類型的支持。處理器通過(guò)新的可擴(kuò)展指令集支持 Power 的 3.1 版本。POWER10 也意味著 IBM 更加重視 CPU 中的 AI 推理性能。

  IBM 表示,推理處理中使用的矩陣數(shù)學(xué)函數(shù)可將性能提升 10-20 倍。緩存帶寬上也有改進(jìn),以使 SIMD 單元獲得數(shù)據(jù)。

  越來(lái)越多的企業(yè)將 AI 部署到實(shí)際應(yīng)用 AI 的運(yùn)營(yíng)工作負(fù)載中。所以,IBM 仍將支持訓(xùn)練加速器,例如 GPU 和 FPGA,但 AI 部署基于的推理使用的是訓(xùn)練創(chuàng)建的模型。

  實(shí)際上,AI 的推理用途是能夠產(chǎn)生商業(yè)實(shí)效的。IBM 將在 PCIe5.0 版本上通過(guò) OpenCAPI 支持加速器。IBM 也放棄了英偉達(dá)的 NVLink 接口,因?yàn)?PCIe v5 提供了足夠的帶寬。

  POWER10 的推理性能展示。

  其他技術(shù)細(xì)節(jié)

  IBM 在 Hot Chips 會(huì)議上展示了 POWER10 的大量技術(shù)細(xì)節(jié)。芯片面積為 600 平方毫米,具有 180 億個(gè)晶體管。最多兩個(gè)管芯可以被放入 POWER10 服務(wù)器的包中。

  每個(gè)芯片具有 15 個(gè)活躍的 CPU 核,其中管芯上還有一個(gè)用于提升成品率的備用核。此外,每個(gè) CPU 可以支持 8 個(gè)線程(虛擬 CPU),所以每個(gè)插槽中共計(jì)有 120 個(gè)線程。

  管芯上緩存內(nèi)存總量為 150MB 以上。在接口設(shè)置上,下一代 PCI Express Gen 5 具有 64 條通路,傳輸速度高達(dá) 32GT/s。

  IBM POWER10 芯片的技術(shù)規(guī)格細(xì)節(jié)。

  POWER10 將會(huì)有兩個(gè)版本。一個(gè)版本采用雙管芯封裝,時(shí)鐘頻率達(dá)到 3.5GHz,并且能夠連接 4 個(gè)插槽。另一版本為單芯片插槽,有更高的時(shí)鐘頻率,為 4GHz 或更高,最多可連接 16 個(gè)插槽。每個(gè)插槽的 PowerAXON 接口都支持超過(guò) TB/s 級(jí)的帶寬,而開(kāi)放式內(nèi)存接口(OMI)可以支持相同的帶寬。

  POWER10 最重要的創(chuàng)新就是它能在整個(gè) POWER 服務(wù)器機(jī)架上聚合內(nèi)存。本地內(nèi)存通過(guò)低延遲、高帶寬的 OMI 進(jìn)行連接,從而提供高達(dá) 4TB 的內(nèi)存以及高帶寬,而且沒(méi)有一般高帶寬內(nèi)存的限制和費(fèi)用。OMI 還可被用于連接存儲(chǔ)類內(nèi)存(SCM)。

  PowerAXON 接口可用于連接其他 16 個(gè) POWER10 插槽,但也可以通過(guò) OpenCAPI 連接到加速器。但它最有趣的用途是內(nèi)存集群。本地處理器可以將其本地內(nèi)存映射到相鄰的處理器,因此需要更多內(nèi)存的工作負(fù)載可以用相鄰處理器的內(nèi)存,而無(wú)需將頁(yè)面交換到速度較慢的存儲(chǔ)內(nèi)存中。這種靈活性對(duì)于管理大型數(shù)據(jù)集來(lái)說(shuō)至關(guān)重要。2PB 的地址空間使之變?yōu)榱丝赡?,而且這種內(nèi)存共享功能也可以擴(kuò)展到企業(yè)級(jí)系統(tǒng)。

  從 CPU 設(shè)計(jì)到軟件堆棧,POWER10 都展示出了 IBM 一直以來(lái)的企業(yè)級(jí)計(jì)算傳統(tǒng)。更重要的是,它現(xiàn)在支持更多的 AI 功能、硬件輔助虛擬環(huán)境、更具擴(kuò)展性的云部署以及更大的數(shù)據(jù)集處理,使其與現(xiàn)代企業(yè)和云工作負(fù)載更加相關(guān)。

  與此前的 Power 系列處理器一樣,POWER10 也向 OpenPower 基金會(huì)的 250 多個(gè)成員開(kāi)放許可和允許修改,包括谷歌、英偉達(dá)、Mellanox、 Tyan 等企業(yè)。

 


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。