《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業(yè)界動態(tài) > SHMT技術推動計算變革:不動硬件,速度翻番、能耗減半

SHMT技術推動計算變革:不動硬件,速度翻番、能耗減半

2024-02-26
來源:IT之家
關鍵詞: SHMT技術 IEEEACM

在第 56 屆 IEEE / ACM 微體系結構國際研討會上,美國加州大學河濱分校(UCR)的研究人員展示了一種全新的方法,可以實現(xiàn)計算速度翻番、能耗減半的效果。

1.jpg

研究人員表示這項技術理論上適用于從智能手機到數(shù)據(jù)中心服務器的任何處理器和加速器,但需要進一步地開發(fā)適配。

加利福尼亞大學電氣與計算機工程系副教授、本研究報告的共同作者曾宏偉(Hung-Wei Tseng)表示:

你不需要增加新的處理器,可以在現(xiàn)有計算機平臺上部署。這項技術的核心,是幫助你更合理高效地管理可用硬件資源。

研究人員開發(fā)的平臺打破了傳統(tǒng)的編程模式,團隊將其稱為同步異構多線程(SHMT)。傳統(tǒng)編程模式是在一段時間內(nèi),只向系統(tǒng)的一個計算組件(中央處理器、圖形處理器、張量處理器或其他處理器或加速器)提供數(shù)據(jù),而 SHMT 技術在所有組件之間同時并行執(zhí)行代碼。

2.jpg

傳統(tǒng)、現(xiàn)代異構和 SHMT 的并行化方法比較

SHMT 采用質(zhì)量感知工作偷?。≦AWS)調(diào)度策略,保持平衡控制計算質(zhì)量和工作負載,因此降低了資源調(diào)用。

SHMT runtime 系統(tǒng)將創(chuàng)建一組虛擬操作(vOPS),并劃分為一個或多個高級操作(HLOP),以便同時使用多個硬件資源。

5.jpg

根據(jù)所選政策加速 SHMT 計算

3.jpg

傳統(tǒng)計算與 SHMT 的活動和閑置消耗比較

SHMT runtime 系統(tǒng)將 HLOPS 分配到任務隊列,在目標硬件上運行。由于 HLOPS 與硬件無關,runtime 系統(tǒng)可根據(jù)需要將任務重定向到計算平臺的一個或另一個組件。

研究人員以他們創(chuàng)建的測試平臺為例,展示了新軟件庫的有效性。他們創(chuàng)造了一種混合體,既可以被視為智能手機,也可以被視為一種個人電腦,甚至是服務器。

4.jpg

該測試平臺基于一塊帶有 PCIe 接口的背板,一臺搭載英偉達 Nano Jetson 模塊組的“計算單元”,通過 M.2 Key E 插槽連接谷歌 Edge 加速器(TPU)。該模塊帶有四核 ARM Cortex-A57 處理器(CPU)和 128 個 Maxwell 架構圖形內(nèi)核(GPU)。

本系統(tǒng)的主內(nèi)存為 4 GB LPDDR4,頻率為 1600 MHz,速度為 25.6 Gbps,用于存儲一般數(shù)據(jù)。Edge TPU 模塊額外包含 8 MB 內(nèi)存,并使用 Ubuntu Linux 18.04 作為操作系統(tǒng)。

在一個使用標準測試應用程序的簡易異構平臺上運行 SHMT 軟件包的結果表明,與基本計算分配方法相比,采用最有效策略的 QAWS 框架的計算速度提高了 1.95 倍,消耗顯著降低了 51%。

這種方法如果應用于數(shù)據(jù)中心,可以在保持現(xiàn)有硬件不變的情況下,最大化性能收益。目前,所提出的解決方案尚未準備好付諸實施,但肯定會有很多人對此感興趣。


weidian.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。