前言:
近年來,邊緣計算技術(shù)試圖讓這些設備在不依賴互聯(lián)網(wǎng)的情況下仍然可以保持智能。
這些小型設備所搭載的電池電量十分有限,往往不足以處理復雜的AI任務。
因此,提高AI芯片的能效變得至關(guān)重要。
解決能源問題很關(guān)鍵
在傳統(tǒng)的芯片里,數(shù)據(jù)的計算和存儲通常在兩個獨立的單元進行。
研究發(fā)現(xiàn)在這樣的芯片中,絕大多數(shù)的能量并非用于AI計算,而是消耗在計算和存儲單元之間頻繁的數(shù)據(jù)移動中。
無人機、智能可穿戴設備和工業(yè)物聯(lián)網(wǎng)傳感器等設備都配備了AI芯片,因此計算可以在數(shù)據(jù)發(fā)源地之互聯(lián)網(wǎng)的[邊緣]進行,可以實時處理并保證數(shù)據(jù)隱私。
在今天的AI芯片中,數(shù)據(jù)處理和數(shù)據(jù)存儲在計算單元和內(nèi)存單元中。
這些單元之間頻繁的數(shù)據(jù)移動消耗了AI處理過程中的大部分能量,而微型邊緣設備上的AI功能會受到電池容量的限制。
目前,邊緣設備上的大多數(shù)AI應用程序都涉及將數(shù)據(jù)從設備移動到云端,AI在云端對其進行處理和分析,然后將結(jié)果移回設備。
雖然使用RRAM芯片進行計算不一定是新的,但通常,它會導致芯片上執(zhí)行的計算精度降低,并且芯片架構(gòu)缺乏靈活性。
因此減少數(shù)據(jù)移動是解決能源問題的關(guān)鍵。
研究小組發(fā)布新型AI芯片
斯坦福大學,加州大學圣地亞哥分校,以及清華大學合作研究團隊提出了一個新的解決方案。
研究小組已經(jīng)開發(fā)了一個新的內(nèi)存中計算(CIM:compute-in-memory)芯片的原型,消除了這種分離的需要。
他們在8月17日發(fā)表在《自然》雜志上的論文中稱,他們的原型展示了兩倍于現(xiàn)有AI平臺的效率。
這款芯片采用了基于阻變存儲器(RRAM)的[存算一體]架構(gòu)來減少數(shù)據(jù)流動。
它在支持多種AI應用的同時,大幅提升了能效,使得在邊緣設備中實現(xiàn)復雜的AI任務成為可能。
這就好比直接在倉庫中對原材料進行加工生產(chǎn),而不必頻繁地把原材料運往專門的加工車間,極大地減少了數(shù)據(jù)流動,從而大幅提升了芯片的能效。
NeuRRAM芯片的新穎之處
NeuRRAM芯片的能效不僅是目前最先進的內(nèi)存計算芯片的兩倍,而且它提供的結(jié)果也與傳統(tǒng)數(shù)字芯片一樣準確。
NeuRRAM的新穎之處在于,對于各種AI應用,極高的效率現(xiàn)在與極大的靈活性相結(jié)合,與標準數(shù)字通用計算平臺相比,精度幾乎沒有損失。
研究人員通過一種稱為能量延遲產(chǎn)物(EDP)的測量來測量芯片的能效。
NeuRRAM芯片實現(xiàn)了比最先進的芯片低1.6至2.3倍的EDP(越低越好)和7至13倍的計算密度。
它在手寫數(shù)字識別任務中實現(xiàn)了99%的準確率;85.7%用于圖像分類任務;和84.7%的谷歌語音命令識別任務。
此外,該芯片還實現(xiàn)了圖像恢復任務中圖像重建誤差降低70%。
采用新存儲技術(shù)實現(xiàn)多核存算一體
NeuRRAM芯片使用的阻變存儲器是一種新型的非易失性存儲技術(shù)。
這種技術(shù)具有高密度,非易失,易加工等優(yōu)點,是低功耗,低成本的邊緣計算場景的理想選擇。
除了更高的能效,NeuRRAM也是首個支持多種神經(jīng)網(wǎng)絡模型的多核存算一體芯片。
因此,NeuRRAM可以被應用到多類邊緣計算任務中,例如圖像分類,圖像去噪,關(guān)鍵詞識別。
在這些不同應用中,NeuRRAM均可實現(xiàn)和傳統(tǒng)數(shù)字芯片相當?shù)腁I推理準確度。
NeuRRAM還不是一顆產(chǎn)品級芯片,但是它驗證了全棧式優(yōu)化對于該技術(shù)產(chǎn)業(yè)化的重要性。
這款NeuRRAM神經(jīng)形態(tài)芯片使AI離在與云斷開的廣泛邊緣設備上運行又近了一步。
架構(gòu)設計有別于傳統(tǒng)芯片
在NeurRRAM架構(gòu)中,CMOS神經(jīng)元電路與RRAM權(quán)重在物理上交錯。
它與傳統(tǒng)設計不同,傳統(tǒng)設計中的CMOS電路通常位于RRAM砝碼的外圍。
神經(jīng)元與RRAM陣列的連接可以配置為神經(jīng)元的輸入或輸出。
這允許神經(jīng)網(wǎng)絡在各種數(shù)據(jù)流方向上進行推理,而不會產(chǎn)生面積或功耗方面的開銷。
這反過來又使體系結(jié)構(gòu)更易于重新配置。
作為神經(jīng)形態(tài)AI芯片,NeuroRRAM在48個神經(jīng)突觸內(nèi)核上執(zhí)行并行分布式處理。
為了同時實現(xiàn)高通用性和高效率,NeuRRAM通過將神經(jīng)網(wǎng)絡模型中的一層映射到多個內(nèi)核上以對多個數(shù)據(jù)進行并行推理來支持數(shù)據(jù)并行性。
此外,NeuRRAM通過將模型的不同層映射到不同的內(nèi)核并以流水線方式執(zhí)行推理來提供模型并行性。
將推動未來的邊緣計算
目前,NeuRRAM只是一種物理概念層面的驗證,但要轉(zhuǎn)化為實際的邊緣設備則需要更多開發(fā)。
這種結(jié)合效率、準確性和執(zhí)行不同任務的能力充分展示了芯片的潛力。
如果成功,像NeuRRAM這樣的RRAM內(nèi)存計算芯片具有幾乎無限的潛力。它們可以嵌入農(nóng)田進行實時AI計算,根據(jù)當前土壤條件調(diào)整灌溉系統(tǒng)。
大規(guī)模生產(chǎn)這些芯片會更加便宜,且適應性強、功耗低,可以用于改善我們的日常生活,如用于家庭健康監(jiān)測的醫(yī)療設備。
也可用于解決從氣候變化到糧食安全的各種問題。
AI計算是非常消耗能源的,但大部分的能源消耗不是由計算本身造成的。能源密集型部分是在AI芯片內(nèi)的內(nèi)存和計算單元之間移動數(shù)據(jù)。
結(jié)尾:
現(xiàn)在考慮商業(yè)化的問題還為時過早。
雖然他們認為該芯片的高效硬件實現(xiàn)與內(nèi)存中計算是一個成功的組合,但廣泛采用仍將取決于能否降低能效基準。
部分資料參考:澎湃新聞:《Nature:新型AI芯片大幅提升能效,邊緣物聯(lián)網(wǎng)時代即將到來?》,智科院:《新的AI芯片的能源效率是替代品的兩倍》
更多信息可以來這里獲取==>>電子技術(shù)應用-AET<<