隨著 AI 炒作的消退和面臨新的工程挑戰(zhàn),內(nèi)存需求成為焦點(diǎn):并非每項(xiàng)機(jī)器學(xué)習(xí)和推理任務(wù)都需要先進(jìn)的內(nèi)存技術(shù)。相反,經(jīng)過(guò)驗(yàn)證的傳統(tǒng)存儲(chǔ)器可以在邊緣處理人工智能,而分布式人工智能可能正是 5G 真正需要的東西。
盡管如此,基本的推理操作已經(jīng)變得越來(lái)越復(fù)雜??傮w而言,內(nèi)存將有望為推理做更多的事情。
TECHnalysis Research 總裁兼首席分析師 Bob O'Donnell 認(rèn)為,人工智能是實(shí)現(xiàn) 5G 承諾不可或缺的一部分。只有將兩者結(jié)合起來(lái),才能實(shí)現(xiàn)新的應(yīng)用?!熬哂兄S刺意味的是,每個(gè)人都將這些都視為獨(dú)立的動(dòng)物:5G 是一回事,邊緣是另一回事。人工智能是另一回事。你真的需要將這些東西結(jié)合起來(lái),讓它們中的任何一個(gè)真正發(fā)揮他們的能力,”O(jiān)'Donnell 說(shuō)。
隨著邊緣處理器的發(fā)展以及諸如 LPDDR之類的存儲(chǔ)器被用于在邊緣處理平凡的 AI 任務(wù),集中式 AI 已經(jīng)在一定程度上證明了自己?!胺块g里的攝像頭可以進(jìn)行非常簡(jiǎn)單的 AI 處理,以檢測(cè)房間內(nèi)的人數(shù),從而調(diào)整 HVAC,”O(jiān)'Donnell 說(shuō)。雖然并不吸引人,但這些任務(wù)可以在一組具有適度計(jì)算和內(nèi)存能力的建筑物中本地處理——消除了將數(shù)據(jù)來(lái)回發(fā)送到云的需要。
O'Donnell 補(bǔ)充說(shuō),還有一個(gè)中間地帶,邊緣設(shè)備在本地處理數(shù)據(jù),同時(shí)具有足夠的智能,可以知道何時(shí)將文件發(fā)送到數(shù)據(jù)中心進(jìn)行“深度處理”。一個(gè)結(jié)果是改進(jìn)的算法被發(fā)送回邊緣。
“有這種持續(xù)的改進(jìn)循環(huán),”分析師說(shuō)?!斑@就是事情開始變得非常有趣的地方?!?/p>
O'Donnell 預(yù)測(cè),專用于分布式 AI 應(yīng)用程序的內(nèi)存將是相對(duì)低端的,這些內(nèi)存類型可用于各種應(yīng)用程序,例如分布式邊緣設(shè)備?!拔业牟聹y(cè)是 LPDDR 類型的存儲(chǔ)器最合乎邏輯?!?/p>
但即使是低功耗 DDR 也可以得到超越智能手機(jī)、車輛和各種邊緣端點(diǎn)中使用的典型設(shè)備類型的提升。在最近討論將內(nèi)存處理 (PIM) 技術(shù)推向主流的進(jìn)展時(shí),三星指出該技術(shù)最終可以應(yīng)用于其他類型的內(nèi)存,以支持 AI 工作負(fù)載。這可能包括 LPDDR5 用于將 AI 帶到各種端點(diǎn)設(shè)備內(nèi)的邊緣,而無(wú)需數(shù)據(jù)中心連接。
三星展示了一款性能提升一倍以上的 LPDDR5-PIM,用于語(yǔ)音識(shí)別、翻譯和聊天機(jī)器人等應(yīng)用時(shí),能耗降低了 60% 以上。
人工智能、5G
Nvidia 首席平臺(tái)架構(gòu)師 Robert Ober 指出,一些需要內(nèi)存的分布式 AI 正在幫助運(yùn)行 5G 基站。
邊緣的 5G 基礎(chǔ)設(shè)施有時(shí)比它所連接的舊基礎(chǔ)設(shè)施具有更多的帶寬,因此需要一些推斷來(lái)管理網(wǎng)絡(luò)事務(wù)。“使用顯式編程太復(fù)雜了,”O(jiān)ber 說(shuō)。
AI 的許多邊緣用例非常普通,使用的嵌入式設(shè)備需要具有較小物理和電源占用的內(nèi)存。Ober 說(shuō),挑戰(zhàn)在于,即使是邊緣的圖像識(shí)別和分類等基本 AI 功能也正在成為更大的工作。高達(dá) 4K 的更高分辨率圖像以及對(duì)更多信息和上下文的需求意味著這些神經(jīng)網(wǎng)絡(luò)更加復(fù)雜。
“如果它是一個(gè)視頻,那么隨著時(shí)間的推移,你會(huì)使用多個(gè)幀來(lái)提取意義,”O(jiān)ber 說(shuō)?!坝洃浽谀抢镎娴暮苤匾?。”
英偉達(dá)專注于數(shù)據(jù)中心培訓(xùn)工作負(fù)載,其中內(nèi)存容量和帶寬至關(guān)重要,同時(shí)降低功耗,Ober 說(shuō)。因此,不同的內(nèi)存技術(shù)可以在未來(lái)的 AI 部署中發(fā)揮作用,包括電壓控制的 MRAM,它可以降低功耗、維持帶寬并釋放計(jì)算能力。“從長(zhǎng)遠(yuǎn)來(lái)看,你會(huì)有一些非常有趣的解決方案。”
Ober 補(bǔ)充說(shuō),即使內(nèi)存能力不斷提高以滿足 AI 的需求,預(yù)期也會(huì)提高,因?yàn)?AI 復(fù)雜性的指數(shù)級(jí)增長(zhǎng)是一致的?!澳憧梢跃幋a的知識(shí)越多,它可以做的事情就越多。” 訓(xùn)練網(wǎng)絡(luò)本質(zhì)上是對(duì)信息進(jìn)行編碼,對(duì)于邊緣設(shè)備來(lái)說(shuō)檢測(cè)狗已經(jīng)不夠了。
“他們想知道什么類型的狗。它在做什么?快樂(lè)嗎?難過(guò)嗎?預(yù)期繼續(xù)呈指數(shù)增長(zhǎng),”英偉達(dá)高管表示。
隨著機(jī)器人圖像檢測(cè)和分類等功能的改進(jìn),預(yù)計(jì)數(shù)據(jù)中心中的人工智能和機(jī)器學(xué)習(xí)工作負(fù)載將做得更多。因此,對(duì)高性能計(jì)算的需求持續(xù)存在,他說(shuō),并且總會(huì)有新的人工智能任務(wù)更復(fù)雜、需要更多時(shí)間并需要更多機(jī)器智能。
將與人工智能任務(wù)相關(guān)的數(shù)據(jù)轉(zhuǎn)移到正確的內(nèi)存中是數(shù)據(jù)中心人工智能面臨的最大挑戰(zhàn)之一。因此,也減少了將每個(gè)工作負(fù)載發(fā)送回中央云的需要,從而對(duì)內(nèi)存資源造成更大壓力。Ober 預(yù)見到新的高帶寬低功耗大容量存儲(chǔ)器的需求,因?yàn)樗举|(zhì)上是非易失性的。已經(jīng)有一些舉措在嵌入式設(shè)備(例如工業(yè)端點(diǎn))中處理 AI 工作負(fù)載,然后將一些任務(wù)轉(zhuǎn)移到本地連接 5G 的基站。
更復(fù)雜的任務(wù)將被運(yùn)送到云數(shù)據(jù)中心?!耙赃@種方式分層的工作已經(jīng)在進(jìn)行,因?yàn)樘孤实卣f(shuō),沒(méi)有足夠的帶寬回到核心?!?/p>
更多信息可以來(lái)這里獲取==>>電子技術(shù)應(yīng)用-AET<<