1月21日消息,當(dāng)你點(diǎn)開社交平臺(tái),瞬間看到心儀的電影推薦;當(dāng)購物網(wǎng)站精準(zhǔn)呈現(xiàn)你可能喜歡的商品——這些智能服務(wù)背后,是計(jì)算系統(tǒng)在海量數(shù)據(jù)中進(jìn)行的急速運(yùn)算與抉擇。
然而,支撐這一切的傳統(tǒng)計(jì)算芯片正在面臨速度與能耗的雙重壓力,科學(xué)家們將目光投向超越傳統(tǒng)數(shù)字計(jì)算的新架構(gòu)。
北京大學(xué)孫仲研究員團(tuán)隊(duì)在這一前沿領(lǐng)域取得關(guān)鍵突破,成功研發(fā)出高能效的新型專用計(jì)算芯片,首次為繁復(fù)的計(jì)算任務(wù)提供了專用硬件加速方案。
實(shí)驗(yàn)表明,相較于先進(jìn)數(shù)字芯片,該系統(tǒng)計(jì)算速度提升約12倍,能效比提升超過228倍。相關(guān)成果發(fā)表于國際期刊《自然·通訊》。
“這項(xiàng)研究瞄準(zhǔn)了機(jī)器學(xué)習(xí)中的一項(xiàng)核心任務(wù)——非負(fù)矩陣分解。該技術(shù)如同一位高效的‘?dāng)?shù)據(jù)解讀者’,能從巨量且龐雜的用戶行為、圖像像素等信息中,提煉出潛在的模式與特征,在圖像分析、信息聚類、個(gè)性化推薦等領(lǐng)域具有廣泛應(yīng)用。
然而,它的計(jì)算過程要求同步求解兩個(gè)矩陣,極為繁復(fù),依賴傳統(tǒng)數(shù)字芯片的串行計(jì)算模式,往往力不從心,成為制約實(shí)時(shí)智能的瓶頸?!睂O仲告訴記者。
正因如此,團(tuán)隊(duì)創(chuàng)新性轉(zhuǎn)向了模擬計(jì)算這一新興賽道,成功研制出基于阻變存儲(chǔ)器的非負(fù)矩陣分解模擬計(jì)算求解器。
“這就像是為一項(xiàng)特定且繁重的任務(wù),打造了一把高度定制化的‘智能鑰匙’,而非繼續(xù)使用通用的‘萬能扳手’。通過精巧的電路設(shè)計(jì)與算法協(xié)同創(chuàng)新,我們在阻變存儲(chǔ)器陣列上構(gòu)建出高度緊湊的模擬電路,并采用原創(chuàng)的電導(dǎo)補(bǔ)償技術(shù),使得核心計(jì)算步驟能夠?qū)崿F(xiàn)‘一步求解’,極大優(yōu)化了芯片的面積與能耗表現(xiàn)。”孫仲說。
為驗(yàn)證系統(tǒng)性能,研究團(tuán)隊(duì)在實(shí)驗(yàn)室中成功搭建原型系統(tǒng),并完成多組實(shí)驗(yàn)測試。
該系統(tǒng)既完成了對(duì)彩色圖像的高質(zhì)量分解,信噪比損失微乎其微;也高效處理了電影推薦數(shù)據(jù)集訓(xùn)練任務(wù),精度幾乎與數(shù)字芯片無異。
系統(tǒng)級(jí)評(píng)估顯示,在面對(duì)網(wǎng)飛規(guī)模數(shù)據(jù)集的推薦系統(tǒng)訓(xùn)練任務(wù)時(shí),該模擬求解器的計(jì)算速度較先進(jìn)數(shù)字芯片提升約12倍,而能效比更是實(shí)現(xiàn)了超過228倍的飛躍性提升。
“這項(xiàng)工作為非負(fù)矩陣分解這類約束優(yōu)化問題的實(shí)時(shí)求解開辟了新路徑,展現(xiàn)了模擬計(jì)算處理現(xiàn)實(shí)復(fù)雜數(shù)據(jù)的巨大潛力?!睂O仲說,“這意味著,未來此類高能效專用芯片,有望大幅提升個(gè)性化推薦的實(shí)時(shí)響應(yīng)能力,并為生成式AI訓(xùn)練提供更節(jié)能、更快的算力支持。”
“這項(xiàng)成果不僅拓展了高效計(jì)算架構(gòu)的應(yīng)用邊界,更為應(yīng)對(duì)人工智能時(shí)代的算力挑戰(zhàn)提供了創(chuàng)新解決方案。
隨著后續(xù)研究深入和產(chǎn)業(yè)化進(jìn)程推進(jìn),此類高能效專用計(jì)算架構(gòu)有望在更多關(guān)鍵領(lǐng)域?qū)崿F(xiàn)應(yīng)用,為我國在下一代智能計(jì)算技術(shù)競爭中構(gòu)建核心優(yōu)勢?!睂O仲期待。

