過(guò)去70年,計(jì)算機(jī)一直遵循馮·諾依曼架構(gòu)設(shè)計(jì),運(yùn)行時(shí)數(shù)據(jù)需要在處理器和內(nèi)存之間來(lái)回傳輸。
隨著時(shí)代發(fā)展,這一工作模式面臨較大挑戰(zhàn):在人工智能等高并發(fā)計(jì)算場(chǎng)景中,數(shù)據(jù)來(lái)回傳輸會(huì)產(chǎn)生巨大的功耗;目前內(nèi)存系統(tǒng)的性能提升速度大幅落后于處理器的性能提升速度,有限的內(nèi)存帶寬無(wú)法保證數(shù)據(jù)高速傳輸。
12月3日,快科技獲悉,達(dá)摩院成功研發(fā)新型架構(gòu)芯片。該芯片是全球首款基于DRAM的3D鍵合堆疊存算一體AI芯片,可突破馮·諾依曼架構(gòu)的性能瓶頸,滿足人工智能等場(chǎng)景對(duì)高帶寬、高容量?jī)?nèi)存和極致算力的需求。
在特定AI場(chǎng)景中,該芯片性能提升10倍以上,能效比提升高達(dá)300倍。
在摩爾定律逐漸放緩的背景下,存算一體成為解決計(jì)算機(jī)性能瓶頸的關(guān)鍵技術(shù)。
存算一體芯片類似人腦,將數(shù)據(jù)存儲(chǔ)單元和計(jì)算單元融合,可大幅減少數(shù)據(jù)搬運(yùn),從而極大地提高計(jì)算并行度和能效。
這一技術(shù)早在上世紀(jì)90年代就被提出,但受限于技術(shù)的復(fù)雜度、高昂的設(shè)計(jì)成本以及應(yīng)用場(chǎng)景的匱乏,過(guò)去幾十年,業(yè)界對(duì)存算一體芯片的研究進(jìn)展緩慢。
達(dá)摩院研發(fā)的存算一體芯片集成了多個(gè)創(chuàng)新型技術(shù),是全球首款使用混合鍵合3D堆疊技術(shù)實(shí)現(xiàn)存算一體的芯片。該芯片內(nèi)存單元采用異質(zhì)集成嵌入式DRAM(SeDRAM),擁有超大帶寬、超大容量等特點(diǎn);計(jì)算單元方面,達(dá)摩院研發(fā)設(shè)計(jì)了流式的定制化加速器架構(gòu),對(duì)推薦系統(tǒng)進(jìn)行“端到端”的加速,包括匹配、粗排序、神經(jīng)網(wǎng)絡(luò)計(jì)算、細(xì)排序等任務(wù)。
得益于整體架構(gòu)的創(chuàng)新,該芯片同時(shí)實(shí)現(xiàn)了高性能和低系統(tǒng)功耗。在實(shí)際推薦系統(tǒng)應(yīng)用中,相比傳統(tǒng)CPU計(jì)算系統(tǒng),存算一體芯片的性能提升10倍以上,能效提升超過(guò)300倍。該技術(shù)的研究成果已被芯片領(lǐng)域頂級(jí)會(huì)議ISSCC 2022收錄,未來(lái)可應(yīng)用于VR/AR、無(wú)人駕駛、天文數(shù)據(jù)計(jì)算、遙感影像數(shù)據(jù)分析等場(chǎng)景。
達(dá)摩院計(jì)算技術(shù)實(shí)驗(yàn)室科學(xué)家鄭宏忠表示:“存算一體是顛覆性的芯片技術(shù),它天然擁有高性能、高帶寬和高能效的優(yōu)勢(shì),可以從底層架構(gòu)上解決后摩爾定律時(shí)代的芯片性能和能耗問(wèn)題,達(dá)摩院研發(fā)的芯片將這一技術(shù)與場(chǎng)景緊密結(jié)合,實(shí)現(xiàn)了內(nèi)存、計(jì)算以及算法應(yīng)用的完美融合?!?/p>
據(jù)悉,達(dá)摩院計(jì)算技術(shù)實(shí)驗(yàn)室專注研究芯片設(shè)計(jì)方法學(xué)和新型計(jì)算機(jī)體系結(jié)構(gòu)技術(shù),已擁有多項(xiàng)領(lǐng)先成果,在ISSCC、ISCA、MICRO、HPCA等頂級(jí)會(huì)議上發(fā)表多篇論文。