有關存算一體、存內(nèi)計算的概念,此前我們撰文探討過。尤其在AI發(fā)展的時代背景下,存儲墻問題越來越成為算力持續(xù)提升的瓶頸,所以業(yè)界就提出了非馮(non-von Neumann)架構(gòu),將傳統(tǒng)、以計算為中心的馮諾依曼架構(gòu),變換計算范式,將部分算力下推到存儲,也就有了存內(nèi)計算的說法。
這個概念有不同的實施方案,通常這種存算一體結(jié)構(gòu),可理解為在存儲器中嵌入算法,存儲單元本身就有計算能力,從理論上消除數(shù)據(jù)存取的延遲和功耗。這種芯片格外適用于神經(jīng)網(wǎng)絡。
昨天的第二屆中國(上海)自貿(mào)區(qū)臨港新片區(qū)半導體產(chǎn)業(yè)發(fā)展高峰論壇的“芯”品路演活動中,北京知存科技有限公司CEO王紹迪談到了自家的WTM2101:存算一體芯片;以及未來今年內(nèi)知存的戰(zhàn)略規(guī)劃。
解決存儲墻問題
王紹迪給出的下面這張圖中,提及了存儲墻問題存在的一些典型數(shù)據(jù);主要反映的是,隨著工藝技術(shù)的進步,處理器計算能力越來越強、運算速度越來越快,存儲容量越來越大,但存儲器帶寬卻難以獲得同比增長。

隨算力增加,處理器核心數(shù)增多,每核心可用帶寬越來越少,也就限制了整體速度?!鞍徇\數(shù)據(jù),成為相當大的瓶頸?!薄芭c此同時能耗也成問題?!睆耐獠看鎯ζ鳎推瑑?nèi)存儲搬運數(shù)據(jù)的能耗差別巨大;而且“數(shù)據(jù)搬運時間是運算時間的幾百倍、上千倍?!?/p>
“這也是為什么要做存算一體方案。解決存儲墻最根本的方案,就是把存儲和計算融合到一起,用存儲單元去做計算?!蓖踅B迪說。

“存內(nèi)計算這個名字可能更好,就是用存儲器去做計算,整體還是計算類型的芯片。其計算介質(zhì)是存儲器,不是邏輯運算單元。”上面這張圖對比了兩者的結(jié)構(gòu)區(qū)別,其中的圓圈代表存儲單元。
和傳統(tǒng)計算架構(gòu)存儲子系統(tǒng)每次激活一行,并依次完成數(shù)據(jù)讀取不同;存算一體架構(gòu)同時激活多行多列。“橫軸不再是選擇信號,實際上是被處理數(shù)據(jù)?!边^程中需轉(zhuǎn)換為模擬電路——此前我們也提過利用單一器件的歐姆定律完成一次乘法,然后利用基爾霍夫定律完成列累加。以此使用存儲器件單元完成乘加計算。
“一個存儲器運算周期可以完成100萬次參數(shù)乘法和加法運算,效率提升50-100倍?!憋@然這對AI而言就相當有價值了。

在更具體的使用場景方面,面向從端側(cè)到云的AI計算,做算力彈性擴展在存算一體的芯片產(chǎn)品上似乎也具備了天然的優(yōu)勢。“2MB、4MB、8MB存儲器算力相對更低,可以給端側(cè)設備去用;存算一體陣列到128MB,就可以給邊緣側(cè)了;存儲容量達到1GB、2GB、4GB,可提供超過1000TOPS的算力,使用云端場景?!?/p>
“存算一體會花5-8年的時間去覆蓋AI運算場景,就從端側(cè)和邊緣側(cè)開始。”王紹迪說。上面這張圖也明確給出了不同場景的AI芯片,未來的市場規(guī)模及其發(fā)展?jié)摿Α@些應當也是眾所周知的了。
從知存1.0到知存3.0
從知存這家公司的發(fā)展軌跡來看,兩名創(chuàng)始人比較早就有參與美國存算一體項目研發(fā)的經(jīng)驗;2017年成立知存科技,并于次年拿到天使輪融資。這還是相當年輕的一家企業(yè)。2019年,知存“與國際知名公司開展存算一體IP研發(fā)合作,并完成IP和SoC測試芯片的流片,發(fā)布國際上首個存算一體芯片”。
2020年,知存完成“國際首個存算一體芯片量產(chǎn)投片”,以及“國際首個存算一體SoC芯片驗證”。這次王紹迪介紹的WTM2101存算一體芯片預計于今年第四季度量產(chǎn)??雌饋怼按嫠阋惑w”這個概念的發(fā)展速度遠比我們預想中的快。

上面這張圖左側(cè)為WTM2101芯片架構(gòu)圖,有存算一體的存儲器主體部分“大部分運算都通過存算一體完成”;另外也配了RISC-V CPU,提供非矩陣類運算。
“對比現(xiàn)有市場方案的算力、功耗,WTM2101都有10倍以上的優(yōu)勢?!彪m然并不清楚這張圖中“市場現(xiàn)有方案”究竟是什么方案,但WTM2101這一欄所標的算法復雜度與功耗,的確都相當令人驚嘆。

除了介紹產(chǎn)品以外,王紹迪還談到了知存的戰(zhàn)略規(guī)劃。從公司成立到2020年是“知存1.0時代”,這一階段“研發(fā)存算一體技術(shù),并應用于語音場景”,王紹迪也再次強調(diào)了“我們是國際上首個技術(shù)落地的公司”。
從今年到2024年屬于知存2.0規(guī)劃期,“進一步推進,推進到128MB,實現(xiàn)64-100TOPS算力級別,覆蓋端側(cè)、邊緣側(cè)場景。我們會選擇優(yōu)勢場景去落地應用?!?/p>
而在2024年以后,芯片“推向云端”,以1GB容量做到500-2000TOPS算力區(qū)間,且產(chǎn)品實現(xiàn)車規(guī)級的可靠性?!?025年之后,計劃推出標準化產(chǎn)品。之后產(chǎn)品不再以應用場景落地為導向,而是像存儲器那樣提供不同的容量,和現(xiàn)有計算系統(tǒng)做整合,以先進封裝技術(shù)完成這樣的整合?!薄巴瑫r我們也推出對應的工具鏈,完全適配存算一體技術(shù),去適配主流的人工智能算法?!?/p>
注意這張圖橫軸的營收與縱軸市值預期,都表明這家公司在未來短期內(nèi)的發(fā)展信心就相當充足?;蛟S這張圖本身也能代表存算一體技術(shù)未來幾年內(nèi)的發(fā)展趨勢。
