《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 存算一體芯片,這幾年可能就要覆蓋從端到云

存算一體芯片,這幾年可能就要覆蓋從端到云

2021-09-17
來(lái)源: 電子工程專(zhuān)輯
關(guān)鍵詞: 存算一體 從端到云

  有關(guān)存算一體、存內(nèi)計(jì)算的概念,此前我們撰文探討過(guò)。尤其在AI發(fā)展的時(shí)代背景下,存儲(chǔ)墻問(wèn)題越來(lái)越成為算力持續(xù)提升的瓶頸,所以業(yè)界就提出了非馮(non-von Neumann)架構(gòu),將傳統(tǒng)、以計(jì)算為中心的馮諾依曼架構(gòu),變換計(jì)算范式,將部分算力下推到存儲(chǔ),也就有了存內(nèi)計(jì)算的說(shuō)法。

  這個(gè)概念有不同的實(shí)施方案,通常這種存算一體結(jié)構(gòu),可理解為在存儲(chǔ)器中嵌入算法,存儲(chǔ)單元本身就有計(jì)算能力,從理論上消除數(shù)據(jù)存取的延遲和功耗。這種芯片格外適用于神經(jīng)網(wǎng)絡(luò)。

  昨天的第二屆中國(guó)(上海)自貿(mào)區(qū)臨港新片區(qū)半導(dǎo)體產(chǎn)業(yè)發(fā)展高峰論壇的“芯”品路演活動(dòng)中,北京知存科技有限公司CEO王紹迪談到了自家的WTM2101:存算一體芯片;以及未來(lái)今年內(nèi)知存的戰(zhàn)略規(guī)劃。

  解決存儲(chǔ)墻問(wèn)題

  王紹迪給出的下面這張圖中,提及了存儲(chǔ)墻問(wèn)題存在的一些典型數(shù)據(jù);主要反映的是,隨著工藝技術(shù)的進(jìn)步,處理器計(jì)算能力越來(lái)越強(qiáng)、運(yùn)算速度越來(lái)越快,存儲(chǔ)容量越來(lái)越大,但存儲(chǔ)器帶寬卻難以獲得同比增長(zhǎng)。

1.png

  隨算力增加,處理器核心數(shù)增多,每核心可用帶寬越來(lái)越少,也就限制了整體速度?!鞍徇\(yùn)數(shù)據(jù),成為相當(dāng)大的瓶頸?!薄芭c此同時(shí)能耗也成問(wèn)題?!睆耐獠看鎯?chǔ)器,和片內(nèi)存儲(chǔ)搬運(yùn)數(shù)據(jù)的能耗差別巨大;而且“數(shù)據(jù)搬運(yùn)時(shí)間是運(yùn)算時(shí)間的幾百倍、上千倍?!?/p>

  “這也是為什么要做存算一體方案。解決存儲(chǔ)墻最根本的方案,就是把存儲(chǔ)和計(jì)算融合到一起,用存儲(chǔ)單元去做計(jì)算?!蓖踅B迪說(shuō)。

2.png

  “存內(nèi)計(jì)算這個(gè)名字可能更好,就是用存儲(chǔ)器去做計(jì)算,整體還是計(jì)算類(lèi)型的芯片。其計(jì)算介質(zhì)是存儲(chǔ)器,不是邏輯運(yùn)算單元?!鄙厦孢@張圖對(duì)比了兩者的結(jié)構(gòu)區(qū)別,其中的圓圈代表存儲(chǔ)單元。

  和傳統(tǒng)計(jì)算架構(gòu)存儲(chǔ)子系統(tǒng)每次激活一行,并依次完成數(shù)據(jù)讀取不同;存算一體架構(gòu)同時(shí)激活多行多列?!皺M軸不再是選擇信號(hào),實(shí)際上是被處理數(shù)據(jù)?!边^(guò)程中需轉(zhuǎn)換為模擬電路——此前我們也提過(guò)利用單一器件的歐姆定律完成一次乘法,然后利用基爾霍夫定律完成列累加。以此使用存儲(chǔ)器件單元完成乘加計(jì)算。

  “一個(gè)存儲(chǔ)器運(yùn)算周期可以完成100萬(wàn)次參數(shù)乘法和加法運(yùn)算,效率提升50-100倍?!憋@然這對(duì)AI而言就相當(dāng)有價(jià)值了。

  3.png

  在更具體的使用場(chǎng)景方面,面向從端側(cè)到云的AI計(jì)算,做算力彈性擴(kuò)展在存算一體的芯片產(chǎn)品上似乎也具備了天然的優(yōu)勢(shì)?!?MB、4MB、8MB存儲(chǔ)器算力相對(duì)更低,可以給端側(cè)設(shè)備去用;存算一體陣列到128MB,就可以給邊緣側(cè)了;存儲(chǔ)容量達(dá)到1GB、2GB、4GB,可提供超過(guò)1000TOPS的算力,使用云端場(chǎng)景?!?/p>

  “存算一體會(huì)花5-8年的時(shí)間去覆蓋AI運(yùn)算場(chǎng)景,就從端側(cè)和邊緣側(cè)開(kāi)始?!蓖踅B迪說(shuō)。上面這張圖也明確給出了不同場(chǎng)景的AI芯片,未來(lái)的市場(chǎng)規(guī)模及其發(fā)展?jié)摿Α@些應(yīng)當(dāng)也是眾所周知的了。

  從知存1.0到知存3.0

  從知存這家公司的發(fā)展軌跡來(lái)看,兩名創(chuàng)始人比較早就有參與美國(guó)存算一體項(xiàng)目研發(fā)的經(jīng)驗(yàn);2017年成立知存科技,并于次年拿到天使輪融資。這還是相當(dāng)年輕的一家企業(yè)。2019年,知存“與國(guó)際知名公司開(kāi)展存算一體IP研發(fā)合作,并完成IP和SoC測(cè)試芯片的流片,發(fā)布國(guó)際上首個(gè)存算一體芯片”。

  2020年,知存完成“國(guó)際首個(gè)存算一體芯片量產(chǎn)投片”,以及“國(guó)際首個(gè)存算一體SoC芯片驗(yàn)證”。這次王紹迪介紹的WTM2101存算一體芯片預(yù)計(jì)于今年第四季度量產(chǎn)??雌饋?lái)“存算一體”這個(gè)概念的發(fā)展速度遠(yuǎn)比我們預(yù)想中的快。

  4.png

  上面這張圖左側(cè)為WTM2101芯片架構(gòu)圖,有存算一體的存儲(chǔ)器主體部分“大部分運(yùn)算都通過(guò)存算一體完成”;另外也配了RISC-V CPU,提供非矩陣類(lèi)運(yùn)算。

  “對(duì)比現(xiàn)有市場(chǎng)方案的算力、功耗,WTM2101都有10倍以上的優(yōu)勢(shì)?!彪m然并不清楚這張圖中“市場(chǎng)現(xiàn)有方案”究竟是什么方案,但WTM2101這一欄所標(biāo)的算法復(fù)雜度與功耗,的確都相當(dāng)令人驚嘆。

  

  除了介紹產(chǎn)品以外,王紹迪還談到了知存的戰(zhàn)略規(guī)劃。從公司成立到2020年是“知存1.0時(shí)代”,這一階段“研發(fā)存算一體技術(shù),并應(yīng)用于語(yǔ)音場(chǎng)景”,王紹迪也再次強(qiáng)調(diào)了“我們是國(guó)際上首個(gè)技術(shù)落地的公司”。

  從今年到2024年屬于知存2.0規(guī)劃期,“進(jìn)一步推進(jìn),推進(jìn)到128MB,實(shí)現(xiàn)64-100TOPS算力級(jí)別,覆蓋端側(cè)、邊緣側(cè)場(chǎng)景。我們會(huì)選擇優(yōu)勢(shì)場(chǎng)景去落地應(yīng)用?!?/p>

  而在2024年以后,芯片“推向云端”,以1GB容量做到500-2000TOPS算力區(qū)間,且產(chǎn)品實(shí)現(xiàn)車(chē)規(guī)級(jí)的可靠性?!?025年之后,計(jì)劃推出標(biāo)準(zhǔn)化產(chǎn)品。之后產(chǎn)品不再以應(yīng)用場(chǎng)景落地為導(dǎo)向,而是像存儲(chǔ)器那樣提供不同的容量,和現(xiàn)有計(jì)算系統(tǒng)做整合,以先進(jìn)封裝技術(shù)完成這樣的整合?!薄巴瑫r(shí)我們也推出對(duì)應(yīng)的工具鏈,完全適配存算一體技術(shù),去適配主流的人工智能算法?!?/p>

  注意這張圖橫軸的營(yíng)收與縱軸市值預(yù)期,都表明這家公司在未來(lái)短期內(nèi)的發(fā)展信心就相當(dāng)充足。或許這張圖本身也能代表存算一體技術(shù)未來(lái)幾年內(nèi)的發(fā)展趨勢(shì)。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。