《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > EDA與制造 > 業(yè)界動(dòng)態(tài) > 存內(nèi)計(jì)算,要爆發(fā)了?

存內(nèi)計(jì)算,要爆發(fā)了?

2021-10-29
來(lái)源:半導(dǎo)體行業(yè)觀察
關(guān)鍵詞: 存內(nèi)計(jì)算

  存算一體的基本概念最早可以追溯到上個(gè)世紀(jì)七十年代,但是受限于芯片設(shè)計(jì)復(fù)雜度與制造成本問(wèn)題,以及缺少殺手級(jí)大數(shù)據(jù)應(yīng)用進(jìn)行驅(qū)動(dòng),存算一體一直不溫不火,但最近幾年,存算一體似乎已經(jīng)進(jìn)入爆發(fā)前夕。

  尤其是國(guó)內(nèi)一大批存算一體技術(shù)公司伴隨著融資信息浮出水面,如知存科技、蘋(píng)芯科技、九天睿芯、后摩智能、合肥恒爍、閃憶科技、新憶科技、杭州智芯科等,動(dòng)輒億元起的融資金額也充分證明了資本對(duì)存算一體這個(gè)賽道的青睞。國(guó)外的三星和Myhtic也是該領(lǐng)域的潛心研究者,他們近來(lái)也動(dòng)作頻頻,在最近的hotchips上,三星就披露了他們的HBM-PIM方案,Myhtic的存算一體模擬AI芯片也有了新進(jìn)展。一個(gè)新的存儲(chǔ)計(jì)算時(shí)代似乎將要來(lái)臨。

  存內(nèi)計(jì)算市場(chǎng)為何被看好?

  今年5月Myhtic C輪融資了7000萬(wàn)美元,迄今為止已共計(jì)籌集了1.65億美元;6月10日,知存科技宣布完成億元A3輪融資,產(chǎn)品線擴(kuò)充及新的產(chǎn)品量產(chǎn),加上此前的兩輪融資,截至目前,知存科技已完成累計(jì)近3億元的A輪系列融資;6月25日九天睿芯獲億元級(jí)A輪融資,用于新產(chǎn)品研發(fā)和人員擴(kuò)充的工作;7月2日,杭州智芯科完成近億元的天使輪融資,用于繼續(xù)搭建團(tuán)隊(duì),啟動(dòng)ACIM下一階段技術(shù)研發(fā)與市場(chǎng)拓展;8月24日,后摩智能宣布完成3億元人民幣Pre-A輪融資,將用于加速芯片產(chǎn)品技術(shù)研發(fā)、團(tuán)隊(duì)拓展,早期市場(chǎng)布局及商業(yè)落地;8月24日,蘋(píng)芯科技完成近千萬(wàn)美元Pre-A輪融資,據(jù)悉,本輪融資將主要用于芯片研發(fā)相關(guān)工作。

  從融資金額的用途我們也可以窺見(jiàn),這些存算一體芯片公司有的處于團(tuán)隊(duì)搭建階段,有的是正在芯片研發(fā)階段,還有的已經(jīng)到了產(chǎn)品線擴(kuò)充和量產(chǎn)階段。前幾年(2019年左右)這個(gè)市場(chǎng)國(guó)內(nèi)也就僅有3-4家嶄露頭角的企業(yè),但現(xiàn)在存算一體這個(gè)賽道顯然已經(jīng)開(kāi)始變得熱鬧起來(lái)了。

  動(dòng)輒億元的資本涌入,前仆后繼的玩家踴躍跳入。為何存算一體芯片市場(chǎng)會(huì)如此被看好?

  存算一體技術(shù)(PIM :Processing in-memory)被視為人工智能創(chuàng)新的核心。它將存儲(chǔ)和計(jì)算有機(jī)結(jié)合,直接利用存儲(chǔ)單元進(jìn)行計(jì)算,極大地消除了數(shù)據(jù)搬移帶來(lái)的開(kāi)銷,解決了傳統(tǒng)芯片在運(yùn)行人工智能算法上的“存儲(chǔ)墻”與“功耗墻”問(wèn)題,可以數(shù)十倍甚至百倍地提高人工智能運(yùn)算效率,降低成本。

  在知存科技CEO王紹迪的眼中,一直看好存算一體技術(shù)的原因有三:一是算力和運(yùn)算數(shù)據(jù)量每年都在指數(shù)級(jí)增加,然而摩爾定律已經(jīng)接近于到極限,每代芯片只有10-20%的性能提升。二是馮諾依曼架構(gòu)的算力已經(jīng)被內(nèi)存墻所限制,只有解決內(nèi)存墻問(wèn)題才能進(jìn)一步提高算力。在各種解決方案中,存內(nèi)計(jì)算是最直接也是最高效的。

  蘋(píng)芯科技CEO楊越則認(rèn)為,萬(wàn)物互聯(lián)+的人工智能的時(shí)代已經(jīng)到來(lái)。智能產(chǎn)品覆蓋面積越來(lái)越大,產(chǎn)品形態(tài)的多樣性將迎來(lái)爆發(fā)式的增長(zhǎng)。我們可以預(yù)見(jiàn),由于傳輸延遲或數(shù)據(jù)安全考慮,很多數(shù)據(jù)處理及推理運(yùn)算將在端側(cè)發(fā)生。通用性計(jì)算芯片在服務(wù)特定AI算法方面并不具備性價(jià)比優(yōu)勢(shì),為AI定制的芯片將成為人工智能產(chǎn)業(yè)鏈條上的底層核心技術(shù)。存內(nèi)計(jì)算作為創(chuàng)新性極強(qiáng)的芯片架構(gòu)形式,由于突破了困擾業(yè)界多年的存儲(chǔ)墻問(wèn)題,且與深度學(xué)習(xí)網(wǎng)絡(luò)運(yùn)算模型中的基本算子高度契合,使得基于存內(nèi)計(jì)算架構(gòu)的芯片相比于市場(chǎng)已有的AI加速芯片,在計(jì)算效率(TOPS/Watt)方面有數(shù)量級(jí)上的提升。在智能時(shí)代里,從可穿戴到自動(dòng)駕駛,功耗約束下場(chǎng)景里的計(jì)算效率都是永恒的主題,存內(nèi)計(jì)算是解放算力、提升能效比最強(qiáng)有力的武器之一。

  而且與其他低功耗計(jì)算,如低電壓亞閾值數(shù)字邏輯ASIC、神經(jīng)模態(tài)(Neuromorphics)計(jì)算和模擬計(jì)算比較,存內(nèi)計(jì)算的優(yōu)勢(shì)也盡顯。

  王紹迪表示,低功耗亞閾值計(jì)算是對(duì)現(xiàn)有邏輯計(jì)算的功耗優(yōu)化,一般能效可以提升2-4倍,但是算力相應(yīng)降低,只能進(jìn)行針對(duì)性的優(yōu)化。而存內(nèi)計(jì)算是新型的運(yùn)算架構(gòu),做的是二維和三維矩陣運(yùn)算,能效和算力可以提高100-1000倍。神經(jīng)模態(tài)運(yùn)算是為類腦算法而設(shè)計(jì)的芯片,有不同的實(shí)現(xiàn)方式,如模擬計(jì)算、數(shù)字計(jì)算、無(wú)時(shí)鐘計(jì)算、或者存算一體的實(shí)現(xiàn)方式。其實(shí)上述三種技術(shù)解決的問(wèn)題是不一樣的。后摩爾時(shí)代下,無(wú)法通過(guò)工藝的提升來(lái)優(yōu)化整體算力,異構(gòu)計(jì)算和新架構(gòu)變得更為重要。

  在楊越看來(lái),與亞閾值數(shù)字邏輯相比,存內(nèi)計(jì)算仍工作在正常供電范圍,可具有實(shí)現(xiàn)高算力的可能性。存內(nèi)計(jì)算的原理就是模擬計(jì)算。存內(nèi)計(jì)算與神經(jīng)形態(tài)計(jì)算有交集,就是用存內(nèi)計(jì)算的原理去實(shí)現(xiàn)synaptic connection,可提供高平行度、高能效地synaptic weighting的計(jì)算。

  存內(nèi)計(jì)算的三條主流技術(shù)路徑

  在認(rèn)準(zhǔn)了賽道之后,就是選擇存內(nèi)計(jì)算的技術(shù)路徑。對(duì)于存算一體技術(shù)來(lái)說(shuō),處于多種存儲(chǔ)介質(zhì)百花齊放的格局,如SRAM,DRAM,F(xiàn)lash等。目前選擇SRAM介質(zhì)陣營(yíng)的主要有蘋(píng)芯科技、后摩智能、九天睿芯。Flash陣營(yíng)的代表玩家有知存科技、合肥恒爍、美國(guó)的Mythic。DRAM陣營(yíng)的還相對(duì)偏少。

  那么該如何選擇合適的技術(shù)路徑,這些技術(shù)路徑又有何特點(diǎn)、壁壘和優(yōu)勢(shì)呢?蘋(píng)芯CEO楊越認(rèn)為,技術(shù)路線選擇的出發(fā)點(diǎn)有多個(gè),包括工藝成熟度、加入計(jì)算功能的復(fù)雜度及結(jié)果精度、向上對(duì)神經(jīng)網(wǎng)絡(luò)算法要求的支持程度、以及落地成本等方面的考慮。

  從器件工藝成熟度來(lái)看,知存科技認(rèn)為,SRAM、DRAM和Flash都是成熟的存儲(chǔ)技術(shù),其中SRAM可以在先進(jìn)工藝上如5nm上制造,DRAM和Flash可在10-20nm工藝上制造。密度方面,F(xiàn)lash最高,其次是DRAM,再次是SRAM。

  在電路設(shè)計(jì)難度上,存內(nèi)計(jì)算的DRAM > 存內(nèi)計(jì)算SRAM > 存內(nèi)計(jì)算Flash ,在存內(nèi)計(jì)算方面,SRAM和DRAM更難設(shè)計(jì),它們是易失性存儲(chǔ)器,工藝偏差會(huì)大幅度增加模擬計(jì)算的設(shè)計(jì)難度,尤其是當(dāng)容量增大到可實(shí)用的MB以上,目前市面上還沒(méi)有SRAM和DRAM的存內(nèi)計(jì)算產(chǎn)品;Flash是非易失存儲(chǔ)器,他的狀態(tài)是連續(xù)可編程的,可以通過(guò)編程等方式來(lái)校準(zhǔn)工藝偏差,從而提高精度。而近存計(jì)算的設(shè)計(jì)相對(duì)簡(jiǎn)單,可采用成熟的存儲(chǔ)器技術(shù)和邏輯電路設(shè)計(jì)技術(shù)。

  而談到量產(chǎn)難度方面,王紹迪給出的答案是DRAM> Flash >SRAM。

  “我們過(guò)去做過(guò)多種存算一體介質(zhì)的流片,包括Flash、SRAM、RRAM和MRAM。最終發(fā)現(xiàn),F(xiàn)lash是密度最高的存儲(chǔ)介質(zhì),F(xiàn)lash的單個(gè)單元可以存儲(chǔ)的bit數(shù)最高(8-bit),這兩個(gè)特點(diǎn)都可以大幅度增加存內(nèi)計(jì)算的算力?!蓖踅B迪告訴筆者,所以從密度、可量產(chǎn)性、能效層面多方面綜合考量,知存科技最終選擇了Flash介質(zhì)。

  楊越表示,F(xiàn)lash和SRAM 路線各自具備優(yōu)勢(shì)。我們選擇SRAM方案出于幾個(gè)考慮:一,SRAM的速度是所有memory類型中最快的,且沒(méi)有寫(xiě)次數(shù)的限制,對(duì)于追求快響應(yīng)的場(chǎng)景幾乎是必選。二,SRAM可以向先進(jìn)制程兼容,從而達(dá)到更高的能效比,更高的面效比等。三,蘋(píng)芯現(xiàn)階段的研究工作可大幅提高SRAM相關(guān)計(jì)算精度,從而降低了對(duì)相關(guān)上層算法補(bǔ)償?shù)囊?。四,相?duì)新型存儲(chǔ)器,SRAM的工藝成熟度較高,可以相對(duì)較快的實(shí)現(xiàn)技術(shù)落地與量產(chǎn)。

  存內(nèi)計(jì)算的最終產(chǎn)品形態(tài)

  在討論存內(nèi)計(jì)算最終的產(chǎn)品形態(tài)之前,讓我們首先來(lái)看下存內(nèi)計(jì)算的賣點(diǎn)究竟是什么?它應(yīng)該被認(rèn)為是一個(gè)有計(jì)算能力的存儲(chǔ)器,還是高能效比的計(jì)算模塊。如果是前者,則往往需要和臺(tái)積電等有志于推動(dòng)下一代存儲(chǔ)器的廠商一起合作。而后者則更傾向于以AI芯片的形式做design house。

  蘋(píng)芯CEO楊越認(rèn)為,存內(nèi)計(jì)算硬件的出現(xiàn),本身在催生一種編程觀念上的革命,也就不能再套用傳統(tǒng)的功能上分離的思維去理解。從功能上來(lái)說(shuō),存內(nèi)計(jì)算既可以存儲(chǔ)數(shù)據(jù),又可以做特定的計(jì)算,本身并不矛盾。從programmability的角度講,面向AI 的存算一體技術(shù)的出現(xiàn)將會(huì)很大程度上影響人們?nèi)绾稳ゾ帉?xiě)軟件,或者說(shuō)為更有效率的去編寫(xiě)軟件提供了一個(gè)非常好的基礎(chǔ)平臺(tái)和機(jī)會(huì)。

  知存科技王紹迪則表示,兩種方案所需要解決的問(wèn)題不一樣:1)有算力的存儲(chǔ)還是馮諾依曼架構(gòu)下的存儲(chǔ)器,做一些加密類和低算力計(jì)算,從而節(jié)省存儲(chǔ)與CPU之間的帶寬。存內(nèi)計(jì)算是非馮諾依曼架構(gòu),它通過(guò)存儲(chǔ)單元完成二維和三維矩陣運(yùn)算(這類運(yùn)算占據(jù)了AI中95%以上的算力),提供大算力,它存儲(chǔ)數(shù)據(jù)是為了高效完成運(yùn)算,本質(zhì)不是做存儲(chǔ)器。

  對(duì)于存算產(chǎn)品,有芯片和IP兩個(gè)選擇。而目前我們觀察到,大多數(shù)企業(yè)也都是以芯片為主。

  “存內(nèi)計(jì)算相關(guān)的IP是很難做的,存內(nèi)計(jì)算針對(duì)的是運(yùn)算場(chǎng)景,不是存儲(chǔ)標(biāo)品。需要針對(duì)不同場(chǎng)景的算力、成本、功耗需求提供更多種類的IP,并且針對(duì)不同的工藝去設(shè)計(jì),需要投入的周期很長(zhǎng)。從測(cè)試方面,客戶集成存算IP的芯片需要增加特殊的測(cè)試步驟。我個(gè)人覺(jué)得以單芯片和Chiplet形式提供存算一體算力是最佳的方式?!蓖踅B迪告訴筆者。

  存內(nèi)計(jì)算的應(yīng)用市場(chǎng)廣闊,但仍需時(shí)間的打磨

  關(guān)于存內(nèi)計(jì)算的具體應(yīng)用市場(chǎng)方向,王紹迪認(rèn)為,存內(nèi)計(jì)算的發(fā)展類似于存儲(chǔ)器的發(fā)展路徑,隨著設(shè)計(jì)能力不斷提升,工藝不斷成熟、算力每年可以有5-10倍提升,能效每年會(huì)有1-2倍提升,成本每年會(huì)有30-50%下降,未來(lái)的存算產(chǎn)品可以用在大多數(shù)AI應(yīng)用場(chǎng)景,因?yàn)樗杀舅懔δ苄Ф伎梢宰龅阶顑?yōu)。

  蘋(píng)芯CEO楊越的觀點(diǎn)是,存內(nèi)計(jì)算的應(yīng)用方向及產(chǎn)品形態(tài)將隨著存算技術(shù)成熟度而演進(jìn)。中早期產(chǎn)品將更多的出現(xiàn)在端側(cè)對(duì)低功耗和高能效有強(qiáng)烈需求的場(chǎng)景下。值得強(qiáng)調(diào)的是,隨著智能城市、智能生態(tài)等應(yīng)用的普及,我們預(yù)測(cè)從邊緣端接入的智能設(shè)備的市場(chǎng)體量將快速增長(zhǎng),應(yīng)用場(chǎng)景的多樣性也將不斷快速拓展。長(zhǎng)遠(yuǎn)地看,存算產(chǎn)品的適用范圍也可能會(huì)延伸至超大算力領(lǐng)域,我們將持續(xù)積極探索,為未來(lái)的應(yīng)用場(chǎng)景做好技術(shù)儲(chǔ)備與戰(zhàn)略規(guī)劃。

  據(jù)了解,目前蘋(píng)芯已開(kāi)發(fā)實(shí)現(xiàn)了多款基于SRAM的存內(nèi)計(jì)算加速單元并已完成流片,處于外部測(cè)試和demo階段,公司正與智慧穿戴、圖像物體識(shí)別領(lǐng)域的頭部客戶做技術(shù)驗(yàn)證。

  “存內(nèi)計(jì)算技術(shù)的發(fā)展是一條追求高能效計(jì)算的重要技術(shù)路線,如何有效控制存內(nèi)計(jì)算接口是一個(gè)重要挑戰(zhàn)。誰(shuí)擁有兼顧計(jì)算密度與存儲(chǔ)密度的存內(nèi)計(jì)算硬件架構(gòu),誰(shuí)就擁有了打開(kāi)高能效計(jì)算的金鑰匙。未來(lái)的存內(nèi)計(jì)算一定會(huì)滲透到大大小小各種規(guī)模的應(yīng)用中去,大大提高計(jì)算的能量效率?!睏钤教寡缘馈?/p>

  在王紹迪看來(lái),存算一體面臨的挑戰(zhàn)就是時(shí)間,還有很多事情沒(méi)有做,這些都需要通過(guò)不斷的實(shí)驗(yàn)去驗(yàn)證和解決,需要時(shí)間,它還在發(fā)展初期,有廣闊的提升空間,這也是我最喜歡它的一點(diǎn)。距離存算一體的能力極限可能還有1000倍的空間,每年我們都能把它提升2-5倍,隨著算力提升和成本降低,它應(yīng)用場(chǎng)景會(huì)越來(lái)越廣。

  寫(xiě)在最后

  “存算一體”打破了運(yùn)行70年的馮諾依曼架構(gòu),將成為AI時(shí)代主流的計(jì)算架構(gòu)。目前國(guó)內(nèi)外在存算一體方面都處于起步階段,存算一體正處于學(xué)術(shù)界向工業(yè)界遷移的關(guān)鍵時(shí)期,所以這可能是我們發(fā)展國(guó)產(chǎn)芯片的另一大重要方向。




電子技術(shù)圖片.png

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。