《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 可編程邏輯 > 業(yè)界動(dòng)態(tài) > GSA Memory+ 會(huì)議札記

GSA Memory+ 會(huì)議札記

2019-07-24
關(guān)鍵詞: Memory 計(jì)算 CPUGPU

  何能夠讓計(jì)算Memory水乳交融,這個(gè)看起來(lái)的確是一個(gè)一石二鳥(niǎo)的想法。畢竟,作為CPU/GPU以及memory,從本質(zhì)上大家都是門(mén)電路,沒(méi)理由不在一起。在這里,就需要認(rèn)真地再?gòu)?fù)習(xí)一下memory的類(lèi)別了。

微信圖片_20190724121150.jpg

  在易失的存儲(chǔ)器中,主要就是SRAM和DRAM。兩者都?xì)v史相對(duì)比較悠久的器件。而且,在大部分的心目中DRAM就是memory的缺省候選。對(duì)于DRAM來(lái)講,有一篇神文值得安利?!禬hat Every Programmer Should Know About Memory》[1],其中基本上介紹了程序員需要關(guān)心的Memory相關(guān)的信息,特別集中在DRAM上。當(dāng)然,如果要寫(xiě)What Every Designer Should Know About Memory, 估計(jì)要關(guān)注SRAM了。

  DRAM和SRAM的主要區(qū)別如下:

 微信圖片_20190724121154.jpg

  可以看出,SRAM相對(duì)于DRAM,需要更多的晶體管來(lái)實(shí)現(xiàn)。SRAM的好處是:

  1. 不需要Refesh的電路,每個(gè)Cell的內(nèi)容在寫(xiě)入之后,會(huì)一直保存到掉電為止。而DRAM則需要在10-100ms的時(shí)間級(jí)別進(jìn)行Refresh。

  2. SRAM的抗干擾能力要比DRAM強(qiáng),這個(gè)也是那些晶體管的主要用處。

  這里面沒(méi)有提另一個(gè)關(guān)鍵的信息,就是功耗。對(duì)于一般的情況下,因?yàn)镈RAM需要周期性地refresh,因此功耗比較大。但是SRAM自身功耗和主頻的關(guān)系比較大,如果整個(gè)系統(tǒng)的時(shí)鐘很高的話,SRAM的功耗可能會(huì)超過(guò)DRAM。

  對(duì)于Memory來(lái)講,定義它的主要性質(zhì)的基本因素就是Cell,每一個(gè)Cell在RAM中代表一個(gè)Bit,但是更重要的是memory的array,任何的memory都不是單個(gè)cell的操作,而是需要array level的操作。


微信圖片_20190724121206.jpg

  這個(gè)是memory cell 和memory array的示意圖,可以看出,wordline 和bitline 是memory cell的基本概念,wordline 也是地址線,性質(zhì)和enable類(lèi)似,主要是來(lái)決定memory array中的一行cell可以被讀取或者寫(xiě)入。當(dāng)然,wordline的信息對(duì)應(yīng)的地址是唯一的,而且在任意時(shí)間,只有一個(gè)workline處于High,也就是enable。

  Bitline就是memeory的真正位寬了,因?yàn)榉N種原因,內(nèi)存的cell的word line 和bitline不沒(méi)有做成完全的nxn的array,代表的地址的word line 總是要比bitline大很多,因此有了RAS和CAS的概念,先選ROW,再下一個(gè)周期選COL。對(duì)于Bitline,和目前的DDR相關(guān)的BANK的概念就是擴(kuò)展Bitline常用的方式。

微信圖片_20190724121258.jpg

  到這里,大家算是對(duì)于DRAM的memory array有了了解。切入正題,段博士的老板,也就是謝源教授在一個(gè)方向上的試探。[2]

微信圖片_20190724121252.jpg

  有興趣的自然自己可以去看原論文,這里只是貼上原文的總結(jié)?!?/p>

  We compare four different DRISA designs and conclude that 1T1C -nor/mixed are the best choices. We then present a case study where

  we evaluate CNN applications on DRISA. With the benefit of in-situ computing, DRISA shows 8.8X speedup and 1.2Xbetter energy

  effciency when compared with ASICs, and 7.7Xspeedup and 15Xbetter energy effciency than GPUs”。

  個(gè)人認(rèn)識(shí)是一個(gè)試探的原因有兩個(gè)方面:

  因?yàn)镈RAM的商業(yè)壁壘太高,我們有基于Xilinx的FPGA做NVDIMM的客戶(hù),他們的商業(yè)模式都是自己做控制器和系統(tǒng)的開(kāi)發(fā),最后交DRAM廠家上產(chǎn)線生產(chǎn)組裝。因?yàn)镈RAM的高度壟斷,因?yàn)槿魏位贒RAM方向的創(chuàng)新都需要他們的支持,目前來(lái)看,這些巨頭對(duì)于這個(gè)方向并沒(méi)有興趣。而且其中Micron在2015-2016年在異構(gòu)計(jì)算上的很多投資基本上都失敗了。謝老師的合作伙伴Samsung電子,估計(jì)也是玩票性質(zhì)。

  和之前講的計(jì)算和存儲(chǔ)結(jié)合不同,這種方式需要對(duì)memory array做非常細(xì)致的拆解,而且處處定制。這個(gè)和GPU或者ASIC方案對(duì)比,實(shí)用性太差了。而且,相對(duì)與GPU 15X的性能功耗比,在2019大放異彩的以色列ASIC面前,基本上可以或略不濟(jì)。

  我曾在2017年的CNCC的會(huì)上,問(wèn)謝老師,他的HBM在從提出到商業(yè)使用,基本上只花了不到10年的時(shí)間,這個(gè)真的很NB了。對(duì)于他的in-suite accelerator,他認(rèn)為要花多久?謝老師很有風(fēng)度的回避了這個(gè)問(wèn)題。[3]

  于是,這個(gè)革命的重任再次落到了NVM身上,誕生于1985年的NOR和NAND先完成了存儲(chǔ)行業(yè)的革命,他們的近親們現(xiàn)在在解決了random access的同時(shí),希望利用array來(lái)解決計(jì)算問(wèn)題。

  目前來(lái)看,大家認(rèn)為通過(guò)對(duì)于未來(lái)的可以支持Random access, byte address的新型非易失存儲(chǔ)在架構(gòu)上的優(yōu)化來(lái)做到一石二鳥(niǎo)充滿(mǎn)信心。段博士引用了幾篇最近的論文,基本上都是基于MRAM[4]和ReRAM[5]的。MRAM在2018年的FMS上有幾個(gè)相關(guān)的專(zhuān)題,但是從目前來(lái)看,MRAM的制程不能隨工藝縮小,人家Samsung都在用1Y做DRAM了,他還在40nm。而ReRAM曾經(jīng)是HP和Sandisk 的深度合作的基礎(chǔ),但是現(xiàn)在也是物是人非。

  雖然工業(yè)界對(duì)于NVM和ML結(jié)合的熱潮有所下降,但是目前的學(xué)術(shù)屆還是非常積極的。有很多不錯(cuò)的綜述文章讓大家上手。因?yàn)楸咀髡卟攀鑼W(xué)淺,下一個(gè)關(guān)于ReRAM和MRAM相結(jié)合的文章目前沒(méi)有時(shí)間表。作為補(bǔ)償,給大家一個(gè)彩蛋,上上周在硅谷的中美半導(dǎo)體"Breaking the memory wall" [6],有興趣的可以看看。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。