《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 業(yè)界動態(tài) > GSA Memory+ 會議札記

GSA Memory+ 會議札記

2019-07-24
關(guān)鍵詞: Memory 計算 CPUGPU

  何能夠讓計算Memory水乳交融,這個看起來的確是一個一石二鳥的想法。畢竟,作為CPU/GPU以及memory,從本質(zhì)上大家都是門電路,沒理由不在一起。在這里,就需要認(rèn)真地再復(fù)習(xí)一下memory的類別了。

微信圖片_20190724121150.jpg

  在易失的存儲器中,主要就是SRAM和DRAM。兩者都?xì)v史相對比較悠久的器件。而且,在大部分的心目中DRAM就是memory的缺省候選。對于DRAM來講,有一篇神文值得安利?!禬hat Every Programmer Should Know About Memory》[1],其中基本上介紹了程序員需要關(guān)心的Memory相關(guān)的信息,特別集中在DRAM上。當(dāng)然,如果要寫What Every Designer Should Know About Memory, 估計要關(guān)注SRAM了。

  DRAM和SRAM的主要區(qū)別如下:

 微信圖片_20190724121154.jpg

  可以看出,SRAM相對于DRAM,需要更多的晶體管來實現(xiàn)。SRAM的好處是:

  1. 不需要Refesh的電路,每個Cell的內(nèi)容在寫入之后,會一直保存到掉電為止。而DRAM則需要在10-100ms的時間級別進(jìn)行Refresh。

  2. SRAM的抗干擾能力要比DRAM強(qiáng),這個也是那些晶體管的主要用處。

  這里面沒有提另一個關(guān)鍵的信息,就是功耗。對于一般的情況下,因為DRAM需要周期性地refresh,因此功耗比較大。但是SRAM自身功耗和主頻的關(guān)系比較大,如果整個系統(tǒng)的時鐘很高的話,SRAM的功耗可能會超過DRAM。

  對于Memory來講,定義它的主要性質(zhì)的基本因素就是Cell,每一個Cell在RAM中代表一個Bit,但是更重要的是memory的array,任何的memory都不是單個cell的操作,而是需要array level的操作。


微信圖片_20190724121206.jpg

  這個是memory cell 和memory array的示意圖,可以看出,wordline 和bitline 是memory cell的基本概念,wordline 也是地址線,性質(zhì)和enable類似,主要是來決定memory array中的一行cell可以被讀取或者寫入。當(dāng)然,wordline的信息對應(yīng)的地址是唯一的,而且在任意時間,只有一個workline處于High,也就是enable。

  Bitline就是memeory的真正位寬了,因為種種原因,內(nèi)存的cell的word line 和bitline不沒有做成完全的nxn的array,代表的地址的word line 總是要比bitline大很多,因此有了RAS和CAS的概念,先選ROW,再下一個周期選COL。對于Bitline,和目前的DDR相關(guān)的BANK的概念就是擴(kuò)展Bitline常用的方式。

微信圖片_20190724121258.jpg

  到這里,大家算是對于DRAM的memory array有了了解。切入正題,段博士的老板,也就是謝源教授在一個方向上的試探。[2]

微信圖片_20190724121252.jpg

  有興趣的自然自己可以去看原論文,這里只是貼上原文的總結(jié)?!?/p>

  We compare four different DRISA designs and conclude that 1T1C -nor/mixed are the best choices. We then present a case study where

  we evaluate CNN applications on DRISA. With the benefit of in-situ computing, DRISA shows 8.8X speedup and 1.2Xbetter energy

  effciency when compared with ASICs, and 7.7Xspeedup and 15Xbetter energy effciency than GPUs”。

  個人認(rèn)識是一個試探的原因有兩個方面:

  因為DRAM的商業(yè)壁壘太高,我們有基于Xilinx的FPGA做NVDIMM的客戶,他們的商業(yè)模式都是自己做控制器和系統(tǒng)的開發(fā),最后交DRAM廠家上產(chǎn)線生產(chǎn)組裝。因為DRAM的高度壟斷,因為任何基于DRAM方向的創(chuàng)新都需要他們的支持,目前來看,這些巨頭對于這個方向并沒有興趣。而且其中Micron在2015-2016年在異構(gòu)計算上的很多投資基本上都失敗了。謝老師的合作伙伴Samsung電子,估計也是玩票性質(zhì)。

  和之前講的計算和存儲結(jié)合不同,這種方式需要對memory array做非常細(xì)致的拆解,而且處處定制。這個和GPU或者ASIC方案對比,實用性太差了。而且,相對與GPU 15X的性能功耗比,在2019大放異彩的以色列ASIC面前,基本上可以或略不濟(jì)。

  我曾在2017年的CNCC的會上,問謝老師,他的HBM在從提出到商業(yè)使用,基本上只花了不到10年的時間,這個真的很NB了。對于他的in-suite accelerator,他認(rèn)為要花多久?謝老師很有風(fēng)度的回避了這個問題。[3]

  于是,這個革命的重任再次落到了NVM身上,誕生于1985年的NOR和NAND先完成了存儲行業(yè)的革命,他們的近親們現(xiàn)在在解決了random access的同時,希望利用array來解決計算問題。

  目前來看,大家認(rèn)為通過對于未來的可以支持Random access, byte address的新型非易失存儲在架構(gòu)上的優(yōu)化來做到一石二鳥充滿信心。段博士引用了幾篇最近的論文,基本上都是基于MRAM[4]和ReRAM[5]的。MRAM在2018年的FMS上有幾個相關(guān)的專題,但是從目前來看,MRAM的制程不能隨工藝縮小,人家Samsung都在用1Y做DRAM了,他還在40nm。而ReRAM曾經(jīng)是HP和Sandisk 的深度合作的基礎(chǔ),但是現(xiàn)在也是物是人非。

  雖然工業(yè)界對于NVM和ML結(jié)合的熱潮有所下降,但是目前的學(xué)術(shù)屆還是非常積極的。有很多不錯的綜述文章讓大家上手。因為本作者才疏學(xué)淺,下一個關(guān)于ReRAM和MRAM相結(jié)合的文章目前沒有時間表。作為補(bǔ)償,給大家一個彩蛋,上上周在硅谷的中美半導(dǎo)體"Breaking the memory wall" [6],有興趣的可以看看。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。