123,123

DDR/HBM/HMC三强争霸新一代内存/显存技术路线解读

日期： 2017-01-07

關(guān)鍵詞： 显存内存处理器 Intel

每次有新聞提到PC市場銷量下滑，可愛的讀者們往往會調(diào)侃兩家公司——“Intel，你又擠牙膏了，SNB還能戰(zhàn)三年”，還有一個想努力擠牙膏但新牙膏上市延期、只能先上PPT的AMD。五年多前的SNB處理器+4GB DDR3內(nèi)存的確還能再戰(zhàn)，但是公平地說，計算機性能實際上一直在不斷增長，2011年的TOP500冠軍是日本京/K計算機，性能只有8.2PFLOPS（千萬億次），內(nèi)存容量141TB，2016上半年的TOP500冠軍是中國的太湖之光，浮點性能93PFLOPS，內(nèi)存容量1.31PB，差不多都是5年前的10倍。

未來幾年將實現(xiàn)百億億次計算，對處理器及內(nèi)存的要求都很高

五年前的高性能計算剛剛達到1億億次，今年太湖之光剛剛實現(xiàn)了10億億次，2020年之前的目標是實現(xiàn)百億億次，也就是exaFLOPS級別，包括中國、美國、日本和歐盟在內(nèi)，百億億次計算是世界各國都在爭奪的下一個制高點，它不僅對主處理器/協(xié)處理器提出了極高的要求，支撐起如此龐大運算規(guī)模也需要在網(wǎng)絡連接、高速內(nèi)存等子系統(tǒng)上實現(xiàn)突破。

處理器方面陸續(xù)將會有Intel下一代Xeon處理器、IBM Power 9及AMD Zen，加速卡也有NVIDIA Volta、AMD Navi等，下一代內(nèi)存技術(shù)則會有DDR5、HBM、HMC等，它們還會根據(jù)不同應用范圍衍生出多個版本。今天我們來聊聊未來的集中內(nèi)存（也包括顯存）技術(shù)的走向及特點。

HBM的出現(xiàn)代表著3D堆棧的新一代內(nèi)存技術(shù)日趨實用化

從Haswell-E處理器開始，內(nèi)存就開始從DDR3向DDR4升級，經(jīng)過2年多時間的磨合，到了今年DDR4內(nèi)存也可以說是白菜價了。2015年AMD推出了Fiji核心的Fury系列顯卡，它使用的是HBM顯存，與之前的GDDR5顯存不同，HBM可以說是普通人接觸到的第一款3D堆棧內(nèi)存，它代表著未來，而DDR內(nèi)存則是主流代表，下一步是DDR5內(nèi)存，再加上美光、Intel主導的HMC內(nèi)存，這三者以及它們的衍生品可以說是2020年之前內(nèi)存/顯存技術(shù)角逐天下的主角了。

內(nèi)存/顯存技術(shù)路線圖

預測DDR、HBM及HMC三強爭霸的結(jié)局還太早了，要想分出勝負我們還得掂量掂量這三者在性能、功耗及成本上的表現(xiàn)。

DDR5/HBM/HMC內(nèi)存及顯存規(guī)范簡介

DDR5：內(nèi)存正統(tǒng)續(xù)作，顯存/移動內(nèi)存之基礎(chǔ)

2014年隨著Hasewll-E處理器及X99主板的問世，DDR4內(nèi)存首次進入桌面市場，不過X99平臺是面向發(fā)燒級玩家的，到了2015年Intel又推出了Skylake處理器，這才算是走入主流市場。經(jīng)過這兩年的發(fā)展，DDR4內(nèi)存已經(jīng)從王謝堂前燕飛入尋常百姓家了，性價比完全不輸DDR3內(nèi)存。

對于DDR4內(nèi)存，我們之前在三位一體升級換代，Haswell-E、X99及DDR4前瞻一文中已經(jīng)詳細解析過它與DDR3內(nèi)存的不同，簡單來說就是在基礎(chǔ)頻率無法大幅提升的情況下，DDR4通過翻倍提升顯存核心的Bank（內(nèi)存庫）數(shù)量變相提高了數(shù)據(jù)吞吐率，其數(shù)據(jù)頻率可從前代的0.8-2.1Gbps大幅提升到1.6-3.2Gbps，進而提高了內(nèi)存帶寬。

此外，DDR4內(nèi)存的電壓也從前代的1.5V降低到了1.2V，提高了能效，而隨著工藝的進步，DDR4內(nèi)存的核心容量也從之前4Gb提升到了8Gb、16Gb，可以輕松實現(xiàn)單條64GB以及128GB內(nèi)存，這些都是它比DDR3內(nèi)存先進的地方。

目前高頻DDR4內(nèi)存頻率已經(jīng)達到了4.26Gbps，差不多又到了一個極限了，下一步該準備DDR4的繼任者了，不出意外的話，其命名就是DDR5，技術(shù)路線也類似DDR3到DDR4那樣，核心頻率同樣不會有大幅提高，能做文章的地方還是數(shù)據(jù)預取位寬、內(nèi)存庫數(shù)量等。

DDR5內(nèi)存目前還在研發(fā)階段，尚未有具體規(guī)范，所以廠商公布的很多規(guī)格都不是確定的，其目標是相比DDR4內(nèi)存至少帶寬翻倍，容量更大，同時更加節(jié)能，具體來說就是數(shù)據(jù)頻率從目前1.6-3.2Gbps的水平提升到3.2-6.4Gbps，預取位寬從8bit翻倍到16bit，內(nèi)存庫提升到16-32個。

至于電壓，DDR4電壓已經(jīng)降至1.2v，DDR5有望降至1.1v或者更低。

在三星討論的DDR5內(nèi)存規(guī)范中，其目標跟美光基本一致，也是帶寬至少翻倍，預取位寬也會翻倍，不過內(nèi)存庫數(shù)量還是16個，與美光公布的數(shù)據(jù)略有不同。

不過在時間點上，業(yè)界還是有一定共識的——DDR5預計在2017年完成規(guī)范制定，2018年出樣，2019年開始生產(chǎn)，不過要普及的話估計至少是2020年的事了。

此外，盡管美光、三星都沒提制程工藝的問題，不過2018年10nm工藝已經(jīng)量產(chǎn)了，2020年左右則是7nm節(jié)點了，而目前DDR4最先進的工藝是18nm，到了2020年那個時間段，內(nèi)存也會殺向10nm以下節(jié)點的。

DDR5內(nèi)存衍生版之GDDR6顯存

說DDR5內(nèi)存是最正統(tǒng)的內(nèi)存續(xù)作，不僅因為它是最主流的內(nèi)存選擇，還與它的衍生版有關(guān)——顯存用的下一代GDDR與手機、平板用的LPDDR低功耗內(nèi)存都跟DDR5息息相關(guān)，業(yè)界在討論DDR5內(nèi)存的同時，同樣也沒忘了GDDR6及未來的LPDDR5內(nèi)存。

很久之前顯卡用的顯存是跟PC內(nèi)存一樣的，但是隨著GPU性能的不斷提升，對帶寬的要求也水漲船高，普通PC內(nèi)存已經(jīng)滿足不了需要了，在DDR內(nèi)存基礎(chǔ)上就衍生出了GDDR內(nèi)存，GDDR5就是在DDR3基礎(chǔ)上衍生的，大部分規(guī)格都是相同的，不過數(shù)據(jù)預取位寬從4bit翻倍到8bit，所以帶寬在DDR3基礎(chǔ)上提高一倍，這也是其數(shù)據(jù)頻率是真實頻率4倍的由來，而普通DDR3內(nèi)存是2倍真實頻率。

在DDR5基礎(chǔ)上衍生出來的顯存就是GDDR6（雖然還不是正式定名）了，它的實際頻率與目前高頻GDDR5內(nèi)存差不多，都是1.75GHz左右，但因為預取位寬再次翻倍，數(shù)據(jù)頻率則會從7Gbps提升到14+Gbps，這個思路其實跟美光主推的GDDR5X顯存是一樣的，同樣是在不提高實際頻率的情況下通過提升預取位寬實現(xiàn)帶寬提升。

當然，為了進一步降低功耗，GDDR6顯存的電壓也會從目前1.5V降至1.35V。

低功耗LPDDR內(nèi)存也會在DDR5基礎(chǔ)上演進，其速率也能達到6.4Gbps，不過電壓則會進一步降低，目前LPDDR4已經(jīng)是1.1v電壓了，LPDDR5電壓會低于1.1v，目標是實現(xiàn)20%的能效提升。

HBM：第三代性能更強大，但降低成本也很重要

2015年AMD推出了Fiji核心的Fury系列顯卡，雖然推出的三款顯卡都是面向高端市場的，售價比較高，但從技術(shù)上來說Fury系列顯卡絕對是顯卡史上的一次重大變革，因為它用上了HBM顯存，它不僅僅是性能更強大，最重要的是HBM顯存極大地減少了PCB面積占用，可以把高端顯卡做的非常小巧，AMD的R9 Nano顯卡是2015年讓筆者印象最深刻的產(chǎn)品，比GTX Titan X和GTX 980 Ti更有意義。

對于HBM顯存，我們之前在評測及解析中也詳細說過它的特點和優(yōu)勢了，詳情可以參考：AMD詳解HBM顯存：性能遠超GDDR5，功耗降50%，面積小94%，一句話來說就是HBM在電壓只有1.2V的情況下將顯存帶寬提升到512GB/s，性能更強，功耗更低，占用面積更小。

到了2016年，HBM顯存又進化到了第二代，并正式成為JEDEC標準。與前代產(chǎn)品相比，HBM 2顯存核心容量從2Gb提升到8Gb，數(shù)據(jù)頻率從1Gbps提升到2Gbps，帶來的好處就是在同樣4-hi堆棧下，HBM 2單顆顯存容量可達4GB，帶寬1024GB/s。

HBM顯存最早是AMD和SK Hynix聯(lián)合研發(fā)的，第一代HBM顯存主要是SK Hynix在生產(chǎn)，HBM 2時代NVIDIA、三星也參與進來了，前者首發(fā)了HBM 2顯存的Tesla P100加速卡，SK Hynix也開始量產(chǎn)HBM 2顯存了，有2-hi、4-hi、8-hi三種堆棧方式，頻率1.0、1.6及2.0Gbps，帶寬分別是128、204256GB/s，堆棧容量2、4、8GB，最高可實現(xiàn)32GB堆?？?cè)萘浚?024GB/s帶寬。

HBM 2還沒上市，三星已經(jīng)在討論HBM 3顯存了，預計在2019-2020年問世，不過目前并沒有確切的規(guī)格。從三星的表態(tài)來看，HBM 3會進一步提高堆棧層數(shù)、核心容量及帶寬，但在核心頻率、內(nèi)存庫、DQ位寬方面保持HBM 2的水平，不過就算提升容量和堆棧層數(shù)，也足夠HBM 3容量翻倍、帶寬翻倍了，64GB HBM 3容量不是夢。

值得注意的是，HBM 3顯存的電壓預計會比目前1.2v低得多，這有助于大幅降低HBM 3功耗。

從HBM顯存問世開始，我們就知道它是個好東西，各方面完勝GDDR顯存——除了成本太高，因為HBM顯存是新標準，產(chǎn)能不足，而且它是2.5D堆棧的，制造工藝比GDDR5顯存復雜多了，這都加劇了HBM顯存的普及難度。

在這方面，三星一方面在推進更高性能的HBM 3，同時也在探討研發(fā)低成本的HBM，通過移除ECC校驗、緩沖器層、減少I/O及降低TSV數(shù)量（TSV工藝中打孔數(shù)量越多，性能越好，但會更復雜），這些手段有助于減少HBM成本，雖然這會對HBM性能造成一定影響，I/O位寬從1024bit減少到512bit，但可以通過其他手段彌補，比如提高數(shù)據(jù)頻率到3Gbps，這樣一來低成本HBM的帶寬會從256GB/s降低到200GB/s左右，還在可接受范圍內(nèi)，而制造成本就低多了。

對HBM來說，阻礙它普及的最大障礙就是成本了，一旦低成本HBM得以實現(xiàn)，那么HBM就有可能不再局限于高端顯卡之中，CPU也可以拿它來做緩存了。

HMC：不同于HBM的3D內(nèi)存，美光獨立支撐

如同閃存從2D NAND轉(zhuǎn)向3D NAND一樣，內(nèi)存也要從平面轉(zhuǎn)向3D立體，前面的HBM就是3D內(nèi)存技術(shù)的一種，不過它并非唯一選擇，美光、Intel還有HMC（Hybrid Memory Cube）內(nèi)存，它也是通過TSV硅穿孔工藝堆棧多層DRAM核心以實現(xiàn)3D堆棧的。

實現(xiàn)3D堆棧之后，HMC也可以搭積木一樣堆疊內(nèi)存核心了，帶來的優(yōu)勢就是：

·性能更強，帶寬是DDR3內(nèi)存的15倍

·功耗更低，功耗比DDR4減少70%

·占用面積更小，比DDR4減少90%

·設(shè)計更簡單，通道復雜性比DDR4減少88%

HMC與HBM都是TSV工藝的堆棧內(nèi)存，很容易混淆，不過具體結(jié)構(gòu)上HMC內(nèi)存與HBM還是有很大不同的，它可以分為三個層次——頂部的是堆棧的DRAM核心，中間有個邏輯層（logic Layer），最下面則是封裝層（package）。

HMC與處理器的連接方式也不同，HBM有個工藝復雜的中介層，打通了處理器與HBM芯片，而HMC與處理器連接是靠4條高速Link，每條Link有16個通道，速度最高可達30Gbps，典型速度有10Gbps、15Gbps、25Gbps。如果是4-link、10Gbps速度，那么帶寬可達160GB/s，15Gbps速度則是240GB/s，美光還在開發(fā)8-link HMC，帶寬可上320GB/s。

美光目前量產(chǎn)的HMC單顆容量2GB，核心容量為4Gb，4層堆棧，帶寬160GB/s，算起來性能比HBM 2顯存的256GB/s要差一些，不過HMC相比HBM還有個優(yōu)勢，那就是HBM的高帶寬需要離處理器很近，顯卡跟HBM都是封裝在一起的，所以制造工藝復雜，成本太高，而HMC通過Link與處理器相連，既可以做近場內(nèi)存(near memory)，也可以距離遠點（far memory），部署更加靈活。

不過與HBM顯存受到顯卡、FPGA追捧不同，HMC推廣的力度就小多了，盡管HMC陣營也有三星、SK Hynix參與，但真正在推的只有美光、Intel，Intel代號“Knights Landing”的Xeon Phi上使用了16GB片上緩存，就是美光提供的HMC，號稱是DDR4內(nèi)存的5倍性能、5倍能效，同時面積占用只有后者1/3。

HMC的規(guī)范發(fā)展已經(jīng)到了2.0時代，據(jù)說美光今年還要推出HMC 3.0規(guī)范，Link數(shù)量、堆棧層數(shù)、核心容量都有進一步提高，帶寬可提升到480GB/s，該指標跟HBM 3差不多同級了。

小結(jié)：

本文主要介紹了2020年之前新一代內(nèi)存/顯存技術(shù)路線，DDR5內(nèi)存的發(fā)展是按部就班，DDR5技術(shù)使用傳統(tǒng)思路提升帶寬、降低能耗，而HBM及HMC則是3D堆棧，發(fā)展?jié)摿Ρ菵DR5更誘人，不過3D堆棧目前制造過程復雜，成本太高，主要用于高性能計算領(lǐng)域，普通消費者要想用上廉價3D內(nèi)存/顯存還要等技術(shù)成熟。

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

DDR/HBM/HMC三强争霸 新一代内存/显存技术路线解读

日期： 2017-01-07

相關(guān)內(nèi)容

DDR/HBM/HMC三强争霸新一代内存/显存技术路线解读