糾錯(cuò)代碼 (ECC) 不僅可以增加存儲密度和帶寬,還能保持功耗中性和可靠性。本白皮書將詳細(xì)介紹個(gè)中原因以及美光 LPDDR4/LPDDR4x 如何實(shí)現(xiàn) ECC 的承諾。
LPDDR 存儲的發(fā)展歷程
隨著新的移動設(shè)備應(yīng)用不斷增多,手機(jī)和平板電腦設(shè)計(jì)師始終面臨這樣一種挑戰(zhàn),那就是如何在不影響電池續(xù)航時(shí)間的情況下增加存儲吞吐量。
2014 年推出的 LPDDR4 標(biāo)準(zhǔn)與 LPDDR3 相比,數(shù)據(jù)傳輸速率高出一倍,工作電壓有所降低,既能提高性能又能延長電池續(xù)航時(shí)間,使移動用戶的體驗(yàn)得到顯著改善。2016 年推出的
LPDDR4x 可提供比標(biāo)準(zhǔn)LPDDR4 存儲高出多達(dá) 20% 的能效,進(jìn)一步延長了電池續(xù)航時(shí)間。
圖 1:移動平臺的峰值吞吐量
LPDDR4 存儲對于可穿戴電子設(shè)備之類的物聯(lián)網(wǎng)應(yīng)用非常重要,因?yàn)楣氖沁@些應(yīng)用的關(guān)鍵設(shè)計(jì)約束因素之一。對于汽車應(yīng)用,LPDDR4 的高帶寬和功耗優(yōu)勢使之成為車載子系統(tǒng)(如中央控制臺和高級駕駛員輔助系統(tǒng)(ADAS))的理想選擇。
DRAM 發(fā)展面臨的挑戰(zhàn)
LPDDR4 規(guī)范旨在適應(yīng)DRAM 加工技術(shù)的不斷發(fā)展,其中包括縮小存儲單元的尺寸。為了在更小的空間內(nèi)保持相同的單元電容,需要運(yùn)用更復(fù)雜的制造工藝。隨著單元尺寸的縮小,單元接入設(shè)備的功能弱化,位線和列線的電阻逐漸增加,而這兩點(diǎn)都會導(dǎo)致每個(gè)存儲單元達(dá)到最高蓄能的用時(shí)增加。由于這些因素的影響,制造商要在過渡到新工藝的同時(shí)保持良率和可靠性會越來越困難。
單比特錯(cuò)誤
限制 DRAM 良率的主要因素是單比特錯(cuò)誤。在這些錯(cuò)誤中,有一小部分可能是“硬”故障位,即比特位卡在 1 或 0。此類故障都需要使用冗余元素進(jìn)行修復(fù)。當(dāng)然,大多數(shù)情況下發(fā)生故障的單比特位都很微不足道;只要它們的刷新頻率足夠高或?qū)懭霑r(shí)間較長即可正常工作。
修復(fù)這些位(在陣列中僅占很小比例)需要增加冗余元素的數(shù)量,而這會導(dǎo)致芯片的尺寸增大、復(fù)雜性提高。需要注意的是,DRAM 寫入恢復(fù)時(shí)間 (tWR) 以及 64ms 或 32ms 刷新規(guī)范的設(shè)定非常保守,旨在使大部分弱位都能通過。若沒有這些弱位,刷新和 tWR 規(guī)范就可以大幅放寬,從而帶來性能和功耗方面的優(yōu)勢。
可變刷新時(shí)間位
隨著各項(xiàng)工藝的縮減,另一個(gè)日益普遍的現(xiàn)象是可變刷新時(shí)間位(即 VRT 位)故障。這是一種偶然發(fā)生的隨機(jī)單比特故障,發(fā)生的原因在于 DRAM 加熱(即執(zhí)行焊接回流以裝配插件)后,它們的刷新時(shí)間會發(fā)生變化。盡管這些VRT 位較為罕見,但若在 DRAM 通過制造商的最終測試之后發(fā)生此類故障,將會非常麻煩,因?yàn)榇藭r(shí)修復(fù)已經(jīng)非常困難甚至無法進(jìn)行。
為了降低封裝后維修或報(bào)廢零件的成本,保持可接受的現(xiàn)場故障率,DRAM 制造商目前會在比規(guī)范要求嚴(yán)格得多的條件下測試存儲位。這樣做的目的是預(yù)先找到可能發(fā)生故障的VRT 位。
雖然這種測試在很大程度上是有效的,但卻會降低良率。更加嚴(yán)格的測試可能導(dǎo)致嚴(yán)重的“過度殺傷”,因?yàn)樵谧R別真正的 VRT 芯片的過程中,將有大量實(shí)際上并不會產(chǎn)生 VRT 故障的芯片被丟棄。此外,任何測試都不是完美的,有些 VRT 可能逃脫,最后仍會到達(dá) OEM 那里。鑒于 VRT 位一直以來造成的這些問題,存儲制造商需要實(shí)施新技術(shù)來提高未來設(shè)備的可靠性并控制其成本。
縮小存儲單元導(dǎo)致存儲制造商面臨的挑戰(zhàn)加劇。存儲制造商需要實(shí)施新技術(shù)來提高未來設(shè)備的可靠性并控制其成本。ECC 就是這樣一種技術(shù),美光科技將ECC 應(yīng)用到了移動LPDRAM 中。
ECC 技術(shù)提供了一種有效的方法來消除隨機(jī)單比特錯(cuò)誤, 從而提高系統(tǒng)可靠性。
糾錯(cuò)代碼的優(yōu)勢
糾錯(cuò)代碼 (ECC) 是一項(xiàng)成熟的存儲技術(shù),被廣泛用于各種應(yīng)用以提高可靠性。ECC 利用漢明碼為存儲
IC 提供更高水平的冗余。漢明碼會生成少量奇偶校驗(yàn)位,與用戶數(shù)據(jù)一起存儲在存儲陣列中。借助漢明碼,可以用少量比特位來保護(hù)更長的數(shù)據(jù)字。例如,美光科技的 LPDDR4 設(shè)備使用 8 個(gè)奇偶校驗(yàn)位為 128 位數(shù)據(jù)字提供糾錯(cuò)。這些奇偶校驗(yàn)位可用于檢測和糾正 128 位數(shù)據(jù)字中的單比特錯(cuò)誤。
糾正單比特錯(cuò)誤
每次數(shù)據(jù)寫入存儲時(shí),相關(guān)的奇偶校驗(yàn)位便會隨之更新。讀取數(shù)據(jù)時(shí),DRAM 會驗(yàn)證整個(gè) 136 位
(128 個(gè)數(shù)據(jù)位+ 8 個(gè)奇偶校驗(yàn)位)代碼字的完整性。如果檢測到單比特故障(例如,裝配后出現(xiàn)一個(gè) VRT 位),ECC 將自動糾正該錯(cuò)誤。鑒于同一代碼字中出現(xiàn)兩個(gè)單比特錯(cuò)誤的可能性極小,可以說ECC 技術(shù)提供了一種有效的方法來消除隨機(jī)單比特錯(cuò)誤。
由于 ECC 是一項(xiàng)被動技術(shù),因此它會自動檢測并糾正錯(cuò)誤,無需開發(fā)人員干預(yù)。此外,糾正過程對系統(tǒng)的其余部分完全透明。
降低總體擁有成本
在 LPDDR4 中加入 ECC 的另一個(gè)優(yōu)勢在于,從功耗、性能和成本角度考慮,它可以降低總體擁有成本 (TCO)。例如,在 LPDDR4 中加入 ECC 會使有功功率略有提高(約 5-7%)。這是因?yàn)榇鎯吞幚?br/>
ECC 校驗(yàn)位奇偶所需的存儲位和邏輯電路增加了。同時(shí),ECC 可以大幅降低待機(jī)和刷新功耗。設(shè)備處于睡眠模式時(shí),基于 DRAM 的存儲需要定期刷新,以替換各個(gè)存儲單元中的泄漏電流。ECC 的使用可以增加可靠性,從而使 DRAM 能夠降低自刷新率。對大多數(shù)低功耗應(yīng)用而言,面對 ECC 帶來的可靠性提升及出色的待機(jī)效率,有功電流的小幅增加已經(jīng)無關(guān)緊要了(參見圖 2 和圖 3)。
圖 2:LPDDR4 功耗對比(低功耗使用案例)
圖 3:LPDDR4 功耗對比(中高功耗使用案例)
高效節(jié)能
采用ECC 的LPDDR4 的出色能效還有助于 OEM 在遷移或過渡到新一代移動設(shè)備時(shí)實(shí)現(xiàn)功耗中性;換言之,他們可以提供更強(qiáng)大的功能,而不需要更大的電池,也不會對工作壽命產(chǎn)生負(fù)面影響。
DRAM 的故障率取決于多種因素,包括 SOC、散熱設(shè)計(jì)、DRAM 密度、DRAM 工廠工藝和測試。單比特錯(cuò)誤是最常見的已確認(rèn)故障根源。ECC 能夠有效處理單比特故障模式,顯著增強(qiáng)系統(tǒng)可靠性和早期使用期限故障率 (ELFR) 性能。
在性能方面,采用ECC 技術(shù)會使讀取延遲略有增加,但仍在指定讀取延遲值的范圍之內(nèi)。此外,為了使 DRAM 時(shí)間能夠計(jì)算奇偶校驗(yàn)位,還需要增加寫入延遲。此時(shí)間已體現(xiàn)在18ns 的tWR 規(guī)范中(與適用于LPDDR3 的 15ns 規(guī)范相比)。
有些業(yè)內(nèi)人士已考慮遷移至 45ns 的 tWR 規(guī)范以解決擴(kuò)展問題。納入 ECC 技術(shù)可以減少在 LPDDR4 規(guī)范中增加此時(shí)間的必要性。除了可以彌補(bǔ)讀取延遲少量增加造成的性能損失,免于增加tWR 還會帶來其他好處。
ECC 還需要小幅增加芯片大小,來容納奇偶校驗(yàn)位和 ECC 邏輯。不過,它為 OEM 帶來的高可靠性以及為 DRAM 制造商帶來的高良率和低測試成本足以彌補(bǔ)這部分成本。
另外,ECC 還可以改善 LPDDR4 在高溫下的性能。溫度每升高 10 ℃,DRAM 的刷新要求會增長約一倍,DRAM 的標(biāo)準(zhǔn)最高溫度是 85 ℃。移動 DRAM 也不例外;盡管通常支持高達(dá)105 ℃ 的工作溫度,但指定刷新率針對的溫度是 85 ℃。當(dāng)工作溫度為 85-95 ℃ 時(shí),存儲控制器提供的刷新率(tREFI) 必須增加一倍;當(dāng)工作溫度為 95-105 ℃ 時(shí),則必須增加三倍。這意味著,在 95-105 ℃ 下工作的 8Gb LPDDR4 存儲需要用 18% 的時(shí)間運(yùn)行全存儲體刷新命令(這部分時(shí)間不能用來執(zhí)行實(shí)用功能),而且還會消耗大量電源。或許可以在后臺執(zhí)行單存儲體刷新,但刷新過程幾乎不能間斷。當(dāng)然,隨著未來的設(shè)備密度越來越高,這種情況會變得更糟。
由于設(shè)定的刷新率非常保守,采用ECC 的 DRAM 大約可按規(guī)范中所規(guī)定刷新率的四分之一進(jìn)行刷新。這樣可以節(jié)約大量能耗,尤其是在高溫條件下。除此之外,它還能減少上述性能影響,盡管這會導(dǎo)致目前的JEDEC 規(guī)范發(fā)生變化。
對于工作溫度需要達(dá)到 105 ℃ 以上的汽車或其他應(yīng)用,采用ECC 的DRAM 可能是唯一可行的選擇。采用 ECC 的 LPDDR4 設(shè)備可以在 115-125 ℃ 的溫度范圍內(nèi)正常工作,并能提供非 ECC 設(shè)備在 95-105 ℃ 溫度范圍內(nèi)提供的刷新性能。此溫度范圍正是使用了邊緣存儲解決方案(microSD 卡)的企業(yè)級部署所具備的典型系統(tǒng)特征。
總結(jié)
為了跟上當(dāng)今移動、汽車和物聯(lián)網(wǎng)應(yīng)用的發(fā)展步伐,開發(fā)者和存儲制造商持續(xù)面臨著如何在增強(qiáng)存儲性能的同時(shí)兼顧功耗和可靠性的挑戰(zhàn)??s小芯片尺寸給制造工藝帶來的難題往往會影響存儲可靠性,使得滿足上述要求變得更具挑戰(zhàn)性。
美光科技采用 ECC 技術(shù)的 LPDDR4 和 LPDDR4x 存儲提供了一種有效的方法來消除其中一些挑戰(zhàn),同時(shí)為當(dāng)今的新一代設(shè)備提供了高帶寬和功耗優(yōu)勢。通過采用 ECC,可以自動檢測和糾正單比特錯(cuò)誤, 從而提高可靠性。待機(jī)和刷新功耗有所降低,因而可實(shí)現(xiàn)新一代設(shè)備所需的低功耗功能。高溫條件 下的性能得到提升,使工作溫度較高的汽車及其他應(yīng)用可以實(shí)現(xiàn)所需的功耗中性。
歡迎聯(lián)系您的美光銷售代表,或訪問 micron.com/lpdram,探索采用 ECC 的美光 LPDDR4/LPDDR4x 存儲如何為您帶來實(shí)現(xiàn)高性能、低功耗的機(jī)會。