《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 解決方案 > ECC 為移動設(shè)備提升可靠性和能效

ECC 為移動設(shè)備提升可靠性和能效

2017-06-28
關(guān)鍵詞: 美光 DRAM LPDDR4 傳輸速率

       圖片1.png糾錯代碼 (ECC) 不僅可以增加存儲密度和帶寬,還能保持功耗中性和可靠性。本白皮書將詳細(xì)介紹個中原因以及美光 LPDDR4/LPDDR4x 如何實現(xiàn) ECC 的承諾。

LPDDR 存儲的發(fā)展歷程
       隨著新的移動設(shè)備應(yīng)用不斷增多,手機(jī)和平板電腦設(shè)計師始終面臨這樣一種挑戰(zhàn),那就是如何在不影響電池續(xù)航時間的情況下增加存儲吞吐量。
2014 年推出的 LPDDR4 標(biāo)準(zhǔn)與 LPDDR3 相比,數(shù)據(jù)傳輸速率高出一倍,工作電壓有所降低,既能提高性能又能延長電池續(xù)航時間,使移動用戶的體驗得到顯著改善。2016 年推出的
LPDDR4x 可提供比標(biāo)準(zhǔn)LPDDR4 存儲高出多達(dá) 20% 的能效,進(jìn)一步延長了電池續(xù)航時間。

圖片2.png

圖 1:移動平臺的峰值吞吐量

       LPDDR4    存儲對于可穿戴電子設(shè)備之類的物聯(lián)網(wǎng)應(yīng)用非常重要,因為功耗是這些應(yīng)用的關(guān)鍵設(shè)計約束因素之一。對于汽車應(yīng)用,LPDDR4  的高帶寬和功耗優(yōu)勢使之成為車載子系統(tǒng)(如中央控制臺和高級駕駛員輔助系統(tǒng)(ADAS))的理想選擇。

DRAM 發(fā)展面臨的挑戰(zhàn)

LPDDR4  規(guī)范旨在適應(yīng)DRAM   加工技術(shù)的不斷發(fā)展,其中包括縮小存儲單元的尺寸。為了在更小的空間內(nèi)保持相同的單元電容,需要運用更復(fù)雜的制造工藝。隨著單元尺寸的縮小,單元接入設(shè)備的功能弱化,位線和列線的電阻逐漸增加,而這兩點都會導(dǎo)致每個存儲單元達(dá)到最高蓄能的用時增加。由于這些因素的影響,制造商要在過渡到新工藝的同時保持良率和可靠性會越來越困難。
單比特錯誤

限制 DRAM 良率的主要因素是單比特錯誤。在這些錯誤中,有一小部分可能是“硬”故障位,即比特位卡在 1 或 0。此類故障都需要使用冗余元素進(jìn)行修復(fù)。當(dāng)然,大多數(shù)情況下發(fā)生故障的單比特位都很微不足道;只要它們的刷新頻率足夠高或?qū)懭霑r間較長即可正常工作。
修復(fù)這些位(在陣列中僅占很小比例)需要增加冗余元素的數(shù)量,而這會導(dǎo)致芯片的尺寸增大、復(fù)雜性提高。需要注意的是,DRAM 寫入恢復(fù)時間 (tWR) 以及 64ms 或 32ms 刷新規(guī)范的設(shè)定非常保守,旨在使大部分弱位都能通過。若沒有這些弱位,刷新和 tWR 規(guī)范就可以大幅放寬,從而帶來性能和功耗方面的優(yōu)勢。
可變刷新時間位

隨著各項工藝的縮減,另一個日益普遍的現(xiàn)象是可變刷新時間位(即  VRT   位)故障。這是一種偶然發(fā)生的隨機(jī)單比特故障,發(fā)生的原因在于 DRAM 加熱(即執(zhí)行焊接回流以裝配插件)后,它們的刷新時間會發(fā)生變化。盡管這些VRT 位較為罕見,但若在 DRAM 通過制造商的最終測試之后發(fā)生此類故障,將會非常麻煩,因為此時修復(fù)已經(jīng)非常困難甚至無法進(jìn)行。
為了降低封裝后維修或報廢零件的成本,保持可接受的現(xiàn)場故障率,DRAM 制造商目前會在比規(guī)范要求嚴(yán)格得多的條件下測試存儲位。這樣做的目的是預(yù)先找到可能發(fā)生故障的VRT      位。

雖然這種測試在很大程度上是有效的,但卻會降低良率。更加嚴(yán)格的測試可能導(dǎo)致嚴(yán)重的“過度殺傷”,因為在識別真正的 VRT 芯片的過程中,將有大量實際上并不會產(chǎn)生 VRT 故障的芯片被丟棄。此外,任何測試都不是完美的,有些 VRT 可能逃脫,最后仍會到達(dá) OEM 那里。鑒于 VRT 位一直以來造成的這些問題,存儲制造商需要實施新技術(shù)來提高未來設(shè)備的可靠性并控制其成本。

圖片3.png縮小存儲單元導(dǎo)致存儲制造商面臨的挑戰(zhàn)加劇。存儲制造商需要實施新技術(shù)來提高未來設(shè)備的可靠性并控制其成本。ECC 就是這樣一種技術(shù),美光科技將ECC 應(yīng)用到了移動LPDRAM 中。

ECC 技術(shù)提供了一種有效的方法來消除隨機(jī)單比特錯誤, 從而提高系統(tǒng)可靠性。

糾錯代碼的優(yōu)勢

糾錯代碼  (ECC)  是一項成熟的存儲技術(shù),被廣泛用于各種應(yīng)用以提高可靠性。ECC  利用漢明碼為存儲

IC 提供更高水平的冗余。漢明碼會生成少量奇偶校驗位,與用戶數(shù)據(jù)一起存儲在存儲陣列中。借助漢明碼,可以用少量比特位來保護(hù)更長的數(shù)據(jù)字。例如,美光科技的 LPDDR4 設(shè)備使用 8 個奇偶校驗位為 128 位數(shù)據(jù)字提供糾錯。這些奇偶校驗位可用于檢測和糾正 128 位數(shù)據(jù)字中的單比特錯誤。
糾正單比特錯誤

每次數(shù)據(jù)寫入存儲時,相關(guān)的奇偶校驗位便會隨之更新。讀取數(shù)據(jù)時,DRAM 會驗證整個 136 位
(128 個數(shù)據(jù)位+ 8 個奇偶校驗位)代碼字的完整性。如果檢測到單比特故障(例如,裝配后出現(xiàn)一個 VRT 位),ECC 將自動糾正該錯誤。鑒于同一代碼字中出現(xiàn)兩個單比特錯誤的可能性極小,可以說ECC   技術(shù)提供了一種有效的方法來消除隨機(jī)單比特錯誤。

由于 ECC 是一項被動技術(shù),因此它會自動檢測并糾正錯誤,無需開發(fā)人員干預(yù)。此外,糾正過程對系統(tǒng)的其余部分完全透明。
降低總體擁有成本

在 LPDDR4 中加入  ECC  的另一個優(yōu)勢在于,從功耗、性能和成本角度考慮,它可以降低總體擁有成本 (TCO)。例如,在 LPDDR4 中加入 ECC 會使有功功率略有提高(約 5-7%)。這是因為存儲和處理

ECC  校驗位奇偶所需的存儲位和邏輯電路增加了。同時,ECC  可以大幅降低待機(jī)和刷新功耗。設(shè)備處于睡眠模式時,基于 DRAM 的存儲需要定期刷新,以替換各個存儲單元中的泄漏電流。ECC  的使用可以增加可靠性,從而使 DRAM 能夠降低自刷新率。對大多數(shù)低功耗應(yīng)用而言,面對 ECC  帶來的可靠性提升及出色的待機(jī)效率,有功電流的小幅增加已經(jīng)無關(guān)緊要了(參見圖 2 和圖 3)。

圖片4.png

圖 2:LPDDR4 功耗對比(低功耗使用案例)

圖片5.png

圖 3:LPDDR4 功耗對比(中高功耗使用案例)

高效節(jié)能
       采用ECC 的LPDDR4 的出色能效還有助于 OEM 在遷移或過渡到新一代移動設(shè)備時實現(xiàn)功耗中性;換言之,他們可以提供更強(qiáng)大的功能,而不需要更大的電池,也不會對工作壽命產(chǎn)生負(fù)面影響。

圖片6.png

DRAM 的故障率取決于多種因素,包括 SOC、散熱設(shè)計、DRAM 密度、DRAM 工廠工藝和測試。單比特錯誤是最常見的已確認(rèn)故障根源。ECC  能夠有效處理單比特故障模式,顯著增強(qiáng)系統(tǒng)可靠性和早期使用期限故障率  (ELFR)  性能。

       在性能方面,采用ECC   技術(shù)會使讀取延遲略有增加,但仍在指定讀取延遲值的范圍之內(nèi)。此外,為了使   DRAM   時間能夠計算奇偶校驗位,還需要增加寫入延遲。此時間已體現(xiàn)在18ns 的tWR 規(guī)范中(與適用于LPDDR3 的 15ns 規(guī)范相比)。
       有些業(yè)內(nèi)人士已考慮遷移至 45ns 的 tWR 規(guī)范以解決擴(kuò)展問題。納入 ECC 技術(shù)可以減少在 LPDDR4  規(guī)范中增加此時間的必要性。除了可以彌補(bǔ)讀取延遲少量增加造成的性能損失,免于增加tWR   還會帶來其他好處。
       ECC 還需要小幅增加芯片大小,來容納奇偶校驗位和 ECC 邏輯。不過,它為 OEM 帶來的高可靠性以及為   DRAM   制造商帶來的高良率和低測試成本足以彌補(bǔ)這部分成本。
另外,ECC 還可以改善 LPDDR4 在高溫下的性能。溫度每升高 10 ℃,DRAM 的刷新要求會增長約一倍,DRAM 的標(biāo)準(zhǔn)最高溫度是 85 ℃。移動 DRAM 也不例外;盡管通常支持高達(dá)105 ℃ 的工作溫度,但指定刷新率針對的溫度是 85 ℃。當(dāng)工作溫度為 85-95 ℃ 時,存儲控制器提供的刷新率(tREFI) 必須增加一倍;當(dāng)工作溫度為 95-105 ℃ 時,則必須增加三倍。這意味著,在 95-105 ℃ 下工作的 8Gb LPDDR4 存儲需要用 18% 的時間運行全存儲體刷新命令(這部分時間不能用來執(zhí)行實用功能),而且還會消耗大量電源?;蛟S可以在后臺執(zhí)行單存儲體刷新,但刷新過程幾乎不能間斷。當(dāng)然,隨著未來的設(shè)備密度越來越高,這種情況會變得更糟。
       由于設(shè)定的刷新率非常保守,采用ECC 的 DRAM 大約可按規(guī)范中所規(guī)定刷新率的四分之一進(jìn)行刷新。這樣可以節(jié)約大量能耗,尤其是在高溫條件下。除此之外,它還能減少上述性能影響,盡管這會導(dǎo)致目前的JEDEC  規(guī)范發(fā)生變化。
對于工作溫度需要達(dá)到 105 ℃ 以上的汽車或其他應(yīng)用,采用ECC 的DRAM 可能是唯一可行的選擇。采用 ECC 的 LPDDR4 設(shè)備可以在 115-125 ℃ 的溫度范圍內(nèi)正常工作,并能提供非 ECC 設(shè)備在 95-105 ℃ 溫度范圍內(nèi)提供的刷新性能。此溫度范圍正是使用了邊緣存儲解決方案(microSD    卡)的企業(yè)級部署所具備的典型系統(tǒng)特征。

總結(jié)
       為了跟上當(dāng)今移動、汽車和物聯(lián)網(wǎng)應(yīng)用的發(fā)展步伐,開發(fā)者和存儲制造商持續(xù)面臨著如何在增強(qiáng)存儲性能的同時兼顧功耗和可靠性的挑戰(zhàn)??s小芯片尺寸給制造工藝帶來的難題往往會影響存儲可靠性,使得滿足上述要求變得更具挑戰(zhàn)性。
美光科技采用 ECC 技術(shù)的 LPDDR4 和 LPDDR4x 存儲提供了一種有效的方法來消除其中一些挑戰(zhàn),同時為當(dāng)今的新一代設(shè)備提供了高帶寬和功耗優(yōu)勢。通過采用 ECC,可以自動檢測和糾正單比特錯誤, 從而提高可靠性。待機(jī)和刷新功耗有所降低,因而可實現(xiàn)新一代設(shè)備所需的低功耗功能。高溫條件  下的性能得到提升,使工作溫度較高的汽車及其他應(yīng)用可以實現(xiàn)所需的功耗中性。
       歡迎聯(lián)系您的美光銷售代表,或訪問 micron.com/lpdram,探索采用 ECC 的美光 LPDDR4/LPDDR4x 存儲如何為您帶來實現(xiàn)高性能、低功耗的機(jī)會。

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。