最近我們聽到了很多關(guān)于云的新聞,現(xiàn)在你需要考慮,你是否會(huì)采用云模式作為你存儲(chǔ)網(wǎng)絡(luò)架構(gòu)的一部分?
云是數(shù)據(jù)存儲(chǔ)架構(gòu)規(guī)劃中的一部分,正如可能會(huì)用到云的應(yīng)用一樣,例如Hadoop。數(shù)據(jù)復(fù)制的標(biāo)準(zhǔn)云方法就是使用低成本硬件。原理就是,你通過(guò)在發(fā)生故障的情況下復(fù)制數(shù)據(jù)來(lái)獲得數(shù)據(jù)可靠性。由于我大部分的工作都是在大型存儲(chǔ)環(huán)境下進(jìn)行的,而且根據(jù)我對(duì)驅(qū)動(dòng)器故障率的了解,我對(duì)使用這種方法來(lái)管理數(shù)PB要求高可靠性的數(shù)據(jù)抱有巨大的疑慮。
因此,我想做的就是,帶你一步步地分析用于大多數(shù)云中的低成本硬件。我不會(huì)談到刀片的故障率,只有存儲(chǔ)。作為分析的一部分,我查看了所有主流磁盤制造商的網(wǎng)站,采用了所有廠商之間的最佳值,因此很多分析都是最理想的情況,可能你會(huì)有不同測(cè)量結(jié)果。讓我們一步步地來(lái)看。
每遷移1PB數(shù)據(jù)的硬錯(cuò)誤
硬錯(cuò)誤率(或稱為比特誤碼率,BER)對(duì)可靠性有很大的影響。我所查看的所有磁盤廠商都規(guī)定了1個(gè)扇區(qū)每讀取10EXX比特所發(fā)生的不可恢復(fù)讀取錯(cuò)誤的誤碼率。

我發(fā)現(xiàn),在云架構(gòu)或者Hadoop中,由于考慮到企業(yè)級(jí)SAS和SATA驅(qū)動(dòng)器之間巨大的成本差距,沒(méi)有人會(huì)采用企業(yè)級(jí)SAS驅(qū)動(dòng)器,大多數(shù)都使用了最廉價(jià)的硬件。
讀取一個(gè)2TB驅(qū)動(dòng)器的時(shí)間

下文中你將看到為什么這很重要的原因?,F(xiàn)在,先看一看讀取驅(qū)動(dòng)器上的數(shù)據(jù)需要的時(shí)間:
了解占滿不同速度SONET通道所需的驅(qū)動(dòng)器數(shù)量是很重要的。我在去掉TCP/IP和其他封包及重試延遲對(duì)通道的影響之后估計(jì)通道的性能,在以這樣的速度雙向運(yùn)行于全雙工時(shí)通道的速率約為90%。

磁盤驅(qū)動(dòng)器故障公式分為兩個(gè)部分。第一個(gè)部分是基于硬錯(cuò)誤率。如果你遷移111TB的數(shù)據(jù),你可以假設(shè)一個(gè)磁盤無(wú)法讀取寫入到消費(fèi)級(jí)SATA驅(qū)動(dòng)器中的數(shù)據(jù)。企業(yè)級(jí)SATA驅(qū)動(dòng)器的數(shù)量是1.1TB。另一個(gè)部分是年故障率(AFR)。這是每年故障驅(qū)動(dòng)器占驅(qū)動(dòng)器總量的比例,是驅(qū)動(dòng)器廠商自己提供的一個(gè)估算值。應(yīng)該注意的是,很少有驅(qū)動(dòng)器廠商會(huì)提供消費(fèi)級(jí)SATA驅(qū)動(dòng)器的AFR數(shù)據(jù)。下表顯示的是使用2TB SATA用于不同存儲(chǔ)的驅(qū)動(dòng)器數(shù)量,以及每年故障驅(qū)動(dòng)器的估算量。





下面得出的結(jié)論:當(dāng)使用率為5%、存儲(chǔ)容量為10PB的時(shí)候,每天平均你會(huì)有15個(gè)消費(fèi)級(jí)SATA驅(qū)動(dòng)器發(fā)生故障。在最好情況下,你大約需要24390秒通過(guò)網(wǎng)絡(luò)進(jìn)行讀取或者寫入每個(gè)驅(qū)動(dòng)器。你最多可以獲得3.37個(gè)驅(qū)動(dòng)器的全部帶寬,24小時(shí)獲得總共276 MB/s的帶寬。因此,簡(jiǎn)單計(jì)算一下,276 MB/sec×3600×24得出每天的總MB/s。對(duì)于每個(gè)驅(qū)動(dòng)器,你需要82 MB/s×24390×15個(gè)驅(qū)動(dòng)器故障。以下是不同情況的計(jì)算結(jié)果:

我相信云公司每天都在權(quán)衡著這些成本因素,找出什么是優(yōu)化成本的最佳方法。有沒(méi)有可能其中一些人并不了解基本的硬件問(wèn)題?我當(dāng)然希望不會(huì)是這種情況。顯然,云存儲(chǔ)適用于5PB、OC-48通達(dá)和消費(fèi)級(jí)SATA存儲(chǔ)?,F(xiàn)在,有多少云是超過(guò)這個(gè)存儲(chǔ)容量的?我不之道,但肯定是存在的,對(duì)于大型存儲(chǔ)用戶來(lái)說(shuō),多達(dá)10~20 PB的歸檔是很常見的。
云架構(gòu)要比本地存儲(chǔ)架構(gòu)復(fù)雜得多。云存儲(chǔ)可以設(shè)計(jì)成一個(gè)RAID后端,消除了很多問(wèn)題,但是我所了解的大多數(shù)云由于成本因素而沒(méi)有使用RAID??偟膩?lái)說(shuō),云架構(gòu)和云設(shè)計(jì)并不簡(jiǎn)單,對(duì)于大型數(shù)據(jù)卷來(lái)說(shuō),我看不出云比本地存儲(chǔ)便宜多少。
驅(qū)動(dòng)器可靠性和帶寬將限制云的采用,而且這是一個(gè)可能永遠(yuǎn)也得不到解決的問(wèn)題。帶寬將越來(lái)越便宜,但是驅(qū)動(dòng)器可靠性并沒(méi)有多大改善,數(shù)據(jù)的增長(zhǎng)速度仍將超過(guò)帶寬。也許基于網(wǎng)絡(luò)的重復(fù)數(shù)據(jù)刪除功能會(huì)起到一些幫助作用——如果數(shù)據(jù)可以被重復(fù)數(shù)據(jù)刪除的話。但是就目前來(lái)看,對(duì)于非常大型的數(shù)據(jù)存儲(chǔ)來(lái)說(shuō),還沒(méi)有一個(gè)比老式數(shù)據(jù)中心更好的選擇。
