最近我們聽到了很多關(guān)于云的新聞,現(xiàn)在你需要考慮,你是否會(huì)采用云模式作為你存儲(chǔ)網(wǎng)絡(luò)架構(gòu)的一部分?
云是數(shù)據(jù)存儲(chǔ)架構(gòu)規(guī)劃中的一部分,正如可能會(huì)用到云的應(yīng)用一樣,例如Hadoop。數(shù)據(jù)復(fù)制的標(biāo)準(zhǔn)云方法就是使用低成本硬件。原理就是,你通過在發(fā)生故障的情況下復(fù)制數(shù)據(jù)來獲得數(shù)據(jù)可靠性。由于我大部分的工作都是在大型存儲(chǔ)環(huán)境下進(jìn)行的,而且根據(jù)我對(duì)驅(qū)動(dòng)器故障率的了解,我對(duì)使用這種方法來管理數(shù)PB要求高可靠性的數(shù)據(jù)抱有巨大的疑慮。
因此,我想做的就是,帶你一步步地分析用于大多數(shù)云中的低成本硬件。我不會(huì)談到刀片的故障率,只有存儲(chǔ)。作為分析的一部分,我查看了所有主流磁盤制造商的網(wǎng)站,采用了所有廠商之間的最佳值,因此很多分析都是最理想的情況,可能你會(huì)有不同測(cè)量結(jié)果。讓我們一步步地來看。
每遷移1PB數(shù)據(jù)的硬錯(cuò)誤
硬錯(cuò)誤率(或稱為比特誤碼率,BER)對(duì)可靠性有很大的影響。我所查看的所有磁盤廠商都規(guī)定了1個(gè)扇區(qū)每讀取10EXX比特所發(fā)生的不可恢復(fù)讀取錯(cuò)誤的誤碼率。

我發(fā)現(xiàn),在云架構(gòu)或者Hadoop中,由于考慮到企業(yè)級(jí)SAS和SATA驅(qū)動(dòng)器之間巨大的成本差距,沒有人會(huì)采用企業(yè)級(jí)SAS驅(qū)動(dòng)器,大多數(shù)都使用了最廉價(jià)的硬件。
讀取一個(gè)2TB驅(qū)動(dòng)器的時(shí)間

下文中你將看到為什么這很重要的原因?,F(xiàn)在,先看一看讀取驅(qū)動(dòng)器上的數(shù)據(jù)需要的時(shí)間:
占滿一個(gè)通道的驅(qū)動(dòng)器數(shù)量
了解占滿不同速度SONET通道所需的驅(qū)動(dòng)器數(shù)量是很重要的。我在去掉TCP/IP和其他封包及重試延遲對(duì)通道的影響之后估計(jì)通道的性能,在以這樣的速度雙向運(yùn)行于全雙工時(shí)通道的速率約為90%。
了解占滿不同速度SONET通道所需的驅(qū)動(dòng)器數(shù)量是很重要的。我在去掉TCP/IP和其他封包及重試延遲對(duì)通道的影響之后估計(jì)通道的性能,在以這樣的速度雙向運(yùn)行于全雙工時(shí)通道的速率約為90%。

顯然,占滿有故障的磁盤驅(qū)動(dòng)器的網(wǎng)絡(luò)帶寬并不需要大量的驅(qū)動(dòng)器。
每年的磁盤驅(qū)動(dòng)器故障
磁盤驅(qū)動(dòng)器故障公式分為兩個(gè)部分。第一個(gè)部分是基于硬錯(cuò)誤率。如果你遷移111TB的數(shù)據(jù),你可以假設(shè)一個(gè)磁盤無法讀取寫入到消費(fèi)級(jí)SATA驅(qū)動(dòng)器中的數(shù)據(jù)。企業(yè)級(jí)SATA驅(qū)動(dòng)器的數(shù)量是1.1TB。另一個(gè)部分是年故障率(AFR)。這是每年故障驅(qū)動(dòng)器占驅(qū)動(dòng)器總量的比例,是驅(qū)動(dòng)器廠商自己提供的一個(gè)估算值。應(yīng)該注意的是,很少有驅(qū)動(dòng)器廠商會(huì)提供消費(fèi)級(jí)SATA驅(qū)動(dòng)器的AFR數(shù)據(jù)。下表顯示的是使用2TB SATA用于不同存儲(chǔ)的驅(qū)動(dòng)器數(shù)量,以及每年故障驅(qū)動(dòng)器的估算量。
磁盤驅(qū)動(dòng)器故障公式分為兩個(gè)部分。第一個(gè)部分是基于硬錯(cuò)誤率。如果你遷移111TB的數(shù)據(jù),你可以假設(shè)一個(gè)磁盤無法讀取寫入到消費(fèi)級(jí)SATA驅(qū)動(dòng)器中的數(shù)據(jù)。企業(yè)級(jí)SATA驅(qū)動(dòng)器的數(shù)量是1.1TB。另一個(gè)部分是年故障率(AFR)。這是每年故障驅(qū)動(dòng)器占驅(qū)動(dòng)器總量的比例,是驅(qū)動(dòng)器廠商自己提供的一個(gè)估算值。應(yīng)該注意的是,很少有驅(qū)動(dòng)器廠商會(huì)提供消費(fèi)級(jí)SATA驅(qū)動(dòng)器的AFR數(shù)據(jù)。下表顯示的是使用2TB SATA用于不同存儲(chǔ)的驅(qū)動(dòng)器數(shù)量,以及每年故障驅(qū)動(dòng)器的估算量。

另一方面是基于BER的故障,因?yàn)檫@是基于數(shù)據(jù)遷移的,所以我再次選擇了一個(gè)保守的數(shù)量,并推測(cè)驅(qū)動(dòng)器占全年總帶寬的5%。

為了確定總故障數(shù)量,你需要向AFR數(shù)量中增加BER(5%):

如果你使用5%這個(gè)值并除以365,那么你將得出每天的故障數(shù)量:

將總帶寬利用率小幅提高到7.5%的話,將得到每天每個(gè)存儲(chǔ)卷的故障數(shù):

遷移數(shù)據(jù)總量的故障
下面得出的結(jié)論:當(dāng)使用率為5%、存儲(chǔ)容量為10PB的時(shí)候,每天平均你會(huì)有15個(gè)消費(fèi)級(jí)SATA驅(qū)動(dòng)器發(fā)生故障。在最好情況下,你大約需要24390秒通過網(wǎng)絡(luò)進(jìn)行讀取或者寫入每個(gè)驅(qū)動(dòng)器。你最多可以獲得3.37個(gè)驅(qū)動(dòng)器的全部帶寬,24小時(shí)獲得總共276 MB/s的帶寬。因此,簡(jiǎn)單計(jì)算一下,276 MB/sec×3600×24得出每天的總MB/s。對(duì)于每個(gè)驅(qū)動(dòng)器,你需要82 MB/s×24390×15個(gè)驅(qū)動(dòng)器故障。以下是不同情況的計(jì)算結(jié)果:
下面得出的結(jié)論:當(dāng)使用率為5%、存儲(chǔ)容量為10PB的時(shí)候,每天平均你會(huì)有15個(gè)消費(fèi)級(jí)SATA驅(qū)動(dòng)器發(fā)生故障。在最好情況下,你大約需要24390秒通過網(wǎng)絡(luò)進(jìn)行讀取或者寫入每個(gè)驅(qū)動(dòng)器。你最多可以獲得3.37個(gè)驅(qū)動(dòng)器的全部帶寬,24小時(shí)獲得總共276 MB/s的帶寬。因此,簡(jiǎn)單計(jì)算一下,276 MB/sec×3600×24得出每天的總MB/s。對(duì)于每個(gè)驅(qū)動(dòng)器,你需要82 MB/s×24390×15個(gè)驅(qū)動(dòng)器故障。以下是不同情況的計(jì)算結(jié)果:

任何負(fù)數(shù)意味著驅(qū)動(dòng)器復(fù)制的要求超過了通道帶寬。例如,在10PB、OC-48和5%驅(qū)動(dòng)器使用率的情況下,帶寬相當(dāng)于6167659 MB(這超過了通道帶寬)或者24小時(shí)內(nèi)71 MB/s。顯然,隨著時(shí)間的推移,這個(gè)問題越來越明顯,因?yàn)槟銖?fù)制數(shù)據(jù)的速度還趕不上丟失的速度。從統(tǒng)計(jì)概率上說,如果你有10PB的話,最終你將丟掉數(shù)據(jù),而且不會(huì)用太長(zhǎng)時(shí)間。唯一的架構(gòu)選擇就是保留數(shù)據(jù)的第三個(gè)副本,而這么做的成本很高。對(duì)于一個(gè)OC-48通道、使用率為5%的存儲(chǔ)系統(tǒng)來說,拐點(diǎn)發(fā)生在5 PB~10 PB之間,在5 PB、使用率為7.5%的情況下,你只有42 MB/s的多余帶寬(3652149,3600×24)。這時(shí)候就需要更高速的網(wǎng)絡(luò)(付出更多成本)或者更可靠的存儲(chǔ)(成本也不低)。
我相信云公司每天都在權(quán)衡著這些成本因素,找出什么是優(yōu)化成本的最佳方法。有沒有可能其中一些人并不了解基本的硬件問題?我當(dāng)然希望不會(huì)是這種情況。顯然,云存儲(chǔ)適用于5PB、OC-48通達(dá)和消費(fèi)級(jí)SATA存儲(chǔ)?,F(xiàn)在,有多少云是超過這個(gè)存儲(chǔ)容量的?我不之道,但肯定是存在的,對(duì)于大型存儲(chǔ)用戶來說,多達(dá)10~20 PB的歸檔是很常見的。
云架構(gòu)要比本地存儲(chǔ)架構(gòu)復(fù)雜得多。云存儲(chǔ)可以設(shè)計(jì)成一個(gè)RAID后端,消除了很多問題,但是我所了解的大多數(shù)云由于成本因素而沒有使用RAID??偟膩碚f,云架構(gòu)和云設(shè)計(jì)并不簡(jiǎn)單,對(duì)于大型數(shù)據(jù)卷來說,我看不出云比本地存儲(chǔ)便宜多少。
驅(qū)動(dòng)器可靠性和帶寬將限制云的采用,而且這是一個(gè)可能永遠(yuǎn)也得不到解決的問題。帶寬將越來越便宜,但是驅(qū)動(dòng)器可靠性并沒有多大改善,數(shù)據(jù)的增長(zhǎng)速度仍將超過帶寬。也許基于網(wǎng)絡(luò)的重復(fù)數(shù)據(jù)刪除功能會(huì)起到一些幫助作用——如果數(shù)據(jù)可以被重復(fù)數(shù)據(jù)刪除的話。但是就目前來看,對(duì)于非常大型的數(shù)據(jù)存儲(chǔ)來說,還沒有一個(gè)比老式數(shù)據(jù)中心更好的選擇。
我相信云公司每天都在權(quán)衡著這些成本因素,找出什么是優(yōu)化成本的最佳方法。有沒有可能其中一些人并不了解基本的硬件問題?我當(dāng)然希望不會(huì)是這種情況。顯然,云存儲(chǔ)適用于5PB、OC-48通達(dá)和消費(fèi)級(jí)SATA存儲(chǔ)?,F(xiàn)在,有多少云是超過這個(gè)存儲(chǔ)容量的?我不之道,但肯定是存在的,對(duì)于大型存儲(chǔ)用戶來說,多達(dá)10~20 PB的歸檔是很常見的。
云架構(gòu)要比本地存儲(chǔ)架構(gòu)復(fù)雜得多。云存儲(chǔ)可以設(shè)計(jì)成一個(gè)RAID后端,消除了很多問題,但是我所了解的大多數(shù)云由于成本因素而沒有使用RAID??偟膩碚f,云架構(gòu)和云設(shè)計(jì)并不簡(jiǎn)單,對(duì)于大型數(shù)據(jù)卷來說,我看不出云比本地存儲(chǔ)便宜多少。
驅(qū)動(dòng)器可靠性和帶寬將限制云的采用,而且這是一個(gè)可能永遠(yuǎn)也得不到解決的問題。帶寬將越來越便宜,但是驅(qū)動(dòng)器可靠性并沒有多大改善,數(shù)據(jù)的增長(zhǎng)速度仍將超過帶寬。也許基于網(wǎng)絡(luò)的重復(fù)數(shù)據(jù)刪除功能會(huì)起到一些幫助作用——如果數(shù)據(jù)可以被重復(fù)數(shù)據(jù)刪除的話。但是就目前來看,對(duì)于非常大型的數(shù)據(jù)存儲(chǔ)來說,還沒有一個(gè)比老式數(shù)據(jù)中心更好的選擇。
本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
