是時(shí)候重新審視你的重復(fù)數(shù)據(jù)刪除策略了。如今大部分環(huán)境都需要使用重復(fù)數(shù)據(jù)刪除技術(shù),不論是面臨資源瓶頸、規(guī)模制約,還是兩者皆有,重復(fù)數(shù)據(jù)刪除已作為一種實(shí)用工具迅速普及。但是當(dāng)面臨持續(xù)快速增長(zhǎng)的數(shù)據(jù)時(shí),這項(xiàng)過于依賴基礎(chǔ)硬件設(shè)備的策略則可能會(huì)產(chǎn)生其他技術(shù)問題。
先來看一些數(shù)據(jù):平均來說,目前數(shù)據(jù)正以每年40%的速度增長(zhǎng),換句話說,每?jī)赡攴环?,并且沒有結(jié)束的跡象——無論你承認(rèn)與否,數(shù)據(jù)增長(zhǎng)的事實(shí)就擺在眼前1。
面對(duì)這樣的現(xiàn)狀,“Parallel Deduplication”(并行重復(fù)數(shù)據(jù)刪除)的概念適時(shí)而出,以提供大規(guī)模、可擴(kuò)展和高彈性的重復(fù)數(shù)據(jù)刪除為前提,通過以軟件為中心的方式為最大的數(shù)據(jù)以及需求最多的應(yīng)用程序設(shè)計(jì),并通過一個(gè)基于網(wǎng)格架構(gòu)和利用重復(fù)數(shù)據(jù)刪除數(shù)據(jù)庫(kù)(DDB)和介質(zhì)運(yùn)行的。根據(jù)網(wǎng)格結(jié)構(gòu),并行重復(fù)數(shù)據(jù)刪除將聯(lián)合多個(gè)DDB一起為數(shù)據(jù)保護(hù)工作(客戶端和子客戶端)提供一個(gè)單一、大規(guī)模的重復(fù)數(shù)據(jù)刪除池:例如,兩節(jié)點(diǎn)平行數(shù)據(jù)刪除池的架構(gòu)模型。由此可以通過接近線性的方式擴(kuò)展重復(fù)數(shù)據(jù)刪除容量和吞吐量,用來支持負(fù)載繁重的數(shù)據(jù)刪除工作。
考慮到這一點(diǎn),CommVault在其最新推出的Simpana® 10中推出了其第四代重復(fù)數(shù)據(jù)刪除技術(shù),該技術(shù)主要基于并行重復(fù)數(shù)據(jù)刪除技術(shù),以應(yīng)對(duì)數(shù)據(jù)持續(xù)爆炸性增長(zhǎng)帶來的挑戰(zhàn)。通過全新的基于網(wǎng)格的結(jié)構(gòu),第四代重復(fù)數(shù)據(jù)刪除在性能及規(guī)模上都提升了一倍,從而能夠使企業(yè)的基礎(chǔ)設(shè)施運(yùn)行更加智能化。除了可以提供大規(guī)模容量和吞吐量,企業(yè)也可以將并行重復(fù)數(shù)據(jù)刪除方法與CommVault獨(dú)有的GridStor®技術(shù)相結(jié)合,得到完整的負(fù)載平衡和作業(yè)故障轉(zhuǎn)移選項(xiàng)。如果重復(fù)數(shù)據(jù)刪除池的一個(gè)節(jié)點(diǎn)出現(xiàn)故障,那么其他節(jié)點(diǎn)會(huì)立刻接管現(xiàn)有任務(wù)從而避免任何宕機(jī)的可能。
圖示1:兩節(jié)點(diǎn)并行重復(fù)數(shù)據(jù)刪除池配置示例
舉例來說(圖示1),將兩個(gè)重復(fù)數(shù)據(jù)刪除節(jié)點(diǎn)聯(lián)合在一起,每個(gè)節(jié)點(diǎn)最多可保護(hù)120TB的前端容量2和大約4.5TB/小時(shí)的吞吐量3。通過將兩個(gè)節(jié)點(diǎn)聯(lián)合到一個(gè)單一的重復(fù)數(shù)據(jù)刪除池,我們最多可以對(duì)240TB的數(shù)據(jù)和9TB/小時(shí)的吞吐量進(jìn)行重復(fù)數(shù)據(jù)刪除管理。
并行重復(fù)數(shù)據(jù)刪除技術(shù)只是Simpana 10眾多功能之一,它可以讓重復(fù)數(shù)據(jù)刪除更加智能。隨著數(shù)據(jù)的不斷增長(zhǎng)和數(shù)據(jù)處理的復(fù)雜性,在制定重復(fù)數(shù)據(jù)刪除策略時(shí),有必要考慮:
1. 將遠(yuǎn)程及中央辦公室的重復(fù)數(shù)據(jù)刪除整合到一個(gè)單一的軟件架構(gòu)中。企業(yè)可以在遠(yuǎn)程站點(diǎn)利用單一節(jié)點(diǎn)重復(fù)數(shù)據(jù)刪除策略。然后在中央站點(diǎn)利用并行重復(fù)數(shù)據(jù)刪除策略,采用DASH Copy技術(shù)將刪除的重復(fù)數(shù)據(jù)拷貝到中央站點(diǎn)。將單一節(jié)點(diǎn)和多節(jié)點(diǎn)重復(fù)數(shù)據(jù)刪除功能融為一體,可以為企業(yè)提供足夠的靈活性,基于企業(yè)的業(yè)務(wù)需求,對(duì)每個(gè)站點(diǎn)的數(shù)據(jù)容量進(jìn)行相應(yīng)的調(diào)整。
2. 利用DASH FULL技術(shù)進(jìn)行永久增量備份。這可以在最大限度降低對(duì)生產(chǎn)服務(wù)器和網(wǎng)絡(luò)影響的同時(shí),大大提高備份策略的智能性,更好地利用原有的基礎(chǔ)設(shè)施。例如,采用傳統(tǒng)的每日增量備份、每周完全備份的方式,虛擬機(jī)(VM)每個(gè)節(jié)點(diǎn)的備份數(shù)據(jù)僅能達(dá)到20-25TB。而采用永久增量和DASH備份技術(shù),每個(gè)節(jié)點(diǎn)就可備份40-50TB的虛擬機(jī)數(shù)據(jù)。
3. 基于數(shù)據(jù)類型,通過單一控制臺(tái)全面統(tǒng)一管理多個(gè)重復(fù)數(shù)據(jù)刪除池,可確保企業(yè)創(chuàng)建的重復(fù)數(shù)據(jù)刪除池在刪除重復(fù)數(shù)據(jù)方面帶來最大的效益,從而優(yōu)化資源的利用。
最后,關(guān)于并行重復(fù)數(shù)據(jù)刪除,企業(yè)還需要做額外考慮:Simpana 10在并行重復(fù)數(shù)據(jù)刪除策略中支持兩個(gè)節(jié)點(diǎn),雖然該策略對(duì)重復(fù)刪除數(shù)據(jù)可以聯(lián)合的節(jié)點(diǎn)沒有硬件上的限制。并且企業(yè)可以期待CommVault把單一并行重復(fù)數(shù)據(jù)刪除策略的節(jié)點(diǎn)數(shù)量推向一個(gè)極限;此外,在存儲(chǔ)策略中,需要預(yù)先對(duì)并行重復(fù)數(shù)據(jù)刪除節(jié)點(diǎn)進(jìn)行配置——單一的節(jié)點(diǎn)無法轉(zhuǎn)換為兩個(gè)節(jié)點(diǎn),兩個(gè)節(jié)點(diǎn)也不會(huì)轉(zhuǎn)換為4個(gè)節(jié)點(diǎn),因此應(yīng)對(duì)數(shù)據(jù)增長(zhǎng)的解決方案仍然需要提前進(jìn)行規(guī)劃。
注解:
1 2013年消費(fèi)傾向調(diào)查表,ESG 2013年1月
2 120TB需要使用SSD——DDB商店
3吞吐量初測(cè)為Simpana10的標(biāo)準(zhǔn),這個(gè)數(shù)字預(yù)計(jì)在Simpana10的生命周期中還會(huì)增長(zhǎng)。
Phil Curran,CommVault基礎(chǔ)設(shè)施解決方案產(chǎn)品營(yíng)銷總監(jiān)。