摘 要: 連續(xù)數(shù)據(jù)保護作為一種全新概念的災(zāi)難備份與恢復(fù)技術(shù),具有廣闊的發(fā)展前景。探討了連續(xù)數(shù)據(jù)保護技術(shù)的概念、原理及特點,并對其發(fā)展方向做了一定的思考。
關(guān)鍵詞: 災(zāi)難備份;恢復(fù)技術(shù);連續(xù)數(shù)據(jù)保護
隨著信息技術(shù)的發(fā)展,企業(yè)、政府等部門對信息系統(tǒng)的依賴日益加深,人們對信息系統(tǒng)的不間斷運行能力及面對突發(fā)事件時的信息安全也提出了更高的要求。因此,災(zāi)難備份與數(shù)據(jù)保護技術(shù)成為人們關(guān)注的焦點。
1 災(zāi)難備份與恢復(fù)技術(shù)
根據(jù)中國國家標(biāo)準(zhǔn)GB/T20988-2007的定義,災(zāi)難是指由于人為或自然的原因,造成信息系統(tǒng)嚴(yán)重故障或癱瘓,使信息系統(tǒng)支持的業(yè)務(wù)功能停頓或服務(wù)水平不可接受,達到特定時間的突發(fā)性事件[1]。災(zāi)難備份與恢復(fù)技術(shù)也叫業(yè)務(wù)連續(xù)性技術(shù),它能夠在災(zāi)難發(fā)生時,保證數(shù)據(jù)的可用性,并且在規(guī)定的時間內(nèi)恢復(fù)系統(tǒng)的正常運行。
傳統(tǒng)的災(zāi)難備份與恢復(fù)技術(shù)大體可分為兩類:
(1)磁帶備份技術(shù)。備份和恢復(fù)效率低,備份時間點不能過于密集,一般的備份計劃是每周全備,每日增量備份,若發(fā)生災(zāi)難,將丟失當(dāng)日未備份資料。但是磁帶備份技術(shù)成本低廉,實施簡便,介質(zhì)便于異地長期保存,適合歸檔數(shù)據(jù),備份整個系統(tǒng)。
(2)數(shù)據(jù)復(fù)制技術(shù)。主要有基于主機、存儲、交換機、數(shù)據(jù)庫等幾種方式,復(fù)制技術(shù)實施成本較高,但技術(shù)成熟,復(fù)制和恢復(fù)效率也高,可以滿足實時同步復(fù)制的要求,也可以做到遠程復(fù)制。
傳統(tǒng)的災(zāi)難備份與恢復(fù)技術(shù)已經(jīng)在各個行業(yè)的信息系統(tǒng)中得到了廣泛應(yīng)用。但是,由于傳統(tǒng)災(zāi)難備份與恢復(fù)技術(shù)固有的局限,無論磁帶備份還是數(shù)據(jù)復(fù)制技術(shù),都只能抵抗對數(shù)據(jù)的物理損壞,如磁盤的失效,文件系統(tǒng)的破壞等。而對于數(shù)據(jù)的邏輯損壞,如數(shù)據(jù)庫或者文件中有錯誤的數(shù)據(jù),傳統(tǒng)的災(zāi)難備份與恢復(fù)技術(shù)則束手無策。當(dāng)發(fā)現(xiàn)系統(tǒng)數(shù)據(jù)有錯誤時,采用磁帶備份的系統(tǒng),雖然有著多個恢復(fù)點可用,可以恢復(fù)到最近的正確備份點,但勢必丟失大量的有用數(shù)據(jù),代價巨大,已經(jīng)失去了災(zāi)難備份的意義。而數(shù)據(jù)復(fù)制技術(shù)本質(zhì)上只有一個恢復(fù)點即最近的停止備份時刻,復(fù)制的數(shù)據(jù)副本中必然也存在著同樣的數(shù)據(jù)邏輯錯誤,根本無法恢復(fù)。
2 連續(xù)數(shù)據(jù)保護的概念及實現(xiàn)原理
2.1 連續(xù)數(shù)據(jù)保護概念的提出
傳統(tǒng)災(zāi)難備份與恢復(fù)技術(shù)的根本局限在于只建立了1個或時間粒度較粗的幾個恢復(fù)點,沒有就每次數(shù)據(jù)的改變建立恢復(fù)點,若能針對數(shù)據(jù)的每次改變,都建立恢復(fù)點,則可以實現(xiàn)無損的數(shù)據(jù)恢復(fù)。連續(xù)數(shù)據(jù)保護CDP(Continuous Data Protection)的概念就是基于這一思想提出的。全球網(wǎng)絡(luò)存儲工業(yè)協(xié)會SNIA(Storage Networking Industry Association)對連續(xù)數(shù)據(jù)保護的定義[2]是:持續(xù)的追蹤、捕獲數(shù)據(jù)的變化并保存變化日志,以便恢復(fù)到之前的任意時間點。由此定義可以看出,連續(xù)數(shù)據(jù)保護并非一種具體技術(shù),而是一個要達到的目標(biāo),只要能達到這個目的的任何方法、技術(shù),均可稱為連續(xù)數(shù)據(jù)保護技術(shù)。
2.2 連續(xù)數(shù)據(jù)保護的實現(xiàn)原理
連續(xù)數(shù)據(jù)保護并非對數(shù)據(jù)的變化進行簡單的復(fù)制,而是對數(shù)據(jù)的每個變化記錄日志或者編制索引,可以說,數(shù)據(jù)的每次變化,都會在CDP設(shè)備中保留一個備份版本,也只有這樣,才能夠?qū)?shù)據(jù)恢復(fù)到過去任意一個時間點。
為了實現(xiàn)不間斷地捕捉數(shù)據(jù)的變化,通常的方法是在寫磁盤時,對備份源和備份目標(biāo)的數(shù)據(jù)進行比對,這種比對可以是基于檔級的,也可以是基于磁盤塊級別的,甚至可以是基于比磁盤塊更小的粒度級別的。如美國飛康等公司的CDP設(shè)備,就可以在磁盤塊大小為4 KB的情況下,將磁盤數(shù)據(jù)比對的粒度定為512 B。數(shù)據(jù)比對的粒度越大,比對操作所占用的系統(tǒng)資源越小,但備份源和備份目標(biāo)之間的數(shù)據(jù)差異也越大,需要傳輸?shù)臄?shù)據(jù)量也越多;相反,數(shù)據(jù)比對的粒度越小,則比對操作所占用的系統(tǒng)資源就越大,但備份源和備份目標(biāo)之間的數(shù)據(jù)差異也越小,需要傳輸?shù)臄?shù)據(jù)量也越小,這對于帶寬較小的遠程備份較為有利。
2.3 連續(xù)數(shù)據(jù)保護技術(shù)的優(yōu)勢
相對于傳統(tǒng)的災(zāi)難備份與恢復(fù)技術(shù),連續(xù)數(shù)據(jù)保護這一全新的技術(shù)有著以下優(yōu)勢:
(1)連續(xù)數(shù)據(jù)保護技術(shù)可以提供粒度無限精細的恢復(fù)點,因為數(shù)據(jù)的每次變化都被記錄,所以從理論上來說,數(shù)據(jù)可以恢復(fù)到任意時間點。而傳統(tǒng)災(zāi)難備份與恢復(fù)技術(shù)的恢復(fù)點時間粒度較粗,只能是少數(shù)幾個用戶定義的備份時間點。這也是連續(xù)數(shù)據(jù)保護技術(shù)最大的概念性突破。
(2)連續(xù)數(shù)據(jù)保護技術(shù)的備份目標(biāo)區(qū)可以同時設(shè)置多個,如CDP設(shè)備的本地磁盤、文件服務(wù)器、網(wǎng)絡(luò)接入設(shè)備(如NAS等)、CDP管理服務(wù)器等均可同時作為備份目標(biāo)區(qū),而傳統(tǒng)災(zāi)難備份與恢復(fù)技術(shù)的備份目標(biāo)區(qū)一般只能對應(yīng)1個。
(3)連續(xù)數(shù)據(jù)保護技術(shù)強調(diào)快速的恢復(fù)能力,而傳統(tǒng)災(zāi)難備份與恢復(fù)技術(shù)則側(cè)重備份。對于CDP設(shè)備來說,備份是自動進行的,數(shù)據(jù)的每次變更都會觸發(fā)保護操作,不需要人工干預(yù),在災(zāi)難發(fā)生時,CDP支持瞬間恢復(fù)及快速故障切換,數(shù)據(jù)的恢復(fù)既可以由管理員來完成,也可以允許最終用戶進行恢復(fù)。傳統(tǒng)災(zāi)難備份與恢復(fù)技術(shù)側(cè)重于對備份過程及備份數(shù)據(jù)的管理,管理員需要關(guān)注如備份窗口、備份周期、備份介質(zhì)的保管等諸多問題,而在災(zāi)難發(fā)生時,卻很難提供快速簡便的恢復(fù)能力。
(4)連續(xù)數(shù)據(jù)保護技術(shù)可以同時提供多重災(zāi)備手段,比如CDP設(shè)備可以在向遠程目標(biāo)區(qū)復(fù)制數(shù)據(jù)的同時,將自身的存儲空間和主機磁盤組成RAID1鏡像,而此RAID是建立在邏輯存儲層,所以主機磁盤原有的RAID絲毫不受影響。傳統(tǒng)的災(zāi)難備份與恢復(fù)技術(shù)一般情況下只能提供一重保護。
3 連續(xù)數(shù)據(jù)保護的發(fā)展方向
各家廠商的解決方案在實現(xiàn)方法及產(chǎn)品功能上不盡相同,連續(xù)數(shù)據(jù)保護技術(shù)本身及其實現(xiàn)方案也在不斷地完善發(fā)展當(dāng)中。隨著人們對數(shù)據(jù)備份及恢復(fù)需求的提高及軟硬件技術(shù)發(fā)展,連續(xù)數(shù)據(jù)保護將在以下幾個方面不斷地發(fā)展。
3.1 連續(xù)數(shù)據(jù)保護技術(shù)本身的完善
連續(xù)數(shù)據(jù)保護技術(shù)的重點在于對數(shù)據(jù)變化的比對、索引、記錄、壓縮和傳輸,在這幾個方面尋求更高效的算法,以提高數(shù)據(jù)備份及恢復(fù)的效率和可靠性,降低主機及網(wǎng)絡(luò)等資源的占用,將是連續(xù)數(shù)據(jù)保護技術(shù)的主要改進方向。
3.2 連續(xù)數(shù)據(jù)保護產(chǎn)品的優(yōu)化改進
目前,常見的CDP設(shè)備均是由X86服務(wù)器附加大容量的存儲設(shè)備組成硬件,以Linux操作系統(tǒng)上運行的專用軟件來提供數(shù)據(jù)保護能力,優(yōu)點是硬件及操作系統(tǒng)技術(shù)成熟,廠家的重點放在了提供連續(xù)數(shù)據(jù)保護的應(yīng)用軟件上面,不足之處是CDP設(shè)備系統(tǒng)軟件和硬件均未針對數(shù)據(jù)保護和存儲做深度優(yōu)化,這在一定程度上限制了CDP設(shè)備功能和性能的發(fā)揮。若能在硬件和系統(tǒng)軟件層面針對數(shù)據(jù)存儲和傳輸加以改進,則能大大提高CDP設(shè)備的可靠性和工作效率。
3.3 連續(xù)數(shù)據(jù)保護技術(shù)與傳統(tǒng)災(zāi)備技術(shù)的整合
傳統(tǒng)的災(zāi)難備份與恢復(fù)技術(shù)已經(jīng)發(fā)展得較為成熟,與連續(xù)數(shù)據(jù)保護技術(shù)相比較,在對特定應(yīng)用環(huán)境的適應(yīng)性、性價比等方面,也具有自身不可替代的作用,而對于有些特殊的要求,CDP設(shè)備也難以滿足,因此,將連續(xù)數(shù)據(jù)保護技術(shù)產(chǎn)品與傳統(tǒng)災(zāi)難備份與恢復(fù)方案相整合,與此同時,使連續(xù)數(shù)據(jù)保護和傳統(tǒng)災(zāi)難備份與恢復(fù)技術(shù)相互吸收融合,取長補短,將可以形成更為完善的災(zāi)難備份與恢復(fù)解決方案,能最大限度滿足客戶需求。
連續(xù)數(shù)據(jù)保護技術(shù),其產(chǎn)品正在各個行業(yè)快速普及,這種思想新穎、特點鮮明的災(zāi)難備份與恢復(fù)技術(shù)為用戶寶貴的信息資源提供了前所未有的保護與恢復(fù)能力。
參考文獻
[1] 中華人民共和國國家質(zhì)量監(jiān)督檢驗檢疫總局,中國國家標(biāo)準(zhǔn)化管理委員會.信息安全技術(shù)信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范(GB/T 20988-2007)[M].北京:中國標(biāo)準(zhǔn)出版社,2007.
[2] Storage Networking Industry Association. Continuous Data protection-solving the problem of restoration. http://www.snia.org/forums/dmf/knowledge/white_papers_and_reports/CDP_Solving_recovery_20080808.pdf.
[3] 范昊,彭超.持續(xù)數(shù)據(jù)保護技術(shù)的研究[J].科技資訊,2006(31):11-12.
[4] 顏軍.飛康CDP,挑戰(zhàn)傳統(tǒng)災(zāi)備技術(shù)[J].金融電子化,2008(10):28.
[5] 劉旭輝.華為3COM稅務(wù)連續(xù)數(shù)據(jù)保護CDP解決方案[J].軍民兩用技術(shù)與產(chǎn)品,2006(6):35-36.
