摘 要: 分析了虛擬化技術(shù)為企業(yè)IT管理帶來的影響和企業(yè)IT虛擬化過程中面臨的主要風(fēng)險。將PDCA的方法運用于IT資源的虛擬化過程,提出了實施IT虛擬化過程的5個步驟,以降低執(zhí)行風(fēng)險。
關(guān)鍵詞: 虛擬化;資源池;風(fēng)險;IT管理
從VLAN開始,越來越多的虛擬化技術(shù)逐漸被各種規(guī)模的數(shù)據(jù)中心的管理者所接受。虛擬化專網(wǎng)、存儲虛擬化、服務(wù)器分區(qū)、服務(wù)器虛擬化等虛擬化技術(shù)在數(shù)據(jù)中心中獲得廣泛使用,在為管理者和使用者帶來資源利用率提升、交付時間減少、系統(tǒng)可用性提高等收益之外,也由于管理層次和被管理對象的增加,帶來了其他方面的影響,這些影響很可能會轉(zhuǎn)變?yōu)橥{IT系統(tǒng)穩(wěn)定運行的風(fēng)險[1]。IT系統(tǒng)的管理者應(yīng)采取相應(yīng)的措施,使這種風(fēng)險始終處于可以接受的范圍內(nèi)。
1 虛擬化技術(shù)為IT管理帶來的影響
單一虛擬化技術(shù)的使用對IT管理的影響有限,通??梢酝ㄟ^手工管理的方式處理,如很多機(jī)構(gòu)的網(wǎng)絡(luò)VLAN管理是通過維護(hù)一張VLAN分配表進(jìn)行的。而現(xiàn)今,各種虛擬化技術(shù)已經(jīng)覆蓋了IT環(huán)境中從網(wǎng)絡(luò)、計算、存儲到桌面以至應(yīng)用等多個層面,不論在應(yīng)用的部署方式還是在IT運維管理體制上,都對IT系統(tǒng)的管理帶來了相當(dāng)?shù)挠绊憽_@些影響主要體現(xiàn)在以下幾個方面。
(1)更多類型的資源池
網(wǎng)絡(luò)交換機(jī)提供了數(shù)據(jù)通信能力,服務(wù)器提供了數(shù)據(jù)處理能力,磁盤陣列提供數(shù)據(jù)存儲能力。隨著單臺設(shè)備處理能力的提高和虛擬化技術(shù)的使用,能力的使用者與提供能力的設(shè)備之間已經(jīng)不存在一一對應(yīng)的關(guān)系,VLAN可以貫穿多個交換機(jī),一臺物理服務(wù)器可以支撐多個虛擬服務(wù)器的運行,一臺磁盤陣列可以分配給多個應(yīng)用系統(tǒng)使用。因此,為降低系統(tǒng)變更時的風(fēng)險,需要維持IT能力使用者與IT設(shè)備之間映射關(guān)系的準(zhǔn)確記錄,并根據(jù)這一記錄管理已使用和尚未使用的IT能力。通常,提供相似能力的設(shè)備被聚合在一起,構(gòu)成某種類型的資源池,而不同種類的能力被構(gòu)建為不同類型的資源池,在需要某種能力時才進(jìn)行能力即資源的分配。在廣泛使用虛擬化技術(shù)的數(shù)據(jù)中心中,資源池的類型可能很多,如IP地址資源池、VLAN資源池、采用VMware、KVM、Xen或PowerVM虛擬化技術(shù)構(gòu)建的計算資源池、共享文件系統(tǒng)存儲資源池、裸存儲設(shè)備資源池等。
(2)對IT設(shè)備的處理能力要求提高
資源池的資源總量一定時,通常希望構(gòu)造資源池使用的設(shè)備數(shù)量越少越好,以減少管理上的負(fù)擔(dān),因此會盡量采用處理能力較高的設(shè)備。在選購設(shè)備時通常采用“處理能力/占用空間”或“處理能力/設(shè)備功耗”等評估參數(shù),以便在相同的功耗或空間占用條件下獲取更多的可調(diào)度資源。
(3)設(shè)備故障對系統(tǒng)可用性的影響面加大
在資源池中,單獨的資源提供者提供的資源可能被多個資源使用者所使用,當(dāng)資源的提供者個體發(fā)生故障時,多個資源使用者都會受到影響。但是,由于可以隨時從資源池分配所需的資源,資源使用者受到的影響將是暫時的,不必等到故障設(shè)備修復(fù)。與一對一的資源提供與資源使用方式相比較,資源池中冗余的能力可以為更多的資源使用者提供保護(hù),從而降低了資源提供者個體發(fā)生故障時的影響程度。因此,在規(guī)劃資源池容量時應(yīng)考慮必要的冗余性和隨時分配資源的能力。
(4)資源池建設(shè)從規(guī)劃出發(fā),資源分配對應(yīng)應(yīng)用需求
通常,資源池的容量與增長規(guī)劃是根據(jù)現(xiàn)有業(yè)務(wù)總量對資源的使用情況以及未來對資源使用需求的預(yù)測做出的,并保留有一定余量。因此,在工程建設(shè)管理上,應(yīng)用系統(tǒng)的建設(shè)項目往往會優(yōu)先考慮使用資源池提供的能力,從而獲得更短的交付時間,而不是采購新的能力。因此,資源池建設(shè)項目可能無法與應(yīng)用系統(tǒng)的建設(shè)項目一一對應(yīng)。
(5)管理工具缺失與操作成熟度不足
雖然虛擬化技術(shù)在IT環(huán)境中已經(jīng)使用了很長時間了,但仍然缺少能夠?qū)Ω鞣N虛擬化的映射關(guān)系進(jìn)行統(tǒng)一和集中管理的有效手段和工具,只能使用專用的管理工具進(jìn)行專項管理,每增加一個虛擬化產(chǎn)品,都會增加對應(yīng)的管理工具。另一方面,為了保證資源的有效使用,還需要在資源池和構(gòu)成資源池的設(shè)備的整個生命周期中,隨時進(jìn)行資源的分配與回收,并對資源池的組成、資源池總?cè)萘?、資源的利用率等指標(biāo)進(jìn)行監(jiān)控,這些都是對運維管理人員的操作熟練程度的考驗。
除上述幾點之外,虛擬化技術(shù)為IT管理帶來的影響還包括對不能進(jìn)行虛擬化的設(shè)備造成的影響、對數(shù)據(jù)訪問和備份體制的影響、對安全管控體系的影響、對運維管理人員的崗位和職責(zé)的影響等,這些影響貫穿了虛擬化技術(shù)使用過程的規(guī)劃設(shè)計、工程實施和系統(tǒng)運維等多個階段,并且有可能透過IT運維管理中的薄弱環(huán)節(jié)成為影響系統(tǒng)正常運行的風(fēng)險。
2 IT虛擬化過程面臨的主要風(fēng)險
當(dāng)前,很多機(jī)構(gòu)希望在IT系統(tǒng)中使用更多更先進(jìn)的虛擬化技術(shù),以獲得虛擬化技術(shù)所帶來的資源利用率提升、交付時間減少、系統(tǒng)可用性提高、總體擁有成本降低等收益[2]。但在IT系統(tǒng)向大規(guī)模使用虛擬化技術(shù)演進(jìn)的過程中,虛擬化技術(shù)為IT管理帶來的影響很可能會轉(zhuǎn)變?yōu)橥{IT系統(tǒng)正常運行的風(fēng)險。
首先,在虛擬化系統(tǒng)規(guī)劃設(shè)計過程中,缺少對整體IT系統(tǒng)虛擬化潛力的評估[3],或者對虛擬化技術(shù)的局限性認(rèn)識不足,都可能導(dǎo)致設(shè)定了過高的虛擬化目標(biāo),最終導(dǎo)致虛擬化項目的失敗。
其次,在應(yīng)用系統(tǒng)由物理環(huán)境向虛擬化環(huán)境遷移的過程中,可能因為缺少對遷移過程中風(fēng)險的識別與控制,或者沒有正確對待重要性等級不同的應(yīng)用系統(tǒng),可能導(dǎo)致遷移過程所做準(zhǔn)備不足、遷移過程持續(xù)時間過長或遷移失敗,因應(yīng)用中斷帶來的損失也可能超出預(yù)期。
再有,運維人員缺少虛擬化系統(tǒng)的運行管理經(jīng)驗和有效的管理工具,可能會導(dǎo)致資源分配與調(diào)度出現(xiàn)失誤、資源無法順利回收、對資源使用的預(yù)測失準(zhǔn)等人為故障。更為嚴(yán)重的是,由于虛擬化設(shè)備的生成非常簡單而且快速,在缺少有效的管控措施的情況下,虛擬化設(shè)備的數(shù)量可能失控,大量的虛擬化設(shè)備導(dǎo)致管理負(fù)擔(dān)的急劇加重,運維管理質(zhì)量迅速下降。一種常見的現(xiàn)象是在一個服務(wù)器虛擬化環(huán)境中存在很多好像無人管理和使用的虛擬機(jī),系統(tǒng)管理員也不敢輕易刪除它們以釋放被占用的資源,只能放任其存在,這種現(xiàn)象被稱作“虛機(jī)蔓延”。
3 IT虛擬化風(fēng)險的應(yīng)對策略
為了降低IT系統(tǒng)在虛擬化過程中所面臨的風(fēng)險的影響,一種有效的方法是采用PDCA法對引入虛擬化技術(shù)的整個過程進(jìn)行控制,這個過程可分為5個主要的步驟。
(1)虛擬化需求分析
虛擬化需求分析的主要任務(wù)是獲取并明確IT虛擬化建設(shè)的需求和目標(biāo),為其后的設(shè)計和實施工作收集必要的信息。主要的分析工作包括:
①進(jìn)行當(dāng)前應(yīng)用系統(tǒng)運行環(huán)境分析,用以確定需要建設(shè)的資源池的種類與功能;
②進(jìn)行IT發(fā)展規(guī)劃分析,用以確定資源池的容量和擴(kuò)展能力的需求;
③進(jìn)行IT安全策略與需求分析,用以確定資源池的安全屬性;
④進(jìn)行虛擬化產(chǎn)品和技術(shù)分析,用以幫助選擇適合的虛擬化技術(shù),確定資源池的可靠性、可用性、擴(kuò)展性和可管理性;
⑤進(jìn)行應(yīng)用連續(xù)性需求分析,用以選擇適合的虛擬化遷移方法,并幫助制定適合的虛擬化演進(jìn)路徑;
⑥進(jìn)行現(xiàn)有管理體制分析,用以確定資源管理體制建設(shè)的起點。
(2)資源池規(guī)劃與設(shè)計
資源池規(guī)劃設(shè)計[4]的主要任務(wù)是依照需求分析階段提出的對資源池的功能、容量、可靠性、可用性、擴(kuò)展性、安全性與可管理性的需求,選擇適合的虛擬化技術(shù),設(shè)計虛擬化體系的總體結(jié)構(gòu)和各資源池的構(gòu)建與部署方式,以為當(dāng)前和未來的應(yīng)用系統(tǒng)提供滿足其運行要求的虛擬化運行環(huán)境,同時確定與虛擬化系統(tǒng)相關(guān)的系統(tǒng)(如數(shù)據(jù)備份系統(tǒng)、應(yīng)用負(fù)載均衡系統(tǒng)等)的調(diào)整方案。
(3)向虛擬化環(huán)境演進(jìn)
在完成資源池規(guī)劃設(shè)計后,可以著手進(jìn)行虛擬化改造的概念驗證(POC)測試,以確定待遷移的應(yīng)用系統(tǒng)能夠在虛擬化環(huán)境中正常運行。進(jìn)一步地,建立種子資源池,并選擇適當(dāng)?shù)姆椒ê蜁r機(jī)將部分應(yīng)用系統(tǒng)由當(dāng)前的物理運行環(huán)境遷移到虛擬化的運行環(huán)境中。演進(jìn)過程的設(shè)計和實施可借鑒業(yè)務(wù)連續(xù)性管理(BCM)的方法,對遷移過程中可能遇到的風(fēng)險和應(yīng)用中斷造成的損失進(jìn)行分析,制定遷移過程的詳細(xì)方案和實施操作細(xì)則,為遷移無法按計劃完成做相應(yīng)準(zhǔn)備,力求將風(fēng)險、必然發(fā)生的損失和可能發(fā)生的損失控制在可接受的范圍內(nèi)。
(4)建立資源管理體制
在部署和使用IT虛擬化技術(shù)后,IT系統(tǒng)的運維管理體制應(yīng)能夠?qū)Y源進(jìn)行管理,包括資源的申請、分配、監(jiān)測、評價、調(diào)度、回收等。可對現(xiàn)有的IT服務(wù)管理(ITSM)流程進(jìn)行優(yōu)化以適應(yīng)資源池管理的需要,如增加資源管理崗位、修改配置管理和變更管理流程等,也可以參考ITIL建立新的IT資源管理體制。
(5)虛擬化效果評估
IT虛擬化建設(shè)的過程是一個持續(xù)改進(jìn)的過程,在建立了IT資源管理體制后,就可以利用資源管理體制提供的管理能力檢查和評價IT虛擬化實施的結(jié)果,分析IT系統(tǒng)仍然存在的虛擬化潛力,尋找資源管理體制的缺陷,提出進(jìn)一步改進(jìn)的需求與建議。
通過上述五個步驟,在引入虛擬化技術(shù)時,IT管理所面臨的主要風(fēng)險都會得到有效控制,虛擬化項目的成功率和收益都將得到保證。
虛擬化技術(shù)的廣泛使用在帶來收益的同時,也對數(shù)據(jù)中心的運作和管理方式產(chǎn)生了重大影響,帶來了新的風(fēng)險。但是,通過對風(fēng)險進(jìn)行識別以及源自PDCA法的五個工作步驟,可以將風(fēng)險控制在可接受的范圍內(nèi)。
參考文獻(xiàn)
[1] 左天祖,劉偉.中國IT服務(wù)管理指南[M].北京:北京大學(xué)出版社,2004.
[2] 藺雷,吳貴生.服務(wù)創(chuàng)新[M].北京:清華大學(xué)出版社,2003.
[3] CHORAFAS D N.Cloud Computing strategies[M].Boca Raton:CRC Press,2010.
[4] MARKS E A,LOZANO B.Executive′s guide to Cloud Computing[M].Hoboken:John Wiley & Sons,Inc.,2010.