專業(yè)的數(shù)據(jù)中心級(jí)設(shè)備
網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大、業(yè)務(wù)種類的日益豐富、流量的快速增長(zhǎng)以及Data、HPC、SAN網(wǎng)絡(luò)逐步融合的要求,對(duì)數(shù)據(jù)中心級(jí)核心交換機(jī)提出了新的需求:Tbps級(jí)以上超大交換容量、數(shù)據(jù)中心級(jí)高可靠性、精細(xì)化業(yè)務(wù)調(diào)度能力、高擴(kuò)展性和高安全性,除此以外還要滿足易維護(hù)、綠色節(jié)能等要求用以進(jìn)一步降低用戶TCO。面對(duì)這些高要求的挑戰(zhàn),下一代100G平臺(tái)的專業(yè)數(shù)據(jù)中心級(jí)交換機(jī)并不只是簡(jiǎn)單的擴(kuò)充10G平臺(tái)的交換容量,而需要采用更多高端的先進(jìn)技術(shù)才能滿足不斷發(fā)展的應(yīng)用要求。
立足于解決國(guó)內(nèi)數(shù)據(jù)中心面臨的問題,考慮不斷提升的應(yīng)用需求,H3C S12500核心交換機(jī)在方案設(shè)計(jì)上綜合了傳統(tǒng)核心交換機(jī)的應(yīng)用經(jīng)驗(yàn),并充分吸收了業(yè)界高端先進(jìn)技術(shù),成為業(yè)界領(lǐng)先的專業(yè)的數(shù)據(jù)中心級(jí)交換機(jī)。
CLOS架構(gòu)實(shí)現(xiàn)超大容量及高可擴(kuò)展性
采用Crossbar交換架構(gòu)的第五代萬兆核心交換機(jī)為10G端口的普及發(fā)揮了巨大作用,但同樣受限于單顆Crossbar芯片的交換容量,對(duì)于設(shè)計(jì)超大容量且兼具高擴(kuò)展性的下一代100G核心交換機(jī)而言,如果再依賴Crossbar芯片容量的進(jìn)一步擴(kuò)展或者簡(jiǎn)單累加就變的比較困難。
基于100G平臺(tái)的H3C S12500系列核心交換機(jī),采用CLOS交換架構(gòu),將多個(gè)交換網(wǎng)模塊互聯(lián)為多級(jí)多平面交換體系,完美解決了交換容量擴(kuò)展受限于單顆交換網(wǎng)片能力的問題。S12500當(dāng)前可提供高達(dá)5.76Tbps的系統(tǒng)交換能力,單向180Gbps的槽位帶寬可以輕松支持40G和100G端口,后續(xù)單臺(tái)設(shè)備交換容量更可擴(kuò)展至13.32Tbps,槽位帶寬增加至360Gbps。同時(shí)多級(jí)多平面交換架構(gòu)的采用,便于通過多框集群技術(shù)突破單臺(tái)設(shè)備交換容量的限制,滿足未來對(duì)交換能力的進(jìn)一步需求,從而深度保護(hù)用戶投資。
新一代數(shù)據(jù)中心" title="新一代數(shù)據(jù)中心" />新一代數(shù)據(jù)中心之智能化" src="http://files.chinaaet.com/images/20110109/98c7e21d-3b4a-42ed-bb2d-d3f63a2ce5f8.jpg" style="cursor: pointer" title="點(diǎn)擊圖片可在新窗口打開" />
更合理的分布式緩存機(jī)制
通過CLOS架構(gòu)提供超大交換容量的同時(shí),S12500創(chuàng)造性的采用更合理的"PULL"模式進(jìn)行系統(tǒng)內(nèi)轉(zhuǎn)發(fā)調(diào)度,從而一改傳統(tǒng)"PUSH"調(diào)度模式下報(bào)文集中緩存于出端口的方式,將報(bào)文分布式緩存在入端口,這對(duì)于解決數(shù)據(jù)中心典型擁塞模型下的突發(fā)丟包具有極大的意義。
擁塞常見于多端口向單端口轉(zhuǎn)發(fā)模型以及高速端口向低速端口轉(zhuǎn)發(fā)模型,這兩種轉(zhuǎn)發(fā)模型下即使持續(xù)業(yè)務(wù)流量低于目的端口帶寬,也會(huì)因?yàn)榱髁康乃查g突發(fā)極易導(dǎo)致丟包的產(chǎn)生。入方向的分布式緩存完美消除了擁塞模型的影響:多對(duì)一轉(zhuǎn)發(fā)模型下報(bào)文被緩存在入方向多個(gè)端口的多個(gè)緩存中,高對(duì)低轉(zhuǎn)發(fā)模型下報(bào)文被緩存在入方向高速端口的更大緩存中,均能最有效的利用端口緩存能力,最大限度的吸收突發(fā)流量。
S12500提供每線速10G端口256M bytes大緩存,結(jié)合分布式的緩存模型,充分保障了200ms的緩存能力,消除了突發(fā)丟包對(duì)業(yè)務(wù)連續(xù)性的影響。
全流量模型下的交換網(wǎng)無阻塞動(dòng)態(tài)路由
交換網(wǎng)提供大容量交換能力的同時(shí),還必須保證對(duì)交換路徑的充分利用,從而真正做到交換網(wǎng)業(yè)務(wù)調(diào)度的無阻塞性。交換網(wǎng)業(yè)務(wù)調(diào)度無阻塞性的一種重要因素就是報(bào)文能否在所有交換網(wǎng)轉(zhuǎn)發(fā)路徑上均勻分擔(dān)。報(bào)文跨交換網(wǎng)轉(zhuǎn)發(fā)時(shí)的路徑選擇方案也稱交換網(wǎng)路由方案,通常有兩類路由方式:基于報(bào)文關(guān)鍵參數(shù)進(jìn)行指定路徑或者HASH選路的靜態(tài)路由方式和基于交換網(wǎng)路徑狀態(tài)實(shí)時(shí)檢測(cè)的動(dòng)態(tài)路由方式。
靜態(tài)路由方式實(shí)現(xiàn)較簡(jiǎn)單經(jīng)濟(jì),能解決普通情況下的交換網(wǎng)不同路徑報(bào)文分擔(dān)問題,但當(dāng)個(gè)別交換網(wǎng)單元出現(xiàn)故障或者報(bào)文特征離散性不夠時(shí)分擔(dān)效果較差,導(dǎo)致報(bào)文集中于個(gè)別轉(zhuǎn)發(fā)路徑,從而出現(xiàn)假阻塞現(xiàn)象:即交換網(wǎng)絡(luò)仍存在空閑路徑時(shí),由于報(bào)文集中于個(gè)別固定路徑進(jìn)行交換導(dǎo)致的阻塞。
動(dòng)態(tài)路由方式通過實(shí)時(shí)檢測(cè)所有交換網(wǎng)轉(zhuǎn)發(fā)路徑,并根據(jù)各轉(zhuǎn)發(fā)路徑的健康狀況和負(fù)荷情況動(dòng)態(tài)調(diào)節(jié)報(bào)文轉(zhuǎn)發(fā)路徑,從而使得任何情況下報(bào)文都能均勻分布于交換網(wǎng)各轉(zhuǎn)發(fā)路徑,充分利用交換帶寬,徹底避免假阻塞現(xiàn)象。交換網(wǎng)動(dòng)態(tài)路由的實(shí)現(xiàn)方式適應(yīng)性最強(qiáng),但同時(shí)對(duì)技術(shù)要求更高,芯片成本也相對(duì)較高。
考慮核心交換機(jī)所處網(wǎng)絡(luò)位置的重要性,S12500通過硬件實(shí)現(xiàn)交換網(wǎng)動(dòng)態(tài)路由方案,可以做到全流量模型下的交換網(wǎng)無阻塞動(dòng)態(tài)路由,最大程度保護(hù)業(yè)務(wù)的永續(xù)性轉(zhuǎn)發(fā)。
零業(yè)務(wù)中斷為目標(biāo)的高可靠性
高可靠性是核心交換機(jī)重要特性,零業(yè)務(wù)中斷是S12500高可靠性設(shè)計(jì)目標(biāo),為此設(shè)備關(guān)鍵模塊如主控板、交換網(wǎng)板、電源、散熱系統(tǒng)均進(jìn)行了冗余設(shè)計(jì)。
主控板1+1冗余備份,并通過NSF/GR、在線升級(jí)機(jī)制避免控制平面倒換對(duì)業(yè)務(wù)轉(zhuǎn)發(fā)產(chǎn)生影響。S12500將交換網(wǎng)板獨(dú)立設(shè)置,使得控制平面和轉(zhuǎn)發(fā)平面物理上完全分離,從而徹底避免相對(duì)高故障率的控制平面問題對(duì)極低故障率的轉(zhuǎn)發(fā)平面產(chǎn)生影響,進(jìn)一步增強(qiáng)了業(yè)務(wù)永續(xù)性保證。冗余配置時(shí)網(wǎng)板故障對(duì)業(yè)務(wù)無影響,非冗余配置時(shí),則隨著損壞的網(wǎng)板數(shù)目系統(tǒng)轉(zhuǎn)發(fā)性能成比例下降(Graceful Degrade)。
對(duì)于保證系統(tǒng)穩(wěn)定運(yùn)行至關(guān)重要的散熱系統(tǒng),S12500通過系統(tǒng)風(fēng)道的優(yōu)化設(shè)計(jì)實(shí)現(xiàn)了風(fēng)扇框的1+1冗余備份,不但風(fēng)扇框內(nèi)的風(fēng)扇實(shí)現(xiàn)冗余備份,必要時(shí)刻通過自動(dòng)調(diào)速單個(gè)風(fēng)扇框即能滿足系統(tǒng)的正常散熱要求,極大增強(qiáng)了散熱系統(tǒng)的可靠性。S12500電源模塊支持N+M冗余備份,確保設(shè)備供電無憂。
除關(guān)鍵模塊的冗余設(shè)計(jì)外,為保證業(yè)務(wù)的高可靠性,S12500控制平面采用三CPU系統(tǒng)進(jìn)行業(yè)務(wù)處理:主控CPU系統(tǒng)、FFDR(Fast Fault Detection and Restoration,快速故障檢測(cè)及恢復(fù))CPU系統(tǒng)、EMS(Embedded Maintenance Subsystem,嵌入式維護(hù)子系統(tǒng))CPU系統(tǒng)。主要協(xié)議處理由主控CPU系統(tǒng)完成。FFDR CPU專門用于BFD、OAM等快速故障檢測(cè)處理,避免業(yè)務(wù)協(xié)議處理對(duì)快速故障檢測(cè)帶來影響。EMS CPU支持電源智能管理,通過控制設(shè)備上電過程,使得系統(tǒng)各模塊分批順序上電,從而平滑系統(tǒng)上電時(shí)的浪涌電流沖擊,增加系統(tǒng)可靠性。
豐富易用的維護(hù)診斷手段
豐富易用的維護(hù)手段有助于運(yùn)維人員及早發(fā)現(xiàn)網(wǎng)絡(luò)和設(shè)備運(yùn)行中的隱患,從而避免故障的發(fā)生,確保網(wǎng)絡(luò)的可靠運(yùn)行。S12500設(shè)計(jì)上充分考慮了維護(hù)性需求,提供了豐富的維護(hù)手段供運(yùn)維人員進(jìn)行日常維護(hù),同時(shí)集成了強(qiáng)大的自動(dòng)檢測(cè)和診斷功能確保第一時(shí)間發(fā)現(xiàn)設(shè)備健康問題。
上電時(shí)的自動(dòng)檢測(cè)技術(shù)防止了將問題模塊或者節(jié)點(diǎn)引入正常運(yùn)行的網(wǎng)絡(luò),運(yùn)行時(shí)的關(guān)鍵器件定時(shí)檢測(cè)技術(shù)以及轉(zhuǎn)發(fā)通道定時(shí)檢測(cè)技術(shù)可以保證最快發(fā)現(xiàn)設(shè)備健康問題,并且這種健康狀態(tài)的定時(shí)檢測(cè)不會(huì)對(duì)業(yè)務(wù)帶來任何影響。當(dāng)有故障導(dǎo)致單板不能正常工作時(shí),提供單板隔離命令,隔離后的單板可以進(jìn)行離線業(yè)務(wù)診斷,用以收集單板的詳細(xì)信息,加速故障排查。并且這些功能的提供都不需要加載額外的軟件,單板隔離和診斷都僅僅需要執(zhí)行單條命令即可實(shí)現(xiàn),具有極大的易用性。如需進(jìn)一步分析,S12500還可以在不影響業(yè)務(wù)的情況下通過單條命令收集整個(gè)系統(tǒng)的診斷信息。
對(duì)于設(shè)備和網(wǎng)絡(luò)的日常維護(hù),S12500提供了802.3ah OAM、NQA(Network Quality Analyzer)、sFlow以及豐富的查詢命令等功能,供運(yùn)維人員收集設(shè)備情況、網(wǎng)絡(luò)流量、鏈路質(zhì)量、連通性等方面的信息。
無處不在的綠色節(jié)能設(shè)計(jì)
在創(chuàng)建綠色數(shù)據(jù)中心呼聲日益高漲的今天,S12500將綠色設(shè)計(jì)貫穿系統(tǒng)的每個(gè)環(huán)節(jié):更高的芯片集成度加上轉(zhuǎn)發(fā)引擎65nm芯片工藝進(jìn)一步提升功能/能耗比;未連線狀態(tài)的外部端口自動(dòng)進(jìn)入節(jié)能模式、槽位空閑時(shí)未使用的交換網(wǎng)端口自動(dòng)關(guān)閉、通過EMS CPU進(jìn)行管理的單板單獨(dú)上下電以及效率高于91.5%的電源方案均最大限度的避免了無效功率的浪費(fèi);同時(shí)優(yōu)化的風(fēng)道設(shè)計(jì)、分區(qū)智能調(diào)速風(fēng)扇的運(yùn)用進(jìn)一步降低了散熱系統(tǒng)自身的功耗。無處不在的綠色設(shè)計(jì)使得S12500每端口對(duì)應(yīng)功耗僅為業(yè)界同類設(shè)備的50%左右,這一能耗水平對(duì)于以高性能、高密度端口和豐富業(yè)務(wù)特性著稱的S12500來說尤其可貴。
專業(yè)的數(shù)據(jù)中心管理
數(shù)據(jù)中心是數(shù)據(jù)的傳輸、計(jì)算和存儲(chǔ)的中心,集中了各種軟硬件資源和關(guān)鍵業(yè)務(wù)系統(tǒng),面臨的異構(gòu)環(huán)境問題、業(yè)務(wù)融合問題、用戶安全問題、管理規(guī)范問題等非常復(fù)雜,給數(shù)據(jù)中心的管理帶來了巨大的挑戰(zhàn)。從基礎(chǔ)設(shè)施角度看,需要管理路由器、交換機(jī)、安全、存儲(chǔ)、機(jī)房動(dòng)力等設(shè)備;從上層應(yīng)用角度看,需要管理數(shù)據(jù)庫、服務(wù)器、中間件、Web等業(yè)務(wù);從使用者角度看,需要管理內(nèi)部用戶、來訪客人、外部供應(yīng)商、internet顧客等類型的用戶;從協(xié)議角度看,需要管理VLAN、MPLS VPN、QoS服務(wù)質(zhì)量、ACL安全策略、SLA服務(wù)水平等不同技術(shù)。因此,數(shù)據(jù)中心的管理不僅要綜合考慮廠商、設(shè)備、應(yīng)用、用戶、技術(shù)等各種要素,還需要考慮與數(shù)據(jù)中心IT部門的運(yùn)維流程結(jié)合,建立一個(gè)開放式、標(biāo)準(zhǔn)化、易擴(kuò)展、可聯(lián)動(dòng)的統(tǒng)一智能管理平臺(tái),從而為數(shù)據(jù)中心的各種關(guān)鍵業(yè)務(wù)系統(tǒng)提供支撐。
傳統(tǒng)網(wǎng)絡(luò)管理軟件以SNMP簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議為核心,采用FCAPS管理模型(即故障管理、配置管理、賬戶管理、性能管理和安全管理),在以網(wǎng)絡(luò)設(shè)備為主的環(huán)境中發(fā)揮了重要作用。而數(shù)據(jù)中心作為IP技術(shù)與IT技術(shù)兩大領(lǐng)域的結(jié)合體,在管理方面帶來了新的挑戰(zhàn)。不僅需要從網(wǎng)絡(luò)的角度來保障用戶和業(yè)務(wù),也要從用戶和業(yè)務(wù)的角度出發(fā)來優(yōu)化網(wǎng)絡(luò),而在網(wǎng)絡(luò)與用戶及業(yè)務(wù)之間,則需要通過技術(shù)和流程將兩者有機(jī)地結(jié)合起來,形成智能化的數(shù)據(jù)中心管理。這意味著新的管理模型必須采用面向服務(wù)的軟件架構(gòu),在融合SNMP、Radius、NetStream、WMI、JMX、ITIL等各種管理技術(shù)的基礎(chǔ)上,提供不同的管理組件和便于擴(kuò)展的開放接口,實(shí)現(xiàn)融合IP和IT、彼此聯(lián)動(dòng)的精細(xì)管理流程。