《電子技術應用》
您所在的位置:首頁 > 通信與網(wǎng)絡 > 設計應用 > 新一代數(shù)據(jù)中心之智能化
新一代數(shù)據(jù)中心之智能化
電子發(fā)燒友
摘要: 專業(yè)的數(shù)據(jù)中心級設備網(wǎng)絡規(guī)模的不斷擴大、業(yè)務種類的日益豐富、流量的快速增長以及Data、HPC、SAN網(wǎng)絡逐步融合的要求,對數(shù)據(jù)中心級核心交換機提出了新的需求:Tbps級以上超大交換容量、數(shù)據(jù)中心級高可靠性、精細化業(yè)務調(diào)度能力、高擴展性和高安全性,除此以外還要滿足易維護、綠色節(jié)能等要求用以進一步降低用戶TCO。面對這些高要求的挑戰(zhàn),下一代100G平臺的專業(yè)數(shù)據(jù)中心級交換機并不只是簡單的擴充10G平臺的交換容量,而需要采用更多高端的先進技術才能滿足不斷發(fā)展的應用要求。立足于解決國內(nèi)數(shù)據(jù)中心面臨的問題,考慮不斷提升的應用需求,H3CS12500核心交換機在方案設計上綜合了傳統(tǒng)核心交換機的應用經(jīng)驗,并充分吸收了業(yè)界高端先進技術,成為業(yè)界領先的專業(yè)的數(shù)據(jù)中心級交換機。CLOS架構(gòu)實現(xiàn)超大容量及高可擴展性采用Crossbar交換架構(gòu)的第五代萬兆核心交換機為10G端口的普及發(fā)揮了巨大作用,但同樣受限于單顆Crossbar芯片的交換容量,對于設計超大容量且兼具高擴展性的下一代100G核心交換機而言,如果再依賴Crossbar芯片容量的進一步擴展或者簡單累加就變的比較困難?;?00G平臺的H3CS12500系列核心交換機,
Abstract:
Key words :

專業(yè)的數(shù)據(jù)中心級設備

網(wǎng)絡規(guī)模的不斷擴大、業(yè)務種類的日益豐富、流量的快速增長以及Data、HPC、SAN網(wǎng)絡逐步融合的要求,對數(shù)據(jù)中心級核心交換機提出了新的需求:Tbps級以上超大交換容量、數(shù)據(jù)中心級高可靠性、精細化業(yè)務調(diào)度能力、高擴展性和高安全性,除此以外還要滿足易維護、綠色節(jié)能等要求用以進一步降低用戶TCO。面對這些高要求的挑戰(zhàn),下一代100G平臺的專業(yè)數(shù)據(jù)中心級交換機并不只是簡單的擴充10G平臺的交換容量,而需要采用更多高端的先進技術才能滿足不斷發(fā)展的應用要求。

 

立足于解決國內(nèi)數(shù)據(jù)中心面臨的問題,考慮不斷提升的應用需求,H3C S12500核心交換機在方案設計上綜合了傳統(tǒng)核心交換機的應用經(jīng)驗,并充分吸收了業(yè)界高端先進技術,成為業(yè)界領先的專業(yè)的數(shù)據(jù)中心級交換機。

CLOS架構(gòu)實現(xiàn)超大容量及高可擴展性

采用Crossbar交換架構(gòu)的第五代萬兆核心交換機為10G端口的普及發(fā)揮了巨大作用,但同樣受限于單顆Crossbar芯片的交換容量,對于設計超大容量且兼具高擴展性的下一代100G核心交換機而言,如果再依賴Crossbar芯片容量的進一步擴展或者簡單累加就變的比較困難。

基于100G平臺的H3C S12500系列核心交換機,采用CLOS交換架構(gòu),將多個交換網(wǎng)模塊互聯(lián)為多級多平面交換體系,完美解決了交換容量擴展受限于單顆交換網(wǎng)片能力的問題。S12500當前可提供高達5.76Tbps的系統(tǒng)交換能力,單向180Gbps的槽位帶寬可以輕松支持40G和100G端口,后續(xù)單臺設備交換容量更可擴展至13.32Tbps,槽位帶寬增加至360Gbps。同時多級多平面交換架構(gòu)的采用,便于通過多框集群技術突破單臺設備交換容量的限制,滿足未來對交換能力的進一步需求,從而深度保護用戶投資。

<a class=新一代數(shù)據(jù)中心" title="新一代數(shù)據(jù)中心" />新一代數(shù)據(jù)中心之智能化" src="http://files.chinaaet.com/images/20110109/98c7e21d-3b4a-42ed-bb2d-d3f63a2ce5f8.jpg" style="cursor: pointer" title="點擊圖片可在新窗口打開" />

更合理的分布式緩存機制

通過CLOS架構(gòu)提供超大交換容量的同時,S12500創(chuàng)造性的采用更合理的"PULL"模式進行系統(tǒng)內(nèi)轉(zhuǎn)發(fā)調(diào)度,從而一改傳統(tǒng)"PUSH"調(diào)度模式下報文集中緩存于出端口的方式,將報文分布式緩存在入端口,這對于解決數(shù)據(jù)中心典型擁塞模型下的突發(fā)丟包具有極大的意義。

擁塞常見于多端口向單端口轉(zhuǎn)發(fā)模型以及高速端口向低速端口轉(zhuǎn)發(fā)模型,這兩種轉(zhuǎn)發(fā)模型下即使持續(xù)業(yè)務流量低于目的端口帶寬,也會因為流量的瞬間突發(fā)極易導致丟包的產(chǎn)生。入方向的分布式緩存完美消除了擁塞模型的影響:多對一轉(zhuǎn)發(fā)模型下報文被緩存在入方向多個端口的多個緩存中,高對低轉(zhuǎn)發(fā)模型下報文被緩存在入方向高速端口的更大緩存中,均能最有效的利用端口緩存能力,最大限度的吸收突發(fā)流量。

S12500提供每線速10G端口256M bytes大緩存,結(jié)合分布式的緩存模型,充分保障了200ms的緩存能力,消除了突發(fā)丟包對業(yè)務連續(xù)性的影響。

新一代數(shù)據(jù)中心之智能化

全流量模型下的交換網(wǎng)無阻塞動態(tài)路由

交換網(wǎng)提供大容量交換能力的同時,還必須保證對交換路徑的充分利用,從而真正做到交換網(wǎng)業(yè)務調(diào)度的無阻塞性。交換網(wǎng)業(yè)務調(diào)度無阻塞性的一種重要因素就是報文能否在所有交換網(wǎng)轉(zhuǎn)發(fā)路徑上均勻分擔。報文跨交換網(wǎng)轉(zhuǎn)發(fā)時的路徑選擇方案也稱交換網(wǎng)路由方案,通常有兩類路由方式:基于報文關鍵參數(shù)進行指定路徑或者HASH選路的靜態(tài)路由方式和基于交換網(wǎng)路徑狀態(tài)實時檢測的動態(tài)路由方式。

靜態(tài)路由方式實現(xiàn)較簡單經(jīng)濟,能解決普通情況下的交換網(wǎng)不同路徑報文分擔問題,但當個別交換網(wǎng)單元出現(xiàn)故障或者報文特征離散性不夠時分擔效果較差,導致報文集中于個別轉(zhuǎn)發(fā)路徑,從而出現(xiàn)假阻塞現(xiàn)象:即交換網(wǎng)絡仍存在空閑路徑時,由于報文集中于個別固定路徑進行交換導致的阻塞。

動態(tài)路由方式通過實時檢測所有交換網(wǎng)轉(zhuǎn)發(fā)路徑,并根據(jù)各轉(zhuǎn)發(fā)路徑的健康狀況和負荷情況動態(tài)調(diào)節(jié)報文轉(zhuǎn)發(fā)路徑,從而使得任何情況下報文都能均勻分布于交換網(wǎng)各轉(zhuǎn)發(fā)路徑,充分利用交換帶寬,徹底避免假阻塞現(xiàn)象。交換網(wǎng)動態(tài)路由的實現(xiàn)方式適應性最強,但同時對技術要求更高,芯片成本也相對較高。

考慮核心交換機所處網(wǎng)絡位置的重要性,S12500通過硬件實現(xiàn)交換網(wǎng)動態(tài)路由方案,可以做到全流量模型下的交換網(wǎng)無阻塞動態(tài)路由,最大程度保護業(yè)務的永續(xù)性轉(zhuǎn)發(fā)。

零業(yè)務中斷為目標的高可靠性

高可靠性是核心交換機重要特性,零業(yè)務中斷是S12500高可靠性設計目標,為此設備關鍵模塊如主控板、交換網(wǎng)板、電源、散熱系統(tǒng)均進行了冗余設計。

主控板1+1冗余備份,并通過NSF/GR、在線升級機制避免控制平面倒換對業(yè)務轉(zhuǎn)發(fā)產(chǎn)生影響。S12500將交換網(wǎng)板獨立設置,使得控制平面和轉(zhuǎn)發(fā)平面物理上完全分離,從而徹底避免相對高故障率的控制平面問題對極低故障率的轉(zhuǎn)發(fā)平面產(chǎn)生影響,進一步增強了業(yè)務永續(xù)性保證。冗余配置時網(wǎng)板故障對業(yè)務無影響,非冗余配置時,則隨著損壞的網(wǎng)板數(shù)目系統(tǒng)轉(zhuǎn)發(fā)性能成比例下降(Graceful Degrade)。

對于保證系統(tǒng)穩(wěn)定運行至關重要的散熱系統(tǒng),S12500通過系統(tǒng)風道的優(yōu)化設計實現(xiàn)了風扇框的1+1冗余備份,不但風扇框內(nèi)的風扇實現(xiàn)冗余備份,必要時刻通過自動調(diào)速單個風扇框即能滿足系統(tǒng)的正常散熱要求,極大增強了散熱系統(tǒng)的可靠性。S12500電源模塊支持N+M冗余備份,確保設備供電無憂。

除關鍵模塊的冗余設計外,為保證業(yè)務的高可靠性,S12500控制平面采用三CPU系統(tǒng)進行業(yè)務處理:主控CPU系統(tǒng)、FFDR(Fast Fault Detection and Restoration,快速故障檢測及恢復)CPU系統(tǒng)、EMS(Embedded Maintenance Subsystem,嵌入式維護子系統(tǒng))CPU系統(tǒng)。主要協(xié)議處理由主控CPU系統(tǒng)完成。FFDR CPU專門用于BFD、OAM等快速故障檢測處理,避免業(yè)務協(xié)議處理對快速故障檢測帶來影響。EMS CPU支持電源智能管理,通過控制設備上電過程,使得系統(tǒng)各模塊分批順序上電,從而平滑系統(tǒng)上電時的浪涌電流沖擊,增加系統(tǒng)可靠性。

豐富易用的維護診斷手段

豐富易用的維護手段有助于運維人員及早發(fā)現(xiàn)網(wǎng)絡和設備運行中的隱患,從而避免故障的發(fā)生,確保網(wǎng)絡的可靠運行。S12500設計上充分考慮了維護性需求,提供了豐富的維護手段供運維人員進行日常維護,同時集成了強大的自動檢測和診斷功能確保第一時間發(fā)現(xiàn)設備健康問題。

上電時的自動檢測技術防止了將問題模塊或者節(jié)點引入正常運行的網(wǎng)絡,運行時的關鍵器件定時檢測技術以及轉(zhuǎn)發(fā)通道定時檢測技術可以保證最快發(fā)現(xiàn)設備健康問題,并且這種健康狀態(tài)的定時檢測不會對業(yè)務帶來任何影響。當有故障導致單板不能正常工作時,提供單板隔離命令,隔離后的單板可以進行離線業(yè)務診斷,用以收集單板的詳細信息,加速故障排查。并且這些功能的提供都不需要加載額外的軟件,單板隔離和診斷都僅僅需要執(zhí)行單條命令即可實現(xiàn),具有極大的易用性。如需進一步分析,S12500還可以在不影響業(yè)務的情況下通過單條命令收集整個系統(tǒng)的診斷信息。

對于設備和網(wǎng)絡的日常維護,S12500提供了802.3ah OAM、NQA(Network Quality Analyzer)、sFlow以及豐富的查詢命令等功能,供運維人員收集設備情況、網(wǎng)絡流量、鏈路質(zhì)量、連通性等方面的信息。

無處不在的綠色節(jié)能設計

在創(chuàng)建綠色數(shù)據(jù)中心呼聲日益高漲的今天,S12500將綠色設計貫穿系統(tǒng)的每個環(huán)節(jié):更高的芯片集成度加上轉(zhuǎn)發(fā)引擎65nm芯片工藝進一步提升功能/能耗比;未連線狀態(tài)的外部端口自動進入節(jié)能模式、槽位空閑時未使用的交換網(wǎng)端口自動關閉、通過EMS CPU進行管理的單板單獨上下電以及效率高于91.5%的電源方案均最大限度的避免了無效功率的浪費;同時優(yōu)化的風道設計、分區(qū)智能調(diào)速風扇的運用進一步降低了散熱系統(tǒng)自身的功耗。無處不在的綠色設計使得S12500每端口對應功耗僅為業(yè)界同類設備的50%左右,這一能耗水平對于以高性能、高密度端口和豐富業(yè)務特性著稱的S12500來說尤其可貴。

 

新一代數(shù)據(jù)中心之智能化

專業(yè)的數(shù)據(jù)中心管理

數(shù)據(jù)中心是數(shù)據(jù)的傳輸、計算和存儲的中心,集中了各種軟硬件資源和關鍵業(yè)務系統(tǒng),面臨的異構(gòu)環(huán)境問題、業(yè)務融合問題、用戶安全問題、管理規(guī)范問題等非常復雜,給數(shù)據(jù)中心的管理帶來了巨大的挑戰(zhàn)。從基礎設施角度看,需要管理路由器、交換機、安全、存儲、機房動力等設備;從上層應用角度看,需要管理數(shù)據(jù)庫、服務器、中間件、Web等業(yè)務;從使用者角度看,需要管理內(nèi)部用戶、來訪客人、外部供應商、internet顧客等類型的用戶;從協(xié)議角度看,需要管理VLAN、MPLS VPN、QoS服務質(zhì)量、ACL安全策略、SLA服務水平等不同技術。因此,數(shù)據(jù)中心的管理不僅要綜合考慮廠商、設備、應用、用戶、技術等各種要素,還需要考慮與數(shù)據(jù)中心IT部門的運維流程結(jié)合,建立一個開放式、標準化、易擴展、可聯(lián)動的統(tǒng)一智能管理平臺,從而為數(shù)據(jù)中心的各種關鍵業(yè)務系統(tǒng)提供支撐。

傳統(tǒng)網(wǎng)絡管理軟件以SNMP簡單網(wǎng)絡管理協(xié)議為核心,采用FCAPS管理模型(即故障管理、配置管理、賬戶管理、性能管理和安全管理),在以網(wǎng)絡設備為主的環(huán)境中發(fā)揮了重要作用。而數(shù)據(jù)中心作為IP技術與IT技術兩大領域的結(jié)合體,在管理方面帶來了新的挑戰(zhàn)。不僅需要從網(wǎng)絡的角度來保障用戶和業(yè)務,也要從用戶和業(yè)務的角度出發(fā)來優(yōu)化網(wǎng)絡,而在網(wǎng)絡與用戶及業(yè)務之間,則需要通過技術和流程將兩者有機地結(jié)合起來,形成智能化的數(shù)據(jù)中心管理。這意味著新的管理模型必須采用面向服務的軟件架構(gòu),在融合SNMP、Radius、NetStream、WMI、JMX、ITIL等各種管理技術的基礎上,提供不同的管理組件和便于擴展的開放接口,實現(xiàn)融合IP和IT、彼此聯(lián)動的精細管理流程。

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。