大規(guī)模的PTN網絡建設之后,如何高效維護成為擺在各分公司眼前的主要問題之一。中國移動海南分公司在PTN網絡的維護領域深入挖掘,通過對業(yè)務配置及調整、告警抑制及各類故障情況下業(yè)務快速恢復等不同場景的深入分析,和PTN廠商一起運維創(chuàng)新,獨辟蹊徑,在LTE時代到來之前率先走出了一條PTN高效簡單運維的道路。
一、PTN運維難點分析
PTN作為IP化的傳輸設備,具有IP網絡固有的運維復雜性,隨著PTN網絡規(guī)模的激增及承載業(yè)務的多樣化,網絡運維人員的維護工作量大幅度增加,“如何簡化運維?”成為PTN維護人員的關注重點。從中國移動海南公司(以下簡稱海南移動)PTN運維經驗來看,主要存在如下圖所示的三大難點:
第一、告警多,故障定位定界困難;
第二、基站業(yè)務調整場景多,調整過程要求快速可靠;
第三、業(yè)務種類多,參數多,需要簡化管理;
分組傳送網)的簡單高效運維之道" src="http://files.chinaaet.com/images/2013/06/17/3613483295163.jpeg" style="margin: 0px; padding: 0px; border: 0px; width: 558px; height: 319px; " />
二、運維創(chuàng)新,實現運維高效簡單
為了有效的應對PTN網絡帶來的運維復雜度,海南移動通過和華為等主要設備廠商定期進行PTN運維專項需求討論等措施,聚焦PTN的運維難點,確保更好的提升運維效率,主要聚焦在以下幾個方面:
1、業(yè)務可視化管理
電信級的IP網絡運維需要可視化的維護方式,將“軟”管道和維護指標圖形化呈現出來,有預見性地維護承載網絡:
1)業(yè)務及其關聯(lián)的主備Tunnel路徑通過層次化路徑拓撲關聯(lián)呈現;
2)以業(yè)務為中心的告警監(jiān)控。當網絡出現故障,影響到業(yè)務開通的時候,相關告警會直接反應到端到端業(yè)務管理界面;
3)以業(yè)務為中心的性能監(jiān)控。通過基于不同場景的模板化指標采集,滿足不同場景的管理需求;
4)全網時鐘可視化展現,清晰時鐘信令方向,清晰時鐘跟蹤關系;
2、智能電路割接
隨著PTN業(yè)務數量的增長,頻繁的網絡業(yè)務調整不可避免,需要通過系統(tǒng)化的管理流程和專業(yè)的割接工具實現高效、準確、安全的業(yè)務調整,并參考如下的操作步驟:
1)對單條電路和批量電路提前制定割接方案,割接前進行割接演習,校驗資源是否沖突;
2)執(zhí)行人工方式和自動方式的割接計劃,將割接設置和管理的時間從晚上調整到白天,釋放夜晚加班人力;
3)割接后可保留原有工作電路資源,以便返回割接后的業(yè)務;
3、工程告警抑制
為抑制PTN網絡日常單板拔插、網元調測等工程施工產生的大量工程告警,與正常網絡告警有效區(qū)分,需要在EMS實現對工程告警的有效過濾:
1)網元、單板、端口等多粒度工程告警標識批量化配置;
2)自動過濾工程告警不上報上層綜合網管;
3)依據告警工程態(tài)標識過濾,分開瀏覽常態(tài)告警和工程告警;
4)工程告警自動結束機制:自由定義工程告警狀態(tài)標識的開始、結束時間;
4、離線網元快速隔離
PTN擴容部署階段,接入側設備機房環(huán)境復雜,經常出現機房掉電導致網元離線的情況,此時業(yè)務得不到及時的修復,維護人員需要通過EMS隔離離線網元后再進行業(yè)務發(fā)放:
1)對故障網元快速隔離,不影響網絡業(yè)務正常發(fā)放;
2)離線網元上線后,EMS提供離線網元恢復功能,重新入環(huán)/鏈,且離線網元的業(yè)務自動恢復無需在離線網元上線后手工配置業(yè)務。
5、端口批量業(yè)務遷移
在PTN網絡的日常運維中,某個RNC突然宕機的緊急情況下,如何快速把業(yè)務遷移到備份的RNC上,快速解決網絡隱患,是運維人員最關心的場景。EMS需要提供端口級的批量業(yè)務遷移解決方案:
整端口的業(yè)務批量快速遷移功能;
1)業(yè)務遷移過程中如果出現故障失敗,提供失敗回滾機制,
2)確保業(yè)務配置無損;
3)提供業(yè)務、Tunnel標簽等資源沖突自動檢測機制,確保遷移過程順利安全。
通過解決一個個運維難點,海南移動PTN運維能力得到較大水平的提高,邁向更高的集約化、精細化管理,使得海南移動的PTN運維效益和網絡的盈利能力得到不斷的提高,并提升了用戶的感知。
三、LTE時代PTN運維思考
在LTE承載中,由于存在基站到基站的切換需求,需要支持基站到基站的邏輯連接,具有MESH互連的承載需求,PTN支持靜態(tài)三層,可以滿足LTE業(yè)務承載的訴求。在當前的PTN網絡中,核心層PTN引入靜態(tài)三層,整體的業(yè)務模型是L2+L3,即基站側接入L2,在核心匯聚層終結L2后上L3,業(yè)務在核心邊緣設備落地接入SGW和MME設備。
靜態(tài)三層就是把原來需要協(xié)議完成的業(yè)務路由計算等工作,移到網管上來完成。下圖是GSM/TD-SCDMA/LTE統(tǒng)一承載組網典型模型。
另外,LTE時代,基站的工作頻率提高了,意味著每個基站覆蓋的范圍減小了,同樣的覆蓋需要更多的基站,特別是小基站,相應的需要更多的PTN設備。綜上,LTE時代PTN的運維重點關注下面幾點:
第一、增加一個網絡層次,E2E業(yè)務發(fā)放復雜性成倍增加,需要網管簡化業(yè)務發(fā)放過程,盡量做到自動化;
第二、增加一個網絡層次后,出現故障,E2E故障定位更加復雜,需要具備豐富的故障定位、定界手段;
第三、當前階段如果要達到GSM/TD-SCDMA的廣覆蓋不太現實,即使解決熱點覆蓋,需要部署更多的小基站,就要求有更多的小規(guī)格PTN盒式設備來承擔,需要廠家網管解決小規(guī)格PTN盒式設備的運維簡化,比如簡化開局、簡化業(yè)務配置及高效升級等;
第四、移動互聯(lián)網流量會大幅增加,為了保證高優(yōu)先級業(yè)務的SLA,對流量的管控會愈加迫切;
四、結束語
PTN網絡目前還持續(xù)處在規(guī)模建設期,同時面臨在LTE時代的運維挑戰(zhàn),所以要求運維人員在深入掌握IP知識的基礎上,對比傳統(tǒng)的SDH網絡運維流程,采用類比的思維,逐步摸索出具有PTN特點的運維方式和經驗。
另外還需充分利用和設備廠家的經驗共享,共同發(fā)現、分析和解決運維過程中的問題和需求,逐步建立面向終端客戶感知的指標體系,落實網絡運維的可視、可控、可分析、可回溯,體現出PTN技術可維可控的優(yōu)勢,推動PTN網絡的進一步發(fā)展。