0.引言
目前,WLAN(無(wú)線局域網(wǎng))在全球發(fā)展勢(shì)頭迅猛。珠海移動(dòng)原有的WLAN 系統(tǒng)共有300 多臺(tái)熱點(diǎn)AP (接入點(diǎn)) 設(shè)備, 2009 年迅猛增加到1000 多臺(tái)。
在現(xiàn)有運(yùn)營(yíng)管理中, 主要存在以下問(wèn)題:a)AP 設(shè)備數(shù)量龐大,維護(hù)人員數(shù)量有限。b)AP 設(shè)備多數(shù)是一些小網(wǎng)絡(luò)設(shè)備, 網(wǎng)管功能不健全,現(xiàn)有的網(wǎng)絡(luò)管理軟件無(wú)法有效監(jiān)控。c)現(xiàn)有AP 設(shè)備類(lèi)型較多,不支持標(biāo)準(zhǔn)網(wǎng)管,且管理手段各不相同,給統(tǒng)一監(jiān)控帶來(lái)很大困難。d)信息化業(yè)務(wù)服務(wù)質(zhì)量缺乏標(biāo)準(zhǔn),無(wú)法衡量。
為了解決以上問(wèn)題,提高工作效率和維護(hù)水平,迅速、有效、合理地調(diào)配資源,提高全網(wǎng)設(shè)備的利用率。廣東移動(dòng)珠海分公司通過(guò)開(kāi)發(fā)WLAN網(wǎng)絡(luò)智能管理系統(tǒng), 從WLAN 網(wǎng)絡(luò)末端設(shè)備AP出發(fā), 基于用戶側(cè)提供自動(dòng)的業(yè)務(wù)監(jiān)控功能,實(shí)時(shí)發(fā)現(xiàn)WLAN 網(wǎng)絡(luò)連通性和性能問(wèn)題,實(shí)時(shí)進(jìn)行異常變動(dòng)告警上傳,變被動(dòng)維護(hù)。
1.WLAN 網(wǎng)絡(luò)智能管理系統(tǒng)功能
珠海WLAN 全網(wǎng)現(xiàn)有1000 多個(gè)AP,分布于珠海香洲、吉大、金灣、斗門(mén)、平沙、三灶等多個(gè)區(qū)域。共110 個(gè)熱點(diǎn)覆蓋于酒店、娛樂(lè)、高檔小區(qū)、政府企業(yè)、服務(wù)廳等。目前網(wǎng)絡(luò)采用常用的AC(接入控制器)串聯(lián)接入,下接匯聚交換機(jī),采用傳輸?shù)礁鳠狳c(diǎn)區(qū)域或傳輸匯聚機(jī)房方式。
通過(guò)網(wǎng)管服務(wù)器的架設(shè)部署,通過(guò)核心交換機(jī)連通各個(gè)網(wǎng)絡(luò)設(shè)備,讀取各個(gè)AP、AC、交換機(jī)路由器等各種網(wǎng)絡(luò)設(shè)備信息。
系統(tǒng)中直接面向用戶業(yè)務(wù)的有4 個(gè)子功能模塊,按照主要功能作用可分為WLAN 設(shè)備管理模塊、用戶行為功能模塊、日志功能模塊和集成功能模塊四大類(lèi)。
WLAN 設(shè)備管理模塊包括性能監(jiān)控(CPU、內(nèi)存監(jiān)控)、無(wú)線參數(shù)監(jiān)控、接口監(jiān)控、用戶認(rèn)證模塊、事件綜合管理、排名等。用戶行為分析模塊包括用戶接入時(shí)長(zhǎng)、用戶接入AP、用戶漫游情況、用戶接入時(shí)段、用戶使用流量、流量應(yīng)用分布、用戶訪問(wèn)目的、用戶行為指紋、用戶特征識(shí)別。流量分析包括接口分析、應(yīng)用分布、會(huì)話分析、網(wǎng)間流量分析、流量報(bào)表、流量告警、流量事件管理、流量過(guò)濾。日志管理包括SYSLOG 日志、Trap 日志、日志匹配、日志告警。
WLAN 網(wǎng)絡(luò)智能監(jiān)控系統(tǒng)著力解決以下關(guān)鍵技術(shù)問(wèn)題: a)全面支持對(duì)小型網(wǎng)絡(luò)設(shè)備運(yùn)行狀況的數(shù)據(jù)抓取。b)全面支持各種網(wǎng)絡(luò)和主機(jī)設(shè)備。
c)統(tǒng)一支持多種采集手段。d)一個(gè)可定制性極強(qiáng)的監(jiān)控框架,大幅降低定制費(fèi)用。e)充分挖掘已有管理系統(tǒng)的潛力,減少用戶方管理系統(tǒng)軟件投入,提高管理效果。f)設(shè)備管理、用戶戶管理雙核心。g)高效率、高可靠性,對(duì)硬件環(huán)境要求不高。
2 WLAN 網(wǎng)絡(luò)智能管理系統(tǒng)原理
2.1 統(tǒng)一采集平臺(tái)(UNICOL)和多采集(MUTICOL)
WLAN 的監(jiān)控對(duì)象大多是接入層的AP 設(shè)備,這些設(shè)備價(jià)格較便宜、網(wǎng)管功能不健全、監(jiān)控方式不標(biāo)準(zhǔn), 且型號(hào)眾多, 通用網(wǎng)管系統(tǒng)不做改動(dòng)很難支持。另一方面,AP 設(shè)備雖然類(lèi)型復(fù)雜,但功能卻相對(duì)統(tǒng)一。功能的相對(duì)統(tǒng)一決定了其監(jiān)控指標(biāo)的展現(xiàn)也相對(duì)統(tǒng)一。
結(jié)合WLAN 系統(tǒng)的這兩大特點(diǎn),構(gòu)造了統(tǒng)一采集平臺(tái)。該平臺(tái)將監(jiān)控指標(biāo)的采集與展現(xiàn)徹底分離,擺脫了傳統(tǒng)的采集模塊與展現(xiàn)模塊結(jié)合在一起的方式,以略微犧牲一點(diǎn)展現(xiàn)的豐富性為代價(jià),換取了采集模塊的極端靈活和高效。
1)統(tǒng)一采集平臺(tái)(UNICOL)
所有的網(wǎng)絡(luò)監(jiān)控類(lèi)軟件都建立在系統(tǒng)數(shù)據(jù)采集的基礎(chǔ)上, 新型的網(wǎng)絡(luò)監(jiān)控系統(tǒng)都已經(jīng)使用了系統(tǒng)化的采集平臺(tái)(COL-PLATFOME),有利于將各種不同類(lèi)型的采集同一化,從而降低定制成本,增加支持設(shè)備類(lèi)型數(shù)量。COL-PLATFOME 雖然在采集同一化方面做了很多工作,但仍然擺脫不開(kāi)“對(duì)象”的概念,采集指標(biāo)(KPI)總是從屬于某一個(gè)設(shè)備類(lèi)型,如CISCO 類(lèi)型下, 有CPU 使用率、接口流量等KPI;HP-UX(一種主機(jī)操作系統(tǒng))類(lèi)型下,也有CPU 使用率、接口流量等相似的KPI。
傳統(tǒng)采集框架如圖1 所示。
傳統(tǒng)采集框架中,KPI 都掛在特定的對(duì)象上。如果要擴(kuò)展支持的對(duì)象類(lèi)型,有兩個(gè)必不可少的步驟:
a)編寫(xiě)對(duì)象層邏輯。b)修改KPI 邏輯,把它們掛到新編寫(xiě)的對(duì)象邏輯上。
存在的問(wèn)題:a)KPI 邏輯是大致相似的。例如CPU 使用率,CISCO 設(shè)備和HUAWEI 設(shè)備的差別可能僅僅在于OID 不同,HP-UX 和AIX 的差別僅僅在于命令有一點(diǎn)不同。有的KPI 邏輯(如取設(shè)備延時(shí)、丟包率等)甚至是完全一樣的。b)對(duì)象邏輯是大不相同的。相對(duì)而言,對(duì)象邏輯與每種對(duì)象管理,其性質(zhì)大不一樣。例如CISCO 設(shè)備,對(duì)象層上必須取得設(shè)備OID、接口列表等關(guān)鍵屬性, 而HP-UX 則必須取得總內(nèi)存、總虛擬內(nèi)存、卷列表等關(guān)鍵屬性。
導(dǎo)致的后果:a)對(duì)象層差別性很大,每增添一個(gè)新設(shè)備類(lèi)型,都必須增添代碼描述新的對(duì)象,形成新的對(duì)象層。b)盡管KPI 差別性不大,但它必須掛在對(duì)象層下,對(duì)象層的增加必然導(dǎo)致KPI 要做相應(yīng)的修改,才能掛到新的對(duì)象下面。
通過(guò)以上分析可看出, 傳統(tǒng)的采集框架的架構(gòu)不盡科學(xué), 其根本問(wèn)題在于差別性大的對(duì)象層被放到框架中層, 而差別性不大的KPI 被放到框架底層。這種架構(gòu)與人類(lèi)的思維很接近(先大后小的自然過(guò)程),但其擴(kuò)展性受到約束,為支持新設(shè)備必須付出昂貴的開(kāi)發(fā)、定制和實(shí)施成本。特別是在WLAN系統(tǒng)中,這個(gè)缺點(diǎn)更為突出。
統(tǒng)一采集平臺(tái)(UNICOL)改變了采集平臺(tái)的架構(gòu),其結(jié)構(gòu)如圖2 所示。
新的框架具有以下特點(diǎn):a)取消了對(duì)象層。不同對(duì)象差異性很大,這里直接把它取消掉。其差異性通過(guò)其他方式(標(biāo)簽層)體現(xiàn)出來(lái)。b)將KPI 直接提到中層。不同KPI 差異性不大,把它提高到架構(gòu)中層。
保證架構(gòu)上兩層很少變動(dòng)。c)在底層新加一個(gè)標(biāo)簽層。KPI 的差異性通過(guò)給它貼上不同的標(biāo)簽得以體現(xiàn)。例如“大類(lèi)”里面,供貼的標(biāo)簽有“網(wǎng)絡(luò)| 主機(jī)| 數(shù)據(jù)庫(kù)| 無(wú)線設(shè)備” 等。小類(lèi)里面, 供貼的標(biāo)簽有“CISCO|HUAWEI|HP-UX|AIX|AP|AC”等。另外,還有一些預(yù)定義的標(biāo)簽(如“解析方式”、“數(shù)據(jù)類(lèi)型”、“數(shù)據(jù)處理”等)按不同的KPI 分別貼上。
這個(gè)標(biāo)簽層的意義在于:a)它標(biāo)示了KPI 的個(gè)性,彌補(bǔ)了對(duì)象層取消帶來(lái)的信息缺失。b)它包含的都是配置性的數(shù)據(jù),基本上以配置文件的形式存在。
新架構(gòu)的優(yōu)勢(shì)是:架構(gòu)上兩層很少變動(dòng),變動(dòng)主要體現(xiàn)在“標(biāo)簽層”,而“標(biāo)簽層”主要以配置文件的形式存在。
通過(guò)改進(jìn)系統(tǒng)架構(gòu),新系統(tǒng)對(duì)新對(duì)象、新KPI只要增加配置項(xiàng)就可以支持, 也就是說(shuō), 不需要改代碼。
2)多采集(MUTICOL)
將傳統(tǒng)的網(wǎng)管延伸到以AP、無(wú)線路由器為代表的小設(shè)備領(lǐng)域,還有另一個(gè)重大問(wèn)題需要解決:采集手段問(wèn)題。
因?yàn)槌杀娟P(guān)系, 這些小設(shè)備大多都不提供完整的網(wǎng)管功能:不提供SNMP(簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議),或?qū)NMP 的支持很弱,很多信息都沒(méi)有提供;不提供遠(yuǎn)程登錄,或遠(yuǎn)程登錄命令很弱,無(wú)法用標(biāo)準(zhǔn)方式得到有價(jià)值的信息等。
這些小設(shè)備都提供形式不一的管理界面, 特別近年來(lái)尤其流行Web 管理界面。這些管理界面在提供管理功能的同時(shí),其設(shè)備運(yùn)行信息、性能信息、流量信息、告警、日志等信息通常都在這些管理界面中提供,但是提供方式非常分散和不統(tǒng)一。如某型號(hào)的AP,其Web 管理界面提供了總內(nèi)存,其他地方?jīng)]提供;其telnet 管理界面提供了當(dāng)前空閑內(nèi)存,其他地方?jīng)]提供,那么要得到“內(nèi)存使用率”這個(gè)KPI 就需要使用不同采集方式,最后加以計(jì)算。
通用網(wǎng)管系統(tǒng)使用標(biāo)準(zhǔn)的SNMP 協(xié)議或定制化的腳本遠(yuǎn)程登錄取得設(shè)備信息, 從監(jiān)控手段上很難滿足小設(shè)備的監(jiān)控需要。
WLAN 網(wǎng)絡(luò)監(jiān)控系統(tǒng)使用獨(dú)特的多采集框架(MUTICOL),同時(shí)支持豐富的采集手段:a)SNMP。
b)TELNET / SSH 等遠(yuǎn)程登錄方法。c)Web 界面截取。d)設(shè)備命令行管理工具。
2.2 設(shè)備監(jiān)控和用戶行為跟蹤雙核心
WLAN 網(wǎng)絡(luò)監(jiān)控從通用網(wǎng)管分支出來(lái),但又有其獨(dú)特的需求。WLAN 的管理不僅關(guān)心網(wǎng)絡(luò)的運(yùn)行情況,也關(guān)心用戶的接入情況,包括接入地點(diǎn)、漫游情況、應(yīng)用分布,甚至接入習(xí)慣和接入指紋。要做到這些,雖然可以通過(guò)定制添加功能的方法,但底層視角仍不可改變地根植于設(shè)備監(jiān)控, 無(wú)法充分站在網(wǎng)絡(luò)分析者的角度進(jìn)行用戶行為分析。
新一代WLAN 網(wǎng)絡(luò)監(jiān)控和用戶行為分析系統(tǒng)從內(nèi)部框架實(shí)現(xiàn)設(shè)備監(jiān)控和用戶行為跟蹤“雙核心”,站在用戶行為分析的角度,為網(wǎng)絡(luò)運(yùn)維、網(wǎng)絡(luò)優(yōu)化和網(wǎng)絡(luò)安全提供更有價(jià)值的信息。
3 WLAN 智能監(jiān)控系統(tǒng)功能結(jié)構(gòu)及系統(tǒng)應(yīng)用
該系統(tǒng)可應(yīng)用于網(wǎng)絡(luò)優(yōu)化測(cè)試、網(wǎng)絡(luò)資產(chǎn)管理、設(shè)備巡檢、維護(hù)資源管理、設(shè)備告警、故障排查等工作中,全方位地提升現(xiàn)場(chǎng)維護(hù)、網(wǎng)絡(luò)資源優(yōu)化、網(wǎng)絡(luò)管理的效率和質(zhì)量。
系統(tǒng)功能如下:
1)實(shí)現(xiàn)全網(wǎng)的網(wǎng)絡(luò)實(shí)時(shí)監(jiān)控:
該系統(tǒng)的接入應(yīng)用, 通過(guò)對(duì)全市1000 多個(gè)AP的實(shí)時(shí)監(jiān)控,綜合呈現(xiàn)了全網(wǎng)的接入樹(shù)形結(jié)構(gòu)、設(shè)備的告警情況, 統(tǒng)計(jì)AP 接入數(shù)量種類(lèi)、用戶登陸情況、用戶熱點(diǎn)分布情況,顯示每天、每周、每月的登陸用戶數(shù)的用戶曲線。
2)維護(hù)測(cè)試:
網(wǎng)絡(luò)維護(hù)人員可直接通過(guò)手提電腦進(jìn)行維護(hù)測(cè)試, 系統(tǒng)將記錄主要的網(wǎng)絡(luò)參數(shù)并以圖形化方式呈現(xiàn)在手提電腦屏幕中。呈現(xiàn)模式為動(dòng)態(tài)圖形呈現(xiàn)。撥測(cè)結(jié)果可以保存單獨(dú)測(cè)試文件, 上傳到服務(wù)器后可生成測(cè)試報(bào)告。
3)全網(wǎng)的綜合呈現(xiàn):
系統(tǒng)呈現(xiàn)全網(wǎng)資源的分布情況, 可將珠海全網(wǎng)的覆蓋熱點(diǎn)信息、AP 數(shù)量統(tǒng)一展現(xiàn)在系統(tǒng)上, 一目了然。
4)巡檢管理:
極大緩解維護(hù)管理人員的日常巡檢作業(yè)壓力,通過(guò)系統(tǒng)的實(shí)時(shí)監(jiān)控,不需到現(xiàn)場(chǎng)巡檢,就能及時(shí)發(fā)現(xiàn)某個(gè)區(qū)域的某個(gè)AP 出現(xiàn)網(wǎng)絡(luò)告警, 有針對(duì)性的到達(dá)故障現(xiàn)場(chǎng)處理故障。節(jié)省了大量的維護(hù)資源,維護(hù)人員由過(guò)去的4 個(gè)精簡(jiǎn)到現(xiàn)在的1 個(gè)。通過(guò)系統(tǒng)就能了解全市任一熱點(diǎn)的AP 設(shè)備的健康情況。
5)故障處理:
方便維護(hù)人員進(jìn)行故障處理,通過(guò)系統(tǒng)監(jiān)控,將被動(dòng)的故障維護(hù)變成主動(dòng)的故障維護(hù)。降低用戶的投訴率,在該系統(tǒng)投入應(yīng)用后,用戶的投訴量大大下降,由以前平均每月的20 宗,降低到現(xiàn)在的5宗以內(nèi)。故障處理及時(shí)率也由以前的80%提高到現(xiàn)在的95%以上。有效壓縮了人力資源,減輕了運(yùn)維壓力。
6)資產(chǎn)統(tǒng)計(jì):
維護(hù)人員通過(guò)該系統(tǒng)可以詳細(xì)統(tǒng)計(jì)出網(wǎng)絡(luò)接入AP 的數(shù)量、種類(lèi)以及全網(wǎng)的AP 分布。
7)基礎(chǔ)報(bào)表管理:
詳細(xì)的報(bào)表信息可以智能地區(qū)分外部用戶和內(nèi)部用戶,得到外部用戶的登陸使用情況、內(nèi)部用戶的登陸使用情況、登錄用戶接入號(hào)碼、接入時(shí)長(zhǎng)等詳細(xì)信息。
8)排名分析:
一些重要的業(yè)務(wù)熱點(diǎn)往往需要分析用戶的登陸次數(shù)和使用動(dòng)向, 為此, 該系統(tǒng)將對(duì)全市所覆蓋的WLAN 無(wú)線業(yè)務(wù)使用情況進(jìn)行排名分析, 對(duì)每天、每月的TOP10 熱點(diǎn)進(jìn)行排名。
4 結(jié)束語(yǔ)
珠海移動(dòng)在無(wú)線城市的建設(shè)中,WLAN 用戶迅猛增長(zhǎng)。WLAN 網(wǎng)絡(luò)智能管理系統(tǒng)將珠海全市的AP 都納入了系統(tǒng)監(jiān)控范圍,由點(diǎn)到面地集中管理整個(gè)珠海移動(dòng)網(wǎng)絡(luò),同時(shí)平臺(tái)具備很強(qiáng)的可擴(kuò)展能力,能方便地進(jìn)行功能擴(kuò)展和規(guī)模擴(kuò)展, 能兼顧各種層次的運(yùn)維管理需求。
該系統(tǒng)接入應(yīng)用,通過(guò)對(duì)全市1000 多個(gè)AP 的實(shí)時(shí)監(jiān)控,極大方便了維護(hù)管理人員的日常巡檢,節(jié)省了大量的維護(hù)資源,有效壓縮人力資源,減輕運(yùn)維壓力。此外,該系統(tǒng)的投入使用大大提高了網(wǎng)絡(luò)規(guī)劃能力及應(yīng)急處理決策的正確性, 通過(guò)對(duì)用戶行為及網(wǎng)絡(luò)歷史數(shù)據(jù)進(jìn)行分析,對(duì)WLAN 網(wǎng)絡(luò)的應(yīng)急預(yù)案市場(chǎng)的精確營(yíng)銷(xiāo)都具有重要的指導(dǎo)意義, 同時(shí)每月可以節(jié)約人力和車(chē)輛成本2 萬(wàn)多元。
本系統(tǒng)創(chuàng)新的維護(hù)管理模式將原本單一而又復(fù)雜的網(wǎng)絡(luò)數(shù)據(jù)用美觀大方的圖形信息進(jìn)行展現(xiàn),使維護(hù)人員能簡(jiǎn)單易懂了解到網(wǎng)絡(luò)整體狀況, 凸顯了移動(dòng)通信網(wǎng)絡(luò)維護(hù)的專(zhuān)家形象, 造成了較好的社會(huì)影響。