《電子技術(shù)應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于粗糙集和模糊神經(jīng)網(wǎng)絡的空氣質(zhì)量評價
基于粗糙集和模糊神經(jīng)網(wǎng)絡的空氣質(zhì)量評價
來源:微型機與應用2010年第15期
徐彩霞1,李義杰2
1.遼寧工程技術(shù)大學 研究生學院,遼寧 葫蘆島 125105;2.遼寧工程技術(shù)大學 軟件學院,遼寧
摘要: 針對概率神經(jīng)網(wǎng)絡的輸入量過多會影響其訓練速度的問題,采用了基于分辨矩陣的粗糙集屬性約簡方法,刪除不相關(guān)或不重要的指標。鑒于空氣質(zhì)量分級標準的模糊性,將模糊數(shù)學和概率神經(jīng)網(wǎng)絡結(jié)合起來,構(gòu)建了模糊概率神經(jīng)網(wǎng)絡空氣質(zhì)量評價模型(FPNN),然后將約簡后的指標值進行模糊化處理后輸入到PNN神經(jīng)網(wǎng)絡進行智能訓練。實例表明,該方法提高了收斂速度,評價結(jié)果客觀可靠,具有一定的實用價值。
Abstract:
Key words :

摘  要: 針對概率神經(jīng)網(wǎng)絡的輸入量過多會影響其訓練速度的問題,采用了基于分辨矩陣粗糙集屬性約簡方法,刪除不相關(guān)或不重要的指標。鑒于空氣質(zhì)量分級標準的模糊性,將模糊數(shù)學和概率神經(jīng)網(wǎng)絡結(jié)合起來,構(gòu)建了模糊概率神經(jīng)網(wǎng)絡空氣質(zhì)量評價模型(FPNN),然后將約簡后的指標值進行模糊化處理后輸入到PNN神經(jīng)網(wǎng)絡進行智能訓練。實例表明,該方法提高了收斂速度,評價結(jié)果客觀可靠,具有一定的實用價值。
關(guān)鍵詞: 粗糙集;概率神經(jīng)網(wǎng)(PNN);分辨矩陣;空氣質(zhì)量

    隨著科技和經(jīng)濟的迅速發(fā)展,工業(yè)廢氣、機動車尾氣、塵埃等急劇增加,成為空氣質(zhì)量下降的污染源,對人們的身體健康構(gòu)成了嚴重威脅,因此采取控制和改善空氣質(zhì)量的有效措施,合理地進行空氣質(zhì)量評價及預測成為當前環(huán)境科學研究的重要內(nèi)容之一。
    常規(guī)的空氣質(zhì)量評價方法有:API法、灰色聚類法、模糊綜合評價法及模糊灰色模型等。但這些方法都存在著一些不足,如評價結(jié)果或多或少受主觀因素的影響。近年來,有人把神經(jīng)網(wǎng)絡應用到空氣質(zhì)量評價上并取得了較好的效果。人工神經(jīng)網(wǎng)絡ANN(Artificial Neural Nets)具有較強的非線性映射、自學習、自適應及容錯能力,它能模擬大腦的思維,利用存儲的網(wǎng)絡信息對未知樣本進行評價。
    模糊數(shù)學是研究和處理自然界與信息技術(shù)中廣泛存在的模糊現(xiàn)象的數(shù)學(其中的相對隸屬度能很好地表示模糊概念的相對狀態(tài)),但它很難表示時變知識和過程,而神經(jīng)網(wǎng)絡能夠通過自學習功能來獲得精確的或模糊的知識,兩者的融合即模糊神經(jīng)網(wǎng)絡,彌補了模糊數(shù)學在學習方面的不足和神經(jīng)網(wǎng)絡在處理模糊數(shù)據(jù)方面的缺陷。
    粗糙集理論是一種處理不完整和不確定知識的數(shù)學工具,它是Z.Pawlak于1982年提出的。粗糙集能有效地分析和處理不精確和不完整等各種不完備信息,并從中發(fā)現(xiàn)隱含的規(guī)律。
    本文把粗糙集理論和模糊概率神經(jīng)網(wǎng)絡知識運用到空氣質(zhì)量評價過程中,簡化了網(wǎng)絡模型,提高了評價效率和評價結(jié)果的客觀性。
1 對粗糙集模糊概率神經(jīng)網(wǎng)絡的描述
1.1 粗糙集屬性約簡問題

    知識約簡是粗糙理論的重要內(nèi)容之一,即求出信息系統(tǒng)的原有屬性集合的一個極小子集,且該子集具有與原屬性集合相同的分類能力,這樣既保證了分類的質(zhì)量,也提高了分類的速度。
   
1.2 指標相對隸屬度矩陣
    若空氣質(zhì)量有b個級別,c項評價指標,則這c項指標對應的b級評價標準構(gòu)成了空氣質(zhì)量評價的標準值矩陣:
 
1.3 基于粗糙集模糊概率神經(jīng)網(wǎng)絡的空氣質(zhì)量評價模型的框架結(jié)構(gòu)
    與常用的BP神經(jīng)網(wǎng)絡相比,概率神經(jīng)網(wǎng)絡(PNN)是一種結(jié)構(gòu)簡單、訓練速度快、非線性映射能力強且具有較好分類能力的神經(jīng)網(wǎng)絡模式。但若PNN有多個輸入或大量的訓練樣本數(shù)據(jù),分類結(jié)果的準確性就可能降低,同時也降低了網(wǎng)絡的訓練速度。因此需要運用粗糙集理論中的知識約簡算法對屬性進行約簡,也就是在保證知識表達系統(tǒng)在分類能力不變的條件下,刪除不重要或不相關(guān)的條件屬性,減少PNN的輸入神經(jīng)元的個數(shù),從而提高訓練速度。
    為了使整個評價模型的指標具有可比性,采用了模糊數(shù)學理論中的相對隸屬度的知識,對約簡后的評價標準數(shù)據(jù)進行預處理,并構(gòu)造相對隸屬度矩陣,這樣就能較清晰地反映空氣質(zhì)量評價中的各指標的相對狀態(tài),并在此基礎上構(gòu)建模糊概率神經(jīng)網(wǎng)絡(FPNN)模型。
    根據(jù)粗糙集和FPNN模型對問題分析的思路,空氣質(zhì)量評價模型的框架結(jié)構(gòu)可以用圖1所示的流程圖描述。

2 基于粗糙集FPNN空氣質(zhì)量評價模型的實例
2.1 指標體系的建立

    指標體系的選擇直接影響到評價結(jié)果的準確性,若評價指標太多,就會延長神經(jīng)網(wǎng)絡訓練的時間,若指標太少,就可能降低評價結(jié)果的準確性。根據(jù)中華人民共和國國家標準(GB3095-1996《環(huán)境空氣質(zhì)量標準》及2000年的[2000]1號文件)及我國空氣污染的特點可知,影響我國空氣質(zhì)量的評價指標有:SO2、NOx、TSP(懸浮顆粒物)、PM10、DF(降塵)、NO2、CO。
2.2 粗糙集屬性約簡
2.2.1 屬性約簡的步驟

    粗糙集理論只能處理離散的數(shù)據(jù),因此需要進行連續(xù)屬性的值離散化,它可以由領域?qū)<腋鶕?jù)經(jīng)驗給出相應的區(qū)間,也可以根據(jù)某種原則對空間進行劃分,給出離散點進行離散化。本文采用后者。區(qū)分矩陣法是計算決策表屬性約簡的常用方法,但它沒有充分考慮到數(shù)據(jù)的不相容度,只適用于相容決策表。下面給出最佳屬性約簡算法的步驟:
    (1)連續(xù)數(shù)據(jù)的離散化;
    (2)構(gòu)造分辨矩陣M=[mij]n×n;
    (3)確定D的C正域POSC(D),可按照文獻[3]所提出的簡便方法來快速確定POSC(D);
    (4)判斷C中各屬性ci是否對D可約簡,方法是當去掉屬性ci時,檢驗正域POSC(D)≠POSc-(ci)(D)是否成立。若成立,則ci不可約簡,否則,ci可約簡[4];
    (5)按步驟(3)~(4)遍歷所有屬性;
    (6)所有不可約簡的屬性集合為約簡后的指標,即條件屬性C對于決策屬性D的一個相對約簡。
2.2.2 空氣質(zhì)量評價指標的約簡
    為了更清楚地了解空氣的質(zhì)量狀況,在三級基礎上增加一級,即將空氣質(zhì)量劃分為四個等級,分別為:Ⅰ級、Ⅱ級、Ⅲ級和Ⅳ級。選取10個城市的數(shù)據(jù),這10個城市污染差別顯著,可以作為屬性約簡的樣本(篇幅有限,此數(shù)據(jù)不再列出)。令a1、a2、a3、a4、a5、a6、a7分別表示條件屬性(空氣質(zhì)量評價指標)中的:SO2、NOx、NO2、PM10(可吸入顆粒物)、TSP(總懸浮顆粒物)、CO、DF(降塵)。然后對屬性值進行離散處理:令xik為第i個樣本第k項指標值,yjk為第k項指標的第j級標準值,pk為所取樣本的第k項指標離散處理后的值。當xik≤y1k時,pk=0;當y1k<xik≤y2k時,pk=1;當y2k<xik≤y3k時,pk=2;當y3k<xik≤y4k時,pk=3;當xik≥y4k時,pk=4。其中我國空氣質(zhì)量分級標準如表1所示。決策屬性D的屬性值與空氣質(zhì)量等級的對應關(guān)系是:1——Ⅰ級,2——Ⅱ級,3——Ⅲ級,4——Ⅳ級,這樣可得到離散化后得到的決策表如表2所示。然后根據(jù)公式(1)建立分辨矩陣(篇幅有限,不再顯示),應用屬性約簡的步驟(3)~(6),最后得到約簡后的指標是:SO2、NO2、TSP、PM10

2.3 相對隸屬度矩陣的建立及FPNN的仿真研究
    在保證相同分類結(jié)果的情況下,粗糙集理論的屬性約簡去掉了不相關(guān)或不重要的屬性,約簡后的指標為:SO2、NO2、PM10和TSP,這4個指標的值越小,表示空氣受污染的程度越小,其分級標準見表2,再按2.2節(jié)所述方法,構(gòu)造出標準隸屬度矩陣P(篇幅有限,檢測樣本指標相對隸屬度矩陣R略)。


    根據(jù)需要,取n=5,共生成16個樣本,將樣本1、2、4、6、7、9、10、11、13、15、16作為訓練樣本,其余5個作為檢驗樣本。SO2、NO2、PM10和TSP作為輸入向量,本實驗是基于Matlab7.0軟件來實現(xiàn)整個模糊概率神經(jīng)網(wǎng)絡空氣質(zhì)量評價過程的,則輸入層有4個神經(jīng)元,徑向基層的神經(jīng)元個數(shù)同訓練樣本的個數(shù)相同,即為11個,將評價等級作為目標向量輸出。本文空氣質(zhì)量評價共分4級,分別對應的等級值為1、2、3、4,則有4個競爭神經(jīng)元;經(jīng)過參數(shù)尋優(yōu)運算,確定高斯函數(shù)的平滑參數(shù)為0.03~0.15之間時效果最為理想。訓練結(jié)果如表3所示,可見對于訓練樣本和檢驗樣本,網(wǎng)絡的判斷率都達到了100%。但指標約簡后的神經(jīng)網(wǎng)絡模型結(jié)構(gòu)簡單,樣本訓練所用的時間更少。

    由于影響空氣質(zhì)量的因素很多,導致了指標體系存在冗余,因此有必要進行指標約簡。約簡后的指標有:SO2、NO2、PM10和TSP,這說明目前我國空氣質(zhì)量主要受這四種污染物的影響,為我國有關(guān)部門合理地制定空氣污染防治措施提供了依據(jù)。模糊數(shù)學理論中的相對隸屬度能夠表明空氣質(zhì)量指標的相對狀態(tài),克服了采用最大隸屬度時存在的只考慮極值、容易丟失中間信息的缺陷,將它和概率神經(jīng)網(wǎng)絡相結(jié)合,建立了模糊概率神經(jīng)網(wǎng)絡模型(FPNN),該模型人為調(diào)節(jié)參數(shù),使評價結(jié)果更客觀合理,并且為了提高評價結(jié)果的質(zhì)量,采用了在標準相對隸屬度矩陣中進行插值的方法,生成更多的樣本。仿真表明,指標約簡后FPNN模型既保證了分類質(zhì)量,也提高了收斂速度,實用性更強。當然本文所采用的空氣質(zhì)量評價方法也可以應用到其他領域中。
參考文獻
[1] 史成東,陳菊紅,胡健.基于粗糙集和神經(jīng)網(wǎng)絡的供應鏈績效預測研究[J].計算機工程與應用,2007,43(33):203-206.
[2] 劉坤,劉賢趙.模糊概率神經(jīng)網(wǎng)絡模型在水質(zhì)評價中的應用[J].水文,2007,27(1):36-39.
[3] 汪小燕.基于分辨矩陣的論域劃分方法[J].電腦學習,2007(4):5-6.
[4] 李錦菊,沈亦欽.中美兩國環(huán)境空氣質(zhì)量標準比較[J].環(huán)境監(jiān)測管理與技術(shù),2003,15(6):24-26.
[5] 飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡理論與MATLAB 7[M].北京:電子工業(yè)出版社,2005:116-127.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。