123,123

基于粗糙集和模糊神经网络的空气质量评价

来源:微型机与应用2010年第15期

徐彩霞1，李义杰2

1.辽宁工程技术大学研究生学院，辽宁葫芦岛 125105；2.辽宁工程技术大学软件学院，辽宁

摘要： 针对概率神经网络的输入量过多会影响其训练速度的问题，采用了基于分辨矩阵的粗糙集属性约简方法，删除不相关或不重要的指标。鉴于空气质量分级标准的模糊性，将模糊数学和概率神经网络结合起来，构建了模糊概率神经网络空气质量评价模型(FPNN)，然后将约简后的指标值进行模糊化处理后输入到PNN神经网络进行智能训练。实例表明，该方法提高了收敛速度，评价结果客观可靠，具有一定的实用价值。

關(guān)鍵詞： 粗糙集概率神经网(PNN) 分辨矩阵空气质量

Abstract：

Key words :

摘要： 針對(duì)概率神經(jīng)網(wǎng)絡(luò)的輸入量過(guò)多會(huì)影響其訓(xùn)練速度的問(wèn)題，采用了基于分辨矩陣的粗糙集屬性約簡(jiǎn)方法，刪除不相關(guān)或不重要的指標(biāo)。鑒于空氣質(zhì)量分級(jí)標(biāo)準(zhǔn)的模糊性，將模糊數(shù)學(xué)和概率神經(jīng)網(wǎng)絡(luò)結(jié)合起來(lái)，構(gòu)建了模糊概率神經(jīng)網(wǎng)絡(luò)空氣質(zhì)量評(píng)價(jià)模型(FPNN)，然后將約簡(jiǎn)后的指標(biāo)值進(jìn)行模糊化處理后輸入到PNN神經(jīng)網(wǎng)絡(luò)進(jìn)行智能訓(xùn)練。實(shí)例表明，該方法提高了收斂速度，評(píng)價(jià)結(jié)果客觀可靠，具有一定的實(shí)用價(jià)值。
關(guān)鍵詞： 粗糙集；概率神經(jīng)網(wǎng)(PNN)；分辨矩陣；空氣質(zhì)量

    隨著科技和經(jīng)濟(jì)的迅速發(fā)展，工業(yè)廢氣、機(jī)動(dòng)車尾氣、塵埃等急劇增加，成為空氣質(zhì)量下降的污染源，對(duì)人們的身體健康構(gòu)成了嚴(yán)重威脅，因此采取控制和改善空氣質(zhì)量的有效措施，合理地進(jìn)行空氣質(zhì)量評(píng)價(jià)及預(yù)測(cè)成為當(dāng)前環(huán)境科學(xué)研究的重要內(nèi)容之一。
    常規(guī)的空氣質(zhì)量評(píng)價(jià)方法有：API法、灰色聚類法、模糊綜合評(píng)價(jià)法及模糊灰色模型等。但這些方法都存在著一些不足，如評(píng)價(jià)結(jié)果或多或少受主觀因素的影響。近年來(lái)，有人把神經(jīng)網(wǎng)絡(luò)應(yīng)用到空氣質(zhì)量評(píng)價(jià)上并取得了較好的效果。人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Nets)具有較強(qiáng)的非線性映射、自學(xué)習(xí)、自適應(yīng)及容錯(cuò)能力，它能模擬大腦的思維，利用存儲(chǔ)的網(wǎng)絡(luò)信息對(duì)未知樣本進(jìn)行評(píng)價(jià)。
    模糊數(shù)學(xué)是研究和處理自然界與信息技術(shù)中廣泛存在的模糊現(xiàn)象的數(shù)學(xué)(其中的相對(duì)隸屬度能很好地表示模糊概念的相對(duì)狀態(tài))，但它很難表示時(shí)變知識(shí)和過(guò)程，而神經(jīng)網(wǎng)絡(luò)能夠通過(guò)自學(xué)習(xí)功能來(lái)獲得精確的或模糊的知識(shí)，兩者的融合即模糊神經(jīng)網(wǎng)絡(luò)，彌補(bǔ)了模糊數(shù)學(xué)在學(xué)習(xí)方面的不足和神經(jīng)網(wǎng)絡(luò)在處理模糊數(shù)據(jù)方面的缺陷。
    粗糙集理論是一種處理不完整和不確定知識(shí)的數(shù)學(xué)工具，它是Z.Pawlak于1982年提出的。粗糙集能有效地分析和處理不精確和不完整等各種不完備信息，并從中發(fā)現(xiàn)隱含的規(guī)律。
    本文把粗糙集理論和模糊概率神經(jīng)網(wǎng)絡(luò)知識(shí)運(yùn)用到空氣質(zhì)量評(píng)價(jià)過(guò)程中，簡(jiǎn)化了網(wǎng)絡(luò)模型，提高了評(píng)價(jià)效率和評(píng)價(jià)結(jié)果的客觀性。
1 對(duì)粗糙集模糊概率神經(jīng)網(wǎng)絡(luò)的描述
1.1 粗糙集屬性約簡(jiǎn)問(wèn)題
    知識(shí)約簡(jiǎn)是粗糙理論的重要內(nèi)容之一，即求出信息系統(tǒng)的原有屬性集合的一個(gè)極小子集，且該子集具有與原屬性集合相同的分類能力，這樣既保證了分類的質(zhì)量，也提高了分類的速度。

1.2 指標(biāo)相對(duì)隸屬度矩陣
    若空氣質(zhì)量有b個(gè)級(jí)別，c項(xiàng)評(píng)價(jià)指標(biāo)，則這c項(xiàng)指標(biāo)對(duì)應(yīng)的b級(jí)評(píng)價(jià)標(biāo)準(zhǔn)構(gòu)成了空氣質(zhì)量評(píng)價(jià)的標(biāo)準(zhǔn)值矩陣:

1.3 基于粗糙集模糊概率神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量評(píng)價(jià)模型的框架結(jié)構(gòu)
    與常用的BP神經(jīng)網(wǎng)絡(luò)相比，概率神經(jīng)網(wǎng)絡(luò)(PNN)是一種結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練速度快、非線性映射能力強(qiáng)且具有較好分類能力的神經(jīng)網(wǎng)絡(luò)模式。但若PNN有多個(gè)輸入或大量的訓(xùn)練樣本數(shù)據(jù)，分類結(jié)果的準(zhǔn)確性就可能降低，同時(shí)也降低了網(wǎng)絡(luò)的訓(xùn)練速度。因此需要運(yùn)用粗糙集理論中的知識(shí)約簡(jiǎn)算法對(duì)屬性進(jìn)行約簡(jiǎn)，也就是在保證知識(shí)表達(dá)系統(tǒng)在分類能力不變的條件下，刪除不重要或不相關(guān)的條件屬性，減少PNN的輸入神經(jīng)元的個(gè)數(shù)，從而提高訓(xùn)練速度。
    為了使整個(gè)評(píng)價(jià)模型的指標(biāo)具有可比性，采用了模糊數(shù)學(xué)理論中的相對(duì)隸屬度的知識(shí)，對(duì)約簡(jiǎn)后的評(píng)價(jià)標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行預(yù)處理，并構(gòu)造相對(duì)隸屬度矩陣，這樣就能較清晰地反映空氣質(zhì)量評(píng)價(jià)中的各指標(biāo)的相對(duì)狀態(tài)，并在此基礎(chǔ)上構(gòu)建模糊概率神經(jīng)網(wǎng)絡(luò)(FPNN)模型。
    根據(jù)粗糙集和FPNN模型對(duì)問(wèn)題分析的思路，空氣質(zhì)量評(píng)價(jià)模型的框架結(jié)構(gòu)可以用圖1所示的流程圖描述。

2 基于粗糙集FPNN空氣質(zhì)量評(píng)價(jià)模型的實(shí)例
2.1 指標(biāo)體系的建立
    指標(biāo)體系的選擇直接影響到評(píng)價(jià)結(jié)果的準(zhǔn)確性，若評(píng)價(jià)指標(biāo)太多，就會(huì)延長(zhǎng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的時(shí)間，若指標(biāo)太少，就可能降低評(píng)價(jià)結(jié)果的準(zhǔn)確性。根據(jù)中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)(GB3095-1996《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》及2000年的[2000]1號(hào)文件)及我國(guó)空氣污染的特點(diǎn)可知，影響我國(guó)空氣質(zhì)量的評(píng)價(jià)指標(biāo)有：SO₂、NOx、TSP(懸浮顆粒物)、PM10、DF(降塵)、NO₂、CO。
2.2 粗糙集屬性約簡(jiǎn)
2.2.1 屬性約簡(jiǎn)的步驟
    粗糙集理論只能處理離散的數(shù)據(jù)，因此需要進(jìn)行連續(xù)屬性的值離散化，它可以由領(lǐng)域?qū)＜腋鶕?jù)經(jīng)驗(yàn)給出相應(yīng)的區(qū)間，也可以根據(jù)某種原則對(duì)空間進(jìn)行劃分，給出離散點(diǎn)進(jìn)行離散化。本文采用后者。區(qū)分矩陣法是計(jì)算決策表屬性約簡(jiǎn)的常用方法，但它沒有充分考慮到數(shù)據(jù)的不相容度，只適用于相容決策表。下面給出最佳屬性約簡(jiǎn)算法的步驟：
    (1)連續(xù)數(shù)據(jù)的離散化；
    (2)構(gòu)造分辨矩陣M=[mij]n×n；
    (3)確定D的C正域POSC(D)，可按照文獻(xiàn)[3]所提出的簡(jiǎn)便方法來(lái)快速確定POSC(D)；
    (4)判斷C中各屬性ci是否對(duì)D可約簡(jiǎn)，方法是當(dāng)去掉屬性ci時(shí)，檢驗(yàn)正域POSC(D)≠POS_c-(ci)(D)是否成立。若成立，則ci不可約簡(jiǎn)，否則，ci可約簡(jiǎn)[4]；
    (5)按步驟(3)~(4)遍歷所有屬性；
    (6)所有不可約簡(jiǎn)的屬性集合為約簡(jiǎn)后的指標(biāo)，即條件屬性C對(duì)于決策屬性D的一個(gè)相對(duì)約簡(jiǎn)。
2.2.2 空氣質(zhì)量評(píng)價(jià)指標(biāo)的約簡(jiǎn)
    為了更清楚地了解空氣的質(zhì)量狀況，在三級(jí)基礎(chǔ)上增加一級(jí)，即將空氣質(zhì)量劃分為四個(gè)等級(jí)，分別為：Ⅰ級(jí)、Ⅱ級(jí)、Ⅲ級(jí)和Ⅳ級(jí)。選取10個(gè)城市的數(shù)據(jù)，這10個(gè)城市污染差別顯著，可以作為屬性約簡(jiǎn)的樣本(篇幅有限，此數(shù)據(jù)不再列出)。令a₁、a₂、a₃、a₄、a₅、a₆、a₇分別表示條件屬性(空氣質(zhì)量評(píng)價(jià)指標(biāo))中的:SO₂、NOx、NO₂、PM₁₀(可吸入顆粒物)、TSP(總懸浮顆粒物)、CO、DF(降塵)。然后對(duì)屬性值進(jìn)行離散處理:令xik為第i個(gè)樣本第k項(xiàng)指標(biāo)值，yjk為第k項(xiàng)指標(biāo)的第j級(jí)標(biāo)準(zhǔn)值，pk為所取樣本的第k項(xiàng)指標(biāo)離散處理后的值。當(dāng)xik≤y1k時(shí)，pk=0；當(dāng)y1k<xik≤y2k時(shí)，pk=1；當(dāng)y2k<xik≤y3k時(shí)，pk=2；當(dāng)y3k<xik≤y4k時(shí)，pk=3；當(dāng)xik≥y4k時(shí)，pk=4。其中我國(guó)空氣質(zhì)量分級(jí)標(biāo)準(zhǔn)如表1所示。決策屬性D的屬性值與空氣質(zhì)量等級(jí)的對(duì)應(yīng)關(guān)系是：1——Ⅰ級(jí)，2——Ⅱ級(jí)，3——Ⅲ級(jí)，4——Ⅳ級(jí)，這樣可得到離散化后得到的決策表如表2所示。然后根據(jù)公式(1)建立分辨矩陣(篇幅有限，不再顯示)，應(yīng)用屬性約簡(jiǎn)的步驟(3)~(6)，最后得到約簡(jiǎn)后的指標(biāo)是:SO2、NO₂、TSP、PM₁₀。

2.3 相對(duì)隸屬度矩陣的建立及FPNN的仿真研究
在保證相同分類結(jié)果的情況下，粗糙集理論的屬性約簡(jiǎn)去掉了不相關(guān)或不重要的屬性，約簡(jiǎn)后的指標(biāo)為：SO2、NO2、PM10和TSP，這4個(gè)指標(biāo)的值越小，表示空氣受污染的程度越小，其分級(jí)標(biāo)準(zhǔn)見表2，再按2.2節(jié)所述方法，構(gòu)造出標(biāo)準(zhǔn)隸屬度矩陣P(篇幅有限，檢測(cè)樣本指標(biāo)相對(duì)隸屬度矩陣R略)。

根據(jù)需要，取n=5，共生成16個(gè)樣本，將樣本1、2、4、6、7、9、10、11、13、15、16作為訓(xùn)練樣本，其余5個(gè)作為檢驗(yàn)樣本。SO₂、NO₂、PM10和TSP作為輸入向量，本實(shí)驗(yàn)是基于Matlab7.0軟件來(lái)實(shí)現(xiàn)整個(gè)模糊概率神經(jīng)網(wǎng)絡(luò)空氣質(zhì)量評(píng)價(jià)過(guò)程的，則輸入層有4個(gè)神經(jīng)元，徑向基層的神經(jīng)元個(gè)數(shù)同訓(xùn)練樣本的個(gè)數(shù)相同，即為11個(gè)，將評(píng)價(jià)等級(jí)作為目標(biāo)向量輸出。本文空氣質(zhì)量評(píng)價(jià)共分4級(jí)，分別對(duì)應(yīng)的等級(jí)值為1、2、3、4，則有4個(gè)競(jìng)爭(zhēng)神經(jīng)元；經(jīng)過(guò)參數(shù)尋優(yōu)運(yùn)算，確定高斯函數(shù)的平滑參數(shù)為0.03~0.15之間時(shí)效果最為理想。訓(xùn)練結(jié)果如表3所示，可見對(duì)于訓(xùn)練樣本和檢驗(yàn)樣本，網(wǎng)絡(luò)的判斷率都達(dá)到了100%。但指標(biāo)約簡(jiǎn)后的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)簡(jiǎn)單，樣本訓(xùn)練所用的時(shí)間更少。

由于影響空氣質(zhì)量的因素很多，導(dǎo)致了指標(biāo)體系存在冗余，因此有必要進(jìn)行指標(biāo)約簡(jiǎn)。約簡(jiǎn)后的指標(biāo)有：SO₂、NO₂、PM₁₀和TSP，這說(shuō)明目前我國(guó)空氣質(zhì)量主要受這四種污染物的影響，為我國(guó)有關(guān)部門合理地制定空氣污染防治措施提供了依據(jù)。模糊數(shù)學(xué)理論中的相對(duì)隸屬度能夠表明空氣質(zhì)量指標(biāo)的相對(duì)狀態(tài)，克服了采用最大隸屬度時(shí)存在的只考慮極值、容易丟失中間信息的缺陷，將它和概率神經(jīng)網(wǎng)絡(luò)相結(jié)合，建立了模糊概率神經(jīng)網(wǎng)絡(luò)模型(FPNN)，該模型人為調(diào)節(jié)參數(shù)，使評(píng)價(jià)結(jié)果更客觀合理，并且為了提高評(píng)價(jià)結(jié)果的質(zhì)量，采用了在標(biāo)準(zhǔn)相對(duì)隸屬度矩陣中進(jìn)行插值的方法，生成更多的樣本。仿真表明，指標(biāo)約簡(jiǎn)后FPNN模型既保證了分類質(zhì)量，也提高了收斂速度，實(shí)用性更強(qiáng)。當(dāng)然本文所采用的空氣質(zhì)量評(píng)價(jià)方法也可以應(yīng)用到其他領(lǐng)域中。
參考文獻(xiàn)
[1] 史成東，陳菊紅，胡健.基于粗糙集和神經(jīng)網(wǎng)絡(luò)的供應(yīng)鏈績(jī)效預(yù)測(cè)研究[J].計(jì)算機(jī)工程與應(yīng)用，2007，43(33):203-206.
[2] 劉坤，劉賢趙.模糊概率神經(jīng)網(wǎng)絡(luò)模型在水質(zhì)評(píng)價(jià)中的應(yīng)用[J].水文,2007，27(1):36-39.
[3] 汪小燕.基于分辨矩陣的論域劃分方法[J].電腦學(xué)習(xí)，2007(4):5-6.
[4] 李錦菊，沈亦欽.中美兩國(guó)環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)比較[J].環(huán)境監(jiān)測(cè)管理與技術(shù)，2003，15(6):24-26.
[5] 飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與MATLAB 7[M].北京:電子工業(yè)出版社,2005:116-127.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容