摘 要: 針對(duì)概率神經(jīng)網(wǎng)絡(luò)的輸入量過(guò)多會(huì)影響其訓(xùn)練速度的問(wèn)題,采用了基于分辨矩陣的粗糙集屬性約簡(jiǎn)方法,刪除不相關(guān)或不重要的指標(biāo)。鑒于空氣質(zhì)量分級(jí)標(biāo)準(zhǔn)的模糊性,將模糊數(shù)學(xué)和概率神經(jīng)網(wǎng)絡(luò)結(jié)合起來(lái),構(gòu)建了模糊概率神經(jīng)網(wǎng)絡(luò)空氣質(zhì)量評(píng)價(jià)模型(FPNN),然后將約簡(jiǎn)后的指標(biāo)值進(jìn)行模糊化處理后輸入到PNN神經(jīng)網(wǎng)絡(luò)進(jìn)行智能訓(xùn)練。實(shí)例表明,該方法提高了收斂速度,評(píng)價(jià)結(jié)果客觀可靠,具有一定的實(shí)用價(jià)值。
關(guān)鍵詞: 粗糙集;概率神經(jīng)網(wǎng)(PNN);分辨矩陣;空氣質(zhì)量
隨著科技和經(jīng)濟(jì)的迅速發(fā)展,工業(yè)廢氣、機(jī)動(dòng)車(chē)尾氣、塵埃等急劇增加,成為空氣質(zhì)量下降的污染源,對(duì)人們的身體健康構(gòu)成了嚴(yán)重威脅,因此采取控制和改善空氣質(zhì)量的有效措施,合理地進(jìn)行空氣質(zhì)量評(píng)價(jià)及預(yù)測(cè)成為當(dāng)前環(huán)境科學(xué)研究的重要內(nèi)容之一。
常規(guī)的空氣質(zhì)量評(píng)價(jià)方法有:API法、灰色聚類(lèi)法、模糊綜合評(píng)價(jià)法及模糊灰色模型等。但這些方法都存在著一些不足,如評(píng)價(jià)結(jié)果或多或少受主觀因素的影響。近年來(lái),有人把神經(jīng)網(wǎng)絡(luò)應(yīng)用到空氣質(zhì)量評(píng)價(jià)上并取得了較好的效果。人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial Neural Nets)具有較強(qiáng)的非線性映射、自學(xué)習(xí)、自適應(yīng)及容錯(cuò)能力,它能模擬大腦的思維,利用存儲(chǔ)的網(wǎng)絡(luò)信息對(duì)未知樣本進(jìn)行評(píng)價(jià)。
模糊數(shù)學(xué)是研究和處理自然界與信息技術(shù)中廣泛存在的模糊現(xiàn)象的數(shù)學(xué)(其中的相對(duì)隸屬度能很好地表示模糊概念的相對(duì)狀態(tài)),但它很難表示時(shí)變知識(shí)和過(guò)程,而神經(jīng)網(wǎng)絡(luò)能夠通過(guò)自學(xué)習(xí)功能來(lái)獲得精確的或模糊的知識(shí),兩者的融合即模糊神經(jīng)網(wǎng)絡(luò),彌補(bǔ)了模糊數(shù)學(xué)在學(xué)習(xí)方面的不足和神經(jīng)網(wǎng)絡(luò)在處理模糊數(shù)據(jù)方面的缺陷。
粗糙集理論是一種處理不完整和不確定知識(shí)的數(shù)學(xué)工具,它是Z.Pawlak于1982年提出的。粗糙集能有效地分析和處理不精確和不完整等各種不完備信息,并從中發(fā)現(xiàn)隱含的規(guī)律。
本文把粗糙集理論和模糊概率神經(jīng)網(wǎng)絡(luò)知識(shí)運(yùn)用到空氣質(zhì)量評(píng)價(jià)過(guò)程中,簡(jiǎn)化了網(wǎng)絡(luò)模型,提高了評(píng)價(jià)效率和評(píng)價(jià)結(jié)果的客觀性。
1 對(duì)粗糙集模糊概率神經(jīng)網(wǎng)絡(luò)的描述
1.1 粗糙集屬性約簡(jiǎn)問(wèn)題
知識(shí)約簡(jiǎn)是粗糙理論的重要內(nèi)容之一,即求出信息系統(tǒng)的原有屬性集合的一個(gè)極小子集,且該子集具有與原屬性集合相同的分類(lèi)能力,這樣既保證了分類(lèi)的質(zhì)量,也提高了分類(lèi)的速度。
1.2 指標(biāo)相對(duì)隸屬度矩陣
若空氣質(zhì)量有b個(gè)級(jí)別,c項(xiàng)評(píng)價(jià)指標(biāo),則這c項(xiàng)指標(biāo)對(duì)應(yīng)的b級(jí)評(píng)價(jià)標(biāo)準(zhǔn)構(gòu)成了空氣質(zhì)量評(píng)價(jià)的標(biāo)準(zhǔn)值矩陣:
1.3 基于粗糙集模糊概率神經(jīng)網(wǎng)絡(luò)的空氣質(zhì)量評(píng)價(jià)模型的框架結(jié)構(gòu)
與常用的BP神經(jīng)網(wǎng)絡(luò)相比,概率神經(jīng)網(wǎng)絡(luò)(PNN)是一種結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練速度快、非線性映射能力強(qiáng)且具有較好分類(lèi)能力的神經(jīng)網(wǎng)絡(luò)模式。但若PNN有多個(gè)輸入或大量的訓(xùn)練樣本數(shù)據(jù),分類(lèi)結(jié)果的準(zhǔn)確性就可能降低,同時(shí)也降低了網(wǎng)絡(luò)的訓(xùn)練速度。因此需要運(yùn)用粗糙集理論中的知識(shí)約簡(jiǎn)算法對(duì)屬性進(jìn)行約簡(jiǎn),也就是在保證知識(shí)表達(dá)系統(tǒng)在分類(lèi)能力不變的條件下,刪除不重要或不相關(guān)的條件屬性,減少PNN的輸入神經(jīng)元的個(gè)數(shù),從而提高訓(xùn)練速度。
為了使整個(gè)評(píng)價(jià)模型的指標(biāo)具有可比性,采用了模糊數(shù)學(xué)理論中的相對(duì)隸屬度的知識(shí),對(duì)約簡(jiǎn)后的評(píng)價(jià)標(biāo)準(zhǔn)數(shù)據(jù)進(jìn)行預(yù)處理,并構(gòu)造相對(duì)隸屬度矩陣,這樣就能較清晰地反映空氣質(zhì)量評(píng)價(jià)中的各指標(biāo)的相對(duì)狀態(tài),并在此基礎(chǔ)上構(gòu)建模糊概率神經(jīng)網(wǎng)絡(luò)(FPNN)模型。
根據(jù)粗糙集和FPNN模型對(duì)問(wèn)題分析的思路,空氣質(zhì)量評(píng)價(jià)模型的框架結(jié)構(gòu)可以用圖1所示的流程圖描述。
2 基于粗糙集FPNN空氣質(zhì)量評(píng)價(jià)模型的實(shí)例
2.1 指標(biāo)體系的建立
指標(biāo)體系的選擇直接影響到評(píng)價(jià)結(jié)果的準(zhǔn)確性,若評(píng)價(jià)指標(biāo)太多,就會(huì)延長(zhǎng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的時(shí)間,若指標(biāo)太少,就可能降低評(píng)價(jià)結(jié)果的準(zhǔn)確性。根據(jù)中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)(GB3095-1996《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》及2000年的[2000]1號(hào)文件)及我國(guó)空氣污染的特點(diǎn)可知,影響我國(guó)空氣質(zhì)量的評(píng)價(jià)指標(biāo)有:SO2、NOx、TSP(懸浮顆粒物)、PM10、DF(降塵)、NO2、CO。
2.2 粗糙集屬性約簡(jiǎn)
2.2.1 屬性約簡(jiǎn)的步驟
粗糙集理論只能處理離散的數(shù)據(jù),因此需要進(jìn)行連續(xù)屬性的值離散化,它可以由領(lǐng)域?qū)<腋鶕?jù)經(jīng)驗(yàn)給出相應(yīng)的區(qū)間,也可以根據(jù)某種原則對(duì)空間進(jìn)行劃分,給出離散點(diǎn)進(jìn)行離散化。本文采用后者。區(qū)分矩陣法是計(jì)算決策表屬性約簡(jiǎn)的常用方法,但它沒(méi)有充分考慮到數(shù)據(jù)的不相容度,只適用于相容決策表。下面給出最佳屬性約簡(jiǎn)算法的步驟:
(1)連續(xù)數(shù)據(jù)的離散化;
(2)構(gòu)造分辨矩陣M=[mij]n×n;
(3)確定D的C正域POSC(D),可按照文獻(xiàn)[3]所提出的簡(jiǎn)便方法來(lái)快速確定POSC(D);
(4)判斷C中各屬性ci是否對(duì)D可約簡(jiǎn),方法是當(dāng)去掉屬性ci時(shí),檢驗(yàn)正域POSC(D)≠POSc-(ci)(D)是否成立。若成立,則ci不可約簡(jiǎn),否則,ci可約簡(jiǎn)[4];
(5)按步驟(3)~(4)遍歷所有屬性;
(6)所有不可約簡(jiǎn)的屬性集合為約簡(jiǎn)后的指標(biāo),即條件屬性C對(duì)于決策屬性D的一個(gè)相對(duì)約簡(jiǎn)。
2.2.2 空氣質(zhì)量評(píng)價(jià)指標(biāo)的約簡(jiǎn)
為了更清楚地了解空氣的質(zhì)量狀況,在三級(jí)基礎(chǔ)上增加一級(jí),即將空氣質(zhì)量劃分為四個(gè)等級(jí),分別為:Ⅰ級(jí)、Ⅱ級(jí)、Ⅲ級(jí)和Ⅳ級(jí)。選取10個(gè)城市的數(shù)據(jù),這10個(gè)城市污染差別顯著,可以作為屬性約簡(jiǎn)的樣本(篇幅有限,此數(shù)據(jù)不再列出)。令a1、a2、a3、a4、a5、a6、a7分別表示條件屬性(空氣質(zhì)量評(píng)價(jià)指標(biāo))中的:SO2、NOx、NO2、PM10(可吸入顆粒物)、TSP(總懸浮顆粒物)、CO、DF(降塵)。然后對(duì)屬性值進(jìn)行離散處理:令xik為第i個(gè)樣本第k項(xiàng)指標(biāo)值,yjk為第k項(xiàng)指標(biāo)的第j級(jí)標(biāo)準(zhǔn)值,pk為所取樣本的第k項(xiàng)指標(biāo)離散處理后的值。當(dāng)xik≤y1k時(shí),pk=0;當(dāng)y1k<xik≤y2k時(shí),pk=1;當(dāng)y2k<xik≤y3k時(shí),pk=2;當(dāng)y3k<xik≤y4k時(shí),pk=3;當(dāng)xik≥y4k時(shí),pk=4。其中我國(guó)空氣質(zhì)量分級(jí)標(biāo)準(zhǔn)如表1所示。決策屬性D的屬性值與空氣質(zhì)量等級(jí)的對(duì)應(yīng)關(guān)系是:1——Ⅰ級(jí),2——Ⅱ級(jí),3——Ⅲ級(jí),4——Ⅳ級(jí),這樣可得到離散化后得到的決策表如表2所示。然后根據(jù)公式(1)建立分辨矩陣(篇幅有限,不再顯示),應(yīng)用屬性約簡(jiǎn)的步驟(3)~(6),最后得到約簡(jiǎn)后的指標(biāo)是:SO2、NO2、TSP、PM10。
2.3 相對(duì)隸屬度矩陣的建立及FPNN的仿真研究
在保證相同分類(lèi)結(jié)果的情況下,粗糙集理論的屬性約簡(jiǎn)去掉了不相關(guān)或不重要的屬性,約簡(jiǎn)后的指標(biāo)為:SO2、NO2、PM10和TSP,這4個(gè)指標(biāo)的值越小,表示空氣受污染的程度越小,其分級(jí)標(biāo)準(zhǔn)見(jiàn)表2,再按2.2節(jié)所述方法,構(gòu)造出標(biāo)準(zhǔn)隸屬度矩陣P(篇幅有限,檢測(cè)樣本指標(biāo)相對(duì)隸屬度矩陣R略)。
根據(jù)需要,取n=5,共生成16個(gè)樣本,將樣本1、2、4、6、7、9、10、11、13、15、16作為訓(xùn)練樣本,其余5個(gè)作為檢驗(yàn)樣本。SO2、NO2、PM10和TSP作為輸入向量,本實(shí)驗(yàn)是基于Matlab7.0軟件來(lái)實(shí)現(xiàn)整個(gè)模糊概率神經(jīng)網(wǎng)絡(luò)空氣質(zhì)量評(píng)價(jià)過(guò)程的,則輸入層有4個(gè)神經(jīng)元,徑向基層的神經(jīng)元個(gè)數(shù)同訓(xùn)練樣本的個(gè)數(shù)相同,即為11個(gè),將評(píng)價(jià)等級(jí)作為目標(biāo)向量輸出。本文空氣質(zhì)量評(píng)價(jià)共分4級(jí),分別對(duì)應(yīng)的等級(jí)值為1、2、3、4,則有4個(gè)競(jìng)爭(zhēng)神經(jīng)元;經(jīng)過(guò)參數(shù)尋優(yōu)運(yùn)算,確定高斯函數(shù)的平滑參數(shù)為0.03~0.15之間時(shí)效果最為理想。訓(xùn)練結(jié)果如表3所示,可見(jiàn)對(duì)于訓(xùn)練樣本和檢驗(yàn)樣本,網(wǎng)絡(luò)的判斷率都達(dá)到了100%。但指標(biāo)約簡(jiǎn)后的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)簡(jiǎn)單,樣本訓(xùn)練所用的時(shí)間更少。
由于影響空氣質(zhì)量的因素很多,導(dǎo)致了指標(biāo)體系存在冗余,因此有必要進(jìn)行指標(biāo)約簡(jiǎn)。約簡(jiǎn)后的指標(biāo)有:SO2、NO2、PM10和TSP,這說(shuō)明目前我國(guó)空氣質(zhì)量主要受這四種污染物的影響,為我國(guó)有關(guān)部門(mén)合理地制定空氣污染防治措施提供了依據(jù)。模糊數(shù)學(xué)理論中的相對(duì)隸屬度能夠表明空氣質(zhì)量指標(biāo)的相對(duì)狀態(tài),克服了采用最大隸屬度時(shí)存在的只考慮極值、容易丟失中間信息的缺陷,將它和概率神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立了模糊概率神經(jīng)網(wǎng)絡(luò)模型(FPNN),該模型人為調(diào)節(jié)參數(shù),使評(píng)價(jià)結(jié)果更客觀合理,并且為了提高評(píng)價(jià)結(jié)果的質(zhì)量,采用了在標(biāo)準(zhǔn)相對(duì)隸屬度矩陣中進(jìn)行插值的方法,生成更多的樣本。仿真表明,指標(biāo)約簡(jiǎn)后FPNN模型既保證了分類(lèi)質(zhì)量,也提高了收斂速度,實(shí)用性更強(qiáng)。當(dāng)然本文所采用的空氣質(zhì)量評(píng)價(jià)方法也可以應(yīng)用到其他領(lǐng)域中。
參考文獻(xiàn)
[1] 史成東,陳菊紅,胡健.基于粗糙集和神經(jīng)網(wǎng)絡(luò)的供應(yīng)鏈績(jī)效預(yù)測(cè)研究[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(33):203-206.
[2] 劉坤,劉賢趙.模糊概率神經(jīng)網(wǎng)絡(luò)模型在水質(zhì)評(píng)價(jià)中的應(yīng)用[J].水文,2007,27(1):36-39.
[3] 汪小燕.基于分辨矩陣的論域劃分方法[J].電腦學(xué)習(xí),2007(4):5-6.
[4] 李錦菊,沈亦欽.中美兩國(guó)環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)比較[J].環(huán)境監(jiān)測(cè)管理與技術(shù),2003,15(6):24-26.
[5] 飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與MATLAB 7[M].北京:電子工業(yè)出版社,2005:116-127.