文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.181513
中文引用格式: 黃欣,李倩玉,駱亦其,等. 一種基于敏感性分析的改進參數(shù)篩選方法[J].電子技術(shù)應(yīng)用,2018,44(12):106-110.
英文引用格式: Huang Xin,Li Qianyu,Luo Yiqi,et al. An effective parameter screening method based on sensitivity analysis[J]. Application of Electronic Technique,2018,44(12):106-110.
0 引言
氣候變化對人類的生產(chǎn)生活、政治經(jīng)濟、科技等方面影響巨大。地球系統(tǒng)模式(Earth System Models,ESMs)是基于動力、物理、化學(xué)、生物過程及其相互間的能量物質(zhì)交換構(gòu)建的一系列數(shù)學(xué)物理模型,是預(yù)測未來氣候變化的重要工具[1]。模式中含有大量取值不確定的參數(shù),會極大影響地球系統(tǒng)模式的模擬性能[2]。然而隨著模式發(fā)展,不確定參數(shù)越來越多[3],這導(dǎo)致參數(shù)不確定性分析難以實施。其原因一方面是參數(shù)空間隨著參數(shù)數(shù)量增加呈指數(shù)增長,計算成本不可接受;另一方面是由于地球系統(tǒng)模式強非線性,參數(shù)間存在復(fù)雜的交互關(guān)系。因此,通過篩選重要參數(shù)來減少待研究參數(shù)個數(shù)是參數(shù)不確定性分析的重要步驟,是提高地球系統(tǒng)模式模擬性能的關(guān)鍵。
參數(shù)敏感性分析方法(Sensitivity Analysis,SA)是一類傳統(tǒng)的參數(shù)篩選方法[4]。其中基于方差分解的Sobol′方法應(yīng)用普遍,許多研究表示它是一個里程碑,能提供最準確和魯棒的結(jié)論[5-6]。然而傳統(tǒng)SA并沒有考慮隨著不敏感參數(shù)的剔除,參數(shù)敏感性信息不斷改變[7],這有可能導(dǎo)致參數(shù)篩選結(jié)論不可靠。
本文首先驗證了這種篩選偏差的存在,其次提出了動態(tài)敏感性分析方法(Dynamic Sensitivity Analysis Method,DSAM)。它利用全連接的超圖結(jié)構(gòu)存儲參數(shù)的敏感性信息,將參數(shù)篩選問題轉(zhuǎn)換為最密子圖的識別問題。最后將DSAM應(yīng)用于兩個模型:一般非線性數(shù)學(xué)函數(shù)、單柱大氣模式。通過對比,驗證了DSAM比傳統(tǒng)Sobol′方法能更有效地識別重要參數(shù)。
1 傳統(tǒng)敏感性方法的參數(shù)篩選問題
本文利用Ishigami函數(shù)進行兩次敏感性分析,結(jié)果如圖1所示。第一次擾動全參數(shù)集,它的結(jié)果是傳統(tǒng)Sobol′的篩選結(jié)果。第二次固定不敏感參數(shù)x3不變,只對剩余參數(shù)子集進行擾動,使有關(guān)x3的交互敏感性消失,最敏感的參數(shù)會變?yōu)閤2。這說明參數(shù)篩選過程中非敏感參數(shù)的剔除會通過交互作用動態(tài)影響到其他參數(shù)的敏感性。
2 動態(tài)敏感性分析方法
2.1 敏感性超圖構(gòu)建
敏感性超圖是一個全連接、權(quán)重全為正實數(shù)且含超邊的圖。超邊代表連接兩個以上節(jié)點的邊。節(jié)點代表參數(shù),點權(quán)代表主敏感性,邊權(quán)代表交互敏感性,超邊權(quán)代表二階以上的高階交互敏感性。實際高于二階的交互敏感性太小可以忽略[9],因此本文只計算二階交互敏感性。
基于方差分解(如式(2)所示)可計算傳統(tǒng)Sobol′方法的三類敏感性和參數(shù)組合的組合敏感性(如式(6)所示)。顯然全參數(shù)的組合效應(yīng)接近1。
2.2 最密k階子圖搜索
給定子圖中節(jié)點數(shù)量k,最密k階子圖就是其中權(quán)重最大的子圖。本文基于深度優(yōu)先搜索算法(Depth-First-Search,DFS)遞增式搜索最密子圖,即k從1遞增到n-1過程中,對每個k值進行一次k階最密子圖的搜索。遞增式搜索的停止條件是當(dāng)前k階最密子圖的權(quán)重接近原始圖的總權(quán)重,如80%。由于敏感性超圖的總權(quán)重為1,因此停止標準可設(shè)置為0.8。
3 實驗設(shè)計與分析
3.1 實驗?zāi)P?/strong>
3.1.1 數(shù)學(xué)函數(shù)
Moon10hd是一個含有20個參數(shù)的高維非線性函數(shù)[10],如式(7)所示。它含有線性項、二次指數(shù)項和二階交互項,其中θ(xi)中含有大量的小系數(shù)項。本文利用Moon10hd的100 000個樣本進行分析。
3.1.2 單柱大氣模式
單柱大氣模型(Single-column Community Atmosphere Model,SCAM)用于模擬一個網(wǎng)格點的大氣物理過程[11]。本實驗限制網(wǎng)格點在澳大利亞北部,模擬時間是從2006年1月18日至2月13日。觀測資料來源于該地區(qū)6個無線電探空站每3小時收集到的觀測數(shù)據(jù)。參數(shù)和輸出變量見表1、表2。模式結(jié)果如式(8)所示,代表N個輸出變量與觀測的平均偏差。本文利用了SCAM模擬的10 000次樣本。
3.2 參數(shù)篩選結(jié)果評估方法
本文利用傳統(tǒng)Sobol′與DSAM的篩選結(jié)果進行對比。變量wDiff(Weighted Difference)用于量化評估參數(shù)篩選結(jié)果的差異。當(dāng)差異小于0.01 時可視為敏感性指標不變,所以當(dāng)wDiff低于1% 時,可認為兩個篩選結(jié)果近似相同。
參數(shù)篩選要為后續(xù)參數(shù)不確定性分析(如參數(shù)取值優(yōu)化)提供待研究參數(shù)。當(dāng)固定待優(yōu)化參數(shù)的數(shù)量時,對更敏感參數(shù)調(diào)優(yōu)更有可能達到更佳的優(yōu)化效果。協(xié)方差矩陣適應(yīng)演化策略(CMA-ES)是一類經(jīng)典的優(yōu)化方法。本文分別將Sobol′和DSAM的篩選結(jié)果應(yīng)用于CMA-ES調(diào)優(yōu),若優(yōu)化后模式結(jié)果越低,篩選結(jié)果越有效。
4 實驗結(jié)果
圖2(a)和圖3(a)顯示了傳統(tǒng)Sobol′方法對Moon10hd函數(shù)、SCAM模式的參數(shù)敏感性結(jié)論,總敏感性最高的參數(shù)被篩選出來。圖2(b)和圖3(b)展示了DSAM的動態(tài)篩選結(jié)果。每列代表一個參數(shù),從左到右按Sobol′的結(jié)果遞減地排序,實心表示參數(shù)被篩選出來,篩選出的敏感參數(shù)個數(shù)隨行號遞增。最后一列是傳統(tǒng)Sobol′方法和DSAM篩選結(jié)果的量化差異(即式(9))。
即使兩個篩選結(jié)果的組成成員大部分相似,加權(quán)差異也可能很大。對于Moon10hd的最敏感的兩個參數(shù)(如圖2(b)所示),Sobol′和DSAM的篩選結(jié)果的量化差異高達29%,而對于前3位敏感參數(shù),篩選差異也超過10%。
Sobol′和DSAM的篩選結(jié)論的不一致有助于發(fā)現(xiàn)潛在的關(guān)鍵過程。文獻[12]認為x12是Moon10hd函數(shù)中的關(guān)鍵參數(shù),而它甚至沒有出現(xiàn)在前3的敏感參數(shù)中。對于SCAM模型,Sobol′剔除掉的不敏感參數(shù)x13和x15被DSAM識別為敏感。從物理意義上分析,x13(聚合冰收集率)影響冰的反射率,進而影響關(guān)鍵的輻射過程。x15(濕夾卷加強參數(shù))影響底部湍流,而x19(上升穿透夾卷率)代表更高層的濕氣夾卷,較低位置的湍流過程更為重要。
圖4、圖5分別顯示了對DSAM和Sobol′的篩選結(jié)果進行優(yōu)化后的模型結(jié)果,其中每個都分別選擇了大量參數(shù)集合和少量參數(shù)集合。首先,當(dāng)優(yōu)化更多參數(shù)時,模式結(jié)果的優(yōu)化程度更好,而調(diào)優(yōu)過程越不容易收斂。其次,相比Sobol′,DSAM的篩選結(jié)果能使結(jié)果收斂到更優(yōu)解,即相對于觀測的偏差更小。由圖4可知,DSAM識別到的Top2敏感參數(shù)的調(diào)優(yōu)效果比Sobol′的結(jié)果提升了38.5%,而所需迭代次數(shù)減少了26.6%。同樣,對于Top5重要參數(shù),優(yōu)化效果提升了12.5%,迭代次數(shù)減少了36.1%。
盡管只有少量參數(shù)不同,但參數(shù)調(diào)優(yōu)中優(yōu)化效果差別卻可能很大。在圖5(b)中,14個參數(shù)中只有2個發(fā)生了替換,即x4和x19替換為x13和x15,但調(diào)優(yōu)效果提升了65.2%。
因此,無論從量化比較還是基于參數(shù)調(diào)優(yōu)應(yīng)用的評估,都證明了DSAM比傳統(tǒng)Sobol′更為有效。
5 結(jié)論
本文基于一個經(jīng)典數(shù)值函數(shù)說明了參數(shù)交互作用對參數(shù)篩選過程的影響,提出了一個基于動態(tài)敏感性的篩選算法(DSAM),并在兩個測試案例中,分析對比了DSAM和傳統(tǒng)篩選方法的效果。通過實驗和分析,可得到如下結(jié)論:
(1)參數(shù)交互作用在模式參數(shù)篩選過程中動態(tài)變化,對篩選結(jié)果有很重要的影響作用。參數(shù)篩選實際是一個組合優(yōu)化問題。
(2)DSAM算法利用圖結(jié)構(gòu)來存儲參數(shù)敏感性信息,將參數(shù)篩選問題轉(zhuǎn)換為遞增式搜索最密子圖問題。由于保證了動態(tài)性,從理論上DSAM更適合參數(shù)篩選應(yīng)用。
(3)實驗表示相比傳統(tǒng)方法,DSAM的篩選結(jié)果量化差異可高達29%。這表明基于組合最優(yōu)和單一敏感性指標的結(jié)論差異很大。
(4)針對參數(shù)調(diào)優(yōu)應(yīng)用,即使篩選結(jié)果的組成差異很小,帶來的調(diào)優(yōu)效果差異可高達67%。
參考文獻
[1] 王斌,周天軍,俞永強,等.地球系統(tǒng)模式發(fā)展展望[J].氣象學(xué)報,2008,66(6):857-869.
[2] HUANG M,HOU Z,LEUNG L R,et al.Uncertainty analysis of runoff simulations and parameter identifiability in the community land model:evidence from MOPEX basins[J].Journal of Hydrometeorology,2013,14(6):1754-1772.
[3] GILMORE M S,STRAKA J M,RASMUSSEN E N.Precipitation uncertainty due to variations in precipitation particle parameters within a simple microphysics scheme[J].Monthly Weather Review,2004,132(11):2610-2627.
[4] SALTELLI A,RATTO M,TARANTOLA S,et al.Sensitivity analysis for chemical models[J].Chemical Reviews,2005,105(7):2811-2828.
[5] SONG X,ZHANG J,ZHAN C,et al.Global sensitivity analysis in hydrological modeling:review of concepts,methods,theoretical framework,and applications[J].Journal of Hydrology,2015,523:739-757.
[6] LI J,DUAN Q Y,GONG W,et al.Assessing parameter importance of the common land model based on qualitative and quantitative sensitivity analysis[J].Hydrology and Earth System Sciences,2013,17(8):3279.
[7] METZGER C,NILSSON M B,PEICHL M,et al.Parameter interactions and sensitivity analysis for modelling carbon heat and water fluxes in a natural peatland, using Coup-Model v5[J].Geoscientific Model Development,2016,9(12):4313-4338.
[8] GAN Y,DUAN Q,GONG W,et al.A comprehensive evaluation of various sensitivity analysis methods:a case study with a hydrological model[J].Environmental Modelling and Software,2014,51:269-285.
[9] SAFTA C,RICCIUTO D,SARGSYAN K,et al.Global sensitivity analysis,probabilistic calibration,and predictive assessment for the data assimilation linked ecosystem carbon model[J].Geoscientific Model Development Discussions,2015,8(7):6893-6948.
[10] MOON H.Design and analysis of computer experiments for screening input variables[D].Columbus, Ohio: The Ohio State University,2010.
[11] U K M,ARAKAWA A.Semiprognostic tests of the Arakawa-Schubert cumulus parameterization using simulated data[J].Journal of the atmospheric sciences,1992,49(24):2421-2436.
[12] ZHANG M H,LIN J L.Constrained variational analysis of sounding data based on column-integrated budgets of mass,heat,moisture,and momentum:approach and application to ARM measurements[J].Journal of the Atmospheric Sciences,1997,54(11):1503-1524.
資助項目:國家重點研發(fā)計劃項目(2016YFA0602103)
作者信息:
黃 欣1,李倩玉2,駱亦其3,薛 巍1,2
(1.清華大學(xué) 計算機科學(xué)與技術(shù)系,北京100084;2.清華大學(xué) 地球系統(tǒng)科學(xué)系,北京100084;
3.北亞利桑那大學(xué) 生態(tài)系統(tǒng)科學(xué)與社會中心,美國 弗拉格斯塔夫 86011)