文獻(xiàn)標(biāo)識碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.071
0 引言
配電網(wǎng)工程在國家穩(wěn)增長、調(diào)結(jié)構(gòu)、惠民生中發(fā)揮重要作用。近年來,公司不斷加大配電網(wǎng)等基礎(chǔ)性建設(shè)的投資力度,配電網(wǎng)新建、改建和擴(kuò)建,有效得提高了供電可靠性和穩(wěn)定性。但是由于配電網(wǎng)工程具有投資規(guī)模大、結(jié)構(gòu)復(fù)雜、多方參與等特點,在項目投資決策中缺少對于項目與線路臺區(qū)的關(guān)聯(lián)分析,不能全面反映資源投入轉(zhuǎn)換成應(yīng)有產(chǎn)出結(jié)果的效益,出現(xiàn)了部分項目與實際需求有差異、項目投產(chǎn)后設(shè)備利用率不足、投資不合理等現(xiàn)象。
目前,針對配電網(wǎng)投資效益如何最優(yōu)化的研究仍較少。文獻(xiàn)[1]分析了配電網(wǎng)投資后得到的經(jīng)濟(jì)效益,但其只是從財務(wù)角度出發(fā),沒有考慮其他影響因素;文獻(xiàn)[2]在配電網(wǎng)評估模型和技術(shù)方法層面進(jìn)行了研究,但太側(cè)重于技術(shù)實現(xiàn)的介紹,而沒有把投資的經(jīng)濟(jì)效益考慮在內(nèi);文獻(xiàn)[3]介紹了十分全面的評價指標(biāo)體系的構(gòu)建,但太多的評價指標(biāo)反而容易干擾評價結(jié)果,導(dǎo)致評價結(jié)果失真;文獻(xiàn)[4]構(gòu)建了輔助電網(wǎng)基建項目決策的模型,但沒有充分考慮投資限額的問題,因此存在某些地區(qū)的投資金額大于投資限額的問題;文獻(xiàn)[5]構(gòu)建了激勵監(jiān)管環(huán)境下多周期優(yōu)化潮流和監(jiān)管約束模型;文獻(xiàn)[6]提出了一種可隨機(jī)優(yōu)化的配網(wǎng)投資決策模型;文獻(xiàn)[7]建立了配電自動化系統(tǒng)成本效益綜合分析模型。
基于上述研究成果現(xiàn)狀,本文針對線路運營數(shù)據(jù)的關(guān)鍵指標(biāo)構(gòu)建了綜合評價指標(biāo)體系,利用熵權(quán)法與層次分析法結(jié)合的組合賦權(quán)法確定指標(biāo)權(quán)重,進(jìn)而得到線路投資迫切程度的得分情況,然后通過基于條件隨機(jī)場的文本挖掘技術(shù)對在建項目進(jìn)行線路主體名稱提取后,對配電網(wǎng)項目投資情況與線路打分結(jié)果進(jìn)行關(guān)聯(lián)分析,最后用實例驗證了該方法的合理性。
1 研究方法
1.1 熵權(quán)法
熵權(quán)法的核心是根據(jù)指標(biāo)變異性的大小來確定權(quán)重。一般地,指標(biāo)的信息熵越小,其變異程度就越大,那么該指標(biāo)提供的信息量就越多,其權(quán)重就越大[8],從而在綜合評價中所起的作用也就越大。
1.2 層次分析(AHP)法
AHP通過分析復(fù)雜系統(tǒng)所包含的因素及相關(guān)關(guān)系,構(gòu)造一個層次分析結(jié)構(gòu)模型[9],然后按照標(biāo)度規(guī)則將各指標(biāo)進(jìn)行兩兩比較,得到指標(biāo)判斷矩陣,最后計算得到判斷矩陣的最大特征值以及最大特征值對應(yīng)的特征向量,從而得出權(quán)重向量。其主要步驟如下:
(1)依據(jù)標(biāo)度規(guī)則,構(gòu)造兩兩比較判斷矩陣A:
如果CR<0.1,則判斷矩陣A通過了一致性檢驗,否則對A進(jìn)行重新修正。
1.3 基于單位化約束條件的組合賦權(quán)法
組合主客觀指標(biāo)權(quán)重的綜合賦權(quán)法是理想的指標(biāo)權(quán)重確定方法,目前,組合集成賦權(quán)法已存在多種形式,本文選用的是基于單位化約束條件的綜合賦權(quán)法[10]。
假設(shè)主觀賦權(quán)AHP法得到的指標(biāo)權(quán)重向量為:w=(w1,w2,…,wn),客觀賦權(quán)熵權(quán)法得到的指標(biāo)權(quán)重向量為:v=(v1,v2,…,vn),且主客觀權(quán)重和分別均為1,令R=αw+βv,其中R為組合主客觀權(quán)重后的最終權(quán)重向量,α、β分別為主客觀權(quán)重向量的系數(shù),且α、β滿足約束條件:α2+β2=1。
令各評價對象的最終得分值為di,依據(jù)多屬性決策的加法原則有:
最后將系數(shù)α、β代入式(8)即可得到各評價對象的得分情況。
1.4 基于條件隨機(jī)場(CRF)的文本挖掘算法
CRF是指在給定一組輸入隨機(jī)變量條件下,得出另一組輸出隨機(jī)變量的條件概率分布的模型,條件隨機(jī)場可以用于不同的預(yù)測問題,尤其是在中文文本提取問題上的應(yīng)用[11]。
設(shè)X與Y是隨機(jī)變量,P(Y|X)是在給定X條件下Y的條件概率分布。若隨機(jī)變量Y構(gòu)成一個無向圖,G=(V,E)表示的馬爾科夫隨機(jī)場,即:P(YV│X,YW,W≠V)=P(YV│X,YW,W~V),對任意結(jié)點V成立,則稱條件概率分布P(Y|X)為條件隨機(jī)場,式中W~V表示在圖G=(V,E)中與結(jié)點V有邊連接的所有結(jié)點W,W≠V表示結(jié)點V以外的所有結(jié)點。
在定義中,并沒有要求X和Y具有相同的結(jié)構(gòu)?,F(xiàn)實中,一般假設(shè)X和Y具有相同的圖結(jié)構(gòu)。本文主要考慮無向圖為如圖1和2所示的線性鏈的情況,即:
G=(V={1,2,3,…,n},E={(i,i+1)}),i=1,2,3,…,(n-1)
在此情況下,X=(X1,X2,…,Xn),Y=C(Y1,Y2,…,Yn),稱(X,Y)是一個條件隨機(jī)場。
CRF++工具是著名的使用命令行進(jìn)行控制的條件隨機(jī)向量場的訓(xùn)練和測試工具,本文的研究實現(xiàn)了Python和工具的聯(lián)調(diào),使得該算法的訓(xùn)練和測試命令更加簡單明了,根據(jù)用具自選參數(shù)設(shè)定顯示內(nèi)容,同時根據(jù)需求定制特征模板。雖然CRF++工具占用內(nèi)存較大,但是它的結(jié)果準(zhǔn)確率較高,總的來說,CRF++是綜合性能最佳的工具。
2 配電網(wǎng)項目投資與線路的關(guān)聯(lián)分析
2.1 綜合評價指標(biāo)體系構(gòu)建
配電網(wǎng)對項目的投資旨在滿足用戶不斷增加的用電負(fù)荷需要,在此基礎(chǔ)上再盡可能較多地獲得企業(yè)收益,因此本文從配電網(wǎng)運營數(shù)據(jù)層面構(gòu)建指標(biāo)體系,對線路運營指標(biāo)進(jìn)行綜合評價,從而驗證在建項目投資的合理情況。綜合評價的關(guān)鍵在于確定評價指標(biāo)的選取,本文從線路供電可靠性、負(fù)荷水平、電壓質(zhì)量以及三相不平衡這4個維度出發(fā)構(gòu)建的指標(biāo)體系如表1所示,指標(biāo)能從信息系統(tǒng)直接提取,避免了主觀因素的參與。
2.2 項目線路主體名稱提取
由于在建項目絕大部分是針對10 kV線路進(jìn)行的,而且項目名稱的命名也存在不規(guī)范的情況,因此,本文對項目中10 kV線路主體名稱的提取采用基于CRF的文本挖掘算法。整個提取流程如圖3所示,具體步驟如下:
(1)對項目名稱進(jìn)行預(yù)處理,主要包括對字母大小寫轉(zhuǎn)換、羅馬數(shù)字規(guī)范化以及統(tǒng)一某些漢字的書寫等工作。
(2)對預(yù)處理后的文本進(jìn)行分詞,這個過程除了采用第三方算法包自帶的分詞規(guī)則外,還需要添加自定義詞典,本文加入了電力行業(yè)專業(yè)詞匯、城市信息詞匯、設(shè)備臺賬表抽取的線路名稱詞匯等。
(3)識別命名實體(線路主體),基于條件隨機(jī)場的命名實體識別需要手動對分詞后的文本進(jìn)行標(biāo)注,預(yù)先根據(jù)文本句式特點建立命名實體標(biāo)注集對每個詞進(jìn)行手動標(biāo)注。
(4)手動標(biāo)注結(jié)束后,需要建立相應(yīng)的幾種特征模板來指定訓(xùn)練時涉及的特征值,從這幾種模板中選擇準(zhǔn)確率最高的一種作為最終的特征模板加入模型定義中,本文中,特征模板選用了CRF++的標(biāo)準(zhǔn)范例模板Template_NER_01、Template_NER_02。Template_NER_01模板中設(shè)定窗口大小為1,即認(rèn)為當(dāng)前詞與前后一個詞之間在語義上關(guān)聯(lián)度最高;Template_NER_02模板中設(shè)定窗口大小為2,即認(rèn)為當(dāng)前詞與前后兩個詞之間在語義上關(guān)聯(lián)度最高。
(5)采用條件隨機(jī)場CRF工具,利用之前標(biāo)注后的訓(xùn)練集分別加入兩種特征模板訓(xùn)練模型,隨后在此基礎(chǔ)上輸入測試數(shù)據(jù)進(jìn)行不斷測試,找出測試集準(zhǔn)確率較高的模型,最后輸入要預(yù)測的文本到該模型中便可返回相應(yīng)的線路主體。
2.3 分析流程
本文基于配電網(wǎng)線路的重過載、超載、過電壓、低電壓、三相不平衡、停電等方面指標(biāo),從業(yè)務(wù)系統(tǒng)中提取多維度信息,通過綜合評價法對線路指標(biāo)情況進(jìn)行打分,然后通過基于條件隨機(jī)場的文本挖掘技術(shù)對在建項目進(jìn)行線路主體名稱提取后,關(guān)聯(lián)分析所有線路的得分情況與在建項目對于線路的投資情況,進(jìn)而驗證在建項目的投資必要性和合理性,最終為電網(wǎng)企業(yè)科學(xué)合理地進(jìn)行配電網(wǎng)投資提供借鑒,發(fā)揮運監(jiān)中心在企業(yè)閉塞環(huán)節(jié)優(yōu)化、風(fēng)險防控、管理提升工作中的積極作用。圖4為本文分析的技術(shù)流程。
3 實例分析
3.1 數(shù)據(jù)來源
提取配電網(wǎng)運營監(jiān)測平臺某供電公司2017年全年的配變運營數(shù)據(jù),包括電壓質(zhì)量、負(fù)荷、三相不平衡以及停電數(shù)據(jù),對其中配變所屬線路利用正則表達(dá)式進(jìn)行統(tǒng)一規(guī)范化后,得到10 kV線路的各指標(biāo)數(shù)據(jù)。例如,線路停電指標(biāo)的計算采用停電類別為“電網(wǎng)故障停限電”、停電時間在2017年內(nèi)、線路所屬電壓質(zhì)量為10 kV后的某線路下所有配變的停電時長總和、停電次數(shù)總和作為該線路的停電指標(biāo)計算結(jié)果,同理計算得到線路的其他運營指標(biāo)計算結(jié)果。然后將線路供電可靠性、負(fù)荷水平、電壓質(zhì)量、三相不平衡4個維度的指標(biāo)數(shù)據(jù)進(jìn)行關(guān)聯(lián),匯總得到記錄數(shù)為19 082條線路指標(biāo)數(shù)據(jù)寬表。樣例結(jié)構(gòu)如表2所示。
3.2 線路綜合評價
線路指標(biāo)數(shù)據(jù)的綜合評價采用AHP法與熵權(quán)法相結(jié)合的組合賦權(quán)法確定指標(biāo)權(quán)重。首先分別計算主、客觀法確定的指標(biāo)權(quán)重值,然后利用基于單位化約束條件的組合集成算法將二者進(jìn)行組合得到最終的指標(biāo)權(quán)重。具體步驟如下:
(1)針對前面的指標(biāo)體系,構(gòu)建一級指標(biāo)專家打分判斷矩陣,結(jié)果如表3所示。
經(jīng)計算,CI= 0.074,CR= 0.082<0.1,通過一致性檢驗,得到的一級指標(biāo)權(quán)重為(0.546,0.211,0.078,0.165)。
(2)構(gòu)建二級指標(biāo)專家打分判斷矩陣。以供電可靠性維度為例,構(gòu)建故障停電時長及故障停電次數(shù)的判斷矩陣如表4所示。同理,構(gòu)建其他維度下的二級指標(biāo)判斷矩陣。
經(jīng)計算,得到的各維度下二級指標(biāo)權(quán)重分別為(0.333,0.667)、(0.167,0.833)、(0.167,0.833)、(0.667,0.333)
(3)將得到的一級、二級權(quán)重值對應(yīng)元素相乘便可得出AHP指標(biāo)權(quán)重值,結(jié)果為w=(0.182,0.364,0.035, 0.176,0.013,0.065,0.11,0.055)。
(4)按照前面熵權(quán)法的介紹,得出熵權(quán)法確定的指標(biāo)權(quán)重結(jié)果為v=(0.108,0.101,0.139,0.234,0.182,0.161, 0.0367,0.038)。
(5)利用基于單位化約束條件的組合集成賦權(quán)法組合主客觀權(quán)重w、v,得到指標(biāo):故障停電時長、故障停電次數(shù)、重載時長、超載時長、低電壓時長、過電壓時長、三相不平衡次數(shù)、三相不平衡時長對應(yīng)的權(quán)重結(jié)果為:R=(0.156,0.273,0.071,0.196, 0.072,0.098,0.084,0.049)。
(6)計算線路得分結(jié)果。利用線路實際指標(biāo)值與最終的指標(biāo)權(quán)重向量R進(jìn)行加權(quán)求和可以計算出19 082條10 kV線路的最終得分,樣例如表5所示。
3.3 項目名稱文本挖掘
本文選用2018年1月~3月共17 881個在建項目,剔除110 kV和20 kV的工程項目后剩余項目記錄數(shù)17 533個,由于項目基礎(chǔ)信息中并沒有針對具體的線路名稱字段,因此只能從項目名稱中利用文本挖掘的技術(shù)提取項目主體。
在對項目名稱字段進(jìn)行數(shù)據(jù)預(yù)處理的基礎(chǔ)上,引入自定義詞典及停用詞詞典,利用R中的jieba分詞算法包對項目名稱短文本進(jìn)行了分詞,基于CRF的實體識別首先需要對分詞后的文本進(jìn)行手動標(biāo)注,其中標(biāo)注符號的說明如表6所示。一部分分詞后的樣本標(biāo)注樣例如表7所示。
本文特征模板選用了CRF++的標(biāo)準(zhǔn)范例模板Template_NER_01、Template_NER_02,采用條件隨機(jī)場CRF工具反復(fù)訓(xùn)練模型,得到兩種特征模板及其測試集對應(yīng)的準(zhǔn)確率和召回率統(tǒng)計結(jié)果如表8所示。
因此選用準(zhǔn)確率和召回率都較高的Template_NER_2作為最終的特征模板。將2018年的17 553個項目經(jīng)過以上預(yù)處理、分詞、標(biāo)注等一系列操作后輸入訓(xùn)練好的最佳模型中,可得到如表9所示的樣例結(jié)果。
3.4 實驗結(jié)果分析
從配變運營數(shù)據(jù)整理、計算得到10 kV線路19 082條,通過上面綜合評價算法相應(yīng)得到19 082條線路的得分值。同時,2018年在建10 kV項目共17 533個,通過基于CRF的文本挖掘算法能提取出線路名稱的項目共15 743個,由于存在多個項目投資一條線路的情況,因此從這15 743個項目中整理得到8 218條10 kV線路,能與19 082條有得分值的線路關(guān)聯(lián)起來的項目有14 457個,相應(yīng)地,能關(guān)聯(lián)起來的線路有7 329條。即,從全省2018年1~3月對項目/線路的投資情況看,未關(guān)聯(lián)到線路運營數(shù)據(jù)卻存在投資行為的線路有889條,可能原因一是從項目名稱中提取的線路名稱與運營數(shù)據(jù)的線路無法匹配,二是存在一部分已投資線路的運營指標(biāo)并未出現(xiàn)異常,因此無法與運營數(shù)據(jù)中的線路關(guān)聯(lián)。能關(guān)聯(lián)起來的線路有7 329條,達(dá)到7 329/8 218=89%的線路投資覆蓋率,但是從線路運營指標(biāo)層面看,這89%的線路投資是否合理,是否存在得分很高但投資金額很低或者得分很低但投資金額高的情況還需進(jìn)一步分析。
結(jié)合2018年前3個月對項目投資金額的考慮,得出線路得分與線路總投資的關(guān)系如圖5所示,橫軸代表項目得分,縱軸代表項目投資情況。對于成本類項目,投資金額基本都在200萬元以下,不存在得分很低但投資金額大于200萬元的情況;而對于資本類項目,有不少20分以下的項目投資金額卻在2 000萬元以上,并且不存在得分大于70分以上的項目。具體的線路得分分布與投資金額的分布詳細(xì)情況如表10、表11所示。
從表10成本類項目的投資情況看出,存在1條線路的投資超過1 000萬元,但其綜合評價得分小于20分;并且存在4條線路的得分在50分以上,但其投資金額卻小于100萬元的情況。從表11資本類項目的投資情況看出,有5條線路的綜合評價得分小于20分,但其投資金額在3 000萬元以上;有7條線路的得分在50分以上但其投資金額卻在100萬元以下。
綜上,從運營數(shù)據(jù)層面來說,通過對在建項目所投資的線路進(jìn)行綜合評價并結(jié)合其投資總金額的分析發(fā)現(xiàn),絕大多數(shù)的項目投資相對合理,但也確實存在某些項目有投資不合理的情況:得分低但實際投資金額大或者得分高但實際投資金額少的線路數(shù)17條,占總線路數(shù)的比例為0.24%,針對這些項目仍需要結(jié)合其他方面的參考因素(比如社會因素、經(jīng)濟(jì)因素、氣象因素等)衡量是否投資合理。
4 結(jié)論
配電網(wǎng)工程在國家穩(wěn)增長、調(diào)結(jié)構(gòu)、惠民生中發(fā)揮重要作用。隨著近年來不斷加大配電網(wǎng)等基礎(chǔ)性建設(shè)的投資力度,配電網(wǎng)新建、改建和擴(kuò)建,有效地提高了供電可靠性和穩(wěn)定性。本文針對線路運營數(shù)據(jù)的關(guān)鍵指標(biāo)構(gòu)建了綜合評價指標(biāo)體系,利用組合賦權(quán)法確定指標(biāo)權(quán)重,進(jìn)而得到線路投資迫切程度的得分情況,然后通過基于條件隨機(jī)場的文本挖掘技術(shù)對在建項目進(jìn)行線路主體名稱提取后,對配電網(wǎng)項目投資情況與線路打分結(jié)果進(jìn)行關(guān)聯(lián)分析,得到不同項目分類下線路得分與投資金額的具體分布情況。通過本文的研究,可以從線路運營數(shù)據(jù)層面發(fā)現(xiàn)投資分配的合理性,為電網(wǎng)企業(yè)科學(xué)合理地進(jìn)行配電網(wǎng)投資提供借鑒,從而有效發(fā)揮運監(jiān)中心在企業(yè)閉塞環(huán)節(jié)優(yōu)化、風(fēng)險防控、管理提升工作中的積極作用。
參考文獻(xiàn)
[1] 吳鴻亮. 配電網(wǎng)投資經(jīng)濟(jì)效益計算分析[J]. 電網(wǎng)與清潔能源, 2010,26(9):13-16.
[2] 盧建昌,王偉. 基于熵權(quán)密切值法的配電網(wǎng)評估模型[J].華東電力,2013,41(5):1047-1050.
[3] 王敬敏,施婷. 智能配電網(wǎng)評估指標(biāo)體系的構(gòu)建[J]. 華北電力大學(xué)學(xué)報,2012,39(6):65-70.
[4] 宋伶俐, 楊軍, 周博文, 等.一種電網(wǎng)基建項目輔助決策方法[J].電力自動化設(shè)備,2013,33(6):64-69.
[5] HUANG Y,SODER L.Assessing the impact of incentive regulationon distribution network investment considering distributedgeneration integration[J].International Journal of Electrical Power& Energy Systems,2017,89:126-135.
[6] KONSTANTELOS I,GIANNELOS S,STRBAC G.Strategic valuationof smart grid technology options in distribution networks[J]. IEEE Transactions on Power Systems,2017,32(2):1293-1303.
[7] 王宗耀,蘇浩益. 配網(wǎng)自動化系統(tǒng)可靠性成本效益分析[J]. 電力系統(tǒng)保護(hù)與控制,2014,42(6):98-103.
[8] 沈世鎰,吳忠華.信息論基礎(chǔ)與應(yīng)用[M]. 北京: 高等教育出版社,2004.
[9] 吳澤寧, 張超, 越仁榮, 等. 工程項目系統(tǒng)評價(第一版)[M]. 鄭州: 黃河水利出版社, 2002.
[10] 郭亞軍. 綜合評價理論與方法[M]. 北京: 科學(xué)出版社,2002.
[11] LEE S, LEE G G. Heuristic methods for reducing errors of geographic named entities learned by bootstrapping[C]. LNCS 3651: Proceedings of the Second International Joint Conference on Natural Language Processing, Jeju Island, Korea, October 11-13, 2005. Berlin, Heidelberg: Springer, 2005:658-669.
作者信息:
胡 宏1,彭 濤2
(1.國網(wǎng)江蘇省電力有限公司,江蘇 南京 210000;2. 國網(wǎng)江蘇省電力有限公司,江蘇 南京 210000)