文獻(xiàn)標(biāo)識(shí)碼: A
DOI: 10.19358/j.issn.2096-5133.2022.04.013
引用格式: 張子霖. 基于深度強(qiáng)化學(xué)習(xí)的電動(dòng)汽車(chē)協(xié)調(diào)充電算法[J].信息技術(shù)與網(wǎng)絡(luò)安全,2022,41(4):83-89.
0 引言
電動(dòng)汽車(chē)作為一種新型的分布式移動(dòng)資源,已成為智能電網(wǎng)發(fā)展的重要組成部分[1],越來(lái)越多的研究人員開(kāi)始關(guān)注電動(dòng)汽車(chē)在電網(wǎng)中的社會(huì)價(jià)值。但電動(dòng)汽車(chē)的日益普及也不可避免地給用戶和電網(wǎng)帶來(lái)了一系列的問(wèn)題和挑戰(zhàn)。例如,大量電動(dòng)汽車(chē)的不協(xié)調(diào)充電,將導(dǎo)致電網(wǎng)承受不可預(yù)測(cè)的負(fù)荷。因此,如何設(shè)計(jì)多輛電動(dòng)汽車(chē)在整個(gè)工作過(guò)程中的協(xié)調(diào)充電策略,以降低能源成本,保證用戶對(duì)電動(dòng)汽車(chē)荷電狀態(tài)的滿意度,并將對(duì)配電網(wǎng)的影響降到最低,是亟需解決的問(wèn)題。
近年來(lái),為了解決電動(dòng)汽車(chē)的協(xié)調(diào)充電問(wèn)題,出現(xiàn)了許多分布式調(diào)度方法。例如,為了最大限度地提高電動(dòng)汽車(chē)用戶的便利性,開(kāi)發(fā)了一種分散的基于交替方向乘法器的優(yōu)化算法[2]。為使電動(dòng)汽車(chē)充電成本最小化,使用電動(dòng)汽車(chē)充電概率模型建立了一個(gè)嚴(yán)格凸分散系統(tǒng)形式的多人博弈[3]。但上述研究只關(guān)注了單一的目標(biāo),這在實(shí)際應(yīng)用中往往是受限制的。針對(duì)多目標(biāo)的協(xié)調(diào)充電問(wèn)題,通過(guò)多智能體自私協(xié)同優(yōu)化的方案,除了實(shí)現(xiàn)用戶利益以外,也保證避免變壓器過(guò)載[4],但它沒(méi)有充分考慮狀態(tài)空間泛化和值函數(shù)逼近的影響,導(dǎo)致擬合性能較差,計(jì)算開(kāi)銷(xiāo)也不理想。針對(duì)該問(wèn)題,文獻(xiàn)[5]考慮采用基于機(jī)器學(xué)習(xí)的方法,其以收斂速度快、計(jì)算效率高而被廣泛應(yīng)用于大規(guī)模數(shù)據(jù)的高維問(wèn)題中。
本文詳細(xì)內(nèi)容請(qǐng)下載:http://ihrv.cn/resource/share/2000004104
作者信息:
張子霖
(中國(guó)科學(xué)技術(shù)大學(xué) 自動(dòng)化系,安徽 合肥230026)