考虑分区与模仿学习的深度强化学习配电网电压优化策略

Voltage optimization strategy for a distribution network based on deep reinforcement learning considering regionalization and imitation learning

下载PDF

导出

摘要现有深度强化学习(deep reinforcement learning,DRL)方法在解决配电网电压优化问题时,存在信用分配难、探索效率低等问题,在模型训练速度和优化效果等方面表现欠佳。为此,结合配电网分区降损与模仿学习的思想,提出一种基于指导信号的多智能体深度确定性策略梯度(guidance signal based multi-agent deep deterministic policy gradient,GS-MADDPG)的电压优化方法。首先,将电动汽车(electric vehicles,EV)集群、分布式电源(distributed generations,DG)和无功调节装置作为决策智能体,构建强化学习优化模型。然后,通过配电网分区,解耦多智能体的外部奖励,并结合模仿学习,利用指导信号引入内部奖励,帮助智能体快速寻优。最后,基于改进IEEE33节点系统进行算例测试。结果表明,所提电压优化策略较传统DRL方法具有更高的样本利用率,实现了更稳定的收敛及更高的模型训练效率,提升了配电网电压的优化效果。 The current deep reinforcement learning(DRL)method has some issues with voltage optimization,such as challenging credit allocation and low exploration efficiency.These all lead to poor performance in model training speed and optimization effect.Considering regionalization and imitation learning,a voltage optimization strategy based on the guidance signal-based multi-agent deep deterministic policy gradient(GS-MADDPG)is proposed.First,electric vehicle(EV)clusters,distributed generation(DG)and reactive power regulators are taken as decision agents to build the reinforcement learning optimization model.Secondly,the external reward is decoupled through regionalization of the distribution network,and combined with imitation learning,an internal reward is introduced through the guidance signal to help agents search for optimization quickly.Finally,an example test is conducted on the improved IEEE 33-node distribution network.The results indicate that the proposed voltage optimization strategy has higher sample utilization,more stable convergence,and higher model training efficiency than the traditional DRL method,and improves the voltage optimization effect.

作者李士丹李航李国杰韩蓓徐晋李玲王宏韬 LI Shidan;LI Hang;LI Guojie;HAN Bei;XU Jin;LI Ling;WANG Hongtao(Key Laboratory of Control of Power Transmission and Conversion,Ministry of Education(Shanghai Jiao Tong University),Shanghai 200240,China;Shanghai PeiKe Technology Co.,Ltd.,Shanghai 200240,China;Jiaxing Power Supply Company,State Grid Zhejiang Electric Power Co.,Ltd.,Jiaxing 314000,China)

机构地区电力传输与功率变换控制教育部重点实验室(上海交通大学) 上海沛可科技有限公司国网浙江省电力有限公司嘉兴供电公司

出处《电力系统保护与控制》 EI CSCD 北大核心 2024年第22期1-11,共11页 Power System Protection and Control

基金国家重点研发计划项目资助(2022YFE0105200) 国网浙江省电力有限公司科技项目资助(5211JX230004)。

关键词配电网电压优化深度强化学习分区降损模仿学习指导信号 voltage optimization of distribution network deep reinforcement learning zoned loss reduction imitation learning guidance signal

分类号 TM7 [电气工程—电力系统及自动化]

引文网络
相关文献

1贺佐斌.基于模糊折中规划法的多目标信号配时研究[J].智能城市,2024,10(10):1-3.
2田世吉,宫建锋,王洪坤,张宏,郑伟,韩一鸣,张斌.基于DR和SOP协调的配电网分布式光伏接纳能力提升方法研究[J].石河子大学学报（自然科学版）,2024,42(5):529-537.
3滕桂萍,岑贤贡.台风灾前-灾后两阶段配电网调度优化研究[J].电力大数据,2024,27(7):71-79.
4何菊华,杨德崇.基于前额脑电信号伪迹去除的可穿戴心理健康疲劳检测仪设计研究[J].自动化与仪器仪表,2024(9):106-110.
5仲世杰,符江锋,刘显为,魏鹏飞,殷德文.基于超参数双调和方程代理模型的航空燃油离心泵多目标优化[J].推进技术,2024,45(12):102-114.
6卢振连,姜阔胜,陈凯,武杰.煤矿装备瞬态非平稳工况下轴承故障诊断方法[J].煤炭技术,2024,43(11):213-217.
7秦潇婕.基于改进灰狼算法的分布式光伏接入配电网无功优化方法研究[J].电气开关,2024,62(5):24-27.
8张虹,曹磊,孙雷,侯懿纯,苏欣,张玉海.主动配电网局部不可观相关性分析与谐波源定位[J].电网与清洁能源,2024,40(10):84-92.
9李鹏,程文涛,杜艺博,丁瀛,占金青.改进的可移动变形组件拓扑优化方法[J].计算力学学报,2024,41(5):879-885.
10张圣涛,赵佳,陈楚琪.改进遗传算法进化的演员网络种群强化学习算法[J].计算机科学与应用,2024,14(10):102-109.

电力系统保护与控制

2024年第22期

浏览历史

内容加载中请稍等...

考虑分区与模仿学习的深度强化学习配电网电压优化策略

相关作者

相关机构

相关主题

浏览历史