基于强化学习算法的微电网优化策略

Optimization Strategy for Microgrid Based on Reinforcement Learning Algorithm

下载PDF

导出

摘要分布式能源具有小规模波动和间歇性的特点,导致微电网运行策略难以制定。微电网有效集成多种分布式能源和外部电网,多能源微电网管理正成为一项非常复杂的任务。针对该问题,提出一种在负荷需求、可再生能源和储能设备等综合因素影响下的微电网实时优化运行策略。该策略首先基于强化学习框架,将微电网运行问题建模为马尔可夫决策过程,然后以最小化微电网电压波动和运行损耗为目的构建微电网策略优化模型。为有效利用微电网的互联结构,在近端策略优化算法的基础上,设计一种图注意力近端策略优化算法(graph attention proximal policy optimization,GT-PPO),该算法使用注意力机制和图神经网络学习微电网节点的相关性,以学习各类环境下不同时段多能源微电网最优调度策略。最后,采用改进的IEEE 33节点、IEEE 118节点两种规格的微电网进行仿真实验。实验结果表明,该优化策略可以实现微电网的实时优化,且结果优于传统的近端策略优化(proximal policy optimization,PPO)算法和双深度Q网络(double deep Q network,DDQN)算法。 Distributed energy has the characteristics of small-scale fluctuations and intermittency,making it difficult to formulate operational strategies for microgrids.As an effective way to integrate multiple distributed energy sources and external grids,multi-energy microgrid management is becoming a very complex task.A microgrid real-time optimal operation strategy was proposed under the influence of comprehensive factors such as load demand,renewable energy sources and energy storage devices.Firstly,based on the reinforcement learning framework,the microgrid operation problem was modeled as a Markov decision process,and then a microgrid strategy optimization model was constructed with the aim of minimizing voltage fluctuations and operational losses in the microgrid.In order to effectively utilize the interconnection structure of the distribution network,a graph attention proximal policy optimization(GT-PPO)algorithm was designed on the basis of the proximal policy optimization algorithm.This algorithm uses an attention mechanism and a graph neural network to learn the correlation of distribution network nodes to formulate the optimal scheduling strategy for multi-energy distribution networks at different times under various environments.Simulation experiments were conducted using two specifications of the improved IEEE 33 node and IEEE 118 node distribution networks.The experimental results show that the optimization strategy can achieve real-time optimization of microgrids,and the results are better than the traditional proximal policy optimization(PPO)algorithm and double deep Q network(DDQN)algorithm.

作者李子凯杨波周忠堂张健徐明珠 LI Zikai;YANG Bo;ZHOU Zhongtang;ZHANG Jian;XU Mingzhu(State Grid Linyi Power Supply Company,Linyi 276001,China;State Grid Shandong EV Service Co.,Ltd.,Jinan 250000,China)

机构地区国网山东省电力公司临沂供电公司国网(山东)电动汽车服务有限公司

出处《山东电力技术》 2024年第6期27-35,共9页 Shandong Electric Power

基金国网山东省电力公司科技项目资助项目“电动两轮车换电业务建设运营关键技术研究”(520607220008)。

关键词微电网近端策略优化图自注意力网络策略优化 microgrid proximal policy optimization graph attention networks strategy optimization

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献13

1周磊,倪佳俊.智能化配电网运行方式的优化分析[J].集成电路应用,2022,39(6):272-273. 被引量：3
2刘一欣,郭力,王成山.微电网两阶段鲁棒优化经济调度方法[J].中国电机工程学报,2018,38(14):4013-4022. 被引量：186
3戴涛,孙伟军.采用模糊控制策略与主动阻尼控制技术的微电网能量管理技术[J].电测与仪表,2019,56(24):92-98. 被引量：7
4张沛,朱驻军,谢桦.基于深度强化学习近端策略优化的电网无功优化方法[J].电网技术,2023,47(2):562-570. 被引量：10
5赵鹏杰,吴俊勇,王燚,张和生.基于深度强化学习的微电网优化运行策略[J].电力自动化设备,2022,42(11):9-16. 被引量：9
6刘俊峰,陈剑龙,王晓生,曾君,黄倩颖.基于深度强化学习的微能源网能量管理与优化策略研究[J].电网技术,2020,44(10):3794-3803. 被引量：60
7熊正勇,苗虹,曾成碧.基于智能软开关与储能系统联合的有源配电网运行优化[J].电测与仪表,2020,57(13):33-39. 被引量：18
8李彦君,裴玮,肖浩,刘友波.基于深度学习的微网需求响应特性封装与配电网优化运行[J].电力系统自动化,2021,45(10):157-165. 被引量：18
9刘宇,张聪,李涛.强化学习A3C算法在电梯调度中的建模及应用[J].计算机工程与设计,2022,43(1):196-202. 被引量：8
10王振宇,许静,胡文博,齐蓓,万长瑛.不确定性环境下园区风光储互动运行的PPO强化学习策略[J].电力需求侧管理,2022,24(5):44-50. 被引量：1

二级参考文献140

1符杨,张智泉,李振坤,米阳.基于二阶段鲁棒博弈模型的微电网群及混合交直流配电系统协调能量管理策略研究[J].中国电机工程学报,2020,40(4):1226-1240. 被引量：34
2徐伟宣,何建秋,邹庆云.目标函数带绝对值号的特殊非线性规划问题[J].中国管理科学,1987(3):9-13. 被引量：19
3王康,孙宏斌,张伯明,吴文传,蒋维勇.基于二维组合属性决策树的暂态稳定评估[J].中国电机工程学报,2009,29(S1):17-24. 被引量：19
4孙振新,刘汉强,赵喆,丁鶄,郭桦,常程.储能经济性研究[J].中国电机工程学报,2013,33(S1):54-58. 被引量：49
5侯学勇,丁晓群.基于遗传–模拟退火算法的配电网电容器优化配置[J].电网技术,2005,29(4):81-84. 被引量：28
6余娟,颜伟,徐国禹,杜鹏,刘方.基于预测-校正原对偶内点法的无功优化新模型[J].中国电机工程学报,2005,25(11):146-151. 被引量：62
7尚金成,程满,周颉英,李佳宇,李予州.电力实时平衡调度交易市场运作机制及模型的研究[J].电力系统自动化,2006,30(17):28-35. 被引量：23
8刘科研,盛万兴,李运华.基于改进遗传模拟退火算法的无功优化[J].电网技术,2007,31(3):13-18. 被引量：59
9赵仁德,赵强,李芳,王平.LCL滤波的并网变换器中阻尼电阻影响分析[J].电力系统及其自动化学报,2009,21(6):112-116. 被引量：14
10叶圣永,王晓茹,刘志刚,钱清泉.基于受扰严重机组特征及机器学习方法的电力系统暂态稳定评估[J].中国电机工程学报,2011,31(1):46-51. 被引量：42

共引文献370

1符杨,张智泉,李振坤,米阳.基于二阶段鲁棒博弈模型的微电网群及混合交直流配电系统协调能量管理策略研究[J].中国电机工程学报,2020,40(4):1226-1240. 被引量：34
2吴俊宏,张印,李莎,王付金.基于LSTM算法的线路故障智能诊断方法研究[J].大电机技术,2023(S02):62-67. 被引量：2
3李珍珍,周红艳,周冬.基于多目标决策分析的智能微电网日前调度模型[J].电力学报,2020,35(1):46-52. 被引量：3
4陈浴清.湘潭市森林固土保肥效能经济评价的研究[J].湖南林业科技,2000,27(1):30-32. 被引量：2
5朱嘉远,刘洋,许立雄,蒋卓臻,马晨霄.考虑风电消纳的热电联供型微网日前鲁棒经济调度[J].电力系统自动化,2019,43(4):40-48. 被引量：68
6崔杨,李梓锋,刘洋,张超,付小标,仲悟之,邱丽君.基于可消纳域的高渗透风电并网调度容量研究[J].电网技术,2019,43(2):488-494. 被引量：6
7刘娇扬,郭力,杨书强,赵宗政,盛万兴.配电网中多光储微网系统的优化配置方法[J].电网技术,2018,42(9):2806-2813. 被引量：50
8李艳,胡志豪,随权,冯忠楠,林湘宁,李正天.考虑风光热不确定性和相变储能系统的城市建筑微网电–热联合调度[J].电网技术,2019,43(10):3687-3697. 被引量：15
9单福州,李晓露,宋燕敏,周海明,刘超群.基于改进两阶段鲁棒优化的区域综合能源系统经济调度[J].电测与仪表,2018,55(23):103-108. 被引量：20
10梁俊文,林舜江,刘明波,宋雨浓,范官盛,何森,蒋浩.主动配电网分布式鲁棒优化调度方法[J].电网技术,2019,43(4):1336-1344. 被引量：28

1刘健.工业园区分布式屋顶光伏发电运行研究[J].通信电源技术,2024,41(11):119-121.

山东电力技术

2024年第6期

浏览历史

内容加载中请稍等...

基于强化学习算法的微电网优化策略

参考文献13

二级参考文献140

共引文献370

相关作者

相关机构

相关主题

浏览历史