基于分布式深度强化学习的微电网实时优化调度被引量：4

Real-time optimal scheduling for microgrid systems based on distributed deep reinforcement learning

下载PDF

导出

摘要随着海量新能源接入到微电网中,微电网系统模型的参数空间成倍增长,其能量优化调度的计算难度不断上升.同时,新能源电源出力的不确定性也给微电网的优化调度带来巨大挑战.针对上述问题,本文提出了一种基于分布式深度强化学习的微电网实时优化调度策略.首先,在分布式的架构下,将主电网和每个分布式电源看作独立智能体.其次,各智能体拥有一个本地学习模型,并根据本地数据分别建立状态和动作空间,设计一个包含发电成本、交易电价、电源使用寿命等多目标优化的奖励函数及其约束条件.最后,各智能体通过与环境交互来寻求本地最优策略,同时智能体之间相互学习价值网络参数,优化本地动作选择,最终实现最小化微电网系统运行成本的目标.仿真结果表明,与深度确定性策略梯度算法(DDPG)相比,本方法在保证系统稳定以及求解精度的前提下,训练速度提高了17.6%,成本函数值降低了67%,实现了微电网实时优化调度. With more and more renewable energy resources penetrating into the microgrid system, the parameter space of the microgrid system model is doubled, and thus the computational complexity of its real-time optimal scheduling keeps rising. At the same time, the uncertainty of renewable energy resources also brings great challenges to the optimal scheduling problem of microgrids. To tackle the above problems, this paper proposes a real-time optimal scheduling strategy for microgrid, which is based on distributed deep reinforcement learning approach. Firstly, under the distributed architecture, each distributed generator and main grid are treated as independent agents. Secondly, each agent has a local learning model, and it establishes its state and action space respectively based on local data. A multi-objective optimization reward function and constraint conditions are designed, which include power generation cost, transaction price, power supply life and so on. Finally, each agent seeks its optimal strategy by interacting with the environment, and meanwhile,agents learn value strategies from each other to optimize local action selection so as to minimize overall operation cost.The simulation results show that, compared to the deep deterministic strategy gradient algorithm, our method improves the training speed by 17.6% and reduces the cost function value by 67%, which meets the requirement of real-time optimal scheduling for microgrids, while ensuring the stability of the system and the accuracy of the solution.

作者郭方洪何通吴祥董辉刘冰 GUO Fang-hong;HE Tong;WU Xiang;DONG Hui;LIU Bing(College of Information Technology Zhejiang University of Technology,Hangzhou Zhejiang 310034,China)

机构地区浙江工业大学信息工程学院

出处《控制理论与应用》 EI CAS CSCD 北大核心 2022年第10期1881-1889,共9页 Control Theory & Applications

基金国家自然科学基金青年基金项目(61903333) 浙江省“钱江人才”特殊急需类项目(QJD1902010)资助。

关键词强化学习分布式优化微电网优化调度优化算法 reinforcement learning distributed optimization microgrid optimal scheduling optimization algorithm

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TM73 [电气工程—电力系统及自动化]

引文网络
相关文献

参考文献12

1苏健,梁英波,丁麟,张国生,刘合.碳中和目标下我国能源发展战略探讨[J].中国科学院院刊,2021,36(9):1001-1009. 被引量：118
2肖浩,裴玮,孔力.基于模型预测控制的微电网多时间尺度协调优化调度[J].电力系统自动化,2016,40(18):7-14. 被引量：137
3朱嘉远,刘洋,许立雄,蒋卓臻,马晨霄.考虑风电消纳的热电联供型微网日前鲁棒经济调度[J].电力系统自动化,2019,43(4):40-48. 被引量：71
4张忠,王建学,曹晓宇.基于负荷分类调度的孤岛型微网能量管理方法[J].电力系统自动化,2015,39(15):17-23 109. 被引量：50
5潘晓杰,张立伟,张文朝,徐友平,边宏宇,王新军.基于飞蛾扑火优化算法的多运行方式电力系统稳定器参数协调优化方法[J].电网技术,2020,44(8):3038-3046. 被引量：20
6赵书强,王扬,徐岩.基于风电预测误差随机性的火储联合相关机会规划调度[J].中国电机工程学报,2014,34(S1):9-16. 被引量：30
7严海波,康林贤,周冬.考虑随机性的微电网日前调度与储能优化模型[J].电网与清洁能源,2019,35(11):61-65. 被引量：28
8冯昌森,张瑜,文福拴,叶承晋,张有兵.基于深度期望Q网络算法的微电网能量管理策略[J].电力系统自动化,2022,46(3):14-22. 被引量：29
9王瀚琳,刘洋,许立雄,谭思维.基于主从博弈理论的社区微电网-配网能量交易模型研究[J].电测与仪表,2021,58(6):68-75. 被引量：11
10贾星蓓,窦春霞,岳东,徐式蕴.基于多代理系统的微电网多尺度能量管理[J].电工技术学报,2016,31(17):63-73. 被引量：33

二级参考文献192

1王利宁,彭天铎,向征艰,戴家权,黄伟隆.碳中和目标下中国能源转型路径分析[J].国际石油经济,2021,29(1):2-8. 被引量：77
2邓喜才,郭华华.两阶段主从博弈均衡解的存在性[J].经济数学,2009,26(4):50-53. 被引量：12
3艾欣,刘晓.基于可信性理论的含风电场电力系统动态经济调度[J].中国电机工程学报,2011,31(S1):12-18. 被引量：56
4朱方,汤涌,张东霞,张文朝.我国交流互联电网动态稳定性的研究及解决策略[J].电网技术,2004,28(15):1-5. 被引量：109
5邓集祥,涂进,陈武晖.大干扰下主导低频振荡模式的鉴别[J].电网技术,2007,31(7):36-41. 被引量：44
6Jonas Eickmann,Tim Drees,Jens D. Sprey,Albert Moser.Optimizing Storages for Transmission System Operation[J].Energy Procedia.2014
7Christian Bussar,Melchior Moos,Ricardo Alvarez,Philipp Wolf,Tjark Thien,Hengsi Chen,Zhuang Cai,Matthias Leuthold,Dirk Uwe Sauer,Albert Moser.Optimal Allocation and Capacity of Energy Storage Systems in a Future European Power System with 100% Renewable Energy Generation[J].Energy Procedia.2014
8H. Siahkali,M. Vakilian.Stochastic unit commitment of wind farms integrated in power system[J].Electric Power Systems Research.2010(9)
9Bouffard F,Galiana F. D.Stochastic Security for Operations Planning with Significant Wind Power Generation[].IEEE Power and Energy Society General Meeting-Conversion and Delivery of Electrical Energy in the st Century.2008
10Hodge B,Milligan M.Wind power forecasting errordistributions over multiple timescales[].IEEEPower and Energy Society General Meeting.2011

共引文献518

1林震宇,李飞,单福昌,何武略.核电厂典型励磁系统仿真研究[J].中国核电,2023,16(1):91-97.
2唐承财,查建平,章杰宽,陶玉国,王立国,王露,韩莹.高质量发展下中国旅游业“双碳”目标:评估预测、主要挑战与实现路径[J].中国生态旅游,2021,11(4):471-497. 被引量：56
3Jianqiang Liu,Xiaoguang Huang,Zuyi Li.Multi-time Scale Optimal Power Flow Strategy for Medium-voltage DC Power Grid Considering Different Operation Modes[J].Journal of Modern Power Systems and Clean Energy,2020,8(1):46-54. 被引量：2
4宋大伟.高端科技智库开展“双碳”战略研究思考[J].中国科学院院刊,2021,36(12):1482-1487. 被引量：5
5陈恒安,管霖,卢操,李中兴,卓映君.新能源发电为主电源的独立微网多目标优化调度模型和算法[J].电网技术,2020,44(2):664-674. 被引量：30
6张峰,杨志鹏,张利,徐震.计及多类型需求响应的孤岛型微能源网经济运行[J].电网技术,2020,44(2):547-557. 被引量：33
7廖鸿图,黄益宏,施亦治,陈健.含光储联合体的交直流配电网双层两阶段鲁棒优化运行策略[J].电力建设,2020,41(3):110-118. 被引量：7
8颜林.龙灯舞与龙图腾文化[J].民族,2000(1):35-36.
9朴香兰,李德洙,金基大,徐东弦.机械原理中机构模型教学用模拟软件开发[J].延边大学农学学报,2000,22(1):44-47. 被引量：1
10黄伟,刘斯亮,羿应棋,伍肇龙,张勇军.基于光伏并网点电压优化的配电网多时间尺度趋优控制[J].电力系统自动化,2019,43(3):92-100. 被引量：17

同被引文献49

1余晓明,曾君,郭红霞,柳澹.基于multi-Agent和Petri网的分布式风光互补系统[J].控制理论与应用,2008,25(2):353-356. 被引量：10
2胡文瑞.中国低渗透油气的现状与未来[J].中国工程科学,2009,11(8):29-37. 被引量：129
3吴军,徐昕,王健,贺汉根.面向多机器人系统的增强学习研究进展综述[J].控制与决策,2011,26(11):1601-1610. 被引量：22
4刘合,高甲善,王雪艳.关于抽油机井合理间抽制度的研究[J].石油钻采工艺,2000,22(1):69-72. 被引量：32
5孙凤兰,朱伟.Finite-time consensus for leader-following multi-agent systems over switching network topologies[J].Chinese Physics B,2013,22(11):152-158. 被引量：7
6谢俊,陈凯旋,岳东,李亚平,王珂,翁盛煊,黄崇鑫.基于多智能体系统一致性算法的电力系统分布式经济调度策略[J].电力自动化设备,2016,36(2):112-117. 被引量：53
7吴建中.欧洲综合能源系统发展的驱动与现状[J].电力系统自动化,2016,40(5):1-7. 被引量：205
8孙文,任涛,王三民.低渗透油藏新型丛式井抽油机研究与应用[J].科学技术与工程,2016,16(35):69-76. 被引量：1
9吴彬彬,马忠军,王毅.领导-跟随多智能体系统的部分分量一致性[J].物理学报,2017,66(6):1-7. 被引量：15
10洪微微.游梁式抽油机倒发电危害机理及治理方法研究[J].石油石化节能,2018,8(6):14-16. 被引量：5

引证文献4

1孙辉辉,胡春鹤,张军国.基于主动风险防御机制的多机器人强化学习协同对抗策略[J].控制与决策,2023,38(5):1420-1429.
2陈晓芳,尹华杰,曾君,廖丁丁,刘俊峰.考虑多主体主动行为的综合能源系统智能运行优化方法[J].电网技术,2023,47(10):4219-4228. 被引量：2
3高小永,李晨龙,檀朝东,黄付宇,米思怡,袁宇.无储能光-电微网下的抽油机井群间抽混合整数非线性优化方法[J].石油钻采工艺,2023,45(6):773-782.
4李浩宇,张春,吴零晨,童泽军.基于改进有限时间一致性的微电网经济优化调度[J].电力系统及其自动化学报,2024,36(7):38-48.

二级引证文献2

1张军飞.基于变频节能技术的煤矿机电设备运行优化方法[J].电工技术,2024(15):133-136.
2徐艳春,章世聪,张涛,王凌云,MI Lu.基于三重博弈的多微网-产消者群自适应鲁棒分布式协同优化[J].电网技术,2024,48(10):4143-4156.

1汪诚博,石亚伟,冉亮,郑祖卿,李华青.面向动态能源资源协调的分布式原始―对偶优化方法[J].控制理论与应用,2022,39(10):1978-1984.
2刘帅,朱善迎,徐金明,李修贤.“复杂CPS的分布式优化及其应用”专刊前言[J].控制理论与应用,2022,39(10):1779-1780.
3陈剑飞,李珂,蒋超,张承慧.计及配电网灵活性的多园区综合能源系统分布式优化调度[J].控制理论与应用,2022,39(10):1898-1906. 被引量：4
4刘奕彤,李正烁,樊淼.基于量测反馈的交直流混合微电网分布式指令追踪方法[J].电力系统自动化,2022,46(24):85-94.
5李辉,黄祖源,田园.基于ADMM的L1/2稀疏迭代分布式算法研究与应用[J].今日自动化,2022(12):134-136. 被引量：1
6程义,李更丰.基于双层模仿学习的多园区综合能源系统分布式协同优化调度[J].电力系统自动化,2022,46(24):16-25. 被引量：9
7戚银城,唐奕明.基于多智能体深度强化学习的智能电网光网络切片方案[J].半导体光电,2022,43(5):979-985. 被引量：2
8张淑兴,马驰,杨志学,王尧,吴昊,任洲洋.基于深度确定性策略梯度算法的风光储系统联合调度策略[J].中国电力,2023,56(2):68-76. 被引量：7
9王驰鑫,陈芳芳,齐琦,甘露.微网的多目标优化调度策略[J].计算机与数字工程,2022,50(11):2574-2580. 被引量：1
10广西壮族自治区电力工业志(1991—2002)(四十四)[J].广西电业,2022(12):63-74.

控制理论与应用

2022年第10期

浏览历史

内容加载中请稍等...

基于分布式深度强化学习的微电网实时优化调度被引量：4

参考文献12

二级参考文献192

共引文献518

同被引文献49

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于分布式深度强化学习的微电网实时优化调度 被引量：4

参考文献12

二级参考文献192

共引文献518

同被引文献49

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于分布式深度强化学习的微电网实时优化调度被引量：4