基于多主体博弈和强化学习的多微网系统协同优化研究被引量：10

Collaborative Optimization of Multi-microgrid System Based on Multi-agent Game and Reinforcement Learning

下载PDF

导出

摘要面向分属于不同投资和运营主体的多个冷热电联供型微网构成的多微网系统,该文提出了一种基于多主体博弈的多微网系统协同优化方法,通过博弈论建立多微网系统的协同优化模型,实现各个微网的利益均衡。针对该模型Nash均衡求解困难的问题,提出了一种改进的Nash-Q学习算法。该算法采用深度神经网络来拟合Nash-Q学习算法中的价值函数,不仅有效解决了Nash-Q学习算法直接应用于复杂环境时遇到的维数灾难问题,并且保证了算法的后效性,能快速完成合理有效的在线优化。实验结果表明,相较于传统数学规划方法和贪婪算法,改进的Nash-Q学习算法能够学习到Nash均衡策略,实现各微网间电能互补,降低各微网的运行成本,验证了所提模型和算法的有效性。 Aiming at the multi-microgrid system composed of multiple microgrids with combined cooling,heating and power,which belong to different investment and operating entities,this paper proposes a collaborative optimization for multi-microgrid systems based on the multi-agent game.By using the game theory,a collaborative optimization model for multi-microgrid system is established to achieve the balance of the interests of all the microgrids.For the difficulty of solving the Nash equilibrium of the model,an improved Nash-Q learning algorithm is proposed.In this algorithm the deep neural network is used to fit the value function in the Nash-Q learning algorithm.Then the dimension disaster problem is solved when Nash-Q learning algorithm is directly applied to complex environment,and also the aftereffect of the algorithm is ensured,which quickly completes the reasonable and effective online optimization.The experimental results show that compared with the traditional mathematical programming and the greedy algorithm,the improved Nash-Q learning algorithm learns well the Nash equilibrium strategy,realizes the power complementarity among microgrids,reduces the operation cost of microgrids,which verifies the effectiveness of the proposed model and the algorithm.

作者刘俊峰王晓生卢俊菠曾君 LIU Junfeng;WANG Xiaosheng;LU Junbo;ZENG Jun(School of Automation Science and Engineering,South China University of Technology,Guangzhou 510640,Guangdong Province,China;School of Electric Power,South China University of Technology,Guangzhou 510640,Guangdong Province,China)

机构地区华南理工大学自动化科学与工程学院华南理工大学电力学院

出处《电网技术》 EI CSCD 北大核心 2022年第7期2722-2732,共11页 Power System Technology

基金国家自然科学基金项目(62173148,51877085) 广州市科技计划科学研究专项(No.202002030373)。

关键词多微网系统协同优化博弈论强化学习 Nash-Q multi-microgrid system collaborative optimization game theory reinforcement learning Nash-Q

分类号 TM721 [电气工程—电力系统及自动化]

引文网络
相关文献

参考文献18

1刘迎澍,陈曦,李斌,朱介北.多微网系统关键技术综述[J].电网技术,2020,44(10):3804-3820. 被引量：64
2桑博,张涛,刘亚杰,陈燕东,刘陵顺,王锐.多微电网能量管理系统研究综述[J].中国电机工程学报,2020,40(10):3077-3092. 被引量：91
3孙秋野,滕菲,张化光.能源互联网及其关键控制问题[J].自动化学报,2017,43(2):176-194. 被引量：53
4徐青山,李淋,蔡霁霖,栾开宁,杨斌.考虑电能交互的冷热电多微网系统日前优化经济调度[J].电力系统自动化,2018,42(21):36-44. 被引量：69
5林顺富,刘持涛,李东东,符杨.考虑电能交互的冷热电区域多微网系统双层多场景协同优化配置[J].中国电机工程学报,2020,40(5):1409-1421. 被引量：70
6吴福保,刘晓峰,孙谊媊,陈宁,袁铁江,高丙团.基于冷热电联供的多园区博弈优化策略[J].电力系统自动化,2018,42(13):68-75. 被引量：41
7赵敏,沈沉,刘锋,黄秀琼.基于博弈论的多微电网系统交易模式研究[J].中国电机工程学报,2015,35(4):848-857. 被引量：89
8曾君,王侨侨,刘俊峰,林炜,郭华芳.一种基于势博弈的微电网分布式运行优化算法[J].中国电机工程学报,2017,37(24):7195-7204. 被引量：22
9陈刚,杨毅,杨晓梅,王中冠,吴文传.基于分布式牛顿法的微电网群分布式优化调度方法[J].电力系统自动化,2017,41(21):156-162. 被引量：47
10曾君,徐冬冬,刘俊峰,李晨迪.考虑负荷满意度的微电网运行多目标优化方法研究[J].中国电机工程学报,2016,36(12):3325-3333. 被引量：36

二级参考文献285

1Di Cao,Weihao Hu,Junbo Zhao,Guozhou Zhang,Bin Zhang,Zhou Liu,Zhe Chen,Frede Blaabjerg.Reinforcement Learning and Its Applications in Modern Power and Energy Systems: A Review[J].Journal of Modern Power Systems and Clean Energy,2020,8(6):1029-1042. 被引量：25
2方勇,李渝曾.电力市场中激励性可中断负荷合同的建模与实施研究[J].电网技术,2004,28(17):41-46. 被引量：54
3钟伟才,刘静,焦李成.多智能体遗传算法用于线性系统逼近[J].自动化学报,2004,30(6):933-938. 被引量：25
4国家发展改革委发布我国第一个《节能中长期专项规划》——国家发展改革委有关负责人答记者问[J].节能与环保,2004(11):1-2. 被引量：4
5张显,王锡凡.短期电价预测综述[J].电力系统自动化,2006,30(3):92-101. 被引量：73
6王丽芳,曾建潮.基于微粒群算法与模拟退火算法的协同进化方法[J].自动化学报,2006,32(4):630-635. 被引量：33
7杨若黎,吴沧浦.一种新的非线性规划神经网络模型[J].自动化学报,1996,22(3):293-300. 被引量：4
8卫忠,徐晓飞,战德臣,邓胜春.协同供应链多级库存控制的多目标优化模型及其求解方法[J].自动化学报,2007,33(2):181-187. 被引量：30
9陈金水,孙优贤.系统存在参数摄动时基于二次规划的一种故障诊断算法[J].自动化学报,1997,23(1):77-80. 被引量：1
10Lasseter R. Smart distribution: coupled microgrids [J]. Proceedings of the IEEE. 2011, 99(6): 1074-1082.

共引文献822

1刘鸣,王攀,毕伟,江玮.微电网状态监测与协调控制系统设计及实现[J].数字制造科学,2020(3):189-193. 被引量：1
2邹屹东,钱晶,李立胜,曹飞,梅宏,于凤荣.柴油发电机在微电网中的研究及应用综述[J].中国水运（下半月）,2021,21(11):50-52.
3王侨侨,曾君,刘俊峰,陈剑龙,王振刚.面向微电网源–储–荷互动的分布式多目标优化算法研究[J].中国电机工程学报,2020,40(5):1421-1432. 被引量：29
4林顺富,刘持涛,李东东,符杨.考虑电能交互的冷热电区域多微网系统双层多场景协同优化配置[J].中国电机工程学报,2020,40(5):1409-1421. 被引量：70
5黄南天,包佳瑞琦,蔡国伟,赵树野,刘德宝,王俊生,王盼盼.多主体联合投资微电网源–储多策略有限理性决策演化博弈容量规划[J].中国电机工程学报,2020,40(4):1212-1225. 被引量：33
6涂京,周明,李庚银,栾开宁.面向居民需求响应的售电公司势博弈分布式优化策略[J].中国电机工程学报,2020,40(2):400-411. 被引量：20
7黄雨佳,孙秋野,王睿,黄博南.面向综合能源系统的静态电压稳定性分析[J].中国电机工程学报,2019,39(S01):44-53. 被引量：15
8郭旭升,文汀,林湘宁,娄素华,丁苏阳*,周旋,李卓,李正天,苏舒,张宏志.面向多利益主体的清洁能源化大型离网海岛源储一体化优化定容[J].中国电机工程学报,2019,39(S01):1-14. 被引量：8
9王岩.纯电动汽车与传统汽车的安全性差异研究[J].商用汽车,2021(2):110-112.
10姚红革,王诚,喻钧,白小军,李蔚.复杂卫星图像中的小目标船舶识别[J].遥感学报,2020,24(2):116-125. 被引量：12

同被引文献131

1林顺富,刘持涛,李东东,符杨.考虑电能交互的冷热电区域多微网系统双层多场景协同优化配置[J].中国电机工程学报,2020,40(5):1409-1421. 被引量：70
2秦炎.欧洲碳市场推动电力减排的作用机制分析[J].全球能源互联网,2021,4(1):37-45. 被引量：24
3Wenxia LIU,Shuya NIU,Huiting XU.Optimal planning of battery energy storage considering reliability benefit and operation strategy in active distribution system[J].Journal of Modern Power Systems and Clean Energy,2017,5(2):177-186. 被引量：26
4余涛,周斌,陈家荣.基于Q学习的互联电网动态最优CPS控制[J].中国电机工程学报,2009,29(19):13-19. 被引量：35
5陈启鑫,康重庆,夏清,Daniel KIRSCHEN.低碳电力调度方式及其决策模型[J].电力系统自动化,2010,34(12):18-23. 被引量：118
6王怀智,余涛,唐捷.基于多智能体相关均衡算法的自动发电控制[J].中国电机工程学报,2014,34(4):620-627. 被引量：12
7刘洪,李吉峰,葛少云,张鹏,陈星屹.基于多主体博弈与强化学习的并网型综合能源微网协调调度[J].电力系统自动化,2019,43(1):40-48. 被引量：57
8杨胜春,刘建涛,姚建国,丁洪发,王珂,李亚平.多时间尺度协调的柔性负荷互动响应调度模型与策略[J].中国电机工程学报,2014,34(22):3664-3673. 被引量：101
9刘方,杨秀,时珊珊,张美霞,邓虹,郭鹏超.不同时间尺度下基于混合储能调度的微网能量优化[J].电网技术,2014,38(11):3079-3087. 被引量：49
10卢跃,周玲.计及风力发电和储能设备的经济调度模型[J].电子设计工程,2015,23(6):121-124. 被引量：3

引证文献10

1周寒英,和学豪,李响,高境,栾思平.考虑隐私保护的工业园区微网贝叶斯博弈优化调度方案[J].云南电业,2023(9):1-7.
2李彦营,席磊,郭宜果,王昱昊,孙梦梦,金澄心.基于权重双Q-时延更新学习算法的自动发电控制[J].中国电机工程学报,2022,42(15):5459-5470. 被引量：5
3林永君,孟耀兵,张聪聪,石晓虎,刘卫亮.基于模型预测控制的多微网系统2阶段优化调度[J].电力科学与工程,2023,39(4):28-40. 被引量：2
4侯慧,陈跃,吴细秀,侯婷婷,方仍存,唐金锐.非预测机制下计及碳交易的家庭能量低碳优化实时管理[J].电网技术,2023,47(3):1066-1077. 被引量：5
5周毅斌,肖浩,裴玮,王小君.基于纵向联邦学习的微电网群协同优化运行与策略进化[J].电力系统自动化,2023,47(11):121-132. 被引量：6
6陈晓芳,尹华杰,曾君,廖丁丁,刘俊峰.考虑多主体主动行为的综合能源系统智能运行优化方法[J].电网技术,2023,47(10):4219-4228.
7余运俊,龚海,龚汉城,陈敏,王忠阳,杨林锋.基于Q-learning的碳-电联合套利策略[J].实验室研究与探索,2023,42(8):93-98.
8陈宇,郑启瑞,邓啸宇,王梓桐,商毅,张蓉.基于“模块标准化、设计自动化”理念的新型电力电子教学实验平台设计[J].实验技术与管理,2023,40(11):175-182. 被引量：1
9董雷,杨子民,乔骥,陈盛,王新迎,蒲天骄.基于分层约束强化学习的综合能源多微网系统优化调度[J].电工技术学报,2024,39(5):1436-1453. 被引量：1
10孙文杰,武家辉,张强.考虑主动配电网下多区域综合能源系统间电能交互的优化调度策略[J].科学技术与工程,2024,24(11):4539-4551.

二级引证文献20

1吴晋波,宋兴荣,刘永刚,李勇,徐松,刘艳,陈豪.采用调控云数据的新能源与储能电站AGC控制方法研究与应用[J].电网与清洁能源,2023,39(2):128-134. 被引量：2
2席磊,刘治洪,李彦营.基于拉格朗日松弛强化学习算法的自动发电控制[J].中国电机工程学报,2023,43(4):1359-1368. 被引量：4
3席磊,金澄心,李彦营,李浩恺.基于信息松弛的多态能源协调控制方法研究[J].电力系统保护与控制,2023,51(9):1-12. 被引量：4
4刘泽润,刘超.可持续建成环境研究的机器学习应用进展与展望[J].风景园林,2023,30(7):51-59.
5王育飞,程伟,薛花,张宇华,米阳.基于串级PI-(1+PD)算法的含飞轮储能互联电网AGC控制器设计[J].电力系统保护与控制,2023,51(14):127-138.
6滕贤亮,谈超,昌力,张小白,曹荣章.高比例新能源电力系统有功功率与频率控制研究综述及展望[J].电力系统自动化,2023,47(15):12-35. 被引量：11
7王晓园.深度学习下电力调度数据自动备份系统设计及优化调度策略[J].电气技术与经济,2023(7):50-52.
8袁桂丽,钟飞,张睿,周彤.考虑碳捕集及需求响应的虚拟电厂热电联合优化调度[J].电网技术,2023,47(11):4458-4466. 被引量：4
9朱瑞金,吴军,崔世庭.一种基于双层纳什博弈的微电网双层电能交易策略[J].电力系统及其自动化学报,2023,35(12):100-109. 被引量：1
10郑杰,牛哲文,韩肖清,陈武晖,武宇翔.面向数据隐私保护的分布式多风电场短期功率预测[J].太原理工大学学报,2024,55(1):102-110.

1姚健,刘爱军.基于粒子群算法的区域综合能源优化调度方法[J].电力需求侧管理,2022,24(4):67-72. 被引量：6
2汪晓勤.中华优秀传统数学文化融入初中数学教学的若干路径[J].教育研究与评论（中学教育教学）,2022(6):34-39. 被引量：10
3郭兴华,李伟,刘芳武.三峡枢纽江海铁多式联运定价及策略研究[J].价格理论与实践,2021(11):151-154. 被引量：1
4杨钰琪,莫莉,周建中,效文静,徐占兴.负荷频繁波动情景下梯级水电站实时调度策略[J].电力自动化设备,2022,42(7):205-211. 被引量：3
5王允军,杨雪.“一站式”服务赋能“老字号”焕发新活力[J].市场监督管理,2022(13):12-13.
6刘晓丹.“双减”背景下运用项目式学习培养学生数学素养的探索[J].数理化解题研究,2022(20):47-49. 被引量：2
7王晓平,金铁龙,岳盈溢,韩宁,张龙.关于深圳市城镇燃气安全管理体系构建的相关建议[J].中国科技投资,2022(13):147-151.
8陈志培.基于生活化情境的小学数学教学[J].天津教育,2022(20):19-21. 被引量：1
9成建兵.高中数学问题驱动式教学方法应用研究[J].数理化解题研究,2022(21):20-22. 被引量：2
10宋俪婧,白同舟,贺玉龙,陈艳艳,刘雪杰,马腾腾.基于混合整数非线性规划的接驳公交优化模型[J].交通运输系统工程与信息,2022,22(3):104-111. 被引量：7

电网技术

2022年第7期

浏览历史

内容加载中请稍等...

基于多主体博弈和强化学习的多微网系统协同优化研究被引量：10

参考文献18

二级参考文献285

共引文献822

同被引文献131

引证文献10

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于多主体博弈和强化学习的多微网系统协同优化研究 被引量：10

参考文献18

二级参考文献285

共引文献822

同被引文献131

引证文献10

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于多主体博弈和强化学习的多微网系统协同优化研究被引量：10