基于改进分层强化学习的CPS指令多目标动态优化分配算法被引量：8

Multi-objective Dynamic Optimal Dispatch Method for CPS Order of Interconnected Power Grids Using Improved Hierarchical Reinforcement Learning

下载PDF

导出

摘要应用经典强化学习方法的控制性能标准(control performance standard,CPS)下自动发电控制(automatic generation control,AGC)指令(CPS指令)由调度端至电网各台机组的分配过程不可避免出现维数灾难问题。提出应用分层强化学习的方法,将全网机组按调频时延做初次分类,CPS指令逐层分配形成任务分层结构。在分层Q学习算法层与层之间引入一个时变协调因子,改进的分层Q学习算法有效提高原算法收敛速度。奖励函数中设计不同的权值线性组合,展示保守及乐观控制下系统CPS控制水平和调节成本的变化关系。南方电网统计性仿真分析表明,改进分层Q学习算法较分层Q学习算法平均收敛时间缩短47%,在复杂随机扰动的环境中改进算法能有效提高系统CPS考核合格率,并降低调节成本约5%。 This paper presented an improved hierarchical reinforcement learning （HRL） algorithm to solve the curse of dimensionality problem in the multi-objective dynamic optimization of automatic generation control （AGC） order dispatch based on control performance standard （CPS）, The CPS order dispatch task was decomposed into several subtasks by classifying the AGC committed units according to their response time delay of power regulatng. A time-va~＇ing coordination factor was introduced between layers of HRL to speed up the algorithm. Numbers of linear combination of weights in reward function were designed to optimize hydro capacity margin and AGC production cost. The application of improved hierarchical Q-learning in the China southern power grid model shows that the proposed method can speed up the algorithm by 47%, enhance the performance of AGC systems in CPS assessment, and save AGC production cost over 5%, compared with the hierarchical Q-learning and genetic algorithm.

作者余涛王宇名叶文加刘前进

机构地区华南理工大学电力学院广东电网公司中山供电局

出处《中国电机工程学报》 EI CSCD 北大核心 2011年第19期90-96,共7页 Proceedings of the CSEE

基金国家自然科学基金项目(50807016) 广东省自然科学基金项目(9151064101000049) 中央高校基本科研业务费专项资金(2009ZM0251)~~

关键词分层强化学习协调因子随机优化控制性能标准自动发电控制 hierarchical reinforcement learning （HRL） coordination factor stochastic optimization control performance standard （CPS） automatic generation control （AGC）

分类号 TM71 [电气工程—电力系统及自动化]

引文网络
相关文献

参考文献10

1余涛,周斌,陈家荣.基于Q学习的互联电网动态最优CPS控制[J].中国电机工程学报,2009,29(19):13-19. 被引量：35
2李滨,韦化,农蔚涛,李林峰,吴阿琴,阳育德.基于现代内点理论的互联电网控制性能评价标准下的AGC控制策略[J].中国电机工程学报,2008,28(25):56-61. 被引量：41
3高宗和,滕贤亮,涂力群.互联电网AGC分层控制与CPS控制策略[J].电力系统自动化,2004,28(1):78-81. 被引量：87
4余涛,陈亮,蔡广林.基于CPS统计信息自学习机理的AGC自适应控制[J].中国电机工程学报,2008,28(10):82-87. 被引量：28
5庞士焕,朱相冰,张琦,汤萍萍.基于MAXQ方法的分层强化学习[J].计算机技术与发展,2009,19(4):154-156. 被引量：1
6唐跃中,张王俊,张健,陈明.基于CPS的AGC控制策略研究[J].电网技术,2004,28(21):75-79. 被引量：61
7高宗和,滕贤亮,张小白.互联电网CPS标准下的自动发电控制策略[J].电力系统自动化,2005,29(19):40-44. 被引量：74
8高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004,30(1):86-100. 被引量：268
9刘斌,王克英,余涛,刘奇.PSO算法在互联电网CPS功率调节中的应用研究[J].电力系统保护与控制,2009,37(6):36-39. 被引量：17
10余涛,王宇名,刘前进.互联电网CPS调节指令动态最优分配Q–学习算法[J].中国电机工程学报,2010,30(7):62-69. 被引量：25

二级参考文献90

1成海彦,黄定成,郑广辉,杨立波.TBC方式下河北南部电网的AGC控制策略分析[J].电网技术,2005,29(18):53-55. 被引量：7
2张小白,高宗和,钱玉妹,徐田.用AGC实现稳定断面越限的预防和校正控制[J].电网技术,2005,29(19):85-89. 被引量：42
3钱玉妹,刘华伟,刘金官.频差系数对省际联络线电力电量考核影响分析[J].江苏电机工程,2004,23(5):18-20. 被引量：2
4赵波,曹一家.电力系统机组组合问题的改进粒子群优化算法[J].电网技术,2004,28(21):6-10. 被引量：60
5唐跃中,张王俊,张健,陈明.基于CPS的AGC控制策略研究[J].电网技术,2004,28(21):75-79. 被引量：61
6张健,唐跃中,章渊.OPEN2000AGC系统在上海电网的应用[J].电力系统自动化,2004,28(19):96-99. 被引量：2
7袁晓辉,王乘,张勇传,袁艳斌.粒子群优化算法在电力系统中的应用[J].电网技术,2004,28(19):14-19. 被引量：220
8汪德星,杨立兵.自动发电控制(AGC)技术在华东电力系统中的应用[J].华东电力,2005,33(1):23-27. 被引量：16
9杨毅刚,彭建春,周意诚,任国梁.水火电力系统有功无功经济调度的研究[J].中国电机工程学报,1994,14(4):19-25. 被引量：6
10高宗和,滕贤亮,张小白.互联电网CPS标准下的自动发电控制策略[J].电力系统自动化,2005,29(19):40-44. 被引量：74

共引文献480

1项宇,秦进,袁琳琳.结合向前状态预测和隐空间约束的强化学习表示算法[J].计算机系统应用,2022,31(11):148-156. 被引量：4
2Shuang Wu,Wei Hu,Zongxiang Lu,Yujia Gu,Bei Tian,Hongqiang Li.Power System Flow Adjustment and Sample Generation Based on Deep Reinforcement Learning[J].Journal of Modern Power Systems and Clean Energy,2020,8(6):1115-1127. 被引量：11
3安萌萌,樊秀梅,蔡含宇.基于雾计算和强化学习的交通灯智能协同控制研究[J].计算机应用研究,2020,37(2):465-469. 被引量：8
4席磊,余璐,张弦,胡伟.基于深度强化学习的泛在电力物联网综合能源系统的自动发电控制[J].中国科学：技术科学,2020,50(2):221-234. 被引量：19
5丁志梁,潘毅群(指导),谢建彤,王尉同,黄治钟.强化学习算法在空调系统运行优化中的应用研究[J].建筑节能,2020(7):14-20. 被引量：7
6王彦朋,郭佳佳,王晓君.基于Q-Learning的青霉素发酵过程控制方法[J].信息化研究,2023,49(3):31-35.
7马庆刘,喻鹏,吴佳慧,熊翱,颜拥.基于深度强化学习的综合能源业务通道优化机制[J].北京邮电大学学报,2020,43(2):87-93. 被引量：1
8赵元,张合新.基于目标状态距离简化Q-learning算法的迷宫路径规划[J].火箭军工程大学学报,2019(4):79-84.
9欧阳朝辉,段彩丽,刘云.提高发电厂AGC系统运行可靠性的管理措施和技术措施[J].电网技术,2005,29(18):35-38. 被引量：3
10周劼英,张伯明,郭玉金,何群,姚诸香.火电AGC机组超前控制策略[J].电网技术,2005,29(21):61-64. 被引量：25

同被引文献91

1唐跃中,张王俊,张健,陈明.基于CPS的AGC控制策略研究[J].电网技术,2004,28(21):75-79. 被引量：61
2段献忠,何飞跃.考虑通信延迟的网络化AGC鲁棒控制器设计[J].中国电机工程学报,2006,26(22):35-40. 被引量：21
3孔莲芳,罗天祥,吴捷.基于状态收缩约束的模型预测负荷频率控制[J].中国电机工程学报,2007,27(7):18-22. 被引量：14
4胡国强,贺仁睦.基于交互式多目标决策方法的水火电力系统日有功负荷优化分配[J].电网技术,2007,31(18):37-42. 被引量：12
5Yao M, Shoults R R, Kelm R. AGC logic based on NERC's new control performance standard and disturbance control standard[J]. IEEE Trans. on Power Systems, 2000, 15(2): 855-857.
6Zeynelgil H L, Demiroren A, Sengor N S. The application of ANN technique to automatic generation control for multi-area power system[J]. Electrical Power and Energy Systems, 2002, 24(5): 345-354.
7Luis O, Jose Ignacio de la F, Juan L Z, et al. New design for the Spanish AGC scheme using an adaptive gain controller[J]. IEEE Trans. on Power Systems, 2004, 19(3): 1528-1537.
8Hassan B, Fatemeh D, Takashi H. A new intelligent agent-based AGC design with real-time application ~lJ [J]. IEEE Trans. on Systems, Man, and Cybernetics-Part C: ~/pplication and Reviews, 2012, 42(6): 994-1002.
9Bevrani H Robust power system frequency control[M]. 1st ed. New York: Springer-Verlag, 2009: 19-24.
10Imthias T P, Nagendra P S, Sastry P S. A reinforcement learning approach to automatic generation control [J]. Electric Power Systems Research, 2002, 63(1): 9-26.

引证文献8

1王磊.图书订货会迈入成熟期[J].中国出版,2000(2):25-26.
2王怀智,余涛,唐捷.基于多智能体相关均衡算法的自动发电控制[J].中国电机工程学报,2014,34(4):620-627. 被引量：12
3张孝顺,余涛.互联电网自动发电控制功率分配的改进逼近于理想解的排序-Q多目标优化算法[J].控制理论与应用,2015,32(4):497-503. 被引量：2
4张孝顺,余涛,唐捷.基于CEQ(λ)多智能体协同学习的互联电网性能标准控制指令动态分配优化算法[J].电工技术学报,2016,31(8):125-133. 被引量：10
5左剑,王子琪,李银红,段献忠.计及时滞的互联电网负荷频率控制最优分数阶PID控制器设计[J].控制理论与应用,2017,34(9):1151-1160. 被引量：20
6席磊,李玉丹,黄悦华,杨苹,许志荣.基于虚拟狼群控制策略的智能发电控制[J].中国电机工程学报,2018,38(10):2966-2979. 被引量：12
7刘新展,朱文红,陈佳鹏,郑全朝,王成佐.信息物理系统下区域发电Q学习控制方法[J].沈阳工业大学学报,2021,43(2):138-143. 被引量：2
8范文帝,王俊芳,党甜,杜龙海,陈丛.基于强化学习的无人机网络资源分配研究[J].计算机测量与控制,2024,32(1):297-303.

二级引证文献56

1王磊.图书订货会迈入成熟期[J].中国出版,2000(2):25-26.
2付鹏,王宁玲,李晓恩,徐汉,张雨檬,杨勇平.基于信息物理融合的火电机组节能环保负荷优化分配[J].中国电机工程学报,2015,35(14):3685-3692. 被引量：17
3赵万宗,李滨,韦化,韦昌福,邓俊.互联电网CPS标准下计及一次调频的最优AGC控制模型[J].中国电机工程学报,2016,36(10):2656-2664. 被引量：16
4李永刚,刘艳,王鑫明,翟万生.基于MAS的电网新设备启动方案智能编制系统的设计与实现[J].电力系统保护与控制,2016,44(12):119-124. 被引量：13
5李柏青,刘道伟,秦晓辉,严剑峰.信息驱动的大电网全景安全防御概念及理论框架[J].中国电机工程学报,2016,36(21):5796-5805. 被引量：41
6文芸,周彬,杜振川,张孝顺,余涛.计及大规模电动汽车接入的AGC功率动态分配深度交互教学优化算法[J].电力建设,2017,38(7):106-113. 被引量：2
7陈艺璇,张孝顺,余涛.基于纳什均衡迁移学习的碳–能复合流自律优化[J].控制理论与应用,2018,35(5):668-681. 被引量：5
8钟永洁,翟苏巍,孙永辉.孤岛模式下互联微电网的自适应同步频率控制[J].电力建设,2019,40(10):94-103. 被引量：7
9刘志坚,陈潇雅.基于AGC的高压互联网络频率协调控制[J].电子测量技术,2019,42(5):11-17. 被引量：5
10郑宇,程乐峰,孟科,余涛,张睿,李正佳.能源互联网分布式设备协调控制软件系统平台方案设计[J].新型工业化,2016,6(11):15-34. 被引量：6

1郑文彬,李林峰.CPS标准下广西电网AGC的应用分析[J].广西电力,2008,31(6):65-67. 被引量：3
2郭晓斌,李鹏,许爱东,雷金勇,喻磊,杨苹,周少雄.基于预测控制的并联式多微网协调控制策略[J].南方电网技术,2015,9(4):22-28. 被引量：11
3赵万宗,李滨,韦化,韦昌福,邓俊.互联电网CPS标准下计及一次调频的最优AGC控制模型[J].中国电机工程学报,2016,36(10):2656-2664. 被引量：16
4张孝顺,余涛,唐捷.基于分层相关均衡强化学习的CPS指令优化分配算法[J].电力系统自动化,2015,39(8):80-86. 被引量：11
5余涛,陈亮,蔡广林.基于CPS统计信息自学习机理的AGC自适应控制[J].中国电机工程学报,2008,28(10):82-87. 被引量：28
6余涛,周斌.基于强化学习的互联电网CPS自校正控制[J].电力系统保护与控制,2009,37(10):33-38. 被引量：18
7余涛,周斌,陈家荣.基于Q学习的互联电网动态最优CPS控制[J].中国电机工程学报,2009,29(19):13-19. 被引量：35
8张焱,王艳,王磊.基于原对偶解耦内点法的节能减排多目标动态优化调度研究[J].江苏电机工程,2011,30(2):11-15. 被引量：1
9高军彦,麻秀范.计及分布式发电的配电网规划新模式[J].现代电力,2009,26(1):83-87. 被引量：7
10姚鹏,肖辉耀,院晓涛,张凯,包伟.一种考虑厂网协调规划的输电阻塞治理模式[J].广东电力,2008,21(4):1-4.

中国电机工程学报

2011年第19期

浏览历史

内容加载中请稍等...

基于改进分层强化学习的CPS指令多目标动态优化分配算法被引量：8

参考文献10

二级参考文献90

共引文献480

同被引文献91

引证文献8

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

基于改进分层强化学习的CPS指令多目标动态优化分配算法 被引量：8

参考文献10

二级参考文献90

共引文献480

同被引文献91

引证文献8

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

基于改进分层强化学习的CPS指令多目标动态优化分配算法被引量：8