基于深度强化学习的暂态稳定紧急控制决策方法被引量：4

Decision-making Method for Transient Stability Emergency Control Based on Deep Reinforcement Learning

下载PDF

导出

摘要随着广域测量系统在暂态稳定控制中的应用,广域信息的随机性时滞造成了系统受控时状态的不确定性,并且切机和切负荷控制的离散决策变量维度极高,电网在线紧急控制决策面临着挑战。为此,将暂态稳定紧急控制问题建模为马尔可夫决策问题,提出一种深度Q网络(DQN)强化学习与暂态能量函数相结合的紧急控制决策方法,多步序贯决策过程中可应对紧急控制的时滞不确定性影响。奖励函数以考虑控制目标和约束条件的短期奖励函数和考虑稳定性的长期奖励函数构成,并在奖励函数中引入暂态能量函数的势能指数来提高学习效率。以最大化累计奖励为目标,通过DQN算法在离散化动作空间中学习得到最优紧急控制策略,解决暂态稳定紧急控制问题。所提方法通过IEEE 39节点系统验证了模型在紧急控制决策中的有效性。 With the application of wide-area measurement systems in the transient stability control,the random time delay of widearea information during the control process may cause the uncertainty of power system state during control.Moreover,the dimension of discrete decision variables for machine tripping and load shedding is extremely high,and the online emergency control decision-making of the power grid is facing challenge.Therefore,the transient stability emergency control problem is modeled as a Markov decision problem,and an decision-making method combining the deep Q-learning network(DQN)reinforcement learning and transient energy function is proposed,which can deal with the time-delay uncertainty of emergency control through the multistep sequential decision-making process.The reward function is composed of a short-term reward function considering the control objectives and constraints,and a long-term reward function considering the stability.The potential energy index of the transient energy function is introduced into the reward function to improve the learning efficiency.With the objective of maximizing the cumulative rewards,the optimal emergency control strategy is learned in the discrete action space by DQN algorithm to solve the transient stability emergency control problem.The effectiveness of the proposed method in the emergency control decision-making is verified by an IEEE 39-bus system.

作者李宏浩张沛刘曌 LI Honghao;ZHANG Pei;LIU Zhao(School of Electrical Engineering,Beijing Jiaotong University,Beijing 100044,China)

机构地区北京交通大学电气工程学院

出处《电力系统自动化》 EI CSCD 北大核心 2023年第5期144-152,共9页 Automation of Electric Power Systems

基金中央高校基本科研业务费专项资金资助项目(2021JBM027) 国家自然科学基金青年基金资助项目(52107068)。

关键词深度强化学习暂态稳定紧急控制决策暂态能量函数深度Q网络(DQN)算法时滞 deep reinforcement learning transient stability emergency control decision-making transient energy function deep Qlearning network(DQN)algorithm time delay

分类号 TM712 [电气工程—电力系统及自动化] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献20

1高昆仑,杨帅,刘思言,李向伟.基于一维卷积神经网络的电力系统暂态稳定评估[J].电力系统自动化,2019,43(12):18-26. 被引量：84
2刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：461
3严梓铭,徐岩.结合深度强化学习与领域知识的电力系统拓扑结构优化[J].电力系统自动化,2022,46(1):60-68. 被引量：11
4程乐峰,余涛,张孝顺,殷林飞.机器学习在能源与电力系统领域的应用和展望[J].电力系统自动化,2019,43(1):15-31. 被引量：118
5强子玥,吴俊勇,李宝琴,张若愚,覃柳芸,郝亮亮.基于改进AlexNet的电力系统暂态功角失稳紧急控制策略[J].高电压技术,2022,48(7):2794-2804. 被引量：11
6王彤,刘九良,朱劭璇,王增平,秦红霞,张岩,张璇.基于随机森林的电力系统暂态稳定评估与紧急控制策略[J].电网技术,2020,44(12):4694-4701. 被引量：42
7刘威,张东霞,王新迎,侯金秀,刘丽平.基于深度强化学习的电网紧急控制策略研究[J].中国电机工程学报,2018,38(1):109-119. 被引量：102
8郑超,苗田,马世英.基于关键支路受扰轨迹凹凸性的暂态稳定判别及紧急控制[J].中国电机工程学报,2016,36(10):2600-2610. 被引量：18
9顾卓远,汤涌,张健,易俊,訾鹏,张妍.基于相对动能的电力系统暂态稳定实时紧急控制方案[J].中国电机工程学报,2014,34(7):1095-1102. 被引量：42
10徐泰山,许剑冰,鲍颜红,方勇杰,李碧君,薛禹胜,鄢安河,孙含笑.互联电网预防控制和紧急控制在线预决策系统[J].电力系统自动化,2006,30(7):1-4. 被引量：51

二级参考文献314

1陈国平,梁志峰,董昱.基于能源转型的中国特色电力市场建设的分析与思考[J].中国电机工程学报,2020,40(2):369-379. 被引量：121
2黄光磊,李喆,许永鹏,钱勇,盛戈皞,江秀臣.基于改进深度信念网络的直流XLPE电缆局部放电模式识别[J].高电压技术,2020,46(1):327-334. 被引量：11
3YU Yixin LIU Hui ZENG Yuan.A novel optimization method of transient stability emergency control based on practical dynamic security region (PDSR) of power systems[J].Science China(Technological Sciences),2004,47(3):376-384. 被引量：7
4王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：331
5白雪峰,倪以信.电力系统动态安全分析综述[J].电网技术,2004,28(16):14-20. 被引量：43
6何大愚.一年以后对美加“8.14”大停电事故的反思[J].电网技术,2004,28(21):1-5. 被引量：181
7赵红嘎,薛禹胜,高翔,潘勇伟,岑宗浩,李碧君.量测量的时延差对状态估计的影响及其对策[J].电力系统自动化,2004,28(21):12-16. 被引量：35
8穆钢,王仲鸿,韩英铎,黄眉.暂态稳定性的定量分析—轨迹分析法[J].中国电机工程学报,1993,13(3):23-30. 被引量：31
9蔡泽祥,倪以信.考虑暂态稳定紧急控制的扩展等面积法[J].中国电机工程学报,1993,13(6):20-26. 被引量：12
10高鹏,王建全,周文平,邹宇.关于振荡中心的研究[J].电力系统及其自动化学报,2005,17(2):48-53. 被引量：44

共引文献2255

1傅汇乔,唐开强,邓归洲,王鑫鹏,陈春林.基于深度强化学习的六足机器人运动规划[J].智能科学与技术学报,2020(4):361-371. 被引量：3
2刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：42
3戴剑勇,王雯雯.基于TOPSIS的复杂电网节点重要性评估[J].南华大学学报（自然科学版）,2022,36(4):94-100. 被引量：4
4王鹏,王文涛,辛力.新型电力系统内涵特征及发展方向[J].中国基础科学,2023,25(3):23-28.
5韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
6杨松浩,孟倩戎,张宇博,郝治国,贺敬.基于功频特性多项式拟合的电力系统暂态频率最低点在线预测模型[J].中国电机工程学报,2022,42(S01):115-125. 被引量：2
7程乐峰,杨汝,刘贵云,王建晖,陈洋,王晓刚,张杰,余涛.多群体非对称演化博弈动力学及其在智能电网电力需求侧响应中的应用[J].中国电机工程学报,2020,40(S01):20-36. 被引量：24
8曾博,胡强,刘裕,刘文霞.考虑需求响应复杂不确定性的电–气互联系统动态概率能流计算[J].中国电机工程学报,2020,40(4):1161-1171. 被引量：27
9宋斯珩,赵书强.电力电子换流器的惯性与稳定性分析[J].中国电机工程学报,2020,40(4):1055-1062. 被引量：3
10杨承,刘换新,王平,范坤乐,黄志峰,马晓茜.燃气–蒸汽联合循环抽凝式热电联供机组调峰经济性分析[J].中国电机工程学报,2020,40(2):592-601. 被引量：22

同被引文献99

1薛禹胜.暂态能量校正和临界群识别——三论暂态能量函数直接法[J].电力系统自动化,1993,17(1):22-31. 被引量：14
2张保会.加强继电保护与紧急控制系统的研究提高互联电网安全防御能力[J].中国电机工程学报,2004,24(7):1-6. 被引量：227
3韦化,阳育德,李啸骢.多预想故障暂态稳定约束最优潮流[J].中国电机工程学报,2004,24(10):91-96. 被引量：34
4孙玉军,邵俊松,方勇杰,薛禹胜.稳定控制装置的标准化策略搜索技术[J].电力系统自动化,2006,30(22):53-56. 被引量：7
5张剑云,孙元章.基于脆弱割集选择紧急控制地点的灵敏度分析方法[J].电网技术,2007,31(11):21-26. 被引量：13
6薛禹胜,刘强,Zhaoyang DONG,Gerard LEDWICH,袁越.关于暂态稳定不确定性分析的评述[J].电力系统自动化,2007,31(14):1-6. 被引量：77
7薛禹胜,王昊昊,董朝阳,Gerard LEDWICH,文福拴.电力市场环境下互联电网恢复控制的评述[J].电力系统自动化,2007,31(21):110-115. 被引量：27
8刘强,石立宝,周明,李庚银,倪以信.现代电力系统恢复控制研究综述[J].电力自动化设备,2007,27(11):104-110. 被引量：14
9韩忠晖,顾雪平,刘艳.考虑机组启动时限的大停电后初期恢复路径优化[J].中国电机工程学报,2009,29(4):21-26. 被引量：48
10刘强,石立宝,倪以信,董朝阳.电力系统恢复控制的网络重构智能优化策略[J].中国电机工程学报,2009,29(13):8-15. 被引量：43

引证文献4

1张建新,常东旭,邱建,杨欢欢,朱益华,朱泽翔.适应新型电力系统的安全稳定控制系统及装置设计方法[J].电网与清洁能源,2023,39(12):10-19. 被引量：3
2江昌旭,刘晨曦,林铮,林俊杰.基于深度强化学习的电力系统暂态稳定控制策略研究综述[J].高电压技术,2023,49(12):5171-5186. 被引量：4
3吕亚洲,李威,刘福锁,薛峰,李兆伟.基于多状态量特征的电网安全稳定紧急控制策略制定方法[J].电力系统自动化,2024,48(3):103-112.
4邱建,朱煜昆,张建新,朱益华,徐光虎,涂亮.基于安全强化学习的电网稳控策略智能生成方法[J].电力系统保护与控制,2024,52(10):147-155.

二级引证文献7

1李生虎,齐楠,夏伟健.计及风电PSS与PLL耦合对功角振荡影响的DFIG控制参数协调优化[J].高电压技术,2024,50(4):1571-1582.
2王思群,王启.基于智能感知技术的配电网故障定位与智能恢复方法研究[J].通信电源技术,2024,41(7):234-236.
3郑庆明,井延伟,梁涛,柴露露,吕梁年.基于DDPG算法的离网型可再生能源大规模制氢系统优化调度[J].综合智慧能源,2024,46(6):35-43.
4刘颂凯,党喜,陈萍,周倩,杨超,王秋杰,张雅婷.结合噪声滤波的电力系统暂态稳定预测[J].智慧电力,2024,52(7):32-39.
5李西艳.基于数字化的电力设计流程再造与实践研究[J].中国新技术新产品,2024(13):134-136.
6吴怡儒,习秀丽,李玉良.新型电力系统背景下送端电网暂态稳定计算[J].云南电业,2024(8):1-5.
7李建林,卢冠铭,游洪灏,郭雅娟,辛迪熙,袁晓冬.基于改进LADRC的构网型储能调频控制策略研究[J].电力系统保护与控制,2024,52(15):142-154.

1许高阳,刘一民,颜云松,夏海峰.电力系统暂态稳定评估与紧急控制灵活组态策略研究[J].微型电脑应用,2023,39(3):36-39. 被引量：1
2郑超,孙华东,李绪广.基于广域支路响应的低频振荡威胁动态评估及紧急控制[J].电网技术,2023,47(3):941-949. 被引量：1
3曾辉,苏安龙,葛延峰,陈晓东,李正文,王顺江,赵鹏,李卫东.考虑负荷特性的区域电网在线转动惯量快速估计算法[J].电网技术,2023,47(2):423-434. 被引量：9
4贾涛.电力线损管理与在线监测技术[J].中文科技期刊数据库（全文版）工程技术,2020(11):81-82.
5刘瀛寰,周春贵.考虑时滞不确定性的闭环供应链多目标风险识别系统设计[J].现代电子技术,2023,46(9):168-172.
6樊陈,姚建国,常乃超,吴艳平,杨青,张海东.电力系统宽频测量装置技术规范解读及应用展望[J].电力系统自动化,2023,47(5):190-199. 被引量：2
7姚明,李建军,彭靖尧.实时工况下线控制动自动紧急控制策略研究[J].电子设计工程,2023,31(9):78-83.
8周文俊,曹毅,李杰,金涛,陈文剑,周霞.考虑风电场调控裕度的风火打捆直流外送系统无功电压紧急控制策略[J].中国电力,2023,56(4):77-87. 被引量：3
9娄兆伟,袁文轩.x^(a)sin x^(b)型函数在构造反例中的应用[J].大学数学,2023,39(2):106-112. 被引量：1
10邓祥力,吴高珍,魏聪聪,肖飞,刘世明,王传启.基于多源数据融合的Alexnet神经网络大电网故障诊断[J].现代电力,2023,40(2):161-169. 被引量：5

电力系统自动化

2023年第5期

浏览历史

内容加载中请稍等...

基于深度强化学习的暂态稳定紧急控制决策方法被引量：4

参考文献20

二级参考文献314

共引文献2255

同被引文献99

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的暂态稳定紧急控制决策方法 被引量：4

参考文献20

二级参考文献314

共引文献2255

同被引文献99

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的暂态稳定紧急控制决策方法被引量：4