求解多目标协调二级电压控制的简化强化学习方法被引量：6

Reduced Reinforcement Learning Method Applied to Multi-objective Coordinated Secondary Voltage Control

下载PDF

导出

摘要以最小化分区内主导节点电压偏差和发电机无功出力比例的方差为目标,建立多目标协调二级电压控制模型,可协调变电站容抗器与发电机自动电压调节器的动作。针对其控制特点和在线优化的要求,提出一种简化强化学习求解方法。为了加快奖励值的传播速度,该方法定义了新的状态函数,并在主循环之前利用全局搜索来实现初始值定位和状态空间的自主压缩,从而极大地提高搜索效率;在主循环的搜索过程中采用基于状态敏感度的自适应学习阶段划分准则,实现学习经验搜索与利用的平衡;将单次动作的变量选择范围扩大到所有控制变量,使得在有限循环次数下的搜索尽可能覆盖到整个状态空间。为了反映系统的当前偏好信息,引入实时权重系数的概念,并在求得帕累托前沿后根据实时权重选出最优控制。算例分析分别从帕累托前沿质量、优化时间、收敛率以及实时权重的控制效果四个方面验证了简化强化学习方法和实时权重系数的优越性。 With the objective of minimizing the voltage deviation of the dominant node and the variance of generator reactive power output proportions in partition, this paper establish the multi-objective coordinated secondary voltage control （MOCSVC） model, which can coordinate the action of capacitors/reactors in substations and automatic voltage regulator （AVR）. According to the control features of MOCSVC as well as the requirements of online optimization, this paper presents a new method for solving MOCSVC, called state sensitivity based reduced reinforcement learning （SSRRL）. In order to accelerate the propagation speed of the award value, SSRRL proposes a new definition of the state function, and achieves the initial point positioning and autonomous compression of the state space through global search before the main loop, greatly improving the search efficiency. Moreover, SSRRL use the adaptive criteria of learning phase division based on state sensitivity during the main loop search, balancing the search and the use of the learning experience, and take the action selection mechanism which extend the variable selection range of single action to all control variables, making the search in a limited cycle number to cover the entire state space as much as possible. Besides, in order to reflect the current preference information of system, this paper introduce the concept of real-time weight coefficient, and select the optimal control from the Pareto frontier （PF） according to it. The example analysis validates the superiority of the SSRRL and the real-time weighting coefficient from four aspects including quality of PF, optimization time, convergence rate and control effect.

作者李婷刘明波

机构地区华南理工大学电力学院

出处《中国电机工程学报》 EI CSCD 北大核心 2013年第31期130-139,16,共10页 Proceedings of the CSEE

基金国家自然科学基金项目(51277078) 广东省绿色能源技术重点实验室资助项目(2008A060301002) 广东省教育部产学研结合项目(2010A090200065)~~

关键词多目标协调二级电压控制强化学习实时权重帕累托前沿状态敏感度 multi-objective coordinated secondary voltage control （MOCSVC） reinforcement learning real-time weighting coefficient pareto frontier state sensitivity

分类号 TM74 [电气工程—电力系统及自动化]

引文网络
相关文献

参考文献17

1郭庆来,孙宏斌,张伯明,吴文传,李钦.协调二级电压控制的研究[J].电力系统自动化,2005,29(23):19-24. 被引量：81
2张安安,杨洪耕.基于ε-支配域的模糊多目标无功优化方法[J].电力系统自动化,2009,33(5):34-39. 被引量：13
3Konak A, Coit D W, Smith A E. Multi-objective optimization using genetic algorithms: a tutorial[J]. Reliability Engineering & System Safety, 2006, 91(9): 992-1007.
4Bui L T. Multi-objective optimization in computational intelligence: theory and practice[M]. Information Science Reference, 2008.
5Zhang Q, Li H. MOEA/D: A multiobjective evolutionary algorithm based on decomposition[J]. IEEE Transactions on Evolutionary Computation, 2007, 11(6): 712-731.
6H L Liao, Q H Wu, L Jiang. Multi-objective optimization by reinforcement learning for power system dispatch and voltage stability[C]//Innovative Smart Grid Technologies Conference Europe (ISGT Europe). Gothenburg: IEEE, 2010: 1-8.
7Barraclough D J, Conroy M L, Lee D. Prefrontal cortex and decision making in a mixed-strategy game[J]. Nature Neuroscience, 2004, 7(4): 404-410.
8Fu Wai-Tat, Anderson John R. From recurrent choice to skill learning: a reinforcement-learning model[J]. Journal of Experimental Psychology: General, 2006, 135(2): 184-206.
9Sutton R S, Barto A G. Reinforcement learning: an introduction[M]. Cambridge: MITpress, 1998.
10Nouri M A, Hesami A, Seifi A. Reactive power planning in Distribution Systems using a reinforcement learning method[C]//IEEE International Conference on Intelligent and Advanced Systems. Kuala Lumpur. IEEE, 2007. 157-161.

二级参考文献36

1郭庆来,孙宏斌,张伯明,李钦,刘崇茹,李尹,杨志新,王小英,李海峰.江苏电网AVC主站系统的研究和实现[J].电力系统自动化,2004,28(22):83-87. 被引量：97
2刘明波,杨勇.计及静态电压稳定约束的无功优化规划[J].电力系统自动化,2005,29(5):21-25. 被引量：50
3郭庆来,孙宏斌,张伯明,吴文传.基于无功源控制空间聚类分析的无功电压分区[J].电力系统自动化,2005,29(10):36-40. 被引量：124
4娄素华,李研,吴耀武,熊信银.多目标电网无功优化的量子遗传算法[J].高电压技术,2005,31(9):69-71. 被引量：28
5陈颖,沈沉,梅生伟,卢强.基于改进Jacobian-Free Newton-GMRES(m)的电力系统分布式潮流计算[J].电力系统自动化,2006,30(9):5-8. 被引量：77
6熊虎岗,程浩忠,李宏仲.基于免疫算法的多目标无功优化[J].中国电机工程学报,2006,26(11):102-108. 被引量：86
7石嘉川,刘玉田.计及分布式发电的配电网多目标电压优化控制[J].电力系统自动化,2007,31(13):47-51. 被引量：54
8SHI Jiachuan, LIU Yutian. Fuzzy evaluation based multi- objective reactive power optimization in distribution networks// Proceedings of 2nd International Conference on Fuzzy Systems and Knowledge Discovery (FSKD'05), August 27-29, 2005, Changsha, China. Heidelberg, Germany: Springer Verlag, 2006, 11-19.
9NIIMURA T, YOKOYAMA R, CORY B J. A fuzzy coordination approach for multi-objective voltage and reactive power schedule of an electrical power system// Proceedings of Second IEEE International Conference on Fuzzy Systems: Vol 1, March 28-April 1, 1993, San Francisco, CA, USA: 267- 272.
10EDMUND K B, GRAHAM K. Search methodologies: introductory tutorials in optimization and decision support techniques. Berlin, Germany: Springer Verlag, 2005.

共引文献102

1Zhao Yu,Shuanbao Niu,Chao Huo,Ning Chen,Kaige Song,Xiaohui Wang,Yu Bai.Multi-objective partition planning for multi-infeed HVDC system[J].Global Energy Interconnection,2021,4(1):81-90. 被引量：3
2孙宏斌,郭庆来,张伯明.大电网自动电压控制技术的研究与发展[J].电力科学与技术学报,2007,22(1):7-12. 被引量：43
3盛戈皞,江秀臣,曾奕.考虑网络传输延迟的二级电压控制[J].电力系统自动化,2007,31(15):30-34. 被引量：6
4刘明波,陈荃.二级电压控制对长期电压稳定性影响的仿真分析[J].湖南工业大学学报,2007,21(4):29-35. 被引量：3
5张勇军,李勇,蔡广林,任震.广东受端电网动态电压支撑优化建模[J].电力系统自动化,2007,31(24):29-33. 被引量：11
6郭庆来,张伯明,孙宏斌,吴文传.电网无功电压控制模式的演化分析[J].清华大学学报（自然科学版）,2008,48(1):16-19. 被引量：15
7郭庆来,孙宏斌,张伯明,吴文传,王彬,李柱华,汤磊,王蓓,宁文元,郑燕涛,袁平.自动电压控制中连续变量与离散变量的协调方法 (一)变电站内协调电压控制[J].电力系统自动化,2008,32(8):39-42. 被引量：32
8郭庆来,孙宏斌,张伯明,吴文传,王彬,李柱华,汤磊.自动电压控制中连续变量与离散变量的协调方法 (二)厂站协调控制[J].电力系统自动化,2008,32(9):65-68. 被引量：22
9贠志皓,刘玉田,牟宏,雷鸣.基于线性目标规划的二级电压多目标控制[J].电力系统自动化,2008,32(19):25-29. 被引量：1
10唐茂林,庞晓艳,李旻,刘柏私,尹晓澜,张蓓,李建,郭庆来,孙宏斌.计及梯级电站的省地一体化AVC系统研究及实现方案[J].电力自动化设备,2009,29(6):119-123. 被引量：14

同被引文献137

1范士雄,李立新,王松岩,刘幸蔚,於益军,郝博文.人工智能技术在电网调控中的应用研究[J].电网技术,2020,44(2):401-411. 被引量：110
2李明节,陶洪铸,许洪强,刘金波,张强,张伟.电网调控领域人工智能技术框架与应用展望[J].电网技术,2020,44(2):393-400. 被引量：78
3张武军,叶剑锋,梁伟杰,方鸽飞.基于改进遗传算法的多目标无功优化[J].电网技术,2004,28(11):67-71. 被引量：81
4王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：333
5邹斌,李庆华,言茂松.电力拍卖市场的智能代理仿真模型[J].中国电机工程学报,2005,25(15):7-11. 被引量：28
6郭创新,朱传柏,曹一家,吴欣.电力系统故障诊断的研究现状与发展趋势[J].电力系统自动化,2006,30(8):98-103. 被引量：134
7吴浩,郭瑞鹏,韩祯祥.电力系统微分代数模型的奇异性和暂态电压稳定[J].电力系统自动化,2006,30(13):16-21. 被引量：14
8兰继斌,徐扬,霍良安,刘家忠.模糊层次分析法权重研究[J].系统工程理论与实践,2006,26(9):107-112. 被引量：312
9武新宇,程春田,廖胜利,李刚.两阶段粒子群算法在水电站群优化调度中的应用[J].电网技术,2006,30(20):25-28. 被引量：40
10李帅,王先培,王泉德,牛胜巍.基于SMDP强化学习的电力信息网络入侵检测研究[J].电力自动化设备,2006,26(12):75-78. 被引量：4

引证文献6

1范士雄,李立新,王松岩,刘幸蔚,於益军,郝博文.人工智能技术在电网调控中的应用研究[J].电网技术,2020,44(2):401-411. 被引量：110
2程乐峰,余涛,张孝顺,殷林飞.机器学习在能源与电力系统领域的应用和展望[J].电力系统自动化,2019,43(1):15-31. 被引量：119
3邓卓明,刘明波.求解多目标暂态电压紧急控制的强化学习方法[J].华南理工大学学报（自然科学版）,2015,43(12):9-17. 被引量：2
4刘明波,冯小峰.考虑区间耦合和无功均衡的二级电压控制器设计[J].电工技术学报,2017,32(6):220-230. 被引量：1
5林静怀,范士雄,徐郑崎,范海威,沈晓东,刘幸蔚,秦佳奇.基于模糊层次分析法和LSTM-注意力机制的电网运行态势感知评估模型[J].电力信息与通信技术,2020,18(4):58-66. 被引量：18
6李鹏,姜磊,王加浩,夏辉,潘有朋.基于深度强化学习的新能源配电网双时间尺度无功电压优化[J].中国电机工程学报,2023,43(16):6255-6265. 被引量：7

二级引证文献250

1程乐峰,杨汝,刘贵云,王建晖,陈洋,王晓刚,张杰,余涛.多群体非对称演化博弈动力学及其在智能电网电力需求侧响应中的应用[J].中国电机工程学报,2020,40(S01):20-36. 被引量：24
2刘冬兰,孔德秋,常英贤,刘新,马雷,王睿.基于受限玻尔兹曼机的电力信息系统多源日志综合特征提取[J].计算机系统应用,2020,29(11):210-217. 被引量：1
3陶洪铸,翟明玉,许洪强,季学纯,刘金波,徐丽燕.适应调控领域应用场景的人工智能平台体系架构及关键技术[J].电网技术,2020,44(2):412-419. 被引量：36
4许杨子,强文,刘俊,孙鸿雁,胡成刚.基于改进深度强化学习算法的电力市场监测模型研究[J].国外电子测量技术,2020,39(1):82-87. 被引量：5
5Ran Li,Yi Han,Tao Ma,Huilan Liu.Nash-Q learning-based collaborative dispatch strategy for interconnected power systems[J].Global Energy Interconnection,2020,3(3):227-236. 被引量：3
6王刘旺,周自强,林龙,韩嘉佳.人工智能在变电站运维管理中的应用综述[J].高电压技术,2020,46(1):1-13. 被引量：79
7韦公远.有针对性的几种班组安全教育形式[J].车间管理,2000(1):47-47.
8张俊华.某厂内设科套取现金私分该定何罪?[J].中国刑事法杂志,2000(1):66-66.
9程乐峰,余涛,张孝顺,殷林飞.机器学习在能源与电力系统领域的应用和展望[J].电力系统自动化,2019,43(1):15-31. 被引量：119
10彭琰,余一平,鞠平,黄晓明,娄伯良,黄弘扬.计及不确定性的电力系统电压波动分析方法[J].电力自动化设备,2017,37(8):137-142. 被引量：5

1邓卓明,刘明波.求解多目标暂态电压紧急控制的强化学习方法[J].华南理工大学学报（自然科学版）,2015,43(12):9-17. 被引量：2
2姚骏,郭利莎,陈知前,周特.电网电压不平衡下双馈型风电场可控运行区域及其控制策略[J].电工技术学报,2016,31(20):181-191. 被引量：10
3张小白,孙素琴,滕贤亮,李大鹏,镐俊杰,李奎.基于多区域的AGC多目标协调控制方法[J].电力系统自动化,2010,34(16):55-57. 被引量：12
4苏立峰.继电保护技术在电力系统中的应用[J].科技与生活,2010(11):14-14. 被引量：1
5郑振祥.电子变压器优化设计的变量选择[J].电子变压器技术,1993(4):8-9. 被引量：3
6栗春,姜齐荣,王仲鸿,纪勇.静止同步补偿器多目标协调控制器的设计[J].电工技术学报,1999,14(2):21-24. 被引量：1
7张曼,张春朋,姜齐荣,周飞,宋洁莹.统一潮流控制器多目标协调控制策略研究[J].电网技术,2014,38(4):1008-1013. 被引量：30
8张怀德,张建生,李蓓.基于多目标协调内点法的分布式电源配置[J].机械制造与自动化,2014,43(2):167-169.
9阳同光,桂卫华.电网不平衡情况下并网逆变器多目标协调控制策略研究[J].电工技术学报,2015,30(11):148-157. 被引量：19
10李文华,马源鸿,许晓杰,王炳龙,杜乐.风力发电接入配电网的电动汽车充电控制研究[J].燕山大学学报,2017,41(1):56-62.

中国电机工程学报

2013年第31期

浏览历史

内容加载中请稍等...

求解多目标协调二级电压控制的简化强化学习方法被引量：6

参考文献17

二级参考文献36

共引文献102

同被引文献137

引证文献6

二级引证文献250

相关作者

相关机构

相关主题

浏览历史

求解多目标协调二级电压控制的简化强化学习方法 被引量：6

参考文献17

二级参考文献36

共引文献102

同被引文献137

引证文献6

二级引证文献250

相关作者

相关机构

相关主题

浏览历史

求解多目标协调二级电压控制的简化强化学习方法被引量：6