Q学习差分进化算法求解热电动态经济排放调度

A Q-Learning Differential Evolution Algorithm for Combined Heat and Power Dynamic Economic Emission Dispatch

下载PDF

导出

摘要热电联产动态经济排放调度同时考虑了燃料成本花费和污染气体排放两个目标值,且下一时间段的热电产量受当前时间段热电产量的影响,这是近年来电力系统运行中的一个重要问题。文中提出一种基于Q学习强化多目标差分进化(Q Learning Multi-Objective Differential Evolution,QLMODE)算法,以此求解热电联产动态经济排放调度(Combined Heat and Power Dynamic Economic Emission Dispatch,CHPDEED)问题。在QLMODE中,采用Q学习技术调整算法的比例因子参数,即在迭代过程中利用子代解和父代解之间的支配关系确定动作奖励和惩罚,并通过Q学习调整参数值,以获得最适合环境模型的算法参数。文中将所提QLMODE用于求解11机组和33机组的热电联产动态经济排放调度问题。仿真结果表明,与4种成熟的多目标优化算法相比,QLMODE算法燃料成本最小,污染气体排放最少,收敛性和多样性指标优于其他4种算法,且QLMODE在两组问题上都获得了更好的Pareto最优前沿。 The dynamic economic emission scheduling of cogeneration takes into account both fuel cost and pollution gas emission,and the thermoelectricity output in the next period is affected by the thermoelectricity output in the current period,which is an important problem in power system operation in recent years.In this study,a new QLMODE(Q-Learning Multi-Objective Differential Evolution)algorithm is proposed to solve the CHPDEED(Combined Heat and Power Dynamic Economic Emission Dispatch)problem.In QLMODE,the Q-learning technique is used to adjust the scale factor parameters of the algorithm,that is,in the iterative process,the action reward and punishment are determined by using the dominant relationship between the child solution and the parent solution,and the parameter values are adjusted by Q-learning to obtain the most suitable algorithm parameters for the environmental model.The proposed QLMODE is used to solve the CHPDEED with 11 units and 33 units.The simulation results show that compared with four mature multi-objective optimization algorithms,the QLMODE algorithm has the least fuel cost and the least pollution gas emission,the convergence and diversity index of QLMODE algorithm is better than the other four algorithms,and QLMODE has a better Pareto optimal frontier on both sets of problems.

作者方帅陈旭李康吉 FANG Shuai;CHEN Xu;LI Kangji(School of Electrical and Information Engineering,Jiangsu University,Zhenjiang 212013,China)

机构地区江苏大学电气信息工程工程学院

出处《电子科技》 2024年第5期9-17,共9页 Electronic Science and Technology

基金国家自然科学基金(61873114) 江苏大学农业装备学部青年计划项目(NZXB20210211)。

关键词 Q学习强化学习多目标算法差分进化热电联产经济排放调度动态调度电力系统 Q learning reinforcement learning multi-objective algorithm differential evolution cogeneration combined heat and power economic emission dispatch dynamic dispatch power system

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1杨德友,刘世宇.求解电力系统多目标环境经济调度的帕累托最优MFO算法[J].电工电能新技术,2018,37(2):30-37. 被引量：8
2王玉梅,张继钦,周永鑫.计及碳交易和价格型需求响应的热电联合低碳经济调度[J].电子科技,2023,36(10):74-81. 被引量：2
3赖俊,魏竞毅,陈希亮.分层强化学习综述[J].计算机工程与应用,2021,57(3):72-79. 被引量：12
4郑敦勇,姚宜斌,聂文锋,林东方,梁继,陈春花.基于机器学习集成算法的电离层层析算法迭代初值精化[J].地球物理学报,2022,65(8):2796-2812. 被引量：3
5张秦浩,敖百强,张秦雪.Q-learning强化学习制导律[J].系统工程与电子技术,2020,42(2):414-419. 被引量：21
6葛传九,武鹏,金俊喆,董祥祥,楼琦凯.基于改进差分进化算法的光伏最大功率点跟踪[J].电子科技,2022,35(9):15-21. 被引量：1
7冯士刚,艾芊.带精英策略的快速非支配排序遗传算法在多目标无功优化中的应用[J].电工技术学报,2007,22(12):146-151. 被引量：119

二级参考文献79

1Amanda LAMPTON,John VALASEK,Mrinal KUMAR.Multiresolution state-space discretization for Q-Learning with pseudorandomized discretization[J].控制理论与应用（英文版）,2011,9(3):431-439. 被引量：1
2张武军,叶剑锋,梁伟杰,方鸽飞.基于改进遗传算法的多目标无功优化[J].电网技术,2004,28(11):67-71. 被引量：80
3娄素华,吴耀武,熊信艮.电力系统无功优化的变尺度混沌优化算法[J].电网技术,2005,29(11):20-24. 被引量：28
4张文志,吕恬生.Reactive fuzzy controller design by Q-learning for mobile robot navigation[J].Journal of Harbin Institute of Technology(New Series),2005,12(3):319-324. 被引量：5
5徐继生,邹玉华,马淑英.GPS地面台网和掩星观测结合的时变三维电离层层析[J].地球物理学报,2005,48(4):759-767. 被引量：27
6刘方,颜伟,David C.Yu.基于遗传算法和内点法的无功优化混合策略[J].中国电机工程学报,2005,25(15):67-72. 被引量：114
7赵波,郭创新,张鹏翔,曹一家.基于分布式协同粒子群优化算法的电力系统无功优化[J].中国电机工程学报,2005,25(21):1-7. 被引量：68
8熊虎岗,程浩忠,李宏仲.基于免疫算法的多目标无功优化[J].中国电机工程学报,2006,26(11):102-108. 被引量：86
9江岳文,陈冲,温步瀛.基于随机模拟粒子群算法的含风电场电力系统经济调度[J].电工电能新技术,2007,26(3):37-41. 被引量：52
10Wang Z H, Yin X G, Zhang Z, et al. Pseudo-parallel genetic algorithm for reactive power optimization[C]. Power Engineering Society General Meeting, IEEE, Greece, 2003: 903-907.

共引文献159

1巩梨,王文璨,刘林忠.多目标一维装箱问题模型算法研究[J].计算机应用研究,2020,37(S02):144-146. 被引量：3
2卢维佳,黄海涛,魏明磊.基于DE-CSO混合算法的多目标无功优化[J].黑龙江电力,2020,42(3):218-223.
3张安安,杨洪耕.考虑电压稳定性的快速多目标无功优化方法[J].四川大学学报（工程科学版）,2009,41(6):219-225. 被引量：2
4张建,牛霞,刘晓东,张安安,潘家和.快速多目标无功优化方法在实际系统中的应用[J].四川电力技术,2009,32(1):79-83. 被引量：2
5李栋学,刘茂.NSGA Ⅱ在应急物资储备库选址中的应用[J].工业安全与环保,2009,35(3):1-3. 被引量：13
6张安安,杨洪耕.基于ε-支配域的模糊多目标无功优化方法[J].电力系统自动化,2009,33(5):34-39. 被引量：13
7李栋学,刘茂.基于NSGA-Ⅱ的工业区急救点优化布局研究[J].安全与环境学报,2009,9(4):168-171.
8张安安,杨洪耕,贺星棋,李乐,杨坤.考虑过渡过程的多目标无功/电压优化控制模型[J].电力自动化设备,2010,30(1):14-19. 被引量：3
9崔海波,姚志超,易先清.基于NSGA-Ⅱ的炮兵火力优化问题研究[J].兵工自动化,2010,29(4):17-19. 被引量：4
10张成芬,赵彦珍,陈锋,马西奎.基于改进NSGA-Ⅱ算法的干式空心电抗器多目标优化设计[J].中国电机工程学报,2010,30(18):115-121. 被引量：23

1周艳丽,徐硕,杨辉.基于改进多目标差分进化算法的城轨列车速度曲线优化[J].华东交通大学学报,2023,40(5):76-82.
2邢晓敏,张明洋,杨修宇,彭建,胡健民,袁少伟.计及网荷侧热惯性特征下用户动态响应的电热联合系统优化运行[J].电网技术,2024,48(3):1062-1071.
3王莉莉,潘越.基于航班收益最大化的机场航班时刻分配[J].飞行力学,2024,42(2):89-94.
4Ruyi Dong,Lixun Sun,Long Ma,Ali Asghar Heidari,Xinsen Zhou,Huiling Chen.Boosting Kernel Search Optimizer with Slime Mould Foraging Behavior for Combined Economic Emission Dispatch Problems[J].Journal of Bionic Engineering,2023,20(6):2863-2895.
5赵伟,谭清月,赵国栋,张田.改进多目标差分进化算法求解考虑供需平衡的热轧合同计划问题[J].冶金自动化,2023,47(5):63-70. 被引量：1
6Rudolf V.Zhang,Stanislav I.Zabolotnik,Pavel S.Zabolotnik.Assessment of the thermal effect of large industrial buildings on permafrost foundation soils in Yakutsk[J].Research in Cold and Arid Regions,2023,15(6):262-267.
7张涛,周晨,杜锋,陈芳,刘瑞林.基于数据流的K-S变化检测的动态多目标规划算法[J].长江大学学报（自然科学版）,2024,21(1):109-116.
8陈昊,李琳,王亚琦,刘洋.多目标差分进化算法改进与电工钢片磁致伸缩模型参数辨识[J].中国电机工程学报,2024,44(5):2047-2057.
9呼子宇,李紫晗,孙浩,魏立新,王聪.基于决策变量关系的动态多目标优化算法[J].控制与决策,2024,39(1):78-86. 被引量：1
10刘澳琦,李强,石晓青,周诚,师丽.隔壁萃取精馏分离环己烷-环己烯过程的模拟与优化[J].石油炼制与化工,2024,55(5):135-140.

电子科技

2024年第5期

浏览历史

内容加载中请稍等...

Q学习差分进化算法求解热电动态经济排放调度

参考文献7

二级参考文献79

共引文献159

相关作者

相关机构

相关主题

浏览历史