基于强化学习的浓密机底流浓度在线控制算法被引量：13

Online Reinforcement Learning Control Algorithm for Concentration of Thickener Underflow

下载PDF

导出

摘要复杂过程工业控制一直是控制应用领域研究的前沿问题.浓密机作为一种复杂大型工业设备广泛用于冶金、采矿等领域.由于其在运行过程中具有多变量、非线性、高时滞等特点,浓密机的底流浓度控制技术一直是学界、工业界的研究难点与热点.本文提出了一种基于强化学习技术的浓密机在线控制算法.该算法在传统启发式动态规划(Heuristic dynamic programming,HDP)算法的基础上,设计融合了评价网络与模型网络的双网结构,并提出了基于短期经验回放的方法用于增强评价网络的训练准确性,实现了对浓密机底流浓度的稳定控制,并保持控制输入稳定在设定范围之内.最后,通过浓密机仿真实验的方式验证了算法的有效性,实验结果表明本文提出的方法在时间消耗、控制精度上优于其他算法. Complex process industrial control is a widely concerned problem in the field of control application.As a kind of complex huge industrial equipment,thickener has been widely used in metallurgy,mining and other applications.Due to its characteristics of complicated variables,nonlinear and long delay in the operational process,the control strategy of underflow concentration for thickener has always been a hot and difficult issue in the academia and industry.This paper proposes a novel online control algorithm for thickener which is based on reinforcement learning.Inspired by the traditional heuristic dynamic programming(Heuristic dynamic programming,HDP)algorithm.The proposed method designs a double net framework which is composed of the critic network and the model network.To achieve the stabilization of underflow concentration,an optimal method which is based on reviewing the history data in a short term is proposed in the training phase of critic network.Simulation experiments verify efficiency of the proposed method.The results show that the proposed method can maintain the concentration of underflow in a stable horizon and performs better than other algorithms in accuracy and time consuming.

作者袁兆麟何润姿姚超李佳班晓娟 YUAN Zhao-Lin;HE Run-Zi;YAO Chao;LI Jia;BAN Xiao-Juan(School of Computer and Communication Engineering University of Science&Technology Beijing,Beijing 100083)

机构地区北京科技大学计算机与通信工程学院

出处《自动化学报》 EI CAS CSCD 北大核心 2021年第7期1558-1571,共14页 Acta Automatica Sinica

基金海南省重点研发计划(ZDYF2019009) 国家重点基础研究发展计划(2019YFC0605300,2016YFB0700500) 国家自然科学基金(61572075,61702036,61873299)资助。

关键词自适应动态规划强化学习最优控制浓密机控制神经网络 Adaptive dynamic programming reinforcement learning optimal control thickener control neural networks

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1段艳杰,吕宜生,张杰,赵学亮,王飞跃.深度学习在控制领域的研究现状与展望[J].自动化学报,2016,42(5):643-654. 被引量：147
2王琳岩,李健,贾瑶,柴天佑.混合选别浓密过程双速率智能切换控制[J].自动化学报,2018,44(2):330-343. 被引量：7

二级参考文献10

1王飞跃.人工社会、计算实验、平行系统——关于复杂社会经济系统计算研究的讨论[J].复杂系统与复杂性科学,2004,1(4):25-35. 被引量：234
2王飞跃.平行系统方法与复杂系统的管理和控制[J].控制与决策,2004,19(5):485-489. 被引量：333
3王飞跃.关于复杂系统研究的计算理论与方法[J].中国基础科学,2004,6(5):3-10. 被引量：97
4王飞跃.词计算和语言动力学系统的基本问题和研究[J].自动化学报,2005,31(6):844-852. 被引量：34
5王飞跃.关于复杂系统的建模、分析、控制和管理[J].复杂系统与复杂性科学,2006,3(2):26-34. 被引量：64
6王飞跃.基于社会计算和平行系统的动态网民群体研究[J].上海理工大学学报,2011,32(1):8-17. 被引量：43
7王飞跃.平行控制:数据驱动的计算控制方法[J].自动化学报,2013,39(4):293-302. 被引量：131
8李海波,柴天佑,赵大勇.混合选别浓密机底流矿浆浓度和流量区间智能切换控制方法[J].自动化学报,2014,40(9):1967-1975. 被引量：10
9唐耀庚,胡蓉.基于神经网络的矿浆浓度控制系统[J].控制工程,2002,9(5):45-46. 被引量：4
10王飞跃,史帝夫.兰森.从人工生命到人工社会——复杂社会系统研究的现状和展望[J].复杂系统与复杂性科学,2004,1(1):33-41. 被引量：109

共引文献152

1吕宜生,王飞跃,张宇,张晓东.虚实互动的平行城市:基本框架、方法与应用[J].智能科学与技术学报,2019,1(3):311-317. 被引量：15
2吕宜生,刘雅慧,陈圆圆,朱凤华.融合时空特征的端到端自动驾驶车辆转向角预测[J].中国公路学报,2022,35(3):263-272. 被引量：2
3吴友平,罗伟.同一流动相分离检测美托洛尔和普罗帕酮的血药浓度[J].中国新药杂志,2000,9(2):99-100. 被引量：9
4程乐峰,余涛,张孝顺,殷林飞.机器学习在能源与电力系统领域的应用和展望[J].电力系统自动化,2019,43(1):15-31. 被引量：120
5刘宪权.人工智能时代的刑事责任演变:昨天、今天、明天[J].法学,2019(1):79-93. 被引量：80
6周念成,廖建权,王强钢,李春艳,李剑.深度学习在智能电网中的应用现状分析与展望[J].电力系统自动化,2019,43(4):180-191. 被引量：183
7郭祥云,胡敏,王文胜,刘亚辉.基于深度学习的非结构环境下海参实时识别算法[J].北京信息科技大学学报（自然科学版）,2019,34(3):27-31. 被引量：5
8吕菲,夏秀渝.基于方位特征的听觉选择性注意计算模型研究[J].自动化学报,2017,43(4):634-644. 被引量：5
9李飞,高晓光,万开方.基于改进并行回火算法的RBM网络训练研究[J].自动化学报,2017,43(5):753-764. 被引量：7
10朱群雄,高慧慧,徐圆.工业过程报警管理研究进展[J].自动化学报,2017,43(6):955-968. 被引量：23

同被引文献103

1王日中,李慧平,崔迪,徐德民.基于深度强化学习算法的自主式水下航行器深度控制[J].智能科学与技术学报,2020(4):354-360. 被引量：4
2袁小锋,王雅琳,阳春华,桂卫华.深度学习在流程工业过程数据建模中的应用[J].智能科学与技术学报,2020(2):107-115. 被引量：13
3秦炎.欧洲碳市场推动电力减排的作用机制分析[J].全球能源互联网,2021,4(1):37-45. 被引量：25
4李俊芳,李峰,吉月辉,高强.四旋翼无人机轨迹稳定跟踪控制[J].控制与决策,2020,35(2):349-356. 被引量：21
5贠永峰,范永慧,孙扬.基于BP神经网络的隧道围岩力学参数反分析方法[J].沈阳建筑大学学报（自然科学版）,2011,27(2):292-296. 被引量：16
6Kang Yong,Hu Xiaomin,Deng Changlie,Luo Qian(Department of Mineral Engineering, Northeastern University, Shenyong 110006).DETERMINING THICKENER UNDERFLOW CONCENTRATION AND UNIT AREA[J].中国有色金属学会会刊：英文版,1996,6(3):29-35. 被引量：2
7王世进,孙晟,周炳海,奚立峰.基于Q-学习的动态单机调度[J].上海交通大学学报,2007,41(8):1227-1232. 被引量：11
8柴天佑,丁进良,王宏,苏春翌.复杂工业过程运行的混合智能优化控制方法[J].自动化学报,2008,34(5):505-515. 被引量：89
9何荣军,张丽,周华强,武龙飞.固体废弃物膏体充填料浆质量的神经网络研究[J].采矿与安全工程学报,2008,25(3):352-356. 被引量：6
10柴天佑.生产制造全流程优化控制对控制与优化理论方法的挑战[J].自动化学报,2009,35(6):641-649. 被引量：70

引证文献13

1贺俊杰,张洁,张朋,汪俊亮,郑鹏,王明.基于长短期记忆近端策略优化强化学习的等效并行机在线调度方法[J].中国机械工程,2022,33(3):329-338. 被引量：7
2王睿,孙秋野,张化光.微电网的电流均衡/电压恢复自适应动态规划策略研究[J].自动化学报,2022,48(2):479-491. 被引量：11
3杨莹,吴爱祥,王先成,王国立,刘伟涛.基于GA-BP神经网络的尾砂浓密多目标精准预测[J].采矿技术,2022,22(2):143-148. 被引量：1
4李潇睿,班晓娟,袁兆麟,乔浩然.工业场景下基于深度学习的时序预测方法及应用[J].工程科学学报,2022,44(4):757-766. 被引量：9
5严家政,专祥涛.基于强化学习的参数自整定及优化算法[J].智能系统学报,2022,17(2):341-347. 被引量：7
6富月,陈威.具有解耦性能的离散时间线性多变量系统最优跟踪控制[J].自动化学报,2022,48(8):1931-1939.
7赵建国,杨春雨.复杂工业过程非串级双速率组合分散运行优化控制[J].自动化学报,2023,49(1):172-184. 被引量：1
8李金娜,袁林,丁进良.不确定工业过程运行指标异步更新强化学习决策算法[J].自动化学报,2023,49(2):461-472.
9王增加,寇云鹏,吴再海,盛宇航,王鹏涛.浓密机耙架扭矩双重模糊PID控制系统研究与应用[J].有色金属工程,2023,13(7):128-133.
10杨加秀,李新凯,张宏立,王昊.基于积分强化学习的四旋翼无人机鲁棒跟踪[J].兵工学报,2023,44(9):2802-2813.

二级引证文献37

1陈亚绒,周升伟,管在林,岳磊.基于增强拓扑神经进化的等效并行机动态调度[J].华中科技大学学报（自然科学版）,2022,50(6):111-117.
2田鑫萃,李丹,袁帅,陈阳,孙安.考虑暂态安全的电网线路电流过载均衡控制方法[J].制造业自动化,2022,44(8):173-176.
3赵云,聂雅萍,王晓光.交流伺服系统控制器参数在线自整定[J].湖北工业大学学报,2022,37(5):28-32.
4龙鑫玉,石英,林朝俊.基于改进Transformer的电网防汛风险概率预测[J].武汉理工大学学报,2022,44(9):79-88. 被引量：2
5王睿,孙秋野,张化光.信息能源系统的信-物融合稳定性分析[J].自动化学报,2023,49(2):307-316. 被引量：4
6王义贺,李占军,侯敏,张修宇.直流微网群分层对等控制及功率管理策略研究[J].可再生能源,2023,41(3):385-393. 被引量：2
7荀洪凯,陶翼飞,张源,何李.多目标启发式狼群算法求解不相关并行机分批调度问题[J].信息与控制,2023,52(1):93-103. 被引量：3
8叶婧,蔡霞,张磊,杨楠,李振华.基于深度强化学习的热电联产机组多工况自适应控制[J].热力发电,2023,52(4):104-112. 被引量：1
9商春磊,王传军,刘文月,朱德鑫,汪水泽,董林硕,吴桂林,高军恒,赵海涛,张朝磊,吴宏辉.数据驱动的文献辅助管线钢产线落锤撕裂韧性内禀特征关联[J].工程科学学报,2023,45(8):1390-1399. 被引量：1
10夏元清,谢超,高寒,詹玉峰,孙中奇,戴荔,柴润祺,崔冰,张元,翟弟华,刘坤,杨辰,吴楚格,高润泽.天空地一体化网络环境下多运动体系统跨域协同控制与智能决策[J].控制与决策,2023,38(5):1176-1199. 被引量：7

1韦云凯,王志宏,冷甦鹏.量子强化学习技术及研究进展[J].广州大学学报（自然科学版）,2021,20(1):56-68.
2谢得卉,陈曦,刘振元,樊垚堤,唐淑贤.基于动态规划的铁路转运站散装物资对位卸载作业优化算法[J].物流技术,2021,40(5):42-48.
3谢当周.地方电视台高清非编制作网络的设计与建设[J].西部广播电视,2020,41(2):251-252. 被引量：1
4王小玲,伍丹丹,李纯孝.孕前超重肥胖对妊娠期糖尿病初产妇妊娠结局的影响[J].现代妇产科进展,2021,30(9):686-689. 被引量：24
5李楠.钢铁产品销售车辆信息管理平台的设计[J].电子技术与软件工程,2021(15):187-189.
6胡中南,樊蓓蓓.基于LabVIEW的空气质量监测系统设计[J].自动化仪表,2021,42(7):78-82. 被引量：4
7何战江,夏启富,裴素梅,项飞.水线光缆生产中异常问题的探讨[J].现代传输,2021(4):40-42.
8谢永超,杨利,严俊.基于MQ-2型传感器的烟雾探测报警器的设计[J].计算机测量与控制,2021,29(8):255-259. 被引量：18

自动化学报

2021年第7期

浏览历史

内容加载中请稍等...

基于强化学习的浓密机底流浓度在线控制算法被引量：13

参考文献2

二级参考文献10

共引文献152

同被引文献103

引证文献13

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

基于强化学习的浓密机底流浓度在线控制算法 被引量：13

参考文献2

二级参考文献10

共引文献152

同被引文献103

引证文献13

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

基于强化学习的浓密机底流浓度在线控制算法被引量：13