基于多动作并行异步深度确定性策略梯度的选矿运行指标决策方法被引量：1

Multi-action parallel asynchronous depth deterministic strategy gradient based decision-making approach of operational indices for mineral processing

原文传递

导出

摘要为了解决深度确定性策略梯度算法探索能力不足的问题,提出一种多动作并行异步深度确定性策略梯度(MPADDPG)算法,并用于选矿运行指标强化学习决策.该算法使用多个actor网络,进行不同的初始化和训练,不同程度地提升了探索能力,同时通过扩展具有确定性策略梯度结构的评论家体系,揭示了探索与利用之间的关系.该算法使用多个DDPG代替单一DDPG,可以减轻一个DDPG性能不佳的影响,提高学习稳定性;同时通过使用并行异步结构,提高数据利用效率,加快了网络收敛速度;最后,actor通过影响critic的更新而得到更好的策略梯度.通过选矿过程运行指标决策的实验结果验证了所提出算法的有效性. In order to solve the problem of insufficient exploration ability of the deep deterministic strategy gradient algorithm,a multi-action parallel asynchronous deep deterministic policy gradient(DDPG) algorithm is proposed for the decision-making approach of operational indices in mineral processing based on reinforcement learning.This algorithm uses multiple actor networks for different initialization and training,which greatly increases the exploration to different degrees.The relationship between exploration and utilization is revealed by extending the critical architecture of deterministic selection policy.This algorithm uses multiple DDPGs instead of a single DDPG,which can alleviate the poor performance of one DDPG and improve the learning stability.And it also improves the data utilization efficiency and speeds up the network convergence by using parallel asynchronous structure.Finally,the actor gets better strategy gradient by influencing critic’s update.The effectiveness of the proposed approach has been verified by experiment results on decision-making of the operational indices in mineral processing.

作者李悄然丁进良 LI Qiao-ran;DING Jin-liang(State Key Laboratory of Synthetical Automation for Process Industries,Northeastern University,Shenyang 110004,China)

机构地区东北大学流程工业综合自动化国家重点实验室

出处《控制与决策》 EI CSCD 北大核心 2022年第8期1989-1996,共8页 Control and Decision

基金国家重点研发计划课题(2018YFB1701104) 辽宁省科技技术项目(2020JH1/10100008)。

关键词选矿运行指标决策多动作并行异步深度确定性策略梯度 mineral processing operational indices decision-making multi-actions parallel asynchronous deep deterministic policy gradient

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1丁进良,杨翠娥,陈远东,柴天佑.复杂工业过程智能优化决策系统的现状与展望[J].自动化学报,2018,44(11):1931-1943. 被引量：58

二级参考文献17

1肖志娇,常会友,衣杨.启发式规则与GA结合的优化方法求解工作流动态调度优化问题[J].计算机科学,2007,34(2):157-160. 被引量：11
2王伟达,王伟,刘文剑.基于仿真的生产计划与调度系统集成[J].计算机工程与设计,2007,28(7):1626-1629. 被引量：5
3柴天佑,丁进良,王宏,苏春翌.复杂工业过程运行的混合智能优化控制方法[J].自动化学报,2008,34(5):505-515. 被引量：89
4柴天佑.生产制造全流程优化控制对控制与优化理论方法的挑战[J].自动化学报,2009,35(6):641-649. 被引量：70
5罗春鹏,荣冈.不确定条件下汽油调和调度的鲁棒优化模型(英文)[J].石油学报（石油加工）,2009,25(3):391-400. 被引量：5
6黄辉,柴天佑,郑秉霖,罗小川,张红.面向铁钢对应的两级案例推理铁水动态调度系统[J].化工学报,2010,61(8):2021-2029. 被引量：9
7邬仲臻,冯毅萍,王继帅,吴玉成,荣冈.一种基于仿真的流程工业生产调度闭环优化方法[J].化工自动化及仪表,2011,38(4):369-374. 被引量：3
8马文强,杜子平,李东坡.仿真优化在制造系统生产调度中的研究进展[J].现代制造工程,2012(3):10-14. 被引量：3
9柴天佑.复杂工业过程运行优化与反馈控制[J].自动化学报,2013,39(11):1744-1757. 被引量：79
10周平,柴天佑.典型赤铁矿磨矿过程智能运行反馈控制[J].控制理论与应用,2014,31(10):1352-1359. 被引量：10

共引文献57

1杨浩立.挠性管负压射孔在一口作斜井中的应用[J].测井与射孔,2000(1):65-66.
2彭才静,刘恩梅.全面认识呼吸道合胞病毒——从病毒学特征到防治现状[J].中国实用儿科杂志,2012,27(4):259-261. 被引量：24
3崔靖涵,刘向杰.变速风力发电机组的经济模型预测控制[J].控制工程,2019,26(3):431-439. 被引量：4
4徐婧,刘伊生,李欣桐.基于大数据的重大工程智能群体决策支持系统研究[J].河南科学,2019,37(6):1014-1019. 被引量：5
5高开来,丁进良.蒸馏与换热协同的约束多目标在线操作优化方法[J].自动化学报,2019,45(9):1679-1690. 被引量：2
6张成伟,李宏伟,李安平,张焱,刘小蒙,李慧霞,王磊.基于模型预测控制及智能寻优的水泥粉磨优化控制[J].水泥工程,2020(1):71-74.
7杜傲,王坚,凌卫青.基于犹豫模糊集的机器自主及人机联合多属性决策方法[J].计算机集成制造系统,2020,26(8):2099-2108. 被引量：1
8桂卫华,曾朝晖,陈晓方,谢永芳,孙玉波.知识驱动的流程工业智能制造[J].中国科学：信息科学,2020,50(9):1345-1360. 被引量：25
9袁烨,张永,丁汉.工业人工智能的关键技术及其在预测性维护中的应用现状[J].自动化学报,2020,46(10):2013-2030. 被引量：79
10马海平,朱聪,母佳鑫,孙超.求解复杂耦合问题的多系统优化方法[J].控制理论与应用,2020,37(11):2354-2364. 被引量：1

同被引文献10

1曹卫国.甘肃某微细粒嵌布磁铁矿选矿试验研究[J].矿业研究与开发,2011,31(2):35-37. 被引量：5
2苏涛,陈铁军,张一敏,卢敏.微细嵌布贫磁铁矿可选性研究[J].矿业研究与开发,2015,35(12):38-42. 被引量：5
3查显明,刘福京.磁选柱在碾子坝选厂技术改造中的应用[J].现代矿业,2017,33(10):155-156. 被引量：2
4高志喆,陈小艳,马长君,孙景新,李宗胜,于凤,刘世昌.大孤山球团厂淘洗机工业对比试验[J].现代矿业,2019,35(2):146-148. 被引量：5
5党炜犇,王宇斌,王妍,王鑫.基于BP神经网络技术的红土镍矿还原焙烧-磁选工艺条件的优化[J].矿产保护与利用,2020,40(5):128-133. 被引量：6
6程志勇,卢东方,薛子兴,李旭东,褚浩然,刘剑军,刘振强,陈福林.基于COMSOL Mutiphysics的履带式磁选机平面磁系磁场仿真与参数优化[J].中南大学学报（自然科学版）,2021,52(4):1049-1057. 被引量：8
7李明宇,黄金夫,姜丽君,武真子,万家国,王文龙.辽宁某铁精矿深度选别实验研究[J].矿产综合利用,2021(4):144-149. 被引量：4
8朱朋岩,翟秋婷,谢鸿鸿,杨金林,马少健.磁铁矿磨矿动力学行为研究[J].有色金属（选矿部分）,2022(4):64-68. 被引量：1
9王长艳,徐冬林,史达,韦文杰,张玲,刘杰.鞍千磁铁矿工艺矿物学研究[J].矿产综合利用,2022(4):193-199. 被引量：7
10朱志强,何逵,曹知勤,张雪峰.磨矿介质形状对橄辉岩型钒钛磁铁矿磨矿动力学影响研究[J].有色金属（选矿部分）,2022(6):43-48. 被引量：4

引证文献1

1张洺睿,李明宇,陈婉晴,孙雪妍.基于柱式弱磁选探究磨矿细度与精矿品位的关系[J].矿业研究与开发,2024,44(1):213-220.

1俞磊,黄飞,钱喜红.SBS改性沥青储存性能研究[J].苏州科技大学学报（工程技术版）,2020(S01):63-68. 被引量：3
2江宏.物流系统售后服务市场新发展[J].物流技术与应用,2022,27(7):82-83.
3沈钦龙,吴立婷.学生创新创业能力评价指标体系的分析与构建[J].福建电脑,2022,38(4):20-24. 被引量：3
4田豆,李凤莲,张雪英,张晋义.特征选择融合深度强化学习分类模型的构建及应用[J].电子设计工程,2022,30(12):93-97. 被引量：5
5韩笑.基于层次分析法的宏观经济指标可靠性评价[J].微型电脑应用,2021,37(6):34-37.
6杨占峰,赵云超.网格化规划闭环管理助力电网转型发展[J].农电管理,2022(8):56-57.
7简凤姣,赵玉婷,王毅,王轩,谭艾伦.海外建站,促进卫星应用走出去[J].卫星应用,2022,30(6):30-35. 被引量：1
8焦如丽,左洪亮.集成QFD/TRIZ/AHP的适老化钢制衣柜设计研究及应用[J].机械,2021,48(11):57-64.
9彭新敏,吴晓波,吴东.核心技术、互补资产与后发企业的超越追赶[J].科研管理,2022,43(7):135-143. 被引量：11
10肖文凯,翟显.专业面对面[J].中学生天地（高中综合版）（B版）,2022(5):27-27.

控制与决策

2022年第8期

浏览历史

内容加载中请稍等...

基于多动作并行异步深度确定性策略梯度的选矿运行指标决策方法被引量：1

参考文献1

二级参考文献17

共引文献57

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多动作并行异步深度确定性策略梯度的选矿运行指标决策方法 被引量：1

参考文献1

二级参考文献17

共引文献57

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多动作并行异步深度确定性策略梯度的选矿运行指标决策方法被引量：1