基于强化学习的煤矸石分拣机械臂智能控制算法研究被引量：10

Research on intelligent control algorithm of coal gangue sorting robot armbased on reinforcement learning

下载PDF

导出

摘要针对传统煤矸石分拣机械臂控制算法如抓取函数法、基于费拉里法的动态目标抓取算法等依赖于精确的环境模型、且控制过程缺乏自适应性,传统深度确定性策略梯度(DDPG)等智能控制算法存在输出动作过大及稀疏奖励容易被淹没等问题,对传统DDPG算法中的神经网络结构和奖励函数进行了改进,提出了一种适合处理六自由度煤矸石分拣机械臂的基于强化学习的改进DDPG算法。煤矸石进入机械臂工作空间后,改进DDPG算法可根据相应传感器返回的煤矸石位置及机械臂状态进行决策,并向相应运动控制器输出一组关节角状态控制量,根据煤矸石位置及关节角状态控制量控制机械臂运动,使机械臂运动到煤矸石附近,实现煤矸石分拣。仿真实验结果表明:改进DDPG算法相较于传统DDPG算法具有无模型通用性强及在与环境交互中可自适应学习抓取姿态的优势,可率先收敛于探索过程中所遇的最大奖励值,利用改进DDPG算法控制的机械臂所学策略泛化性更好、输出的关节角状态控制量更小、煤矸石分拣效率更高。 The problems of the traditional gangue sorting robot arm control algorithms such as the grasping function method and the dynamic target grasping algorithm based on Ferrary method are relying on an accurate environment model and lacking adaptivity in the control process.At the same time,the problems of the traditional intelligent control algorithms such as deep deterministic policy gradient(DDPG)are excessive output actions and sparse rewards that are easily covered.In order to solve these problems,this study improves the neural network structure and reward function in the traditional DDPG algorithm,and proposes an improved DDPG algorithm based on reinforcement learning,which is suitable for handling six-degree-of-freedom gangue sorting robot arms.After the gangue enters the working space of the robot arm,the improved DDPG algorithm can make decisions according to the gangue position and robot arm state returned by the corresponding sensor,and can output a set of joint angle state control quantity to the corresponding motion controller.The algorithm can control the movement of the robot arm according to the gangue position and joint angle state control quantity,so that the robot arm moves to the nearby gangue to conduct gangue sorting.The simulation results show that compared with the traditional DDPG algorithm,the improved DDPG algorithm has the advantages of model-free versatility and adaptive learning of grasping pose in interaction with the environment.Moreover,the improved algorithm can be the first to converge to the maximum reward value encountered during exploration.The robot arm controlled by the improved DDPG algorithm has better policy generalization,smaller joint angle state control output and higher gangue sorting efficiency.

作者张永超于智伟丁丽林 ZHANG Yongchao;YU Zhiwei;DING Lilin(College of Mechanical and Electronic Engineering,Shandong University of Science and Technology,Qingdao 266590,China)

机构地区山东科技大学机械电子工程学院

出处《工矿自动化》北大核心 2021年第1期36-42,共7页 Journal Of Mine Automation

基金山东省自然科学基金项目(ZR2018MEE036)。

关键词选煤煤矸石分拣分拣机器人机械臂关节角状态控制强化学习奖励函数 DDPG算法 coal preparation coal gangue sorting sorting robot robot arm joint angle state control reinforcement learning reward function DDPG algorithm

分类号 TD67 [矿业工程—矿山机电]

引文网络
相关文献

参考文献6

1王鹏,曹现刚,马宏伟,吴旭东,夏晶.基于余弦定理-PID的煤矸石分拣机器人动态目标稳准抓取算法[J].煤炭学报,2020,45(12):4240-4247. 被引量：19
2杨惟轶,白辰甲,蔡超,赵英男,刘鹏.深度强化学习中稀疏奖励问题研究综述[J].计算机科学,2020,47(3):182-191. 被引量：37
3苏婷婷,张好剑,王云宽,秦晓飞.基于费拉里法的Delta机器人动态目标抓取算法[J].华中科技大学学报（自然科学版）,2018,46(6):128-132. 被引量：16
4崔彦凯,梁晓庚,王斐,胡艳娜.弹道导弹助推段拦截最优制导律设计[J].飞行力学,2011,29(1):59-62. 被引量：8
5王鹏,曹现刚,夏晶,吴旭东,马宏伟.基于机器视觉的多机械臂煤矸石分拣机器人系统研究[J].工矿自动化,2019,45(9):47-53. 被引量：52
6夏云凯,李功民.我国动力煤干选技术现状及展望[J].洁净煤技术,2017,23(6):17-25. 被引量：29

二级参考文献71

1韩成石,董长双,周西军,邢伟.煤和矸石γ-射线分选系统的研究[J].山西矿业学院学报,1997,15(2):157-161. 被引量：8
2刘善增,余跃庆,杜兆才,杨建新.并联机器人的研究进展与现状(连载)[J].组合机床与自动化加工技术,2007(8):5-13. 被引量：7
3John A Lukacs IV, Oleg A Yakimenko. Trajectory-shaping guidance for interception of ballistic missiles during the boost phase [ J]. Journal of Guidance, Control, and Dynamics ,2008,31 ( 5 ) : 1524-1531.
4John A Lukacs IV, Oleg A Yakimenko. Trajectory-shapevarying missile guidance for interception of ballistic missiles during the boost phase [ C ]//AIAA Guidance, Navigation and Control Conference and Exhibit. Hilton Head, South Carolina ,2007 : 1-21.
5Guelman M, Golan 0 M. Minimum energy guidance for boost phase ballistic missile interception [ C ]//Proceedings of the American Control Conference. Seattle, Washington, 1995:4131-4135.
6蒋志新.复合式干法选煤在阳煤五矿的应用[J].山西煤炭,2008,28(2):46-47. 被引量：2
7任尚锦,任彦东,胡永亮.差动式干法选煤机的应用[J].煤炭加工与综合利用,2008(4):14-16. 被引量：6
8许述纯,高锋,朱惠臣.干法选煤厂运营效果分析[J].中国煤炭,2009,35(1):68-69. 被引量：5
9孔力,李红,徐琦,徐恕宏.基于双能γ射线的煤、矸石区域分割识别方法[J].华中理工大学学报,1998,26(1):39-40. 被引量：8
10王森,杨建军.战术弹道导弹助推段拦截方法研究[J].飞航导弹,2009(5):54-57. 被引量：19

共引文献147

1宋国栋,魏立科,马宏伟,付霁野,刘希梁.六轴式小臂机器人运动学理论研究及其在掘锚作业中的应用[J].煤炭学报,2021,46(S02):1114-1123. 被引量：5
2陈坤,胡丙升,宋俊超,贾金鑫.风力选煤旋风除尘器内壁防冻粘涂层试验研究[J].煤炭工程,2022,54(S01):191-194. 被引量：1
3曾红久.石圪台选煤厂手选带人工拣矸改造[J].洁净煤技术,2023,29(S01):122-126.
4李瑜,张占强,孟克其劳,魏皓天.基于改进深度确定性策略梯度算法的微电网能量优化调度[J].电子测量技术,2023,46(2):73-80. 被引量：4
5张博,黄山,张浛芮,李应昆,涂海燕.基于强化学习的艾灸机器人温度控制策略研究[J].电子测量技术,2022,45(24):60-66. 被引量：1
6徐伟锋,胡俊武,叶佳佳,祝新军.基于视觉检测的口罩枕包并联机器人动态抓取[J].国外电子测量技术,2022,41(3):152-157. 被引量：5
7肖增博,雷虎民,叶继坤,宋龙,徐剑芸.一种用于弹道导弹助推段拦截的最优制导律[J].弹道学报,2011,23(4):16-21. 被引量：6
8仵浩,周晓光,王军.基于弹道形成的空基助推段反导拦截弹制导律设计[J].空军工程大学学报（自然科学版）,2013,14(5):31-35. 被引量：3
9巩冰,肖增博,雷虎民.空基动能拦截弹制导控制系统综述[J].航空兵器,2013,20(6):17-23. 被引量：2
10马自茹,魏明英,李运迁.控制量权重可变的主动段最优中制导律[J].现代防御技术,2018,46(6):44-50. 被引量：2

同被引文献126

1李克讷,马玉如,王温鑫,刘超.基于伪逆的冗余度机械臂关节速度约束方案[J].仪器仪表学报,2022,43(2):225-233. 被引量：5
2SUN Ping,SHAN Rui.Predictive Control with Velocity Observer for Cushion Robot Based on PSO for Path Planning[J].Journal of Systems Science & Complexity,2020,33(4):988-1011. 被引量：11
3王德明,颜熠,周光亮,李勇奇,刘成菊,林立民,陈启军.基于实例分割网络与迭代优化方法的3D视觉分拣系统[J].机器人,2019,41(5):637-648. 被引量：17
4谢任林,张志强.自动售烟机分拣系统模块化设计及仿真验证[J].电子测量技术,2021,44(7):19-25. 被引量：1
5Chelmsford,Mass,杨进录.如何使机械运动部件控制最佳[J].电子工业专用设备,2005,34(3):25-27. 被引量：7
6张朝阳,周惠兴,曹荣敏,吴小艳.基于金字塔形寻优的传送带动态抓取研究[J].制造业自动化,2015,37(9):92-95. 被引量：4
7聂海涛,龙科慧,马军,刘金国.采用改进尺度不变特征变换在多变背景下实现快速目标识别[J].光学精密工程,2015,23(8):2349-2356. 被引量：28
8曾俊宝,李硕,李一平,王晓辉,阎述学.便携式自主水下机器人控制系统研究与应用[J].机器人,2016,38(1):91-97. 被引量：32
9张云峰,马振书,孙华刚,陆继山.基于改进快速扩展随机树的机械臂路径规划[J].火力与指挥控制,2016,41(5):25-30. 被引量：10
10朱道瑶,梁殿印,史佩伟,冉红想,尚红亮.矿石拣选技术和设备的研究和进展[J].矿山机械,2016,44(7):5-10. 被引量：20

引证文献10

1王子玉.煤矸石智能分拣机器人视觉伺服自抗扰控制方法研究[J].煤炭工程,2022,54(S01):143-147. 被引量：3
2朱子祺,李创业,代伟.基于G-RRT^(*)算法的煤矸石分拣机器人路径规划[J].工矿自动化,2022,48(3):55-62. 被引量：11
3翟敬梅,黄乐.机器人无序分拣技术研究[J].包装工程,2022,43(8):66-75. 被引量：3
4董楠.基于激光扫描的物流自动分拣入库控制系统设计[J].自动化与仪器仪表,2022(6):127-131. 被引量：2
5陈皓炜,贾新春,孙小明,侯鹏飞.SCR脱硝系统的强化学习复合串级控制[J].动力工程学报,2022,42(5):421-428. 被引量：9
6王凯.论域自适应变化的不确定机械臂模糊补偿控制[J].组合机床与自动化加工技术,2023(2):86-89.
7李浩,文彪,左学海,祝莉娜.煤矸石分拣机械手的系统设计及实验模拟[J].煤,2023,32(4):21-23.
8张洁.基于关节位置约束的仓储运输机械臂分拣控制[J].自动化与仪表,2023,38(11):109-114.
9张震男,武牡丹.露天煤矿智能化建设现状及方案[J].露天采矿技术,2024,39(2):34-37.
10高琳,梁朝辉,董红娟,于鹏伟,张志远.煤矸石智能分拣机器人运动规划技术的研究进展[J].科学技术与工程,2024,24(16):6567-6575.

二级引证文献28

1张袁浩,潘祥生,陈晓晶,霍振龙,任书文,季亮.智能选矸机器人关键技术研究[J].工矿自动化,2022,48(6):69-76. 被引量：16
2姜家国,郭曼利,卢干.基于PLC的选择性催化还原脱硝系统PID控制[J].仪器仪表用户,2022,29(8):97-99. 被引量：1
3黄金凤,张建喜,于江涛,苗术佶.并联式选矸机器人路径规划研究[J].工矿自动化,2022,48(8):26-32. 被引量：3
4张烨,马宏伟,王鹏,曹现刚,魏小荣,周文剑.煤矸石智能分拣机器人研究进展与关键技术[J].工矿自动化,2022,48(12):42-48. 被引量：7
5王永林,白永峰,孔祥山,郝正,杨彭飞,孔德伟.基于CNN-LSTM算法的脱硝优化控制模型研究[J].综合智慧能源,2023,45(6):25-33. 被引量：5
6董祺成,徐志刚,王军义,杨明毅,位亚强,张家川.基于RRT^(*)的弹药装填双机器人路径规划[J].组合机床与自动化加工技术,2023(6):39-43.
7许子明,姜浩,赵文杰.基于IHHO-LSTM的SCR脱硝反应器出口NO_(x)浓度预测[J].电力科学与工程,2023,39(8):71-78. 被引量：4
8孙永芝.基于RFID技术的图书馆图书自动分拣方法[J].信息与电脑,2023,35(11):77-79.
9杨超杰,刘长良,王梓齐,韩超.SCR脱硝系统的改进线性自抗扰优化控制研究[J].动力工程学报,2023,43(7):893-900. 被引量：1
10刘爽.基于机器视觉的物流系统智能化发展研究[J].物流科技,2023,46(21):44-46. 被引量：2

1张敏.治疗糖尿病的重要手段——运动锻炼[J].家庭生活指南（下旬刊）,2020(4):116-116.
2王鹏,曹现刚,马宏伟,吴旭东,夏晶.基于余弦定理-PID的煤矸石分拣机器人动态目标稳准抓取算法[J].煤炭学报,2020,45(12):4240-4247. 被引量：19
3车健生.PLC教学中组态软件编程模拟梯形图方法探析[J].数字技术与应用,2020,38(12):16-19. 被引量：2
4高远,陈玉春,史新兴.深冷组合发动机吸气模态最大状态控制规律研究[J].推进技术,2020,41(12):2659-2669. 被引量：4
5萧倩雯,邓昌荣,王泽韵,郑淑梅,梁颖欣,余晓,徐国良.改良Tullgren干漏斗分离土壤动物的效果探讨[J].生物学通报,2020,55(10):51-54. 被引量：1
6蒋鹏飞,刘延鹤,周建波,傅万四,张彬,常飞虎.林业野外作业机器人技术发展研究[J].林业和草原机械,2020,1(3):20-27. 被引量：6
7秦馨,赵剑道,任楠.基于聚类算法的订单分批策略研究[J].制造业自动化,2021,43(1):134-137. 被引量：8
8廖斌,陈善群.活塞式造波池中箱式浮体运动的数值研究[J].安徽工程大学学报,2020,35(6):41-47.
9高昂,董志明,李亮,宋敬华,段莉.MADDPG算法并行优先经验回放机制[J].系统工程与电子技术,2021,43(2):420-433. 被引量：9
10李蹬珺.空投航行体入水弹道建模与控制策略研究[J].数字海洋与水下攻防,2020,3(5):431-436. 被引量：1

工矿自动化

2021年第1期

浏览历史

内容加载中请稍等...

基于强化学习的煤矸石分拣机械臂智能控制算法研究被引量：10

参考文献6

二级参考文献71

共引文献147

同被引文献126

引证文献10

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于强化学习的煤矸石分拣机械臂智能控制算法研究 被引量：10

参考文献6

二级参考文献71

共引文献147

同被引文献126

引证文献10

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于强化学习的煤矸石分拣机械臂智能控制算法研究被引量：10