基于增强学习的机械臂轨迹跟踪控制被引量：19

Robotic trajectory tracking control method based on reinforcement learning

下载PDF

导出

摘要为了提高机器臂轨迹跟踪控制器的工作性能,提出基于增强学习的机械臂轨迹跟踪控制方法。介绍了增强学习的基本原理,提出基于SARSA算法的增强学习补偿控制策略。利用比例—微分(PD)控制器完成了基本的稳定任务后,再利用增强学习算法实现了对未知干扰因素的补偿,提升了对不同未知情况的适应能力。实验结果验证了自适应离散化增强学习方法在机械臂轨迹跟踪问题中的可行性和有效性,明显提高了控制器的学习速度。 To improve the working performance of robotic trajectory tracking controller,the robotic trajectory tracking control method based on reinforcement learning was proposed.The basic principle of reinforcement learning was introduced,and then the robot trajectory tracking control strategy based on SARSA was proposed.By using the reinforcement learning,the unknown disturbance factors were compensated and the adaptability to the unknown was improved after the PD control method was applied.The experimental results verified the feasibility and effectiveness of the reinforcement learning method in the trajectory tracking problem of robot arms,and the learning speed of the controller was enhanced.

作者刘卫朋邢关生陈海永孙鹤旭 LIU Weipeng;XING Guansheng;CHEN Haiyong;SUN Hexu(School of Control Science and Engineering,Hebei University of Technology,Tianjin 300130,China;School of Automation and Electronic Engineering,Qingdao University of Science and Technology,Qingdao 266042,China)

机构地区河北工业大学控制科学与工程学院青岛科技大学自动化与电子工程学院

出处《计算机集成制造系统》 EI CSCD 北大核心 2018年第8期1996-2004,共9页 Computer Integrated Manufacturing Systems

基金河北省科技计划资助项目(17211804D) 天津市教委科研计划资助项目(20140728) 河北省自然科学基金资助项目(F2018202078) 河北省首批青年拔尖人才支持计划资助项目(210003) 天津市自然科学基金资助项目(16JCQNJC04200)~~

关键词机器人增强学习轨迹跟踪比例-微分控制器前馈神经网络 robot reinforcement learning trajectory tracking PD controller feedforward neural network

分类号 TP242.2 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1张尚炜,李世其.基于强化学习的机械臂避碰研究[J].机械设计与制造,2007(8):140-142. 被引量：1
2王良勇,柴天佑.带有神经网络补偿的机械手PD控制[J].中国电机工程学报,2009,29(12):110-115. 被引量：20

二级参考文献24

1Dixon W E, Zerqeroqlu E, Dawson D M. Global robust output feedback tracking control of robot manipulators[J]. Robotica, 2004, 22(4): 351-357.
2Reyesa F, Kelly R. Experimental evaluation of model,based controllers on a direct drive robot arm[J]. Mechatronics, 2001, 11(3): 267-282.
3Wai R J, Chen P C. Robust neural- fuzzy-network control for robot manipulator including actuator dynamics[J]. IEEE Transactions on Industry Electronics, 2006, 53(4): 1328-1349.
4Ren Xuemei, Rad A B, Lewis F L. Neural network-based compensation control of robot manipulators with unknown dynamics[C]. The American Control Conference, New York, USA, 2007.
5Lewis F L, Yesildirek A, Liu K. Multilayer neural-net robot controller with guaranteed tracking performance[J]. IEEE Transactions on Neural Networks, 1996, 7(2): 388-399.
6Ge S S, Hang C C, Woon L C. Adaptive neural network control of robot manipulators in task space[J]. IEEE Transactions on Industrial Electronics, 1997, 44(6): 746-752.
7Purwar S, Kar I N, Jha A N. Neuro sliding mode control of robotic manipulator[C]. IEEE Conference on Robotics, Automation and Mechatronics, Singapore, 2004.
8Sun Fuchun, Sun Zengqi, Zhang R J, et al. Neural adaptive tracking controller for robot manipulators with unknown dynamics[J], IEE Proceedings-Control Theory and Applications, 2000, 147(3): 366-370.
9Sun Fuchun, Li Hanxiong, Li Lei. Robot discrete adaptive control based on dynamic inversion using dynamical neural networks[J]. Automatica, 2002, 38(11): 1977-1983.
10Jung S, Kim S S. Hardware implementation of a real-time neural network controller with a DSP and an FPGA for nonlinear systems [J]. IEEE Transactions on Industrial Electronics, 2007, 54(1): 265-271.

共引文献19

1董立红.基于模糊补偿的机械手鲁棒自适应模糊控制研究[J].计算机工程与科学,2012,34(1):169-173. 被引量：11
2廖春,杨来科.港澳制度效率比较研究[J].世界经济与政治论坛,2000(2):57-60. 被引量：1
3王良勇,杨枭.带有前馈和神经网络补偿的机械手系统轨迹跟踪控制[J].电机与控制学报,2013,17(8):113-118. 被引量：26
4梁伟平,王佳荣.机械手轨迹跟踪精度控制仿真研究[J].计算机仿真,2015,32(10):314-317. 被引量：3
5罗天洪,马翔宇,刘淼,徐向阳,陈才.基于神经元时空整合能力的重载精密机械手传递模式[J].计算机集成制造系统,2015,21(11):2964-2971. 被引量：2
6陈罡,周奇才,吴菁,严楠.七自由度机械臂的ADAMS/MATLAB联合仿真研究[J].系统仿真学报,2017,29(1):99-106. 被引量：21
7马翔宇,李阿为,刘冠云.基于躯体反射的焊接机械手位姿路径规划[J].西安航空学院学报,2017,35(1):29-33. 被引量：1
8徐泽祥.基于最小二乘法的机械手偏移距离预测[J].科技广场,2016(12):28-30.
9毛润,高宏力,宋兴国.基于模糊补偿的RBF神经网络机械手控制[J].西南交通大学学报,2018,53(3):638-645. 被引量：10
10嵇道扬,马晨波,孙见君,牛韬.基于神经网络的机械手轨迹跟踪控制器优化设计[J].组合机床与自动化加工技术,2020(8):79-82. 被引量：5

同被引文献190

1闫冬,陈盛,彭国政,谈元鹏,张玉天,吴凯.基于层次深度强化学习的带电作业机械臂控制技术[J].高电压技术,2020,46(2):459-471. 被引量：17
2郭纯,王江,乔国栋.自主汽车的侧向H_∞自适应变论域模糊控制[J].控制理论与应用,2005,22(6):905-912. 被引量：4
3文生平,赵国平,蔡康雄.一种变论域模糊控制自适应算法[J].控制理论与应用,2009,26(3):265-268. 被引量：26
4李洪兴.模糊控制的插值机理[J].中国科学（E辑）,1998,28(3):259-267. 被引量：252
5龙祖强,许岳兵,杨利容,刘灿.MATLAB环境下变论域模糊控制算法的仿真方法[J].衡阳师范学院学报,2009,30(6):34-36. 被引量：6
6史先鹏,刘士荣.机械臂轨迹跟踪控制研究进展[J].控制工程,2011,18(1):116-122. 被引量：51
7席雷平,何辉,董海瑞.机械臂轨迹跟踪滑模控制中的抖振抑制法研究[J].计算机仿真,2012,29(5):188-191. 被引量：9
8龙祖强,梁昔明,阎纲.变论域模糊控制器的万能逼近性及其逼近条件[J].中南大学学报（自然科学版）,2012,43(8):3046-3052. 被引量：3
9梁捷,陈力,梁频.柔性臂空间机器人的神经网络自适应控制及振动模态分级模糊控制[J].计算机集成制造系统,2012,18(9):1930-1937. 被引量：8
10崔泽,韩增军.基于自运动的仿人七自由度机械臂逆解算法[J].上海大学学报（自然科学版）,2012,18(6):589-595. 被引量：13

引证文献19

1车众元,王景瑞,吴雪松.基于混合插值的机械臂运动轨迹跟踪控制方法[J].科技通报,2020(10):46-51. 被引量：7
2晋帅,李煊鹏,何嘉颖,李纾昶,周敬淞.基于强化学习的两轮模型车控制仿真分析[J].测控技术,2019,38(12):115-121. 被引量：3
3眭东亮,解仑,李连鹏,汪世鹏,王志良.一种冗余机械臂的耦合规划控制算法[J].计算机集成制造系统,2019,25(12):3226-3234. 被引量：2
4贺晓莹,高兴宇,王海舰,彭艳华,李煜.七自由度双臂协作机器人操作稳定性分析[J].工程设计学报,2019,26(6):706-713. 被引量：4
5于府平.基于Android的机械臂实时位姿数据采集系统设计[J].电子设计工程,2020,28(19):12-16.
6李小华,杨瑞芳,刘辉,何帅.一类机械臂系统自适应有限时间有界H_(∞)跟踪控制[J].控制理论与应用,2021,38(1):147-156. 被引量：13
7周煜.基于边缘轮廓特征的健身操手臂动作弧度轨迹定位研究[J].自动化与仪器仪表,2021(1):161-163.
8赵丽丽.基于深度学习的混联机械臂轨迹运动容错算法研究[J].机床与液压,2021,49(3):35-40. 被引量：2
9张帅,李世其,王海鹏,熊友军.双臂冗余机器人主动自避碰控制策略研究[J].华中科技大学学报（自然科学版）,2021,49(3):1-5. 被引量：2
10薛卫萍,熊俊,姚志文.机械臂数控加工过程动力学控制仿真[J].计算机仿真,2021,38(5):287-291. 被引量：7

二级引证文献61

1马惠雯,杨帆,孙晓晋.基于扩张状态观测器的机械臂滑模控制[J].天津城建大学学报,2022,28(6):455-459.
2汪世鹏,解仑,李连鹏,孟盛,王志良.基于EtherCAT总线的七自由度机械臂的隐蔽攻击技术[J].工程科学学报,2020,42(12):1653-1663. 被引量：3
3梁晨,刘小雄,张兴旺,黄剑雄.基于强化学习的四旋翼无人机控制律设计[J].计算机测量与控制,2021,29(2):71-75. 被引量：6
4韩霖骁,胡剑波,宋仕元,王应洋,贺子厚,张鹏.基于Policy Gradient的机械臂运动跟踪控制器参数整定[J].系统工程与电子技术,2021,43(9):2605-2611. 被引量：3
5耿林,杨茜.基于力矩前馈的体育机械驱动力控制方法研究[J].自动化与仪器仪表,2021(8):143-146.
6胡淼,韩江桂,郭文勇.船用水下机械臂载体结构设计及稳定性分析[J].兵器装备工程学报,2021,42(10):254-260. 被引量：4
7李淑红.机械数控加工技术中存在的问题及对策[J].造纸装备及材料,2021,50(6):94-96. 被引量：1
8王刚,李小华.柔性关节机械臂的自抗扰预设定有限时间跟踪控制[J].辽宁科技大学学报,2021,44(5):363-370. 被引量：2
9杨伊,李小华,杨瑞芳.机械臂系统快速有限时间有界H_(∞)量化跟踪控制[J].安徽大学学报（自然科学版）,2022,46(2):61-71. 被引量：4
10马光明,王世博,葛世荣,邹文才.基于联立约束法的液压支架动力学建模[J].计算机仿真,2022,39(3):308-314. 被引量：1

1丁幼春,杨军强,舒彩霞,何志博,彭靖叶,夏中州,周雅文.油菜直播机组自动对厢作业控制器设计与试验[J].华中农业大学学报,2018,37(1):101-107. 被引量：5
2陈征,刘亚辉,杨芳.基于进化-增强学习方法的插电式混合动力公交车能量管理策略[J].机械工程学报,2017,53(16):86-93. 被引量：10
3王东晓.分数阶超混沌Bao系统的比例积分滑模同步[J].内蒙古农业大学学报（自然科学版）,2018,39(3):83-89. 被引量：28
4贾家宏.语文教学中学生主动参与学习的有效策略[J].青少年日记（教育教学研究）,2018,0(5):138-138.
5肖玥,封焯文.一种含非线性负载的孤岛微电网补偿控制策略[J].电气应用,2018,37(15):44-49. 被引量：2
6贝旭颖,平雪良,高文研.纵向打滑状态下轮式移动机器人轨迹跟踪控制[J].中国机械工程,2018,29(16):1958-1964. 被引量：15
7刘江.翁鼎:追踪仿生科学前沿[J].科学中国人,2018,0(9):56-57.
8费盼峰,张军辉.集中供热换热站实时热负荷智能调节研究与应用[J].内燃机与配件,2017(23):145-147. 被引量：2
9姜莹.全方位移动康复机器人重心偏移时的轨迹跟踪控制[J].电子测试,2018,29(8):5-7.
10张勇,陈增强,张兴会,孙明玮,孙青林.四旋翼无人机系统PD-ADRC串级控制[J].系统工程与电子技术,2018,40(9):2055-2061. 被引量：13

计算机集成制造系统

2018年第8期

浏览历史

内容加载中请稍等...

基于增强学习的机械臂轨迹跟踪控制被引量：19

参考文献2

二级参考文献24

共引文献19

同被引文献190

引证文献19

二级引证文献61

相关作者

相关机构

相关主题

浏览历史

基于增强学习的机械臂轨迹跟踪控制 被引量：19

参考文献2

二级参考文献24

共引文献19

同被引文献190

引证文献19

二级引证文献61

相关作者

相关机构

相关主题

浏览历史

基于增强学习的机械臂轨迹跟踪控制被引量：19