自适应轨迹任务模仿的模仿学习方法研究被引量：2

Research on Imitation Learning Method of Self-adaptive Trajectory Task Imitation

下载PDF

导出

摘要机器人模仿的学习方法在行为运动的模仿上受到示教速度的限制,导致机器人模仿的速度也受到限制,无法更好发挥机器人的性能。为了提高机器人行为模仿的快速性,提出了一种自适应改变机器人模仿学习运动速度的方法。首先通过基于动态系统的方法建模示教运动,并将动态系统稳定的充分条件作为约束,确保行为模仿的稳定性。其次构造了一个随机器人状态到目标点的距离而变化的非线性函数,将非线性函数作为参数与系统模型结合,以便自适应地调整模仿的速度。最后给出了4种模仿学习评价的方法来评价模仿的性能。实验结果表明,提出的方法在保证机器人运动模仿的稳定性前提下很好地提高了行为模仿的速度。 The imitation learning method of robot is restricted by the speed of demonstrator,which limits the speed of the robot’s imitation,and cannot give full play to the performance of the robot.To improve the rapidity of robot behavioral imitation,a method for adaptively changing the speed of robot imitation learning movement is proposed.Firstly,the demonstration movement is modeled by the method based on dynamical system,and the sufficient condition of dynamical system stability is taken as a constraint to ensure the stability of behavioral imitation.Secondly,a nonlinear function which varies with the distance from the current state of the robot to the target point is constructed.The nonlinear function is used as a parameter to combine with the system model to adaptive adjust the speed of behavioral imitation.Finally,four methods of imitation learning evaluation are given to evaluate the performance of imitation.The experimental results show that the proposed method improves the speed of behavioral imitation under the premise of maintaining the stability of robot behavioral imitation.

作者于建均姚红柯左国玉阮晓钢 YU Jian-jun;YAO Hong-ke;ZUO Guo-yu;RUAN Xiao-gang(Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China;Beijing Key Laboratory of Computational Intelligence and Intelligent System,Beijing University of Technology,Beijing 100124,China)

机构地区北京工业大学信息学部北京工业大学计算智能与智能系统北京市重点实验室

出处《控制工程》 CSCD 北大核心 2021年第2期266-274,共9页 Control Engineering of China

基金国家自然科学基金项目(61773027) 北京市教育委员会科技计划重点项目(KZ201610005010)。

关键词机器人模仿学习动态系统非线性函数性能评价 Robot imitation learning dynamical system nonlinear function performance evaluation

分类号 TP242.6 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献4

1于建均,徐骢驰,阮晓钢,门玉森.基于神经网络的机械臂的模仿学习研究[J].控制工程,2017,24(11):2368-2373. 被引量：4
2于建均,姚红柯,左国玉,阮晓钢,安硕.基于动态系统的机器人模仿学习方法研究[J].智能系统学报,2019,14(5):1026-1034. 被引量：4
3于建均,郑逸加,阮晓钢,赵少琼.基于高斯混合模型的轨迹模仿学习表征参数优化[J].北京工业大学学报,2017,43(5):719-728. 被引量：3
4杨俊友,马乐,白殿春,东俊光.机器人模仿学习的非接触观测控制图模型[J].机器人,2014,36(3):309-315. 被引量：4

二级参考文献39

1王源,陈亚军.基于高斯混合模型的EM学习算法[J].山西师范大学学报（自然科学版）,2005,19(1):46-49. 被引量：18
2岳佳,王士同.高斯混合模型聚类中EM算法及初始化的研究[J].微计算机信息,2006,22(11X):244-246. 被引量：51
3Schaal S, Atkeson C G. Learning control in robotics[J]. IEEE Robotics and Automation Magazine, 2010, 17(2): 20-29.
4Grae K, Stiikler J, Behnke S. Improving imitated grasping mo- tions through interactive expected deviation learning[C]//2010 IEEE-RAS International Conference on Humanoid Robots. Pis- cataway, USA: IEEE, 2010: 397-404.
5Minato T, Thomas D, Yoshikawa Y, et al. A model of the emer- gence of early imitation development based on predictability preference[C]//IEEE International Conference on Development and Learning. Piscataway, USA: IEEE, 2010: 19-25.
6Vijayakumar S, D' Souza A, Schaal S. Incremental online learn- ing in high dimensions[J]. Neural Computation, 2005, 17(2): 2602-2634.
7Schaal S. Is imitation learning the route to humanoid robots[J]. Trends in Cognitive Sciences, 1999, 3(6): 233-242.
8Calinon S, D'Halluin F, Sauser E L, et al. Learning and re- production of gestures by imitation-an approach based on hid- den Markov model and Gaussian mixture regression[J]. IEEE Robotics and Automation Magazine, 2010, 17(2): 44-54.
9Poggio T, Bizzi E. Generalization in vision and motor con- trol[J]. Nature, 2004, 431(7010): 768-774.
10Nguyen K C, Perdereau V. Arm-hand movement: Imitation of human natural gestures with tenodesis effect[C]//IEEE/RSJ In- ternational Conference on Intelligent Robots and Systems. Pis- cataway, USA: IEEE, 2011: 1459-1464.

共引文献11

1余乐,李庆,郑力新,朱建清.六自由度机械臂运动轨迹自动生成方法仿真与实现[J].华侨大学学报（自然科学版）,2018,39(3):355-359. 被引量：10
2韩丽丽,王奇志,杨永刚.机械臂抓取行为规划研究综述[J].计算机与现代化,2018(9):11-16. 被引量：6
3于建均,门玉森,阮晓钢,徐骢驰.在书写任务中的基于轨迹匹配的模仿学习[J].北京工业大学学报,2016,42(8):1144-1152. 被引量：4
4陈静,林雅婷,周清旭,江灏.基于峰值匹配分布式估计算法的光纤布拉格光栅传感网络重叠光谱的波长解调[J].光子学报,2019,48(4):79-86. 被引量：20
5于建均,姚红柯,左国玉,阮晓钢,安硕.基于动态系统的机器人模仿学习方法研究[J].智能系统学报,2019,14(5):1026-1034. 被引量：4
6江灏,周清旭,陈静,缪希仁.畸变光谱下光纤布拉格光栅传感网络波长检测优化方法[J].光学学报,2019,39(10):84-93. 被引量：19
7叶子涵,陈俊洪,杨振国,刘文印.基于视觉和动态运动基元的机械臂抓取轨迹规划[J].机器人技术与应用,2020(3):31-36. 被引量：2
8刘冬,于洪华,丛明,王子途.基于情景记忆和元学习的机器人运动技能获取[J].华中科技大学学报（自然科学版）,2021,49(12):57-63. 被引量：2
9王可,张辉,曹意宏,易俊飞,袁小芳,王耀南.面向医药生产的智能机器人及其关键技术研究综述[J].计算机集成制造系统,2022,28(7):1981-1995. 被引量：2
10张秋菊,吕青.机器人多模态智能操作技术研究综述[J].计算机科学与探索,2023,17(4):792-809. 被引量：3

同被引文献25

1范本正.嵌入式舰船智能巡检机器人优化控制[J].舰船科学技术,2019,41(24):217-219. 被引量：2
2彭盖伦,彭道刚,张浩,夏飞.基于Faster R-CNN和模糊PID的巡检机器人云台控制研究[J].微电子学与计算机,2019,36(3):61-65. 被引量：15
3周自强,纪扬,苏烨,蔡钧宇.基于迁移学习卷积神经网络的电缆隧道锈蚀识别算法[J].中国电力,2019,52(4):104-110. 被引量：13
4刘明春,张葛祥,黄占鳌,鲜开义,黄志伟.基于深度学习的变电站巡检机器人道路场景识别[J].科学技术与工程,2019,19(13):158-163. 被引量：17
5熊勋,陈新度,吴磊,林旭华.基于卷积记忆神经网络的数字表盘读数识别[J].组合机床与自动化加工技术,2019(7):72-75. 被引量：8
6王凯丰,王忠强,谢丽蓉,杨欢.高压电力廊道巡检机器人控制系统研究[J].电子技术应用,2019,45(8):87-90. 被引量：9
7黄小琴,陈力.基座、臂杆全弹性空间机器人的递归CMACNN控制[J].系统仿真学报,2019,31(9):1899-1906. 被引量：1
8王建邦,袁智勇,陈波,陈浩敏,杨占杰,任超.变电站巡检机器人数据驱动无模型自适应控制[J].电测与仪表,2019,56(19):114-120. 被引量：28
9魏源鑫.基于神经网络的双臂机器人路径规划算法[J].新一代信息技术,2019,2(19):43-48. 被引量：4
10吴厚波,孟志军,刘卉,陈竞平.基于行为的农田巡查机器人自主行走控制方法[J].江苏农业科学,2020,48(1):200-205. 被引量：8

引证文献2

1胡平,林雪华,张冉.基于Transformer网络的双臂机器人模仿学习方法[J].信息与电脑,2021,33(6):33-35.
2徐波,刘凯.机器人神经网络自适应控制下的新能源电力场站巡检技术[J].能源与环保,2022,44(12):209-214.

1周艳聪,黎屹杰,张波,胡德计.基于Maya的智能制造仿真系统研究[J].科学技术创新,2020(21):79-80. 被引量：2
2张莉,肖冉.一个新的非线性系统的隐藏动力学分析[J].河北师范大学学报（自然科学版）,2021,45(2):142-152. 被引量：2
3滕云.优化教学行为,教师善教善导[J].教育界,2021(2):71-72.
4吴雪玲.教师价值取向对高校体育课程决策的影响:个案比较研究[J].福建体育科技,2021,40(1):88-92.

控制工程

2021年第2期

浏览历史

内容加载中请稍等...

自适应轨迹任务模仿的模仿学习方法研究被引量：2

参考文献4

二级参考文献39

共引文献11

同被引文献25

引证文献2

相关作者

相关机构

相关主题

浏览历史

自适应轨迹任务模仿的模仿学习方法研究 被引量：2

参考文献4

二级参考文献39

共引文献11

同被引文献25

引证文献2

相关作者

相关机构

相关主题

浏览历史

自适应轨迹任务模仿的模仿学习方法研究被引量：2