基于强化学习的机械臂避碰研究被引量：1

Reinforcement learning based obstacle avoidance for robotic manipulator

下载PDF

导出

摘要将强化学习引入机械臂的避碰问题研究,建立了平面三自由度机械臂的多Agent避碰系统,系统结合了最近障碍物信息和偏差角信息来产生控制指令。采用基于K-均值聚类的强化学习方法作为基本的控制策略,给出了系统算法的具体实施过程。通过仿真试验,证明了基于聚类划分的强化学习方法在机械臂避碰问题中的可行性和有效性。 This paper reports on the obstacle avoidance problem for robotic manipulators.The reinforcement learning（RL） method was applied to obstacle avoidance problem and a multi-agent system was built.According the real-time demand of manipulator control, the Sarsa（A） algorithm, which was combined with K-means clustering algorithm, has been selected for its on-policy feature and efficiency. The implement process of the algorithm was given and in the end of this paper, a simulation experiment with different environment was done, the result showed the RL method＇s feasibility and availability.

作者张尚炜李世其

机构地区华中科技大学机械科学与工程学院

出处《机械设计与制造》北大核心 2007年第8期140-142,共3页 Machinery Design & Manufacture

基金国家民用航天科研专项计划(科工技[20041530)

关键词强化学习避碰 AGENT K-均值聚类 Reinforcement learning Obstacle avoidance Agent K-means clustering

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1O.Khatib.Real-time obstacle avoidance for anipulators and mobile robots[J].Robotics,1986,5(1):90-98.
2庄慧忠,杜树新,吴铁军.机器人路径规划及相关算法研究[J].科技通报,2004,20(3):210-215. 被引量：36
3K.Altlioefer,L.D.Seneviratnc.Fuzzy Navigation for Robotic Manipulators[J].International Journal of Uncertainty,Fuzziness and Knowledge-based System,1998,6(2):179-188.
4R S Sutton,A G Barto.Reinforcement Learning:An Introduction[M].Massachusetts:The MIT Press,1998.
5高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004,30(1):86-100. 被引量：269

二级参考文献40

1Barraquand J,Langlois B,Latombe J C.Numerical potential field techniques for robot path planning [J].IEEE Trans on Systems,Man and Cybernetics,1992,22(2):224-241.
2Kondo K.Motion planning with six degrees of freedom by multi-strategic bi-directional heuristic free-space enumeration [J].IEEE Trans on Robotics and Automation,1991,7(3):267-277.
3Gupta K K.Fast collision avoidance for manipulator arm:a sequential search strategy [J].IEEE Trans on Robotics and Automation,1990,6(5):522-532.
4Gupta K,K,Guo Z P.Motion planning for many degrees of freedom:sequential search with backtracking [J].IEEE Trans on Robotics and Automation,1995,11(6):897-906.
5Kavraki L E,Svestka P,Latombe J C,et al.Probabilistic roadmaps for path planning in high-dimensional configuration spaces [J].IEEE Trans on Robotics and Automation,1996,12(4):566-580.
6Lozano-Perez T.Automatic planning of manipulator transfer movement [J].IEEE Trans on Systems,Man and Cybernetics,1981,11(10):681-698.
7Lozano-Perez T.Spatial planning:A configuration space approach [J].IEEE Trans on Computers,1983,32(2):108-120.
8Zhu D,Latombe J C.New heuristic for efficient hierarchical path planning [J].IEEE Trans.on Robotics and Automation,Feb 1991,7:9-20.
9Schwartz J T,Sharir M.On the 'piano movers' problem-I:The case of a two-dimensional rigid polygonal body moving amidst polygonal barriers [J].Comm Pure Applied Math,1983,36:345-398.
10Schwartz J T,Sharir M.On the 'piano movers' problem-II:General techniques for computing topological properties of real algebraic manifolds [J].Advances in Applied Mathematics,1983,4:298-351.

共引文献303

1项宇,秦进,袁琳琳.结合向前状态预测和隐空间约束的强化学习表示算法[J].计算机系统应用,2022,31(11):148-156. 被引量：4
2安萌萌,樊秀梅,蔡含宇.基于雾计算和强化学习的交通灯智能协同控制研究[J].计算机应用研究,2020,37(2):465-469. 被引量：8
3丁志梁,潘毅群(指导),谢建彤,王尉同,黄治钟.强化学习算法在空调系统运行优化中的应用研究[J].建筑节能,2020(7):14-20. 被引量：7
4王彦朋,郭佳佳,王晓君.基于Q-Learning的青霉素发酵过程控制方法[J].信息化研究,2023,49(3):31-35.
5马庆刘,喻鹏,吴佳慧,熊翱,颜拥.基于深度强化学习的综合能源业务通道优化机制[J].北京邮电大学学报,2020,43(2):87-93. 被引量：1
6赵元,张合新.基于目标状态距离简化Q-learning算法的迷宫路径规划[J].火箭军工程大学学报,2019(4):79-84.
7张智,朱齐丹,刘海.蒸汽发生器检修用六轴机械臂无碰撞路径规划研究[J].弹箭与制导学报,2006,26(S1):260-264.
8周济,陈锋.基于强化神经网络的区域协调控制研究[J].电子技术（上海）,2010(9):20-22.
9刘春阳,程亿强,柳长安.基于改进势场法的移动机器人避障路径规划[J].东南大学学报（自然科学版）,2009,39(S1):116-120. 被引量：11
10高庆吉,于咏生,胡丹丹.基于改进A*算法的可行性路径搜索及优化[J].中国民航学院学报,2005,23(4):42-45. 被引量：15

同被引文献1

1王良勇,柴天佑.带有神经网络补偿的机械手PD控制[J].中国电机工程学报,2009,29(12):110-115. 被引量：20

引证文献1

1刘卫朋,邢关生,陈海永,孙鹤旭.基于增强学习的机械臂轨迹跟踪控制[J].计算机集成制造系统,2018,24(8):1996-2004. 被引量：20

二级引证文献20

1车众元,王景瑞,吴雪松.基于混合插值的机械臂运动轨迹跟踪控制方法[J].科技通报,2020(10):46-51. 被引量：7
2晋帅,李煊鹏,何嘉颖,李纾昶,周敬淞.基于强化学习的两轮模型车控制仿真分析[J].测控技术,2019,38(12):115-121. 被引量：3
3眭东亮,解仑,李连鹏,汪世鹏,王志良.一种冗余机械臂的耦合规划控制算法[J].计算机集成制造系统,2019,25(12):3226-3234. 被引量：2
4贺晓莹,高兴宇,王海舰,彭艳华,李煜.七自由度双臂协作机器人操作稳定性分析[J].工程设计学报,2019,26(6):706-713. 被引量：4
5于府平.基于Android的机械臂实时位姿数据采集系统设计[J].电子设计工程,2020,28(19):12-16.
6李小华,杨瑞芳,刘辉,何帅.一类机械臂系统自适应有限时间有界H_(∞)跟踪控制[J].控制理论与应用,2021,38(1):147-156. 被引量：14
7周煜.基于边缘轮廓特征的健身操手臂动作弧度轨迹定位研究[J].自动化与仪器仪表,2021(1):161-163.
8赵丽丽.基于深度学习的混联机械臂轨迹运动容错算法研究[J].机床与液压,2021,49(3):35-40. 被引量：2
9张帅,李世其,王海鹏,熊友军.双臂冗余机器人主动自避碰控制策略研究[J].华中科技大学学报（自然科学版）,2021,49(3):1-5. 被引量：2
10薛卫萍,熊俊,姚志文.机械臂数控加工过程动力学控制仿真[J].计算机仿真,2021,38(5):287-291. 被引量：7

1蔡成涛,朱齐丹.基于模糊控制器的移动机器人路径规划仿真[J].计算机仿真,2008,25(3):182-185. 被引量：22
2温素芳,朱齐丹,张小仿.基于模糊控制器的移动机器人路径规划仿真[J].应用科技,2005,32(4):31-33. 被引量：14
3张志斌,石志寒,郭桂治.一种六自由度机械臂避障算法研究[J].微计算机信息,2008,24(29):230-231.
4欧锦军,朱枫.一种多移动机器人避碰规划方法[J].机器人,2000,22(6):474-481. 被引量：12
5张广立,付莹,杨汝清.一种新型平面三自由度冗余度并联机器人的运动学分析[J].机械设计与研究,2002,18(5):19-21. 被引量：6
6胡毅,余跃庆.平面三自由度欠驱动机器人轨迹跟踪控制[J].组合机床与自动化加工技术,2012(12):82-84. 被引量：2
7孙亮.AGVS中避碰问题的研究现状与发展趋势[J].物流技术,2005,24(3):25-27. 被引量：4
8容芷君,张煜.港口自动导引小车的优化调度研究[J].湖北工业大学学报,2005,20(3):106-108. 被引量：6
9刘鑫.一种双天线组合导航系统基线偏差角的测量方法[J].黑龙江大学自然科学学报,2015,32(4):550-554.
10方跃法,黄真.平面三自由度机器人的有限灵活工作空间研究[J].东北重型机械学院学报,1997,21(3):196-200. 被引量：3

机械设计与制造

2007年第8期

浏览历史

内容加载中请稍等...

基于强化学习的机械臂避碰研究被引量：1

参考文献5

二级参考文献40

共引文献303

同被引文献1

引证文献1

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于强化学习的机械臂避碰研究 被引量：1

参考文献5

二级参考文献40

共引文献303

同被引文献1

引证文献1

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于强化学习的机械臂避碰研究被引量：1