未知环境下基于有先验知识的滚动Q学习机器人路径规划被引量：11

Path planning of robot for unknown environment based on prior knowledge rolling Q-learning

导出

摘要提出一种未知环境下基于有先验知识的滚动Q学习机器人路径规划算法.该算法在对Q值初始化时加入对环境的先验知识作为搜索启发信息,以避免学习初期的盲目性,可以提高收敛速度.同时,以滚动学习的方法解决大规模环境下机器人视野域范围有限以及因Q学习的状态空间增大而产生的维数灾难等问题.仿真实验结果表明,应用该算法,机器人可在复杂的未知环境中快速地规划出一条从起点到终点的优化避障路径,效果令人满意. A path planning of rolling Q-learning algorithm based on the prior knowledge in the unknown environment is proposed. The prior knowledge about the environment is added as heuristic information of Q learning to initialize the Q value, so as to avoid the blindness of early-stage learning and improve rate of convergence. Besides, the method of rolling learning is used for solving the problems of limited visual domain of the robot as well as dimensionality disaster caused by the increase in state space of Q-learning in a large scale environment. The simulation results show that, the robot can not only avoid collision safely, but also find out an optimal path by using the algorithm in the unknown environment, and the results obtained are satisfactory.

作者胡俊朱庆保

机构地区南京师范大学计算机科学与技术学院江苏省信息安全保密技术工程研究中心

出处《控制与决策》 EI CSCD 北大核心 2010年第9期1364-1368,共5页 Control and Decision

基金国家自然科学基金项目(60673102) 江苏省自然科学基金项目(BK2006218)

关键词滚动路径规划移动机器人先验知识 Q学习未知环境 Rolling path planning Mobile robot Prior knowledge Q-learning Unknown environment

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献13

1Ahuh D J, Park J H. Path planning and navigation for autonomous mobile robot[C]. IEEE 28th the Annual Conf of the Industrial Electronics Society. Seville: IEEE Press, 2002: 1538-1542.
2Cabin I, Land S. Adaptation of the A* algorithm for the computation of fastest paths in deterministic discrete- time dynamic networks[J]. IEEE Trans on Intelligent Transportation Systems, 2002, 3(1): 60-74.
3Rimon E. Exact robot navigation using artificial potential functions[J]. IEEE Trans on Robotics and Automation, 1992, 8(5): 501-518.
4Lavelle S M, Kuffner J. Randomized kino dynamic planning[J]. Int J of Robotics Research, 2001, 20(5): 378- 398.
5张纯刚,席裕庚.基于局部探测信息的机器人滚动路径规划(英文)[J].自动化学报,2003,29(1):38-44. 被引量：14
6席裕庚,张纯刚.一类动态不确定环境下机器人的滚动路径规划[J].自动化学报,2002,28(2):161-175. 被引量：93
7Sutton R, Barto A G. Reinforcement learning: An introduction[M]. Cambridge: MIT Press, 1998.
8Smart W D, Kaelbling L E Effective reinforcement learning for mobile robots[C]. Proc of the IEEE Int Conf on Robotics and Automation. Washington, 2002: 3404-3410.
9Steven D W, Lin L J. Reinforcement learning of non- Markov decision processes[J]. Artificial Intelligent, 1995, 73: 271-306.
10宋清昆,胡子婴.基于经验知识的Q-学习算法[J].自动化技术与应用,2006,25(11):10-12. 被引量：7

二级参考文献14

1MitchellTM著曾华军张银奎译.机器学习[M].北京:机械工业出版社,2003..
2Sankaranarayanan A, Vidyasagar M. Anew path planning algorithm for moving a point object amidst unknown obstacles in a plane.In: Proceedings of IEEE Conference on Robotics and Automation, France:Nice, 1990. 1930～1936
3Borenstein J, Koren Y. Real time obstacle avoidance for fast mobile robots. IEEETransactions on Systems, Man and Cybernetics, 1989, 19(5):1179～1187
4Tilove R B. Local obstacle avoidance for mobile robots based on the method ofartificial potentials. In: Proceedings of IEEE Conference on Robotics and Automation,France: Nice, 1990. 566～571
5Lumelsky V J. Algorithm and complexity issues of robot motion in an uncertainenvironment. Journal of Complexity, 1987, 3(2):146～182
6Iyengar S S, Jorgensen C C, Rao S V N, Weisbin C R. Learned navigation paths for arobot in unexplored terrain. In: Proceedings of 2nd Conference on Artificial IntelligenceApplications and Engineering of Knowledge Based Systems, USA:Miami Beach, Florida, 1985.11～13
7Xi Yu-Geng. Predictive control. Beijing: National Defense Industry Press, 1993(inChinese)
8Zhang Chun-Gang, Xi Yu-Geng. Robot path planning in globally unknown environmentsbased on rolling windows. Science in China(E), 2001, 44(2): 131～139(in Chinese)
9C.J.C.H.WATKINS,"Learning from delayed rewards"[D],PhD Thesis of the King's College,University of Cambridge,England,1989.
10席裕庚.动态不确定环境下广义控制问题的预测控制[J].控制理论与应用,2000,17(5):665-670. 被引量：71

共引文献110

1曾佳,李菁菁.面向复杂环境的移动机器人在线路径规划[J].上海电气技术,2009,2(1):32-35.
2张捍东,郑睿,岑豫皖.移动机器人路径规划技术的现状与展望[J].系统仿真学报,2005,17(2):439-443. 被引量：119
3庄慧忠,杜树新,吴铁军.移动机器人在线实时路径规划[J].制造业自动化,2005,27(4):50-55. 被引量：2
4沈捷,费树岷,郑波.多移动机器人保持队形路径规划[J].东南大学学报（自然科学版）,2005,35(3):391-395. 被引量：3
5樊晓平,李双艳.带滚动约束轮移式机器人动态规划的研究[J].控制与决策,2005,20(7):786-788. 被引量：9
6樊晓平,李双艳,陈特放.基于新人工势场函数的机器人动态避障规划[J].控制理论与应用,2005,22(5):703-707. 被引量：40
7朱庆保.动态复杂环境下的机器人路径规划蚂蚁预测算法[J].计算机学报,2005,28(11):1898-1906. 被引量：50
8郑敏捷,蔡自兴,邹小兵.一种混合结构的移动机器人导航控制策略[J].机器人,2006,28(2):164-169. 被引量：2
9樊晓平,李双艳,瞿志华.机器人对多运动障碍物环境中方向可变运动目标的跟踪[J].控制理论与应用,2006,23(3):347-350. 被引量：4
10孙斌,韩大鹏,韦庆.基于滚动窗口算法的机器人路径规划应用研究[J].计算机仿真,2006,23(6):159-162. 被引量：9

同被引文献134

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：35
2单梁,强浩,李军,王执铨.基于Tent映射的混沌优化算法[J].控制与决策,2005,20(2):179-182. 被引量：188
3戴博,肖晓明,蔡自兴.移动机器人路径规划技术的研究现状与展望[J].控制工程,2005,12(3):198-202. 被引量：75
4童亮,陆际联,龚建伟.一种快速强化学习方法研究[J].北京理工大学学报,2005,25(4):328-331. 被引量：4
5于红斌,李孝安.基于栅格法的机器人快速路径规划[J].微电子学与计算机,2005,22(6):98-100. 被引量：62
6张汝波,施洋.基于模糊Q学习的多机器人系统研究[J].哈尔滨工程大学学报,2005,26(4):477-481. 被引量：4
7孙波,陈卫东,席裕庚.基于粒子群优化算法的移动机器人全局路径规划[J].控制与决策,2005,20(9):1052-1055. 被引量：77
8朱庆保.动态复杂环境下的机器人路径规划蚂蚁预测算法[J].计算机学报,2005,28(11):1898-1906. 被引量：50
9袁晓辉,袁艳斌,王乘,张勇传.一种新型的自适应混沌遗传算法[J].电子学报,2006,34(4):708-712. 被引量：47
10周兰凤,洪炳熔.用基于知识的遗传算法实现移动机器人路径规划[J].电子学报,2006,34(5):911-914. 被引量：27

引证文献11

1杨月全,韩飞,金露,倪春波,曹志强,张天平.基于局部加权k近邻的多机器人系统异步互增强学习[J].东南大学学报（自然科学版）,2012,42(A01):208-211. 被引量：2
2国海涛,岳峻,苏庆堂.基于自适应混沌变异粒子群算法的路径规划[J].计算机工程与应用,2012,48(30):46-49. 被引量：1
3胡喜玲,李洪波,胡俊.基于自适应混沌遗传算法的路径规划[J].计算机工程与应用,2013,49(9):68-73. 被引量：5
4周峰.基于Tent混沌粒子群算法的滚动窗口路径规划[J].计算机应用与软件,2013,30(5):76-79. 被引量：1
5张琴丽,吴怀宇,陈洋.未知环境下基于椭圆约束的机器人路径规划[J].计算机工程与设计,2014,35(11):3951-3955. 被引量：1
6徐守江.基于蚂蚁导航的未知环境下机器人路径滚动规划算法[J].西南师范大学学报（自然科学版）,2016,41(11):80-86. 被引量：2
7张宁,李彩虹,郭娜,王迪.基于CM-Q学习的自主移动机器人局部路径规划[J].山东理工大学学报（自然科学版）,2020,34(4):37-43. 被引量：3
8Yang Yang,Li Juntao,Peng Lingling.Multi-robot path planning based on a deep reinforcement learning DQN algorithm[J].CAAI Transactions on Intelligence Technology,2020,5(3):177-183. 被引量：21
9王付宇,张康,谢昊轩,陈梦凯.基于改进Q-learning算法的移动机器人路径优化[J].系统工程,2022,40(4):100-109. 被引量：4
10郁洲,毕敬,苑海涛.基于改进DQN算法的复杂海战场路径规划方法[J].智能科学与技术学报,2022,4(3):418-425. 被引量：1

二级引证文献44

1倪春波,孔一斐,杨月全,曹志强,张天平.粒子群优化及其在多机器人系统中的应用展望[J].中南大学学报（自然科学版）,2013,44(S2):126-132. 被引量：3
2刘广会,于静静,李凡国.基于线圆结构和LINGO的机器人避障路径选择[J].世界科技研究与发展,2013,35(5):633-636.
3李宏升.基于虚拟真实拓扑结构宇宙算法的图像分解研究[J].科学技术与工程,2013,21(36):10953-10956. 被引量：4
4魏凌华,张栋冰,范祺.基于群智能的NPC行为建模研究[J].淮北师范大学学报（自然科学版）,2014,35(3):62-65.
5林仁,周国华.任务分解控制及人员柔性的车间集成调度[J].计算机工程与应用,2015,51(4):11-16. 被引量：4
6韩建妙,刘业政.基于遗传算法的超市最短导购路径推荐[J].计算机工程与应用,2016,52(4):238-242. 被引量：10
7林娜,李建明.基于浮动车数据的公交车路线规划研究与实现[J].计算机应用与软件,2016,33(10):270-274.
8杨春静,倪健,游龙泰,冷新,王文平,董晓旭,张欣,杜雪莹,尹兴斌.基于局部加权回归实现五味子醇提结果预测[J].现代中药研究与实践,2017,31(6):44-47.
9王春颖,刘平,秦洪政.移动机器人的智能路径规划算法综述[J].传感器与微系统,2018,37(8):5-8. 被引量：65
10赵澄东.基于运动微分约束的机器人纵横向路径规划[J].科学技术与工程,2018,18(24):261-266. 被引量：3

1崔茂源,田彦涛,赵中祺.基于模糊逻辑的自主移动机器人实时滚动路径规划及控制[J].吉林工业大学学报,1999,29(1):58-63. 被引量：12
2席裕庚,张纯刚.一类动态不确定环境下机器人的滚动路径规划[J].自动化学报,2002,28(2):161-175. 被引量：93
3张育,席裕庚.基于V距离势场的实时滚动路径规划[J].机器人,1997,19(5):350-355. 被引量：4
4王一可,席裕庚.一种多移动机器人的分布式滚动路径规划算法[J].微型电脑应用,2004,20(11):8-9.
5张纯刚,席裕庚.动态未知环境中移动机器人的滚动路径规划及安全性分析[J].控制理论与应用,2003,20(1):37-44. 被引量：31
6张纯刚,席裕庚.基于局部探测信息的机器人滚动路径规划(英文)[J].自动化学报,2003,29(1):38-44. 被引量：14
7王忠立,赵杰,蔡鹤皋.大规模环境下基于图优化SLAM的图构建方法[J].哈尔滨工业大学学报,2015,47(1):75-85. 被引量：28
8吕慧勤,褚永刚,吕硕望,蔺思涛.入侵检测系统融合机制研究[J].网络安全技术与应用,2003(12):10-14. 被引量：3
9张纯刚,席裕庚.机器人滚动路径规划的算法与仿真研究[J].高技术通讯,2003,13(4):53-57. 被引量：6
10段群杰,张铭钧,吕超.基于传感器信息的水下机器人滚动路径规划[J].传感器与微系统,2006,25(9):40-42. 被引量：2

控制与决策

2010年第9期

浏览历史

内容加载中请稍等...

未知环境下基于有先验知识的滚动Q学习机器人路径规划被引量：11

参考文献13

二级参考文献14

共引文献110

同被引文献134

引证文献11

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

未知环境下基于有先验知识的滚动Q学习机器人路径规划 被引量：11

参考文献13

二级参考文献14

共引文献110

同被引文献134

引证文献11

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

未知环境下基于有先验知识的滚动Q学习机器人路径规划被引量：11