基于神经网络Q-learning算法的智能车路径规划被引量：17

Intelligent Vehicle Path Planning Based on Neural Network Q-learning Algorithm

下载PDF

导出

摘要针对智能小车行走过程中的全局路径规划和路障规避问题,提出了一种基于神经网络Q-learning强化学习算法,采用RBF(Radial Basis Function)网络对Q学习算法的动作值函数进行逼近,基于MATLAB环境开发了智能小车全局路径规划和路障规避仿真系统。与传统的以及基于势场的Q学习算法相比,所采用的算法能更加有效地完成智能小车在行驶环境中的路径规划和路障规避。仿真结果表明:算法具有更好的收敛速度,可增强智能小车的自导航能力。 A reinforcement learning algorithm based on neural network Q-learning is proposed to solve the problem of global path planning and obstacle avoidance.RBF(Radial Basis Function)network is used to approximate the action value function of Q learning algorithm.The global path planning and obstacle avoidance simulation system is developed by MATLAB.Compared with the traditional and potential field Q algorithm,the algorithm can be more effective to complete the path planning and obstacle avoidance of intelligent car in the driving environment.The simulation results show that the algorithm has better convergence speed and the ability of self navigation.

作者卫玉梁靳伍银 WEI Yu-liang;JIN Wu-yin(School of Mechno-Electronic Engineering,Lanzhou University of Technology,Lanzhou 730050,China)

机构地区兰州理工大学机电工程学院

出处《火力与指挥控制》 CSCD 北大核心 2019年第2期46-49,共4页 Fire Control & Command Control

基金国家自然科学基金资助项目(11372122)

关键词路径规划智能小车 Q-LEARNING 神经网络仿真 path planning intelligent car Q-learning neural network simulation

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献6

1钱堃,贾凯,宋潇.基于低维映射和Q学习的机械臂避碰规划算法[J].华中科技大学学报（自然科学版）,2015,43(S1):468-472. 被引量：4
2徐学东.基于Q-learning算法的煤矿井下移动机器人路径规划[J].煤炭技术,2013,32(2):105-106. 被引量：4
3黄小燕.基于经验回放Q-Learning的最优控制算法[J].计算机工程与设计,2017,38(5):1352-1355. 被引量：6
4王帅.煤矿井下基于Q-learning算法的移动机器人路径规划[J].现代电子技术,2008,31(24):106-108. 被引量：3
5王子强,武继刚.基于RDC-Q学习算法的移动机器人路径规划[J].计算机工程,2014,40(6):211-214. 被引量：6
6聂春雨,祝明,郑泽伟,武哲.基于Q-Learning算法和神经网络的飞艇控制[J].北京航空航天大学学报,2017,43(12):2431-2438. 被引量：5

二级参考文献35

1石鸿雁,孙茂相,孙昌志.未知环境下移动机器人路径规划方法[J].沈阳工业大学学报,2005,27(1):63-69. 被引量：10
2戴博,肖晓明,蔡自兴.移动机器人路径规划技术的研究现状与展望[J].控制工程,2005,12(3):198-202. 被引量：75
3丁伟,孙华,曾建辉.基于多传感器信息融合的移动机器人导航综述[J].传感器与微系统,2006,25(7):1-3. 被引量：12
4孙章军,田海晏,邓双成,孙晨.移动机器人路径规划仿真平台设计[J].北京石油化工学院学报,2006,14(3):16-19. 被引量：2
5Khatib O. Real - time Obstacle Avoidance for Manipulators and Mobile Robot [J]. The International Journal of Robotic Research,1986,5(1) :90 - 98.
6Gemeinder M,Gerke M. GA - based Path Planning for Robot System Employing an Aetive Search Algorithm [J]. Applied Soft Computing, 2003(3) : 149 - 158.
7Sutton R S, Barto A G. Reinforcement Learning: An Introduction [M]. Cambridge, MA : MIT Press, 1998.
8Miyazaki K, Yamamura M, Kobayashi S. On the Rationality of Profit Sharing in Reinforcement Learning [C]. Proc. of the 3rd International Conference on Fuzzy Logic Neural Net and Soft Computing, 1994 : 285 - 288.
9Labb A M, Kavraki L E. Measure Theoretic Analysis of Probabilistic Path Planning [J]. Robotics and Automation, IEEE Transactions on, 2004,20 (2): 229 - 242.
10Smith, Andrew James. Applications of the Self - organizing Map to Reinforcement Learning[J]. Neural Networks,2002 (15):1 107-1 124.

共引文献21

1蔡建羡,阮晓钢,于乃功,柴洁,朱晓庆.基于认知发育的移动机器人自主导航[J].计算机工程,2018,44(1):9-16. 被引量：4
2王曌,胡立生.基于深度Q学习的工业机械臂路径规划方法[J].化工自动化及仪表,2018,45(2):141-145. 被引量：6
3赵文仓,吴建辉.基于改进优先经验重放算法的游戏控制研究[J].甘肃科学学报,2018,30(2):15-19. 被引量：3
4周滔,赵津,胡秋霞,席阿行,刘东杰.复杂环境下移动机器人全局路径规划与跟踪[J].计算机工程,2018,44(12):208-214. 被引量：19
5闫军威,黄琪,周璇.基于Double-DQN的中央空调系统节能优化运行[J].华南理工大学学报（自然科学版）,2019,47(1):135-144. 被引量：10
6孙鹏,孙若莹,刘滨翔.基于Double-DQN的平衡类游戏改善[J].电子设计工程,2019,27(14):112-116. 被引量：1
7汪黎明.制造企业零库存管理物资调度方法研究[J].价值工程,2019,38(23):126-129. 被引量：1
8张秦浩,敖百强,张秦雪.Q-learning强化学习制导律[J].系统工程与电子技术,2020,42(2):414-419. 被引量：21
9张宁,李彩虹,郭娜,王迪.基于CM-Q学习的自主移动机器人局部路径规划[J].山东理工大学学报（自然科学版）,2020,34(4):37-43. 被引量：3
10马小铭,靳伍银.基于改进蚁群算法的多目标路径规划研究[J].计算技术与自动化,2020,39(4):100-105. 被引量：25

同被引文献197

1赵明,郑泽宇,么庆丰,潘怡君,刘智.基于改进人工势场法的移动机器人路径规划方法[J].计算机应用研究,2020,37(S02):66-68. 被引量：30
2周瑶瑶,李烨.基于排序优先经验回放的竞争深度Q网络学习[J].计算机应用研究,2020,37(2):486-488. 被引量：5
3胡艳明,李德才,何玉庆,韩建达.基于增量式RBF网络的Q学习算法[J].机器人,2019,41(5):562-573. 被引量：7
4李宪强,马戎,张伸,侯砚泽,裴毅飞.蚁群算法的改进设计及在航迹规划中的应用[J].航空学报,2020(S02):213-219. 被引量：33
5邓修朋,崔建明,李敏,张小军,宋戈.深度强化学习在机器人路径规划中的应用[J].电子测量技术,2023,46(6):1-8. 被引量：2
6赵燕伟,彭典军,张景玲,吴斌.有能力约束车辆路径问题的量子进化算法[J].系统工程理论与实践,2009,29(2):159-166. 被引量：41
7常宝娴,丁洁,朱俊武,章永龙.未知环境下机器人Q学习覆盖算法[J].南京理工大学学报,2013,37(6):792-798. 被引量：2
8朱庆保,张玉兰.基于栅格法的机器人路径规划蚁群算法[J].机器人,2005,27(2):132-136. 被引量：121
9肖健梅,李军军,王锡淮.求解车辆路径问题的改进微粒群优化算法[J].计算机集成制造系统,2005,11(4):577-581. 被引量：49
10戴博,肖晓明,蔡自兴.移动机器人路径规划技术的研究现状与展望[J].控制工程,2005,12(3):198-202. 被引量：75

引证文献17

1杨洋,张建敏,刘艺林,宋馨.基于改进蚁群算法的无人仓的多AGV避碰路径优化策略[J].数学的实践与认识,2020,50(16):1-9. 被引量：8
2随博文,黄志坚,姜宝祥,郑欢,温家一.基于深度Q网络的水面无人艇路径规划算法[J].上海海事大学学报,2020,41(3):1-5. 被引量：5
3郑永玲,白宇,杨楠,蒋顺英.基于Bi-A^(*)的ACO算法的最快路径推荐[J].现代信息科技,2020,4(22):74-80.
4任学干,葛英飞.基于改进势场蚁群算法的AGV路径规划[J].南京工程学院学报（自然科学版）,2021,19(1):36-41. 被引量：2
5唐恒亮,唐滋芳,董晨刚,尹棋正,海秋茹.基于启发式强化学习的AGV路径规划[J].北京工业大学学报,2021,47(8):895-903. 被引量：8
6刘虹庆,王世民.基于强化学习的车辆路径规划问题研究[J].计算机应用与软件,2021,38(8):303-308. 被引量：7
7王慧,秦广义,杨春梅.定制家具板材搬运AGV路径规划[J].包装工程,2021,42(17):203-209. 被引量：3
8张小月,韩尚君,陶青川,余艳梅.基于改进Q-Learning的路径规划算法[J].现代计算机,2022,28(2):67-72. 被引量：2
9杨云,刘婷婷.基于机器学习的农业机器人滑移量计算及路径规划[J].农机化研究,2022,44(9):264-268. 被引量：1
10段书用,章霖鑫,韩旭,刘桂荣.具有光滑-直行功能的Q-Learning路径优化算法[J].机械工程学报,2022,58(11):72-87.

二级引证文献51

1吴恭兴,王凌超,郑剑,汪超.考虑复杂气象变化的智能船舶动态航线规划方法[J].上海海事大学学报,2021,42(1):1-6. 被引量：10
2唐恒亮,唐滋芳,董晨刚,尹棋正,海秋茹.基于启发式强化学习的AGV路径规划[J].北京工业大学学报,2021,47(8):895-903. 被引量：8
3林韩熙,向丹,欧阳剑,兰晓东.移动机器人路径规划算法的研究综述[J].计算机工程与应用,2021,57(18):38-48. 被引量：79
4彭育辉,江铭,马中原,钟聪.汽车自动驾驶关键技术研究进展[J].福州大学学报（自然科学版）,2021,49(5):691-703. 被引量：27
5王槐彬,彭雪,夏小云,周诗源.基于改进天牛须搜索的自导引机器人路径规划[J].机械设计与研究,2021,37(5):27-30. 被引量：3
6王超,于德洋,王子强,吕松天,牟洋.复杂任务环境下多无人机多任务规划技术研究[J].电子技术与软件工程,2021(22):106-109. 被引量：2
7段丽妮,阚龙营.基于蚁群算法的多车型物流车辆调度研究[J].物流科技,2022,45(4):14-17. 被引量：2
8张晓燕,张晓娇.基于改进蚁群算法的AGV自动导引车避障路径选择研究[J].自动化与仪器仪表,2022(6):52-56. 被引量：3
9许志远.基于改进神经网络的船舶航行路径规划[J].舰船科学技术,2022,44(14):57-60. 被引量：1
10吴鹏,魏上清,董嘉鹏,潘理.基于SARSA强化学习的审判人力资源调度方法[J].计算机技术与发展,2022,32(9):82-88. 被引量：1

1许珂.国际私法角度的法律规避问题研究[J].法制博览,2017(31):233-233. 被引量：2
2谢晓晶.浅析国际私法中的法律规避问题[J].法制博览,2019(5):253-253.
3周敏,黄兰凤.4K电视产业前景分析及商业模式探讨[J].中国广播影视,2018(18):82-84.
4隋艳,翁伯林,陈帅,杨睿.扫地机器人清理路障优化问题[J].武汉电力职业技术学院学报,2018(3):36-39.
5货车帮合作高德推出货车司机专属地图[J].中国物流与采购,2019,0(1):8-8.
6科学之冠[J].围棋天地,2019,0(1):14-14.
7王丽丽.中国对外直接投资是风险规避还是风险偏好[J].金融经济学研究,2018,33(6):117-126. 被引量：8
8杨蔓,方承香,张维.对法律规避制度的一些讨论[J].法制博览,2019(3):124-125.
9吴进,李乔深,赵隽,闵育.基于改进的ICA和RBF神经网络的人脸识别[J].西安邮电大学学报,2018,23(5):18-22.
10王其东,魏振亚,王乃汉,陈无畏,谢有浩.基于投影统计与双曲线拟合的车道识别算法[J].中国机械工程,2019,30(4):393-399. 被引量：8

火力与指挥控制

2019年第2期

浏览历史

内容加载中请稍等...

基于神经网络Q-learning算法的智能车路径规划被引量：17

参考文献6

二级参考文献35

共引文献21

同被引文献197

引证文献17

二级引证文献51

相关作者

相关机构

相关主题

浏览历史

基于神经网络Q-learning算法的智能车路径规划 被引量：17

参考文献6

二级参考文献35

共引文献21

同被引文献197

引证文献17

二级引证文献51

相关作者

相关机构

相关主题

浏览历史

基于神经网络Q-learning算法的智能车路径规划被引量：17