基于深度自动编码器与Q学习的移动机器人路径规划方法被引量：14

Mobile Robot Path Planning Based on Deep Auto-encoder and Q-learning

下载PDF

导出

摘要针对移动机器人在静态未知环境中的路径规划问题,提出了一种将深度自动编码器(deep auto-encoder)与Q学习算法相结合的路径规划方法,即DAE-Q路径规划方法.利用深度自动编码器处理原始图像数据可得到移动机器人所处环境的特征信息;Q学习算法根据环境信息选择机器人要执行的动作,机器人移动到新的位置,改变其所处环境.机器人通过与环境的交互,实现自主学习.深度自动编码器与Q学习算法相结合,使系统可以处理原始图像数据并自主提取图像特征,提高了系统的自主性;同时,采用改进后的Q学习算法提高了系统收敛速度,缩短了学习时间.仿真实验验证了此方法的有效性. To solve the path planning problem of mobile robot in static unknown environment, a new pathplanning method was proposed which combined the deep autoencoder with the Qlearning algorithm,namely the DAEQ path planning method. The deep autoencoder processed the raw image data to get thefeature information of the environment. The Qlearning algorithm chose an action according to theenvironmental information and the robot moved to a new position, changing the surrounding environmentof the mobile robot. The robot realized autonomous learning through the interaction with the environment.The system processed raw image data and extracted the image feature autonomously by combining thedeep autoencoder and the Qlearning algorithm, and the autonomy of the system was improved. Inaddition, an improved Qlearning algorithm to improve the system爷s convergence speed and shorten thelearning time was utilized. Experimental evaluation validates the effectiveness of the method.

作者于乃功默凡凡

机构地区北京工业大学电子信息与控制工程学院北京工业大学计算智能与智能系统北京市重点实验室数字社区教育部工程研究中心城市轨道交通北京实验室

出处《北京工业大学学报》 CAS CSCD 北大核心 2016年第5期668-673,共6页 Journal of Beijing University of Technology

基金国家自然科学基金资助项目(61573029)

关键词移动机器人路径规划深度自动编码器 Q学习算法 mobile robot path planning deep autoencoder Qlearning algorithm

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献10

1朱大奇,颜明重.移动机器人路径规划技术综述[J].控制与决策,2010,25(7):961-967. 被引量：328
2BEOM H R, CHO H S. A sensor-based navigation for amobile robot using fuzzy logic and reinforcement learning[J]. IEEE Trans on System, Man and Cybernetics, 1995,25(3): 464-477.
3DEISENROTH M P, FOX D, RASMUSSEN C E.Gaussian processes for data-efficient learning in roboticsand control[J]. IEEE Transactions on Pattern Analysis &Machine Intelligence, 2015, 37(2): 408-423.
4MAEDA Y, WATANABE T, MORIYAMA Y. View-basedprogramming with reinforcement learning for roboticmanipulation[C]//2011 IEEE International Symposium onAssembly and Manufacturing (ISAM). Piscataway, NY:IEEE, 2011: 1-6.
5LANGE S, RIEDMILLER M, VOIGTLANDER A.Autonomous reinforcement learning on raw visual input datain a real world application[C] //The 2012 InternationalJoint Conference on Neural Networks ( IJCNN ).Piscataway, NY: IEEE, 2012: 1-8.
6LANGE S, RIEDMILLER M. Deep auto-encoder neuralnetworks in reinforcement learning [C] //The 2010International Joint Conference on Neural Networks(IJCNN). Piscataway, NY: IEEE, 2010: 1-8.
7LIU H L, TANIGUCHI T. Feature extraction and patternrecognition for human motion by a deep sparse autoencoder[C] //2014 IEEE International Conference on Computerand Information Technology ( CIT). Piscataway, NY:IEEE, 2014: 173-181.
8陈宗海,杨志华,王海波,盛捷.从知识的表达和运用综述强化学习研究[J].控制与决策,2008,23(9):961-968. 被引量：14
9MAEDA Y, ABURATA R. Teaching and reinforcementlearning of robotic view-based manipulation[C] //IEEERO-MAN 2013. Piscataway, NY: IEEE, 2013: 87-92.
10GOYAL J K, NAGLA K S. A new approach of pathplanning for mobile robots [C] //2014 InternationalConference on Advances in Computing, Communicationsand Informatics ( ICACCI). Piscataway, NY: IEEE,2014: 863-867.

二级参考文献105

1戴博,肖晓明,蔡自兴.移动机器人路径规划技术的研究现状与展望[J].控制工程,2005,12(3):198-202. 被引量：75
2陈宗海,文锋.基于复杂过程简化模型的DHP学习控制[J].控制与决策,2006,21(10):1087-1091. 被引量：2
3Hofner C, Schmidt G. Path planning and guidance techniques for an autonomous mobile robot[J]. Robotic and Autonomous Systems, 1995, 14(2): 199-212.
4Schmidt G, Hofner C. An advaced planning and navigation approach for autonomous cleaning robot operationa[C]. IEEE Int Conf Intelligent Robots System. Victoria, 1998: 1230-1235.
5Vasudevan C, Ganesan K. Case-based path planning for autonomous underwater vehicles[C]. IEEE Int Symposium on Intelligent Control. Columbus, 1994:160-165.
6Liu Y. Zhu S, Jin B, et al. Sensory navigation of autonomous cleaning robots[C]. The 5th World Conf on Intelligent Control Automation. Hangzhou, 2004: 4793- 4796.
7De Carvalho R N, Vidal H A, Vieira P, et al. Complete coverage path planning and guidance for cleaning robots[C]. IEEE Int Conf Industry Electrontics. Guimaraes, 1997: 677-682.
8Ram A, Santamaria J C. Continuous case-based reasoning[J]. Artificial Inteligence, 1997, 90(1/2): 25-77.
9Arleo A, Smeraldi E Gerstner W. Cognitive navigation based on non-uniform Gabor space sampling, unsupervised growing Networks, and reinforcement learning[J]. IEEE Trans on Neural Network, 2004, 15(3): 639-652.
10Fujimura K, Samet H. A hierarchical strategy for path planning among moving obstacles[J]. IEEE Trans on Robotic Automation, 1989, 5(1): 61-69.

共引文献340

1刘军,冯硕,任建华.移动机器人路径动态规划有向D~*算法[J].浙江大学学报（工学版）,2020,54(2):291-300. 被引量：27
2黄鲁,周非同.基于路径优化D^*Lite算法的移动机器人路径规划[J].控制与决策,2020,35(4):877-884. 被引量：23
3张凡,蔡涛,刘文达,范亚雷.基于改进JPS算法的电站巡检机器人路径规划[J].电子测量技术,2020,43(8):10-16. 被引量：7
4章国安,丁晨莉,包志华.认知无线Mesh网络自适应多路径算法[J].电讯技术,2010,50(9):55-59.
5柯文德,蔡则苏,彭志平,钟秋波,朴松昊.一种混合路径规划方法在轮式机器人中的应用[J].计算机应用研究,2011,28(2):505-507. 被引量：5
6徐安,于雷,寇英信,徐保伟,李战武.基于MDP框架的飞行器隐蔽接敌策略[J].系统工程与电子技术,2011,33(5):1063-1068. 被引量：11
7李丽娜,王俊玲,陈国权.船舶拟人智能避碰决策理论的集成机器学习策略[J].信息与控制,2011,40(3):359-368. 被引量：13
8肖国宝,严宣辉.一种动态不确定环境中机器人路径规划方法[J].计算机系统应用,2012,21(4):92-98. 被引量：5
9董西增.知识经济时代中国石化工业面临的经营课题[J].金山企业管理,2000(1):34-40.
10邬文帅,寇纲,彭怡,石勇.面向突发事件的模糊多目标应急决策方法[J].系统工程理论与实践,2012,32(6):1298-1304. 被引量：43

同被引文献168

1李卫硕,孙剑,陈伟.基于BP神经网络机器人实时避障算法[J].仪器仪表学报,2019,40(11):204-211. 被引量：38
2胡艳明,李德才,何玉庆,韩建达.基于增量式RBF网络的Q学习算法[J].机器人,2019,41(5):562-573. 被引量：7
3杨旭东,刘全,李瑾.一种基于资格迹的并行强化学习算法[J].苏州大学学报（自然科学版）,2012,28(1):26-33. 被引量：1
4常宝娴,丁洁,朱俊武,章永龙.未知环境下机器人Q学习覆盖算法[J].南京理工大学学报,2013,37(6):792-798. 被引量：2
5朱庆保,张玉兰.基于栅格法的机器人路径规划蚁群算法[J].机器人,2005,27(2):132-136. 被引量：123
6蒋永平,徐杜,黄尚廉.圆光栅增量式光电轴角编码器性能自动检测方法[J].工具技术,1995,29(3):43-46. 被引量：6
7张晓晖,刘丁,李攀.基于网络的机器人远程控制系统实现与研究[J].机械科学与技术,2007,26(6):808-811. 被引量：10
8叶晔,岑豫皖,包家汉.基于改进遗传算法的移动机器人路径规划[J].安徽工业大学学报（自然科学版）,2007,24(4):409-411. 被引量：5
9宋志章.基于Linux移动机器人控制系统设计[J].微计算机信息,2008,24(29):240-241. 被引量：4
10王兴如,弓永军,衣正尧,王祖温.超高压水射流船舶爬壁除锈机器人力学特性分析[J].机床与液压,2008,36(10):67-70. 被引量：12

引证文献14

1贾云辉,张志宏,何宏.基于ARM-Linux的爬壁机器人控制器研究[J].电子测量与仪器学报,2017,31(9):1459-1466. 被引量：8
2贾文娟,张煜东.自编码器理论与方法综述[J].计算机系统应用,2018,27(5):1-9. 被引量：24
3龙卓群,吴超,雷日兴.移动机器人躲避多静态障碍物路径智能规划方法[J].自动化与仪器仪表,2018,0(10):178-181. 被引量：5
4赵澄东.自主轮式移动机器人纵横向目标路径规划仿真[J].计算机仿真,2019,36(6):306-309. 被引量：4
5段建民,陈强龙.利用先验知识的Q-Learning路径规划算法研究[J].电光与控制,2019,26(9):29-33. 被引量：11
6任剑锋,叶春明,杨枫.带时间窗的车间搬运机器人路径优化建模及算法研究[J].运筹与管理,2020,29(5):52-60. 被引量：15
7司国斌,王春霞.农业采摘机械手路径规划——基于云平台和Q学习算法[J].农机化研究,2021,43(10):23-27. 被引量：7
8向玉云,黄铝文.基于生物激励神经网络的室内实时激光SLAM控制方法[J].信息与控制,2021,50(6):709-721. 被引量：7
9刘景森,袁蒙蒙,李煜.基于改进的樽海鞘群算法求解机器人路径规划问题[J].计算机研究与发展,2022,59(6):1297-1314. 被引量：7
10林芸.基于网络远程控制和仿真的智能制造机器人的路径自动规划[J].科技通报,2022,38(6):30-34. 被引量：3

二级引证文献97

1李文举,张耀星,陈慧玲,李培刚,沙利业.基于TSCD模型的轨道板裂缝检测方法[J].应用科学学报,2022,40(1):155-166. 被引量：2
2王学军,张帆.含柔性吸附材料的攀爬机器人振动特性与稳定性分析研究[J].仪器仪表学报,2022,43(8):271-279. 被引量：3
3马家麟,孙海洲,任贵珊,王素珍,邹开元,王怀铭.高集成度多种格式并行输出的视频测试信号源研制[J].电子测量与仪器学报,2022,36(3):217-223. 被引量：8
4何彦霖,祝连庆,孙广开,董明利.小型两栖球形机器人陆地运动建模及实验分析[J].仪器仪表学报,2018,39(12):100-108. 被引量：3
5翟正利,梁振明,周炜,孙霞.变分自编码器模型综述[J].计算机工程与应用,2019,55(3):1-9. 被引量：65
6张生顺.基于深度自编码器的网络安全态势预测[J].信息安全研究,2019,5(7):644-648. 被引量：4
7蒋宗礼,史倩月.面向不平衡数据的分类算法[J].计算机系统应用,2019,28(8):120-128. 被引量：8
8刘春平,马晓明,张志利.工业智能机器人自定位信息采集精度控制仿真[J].计算机仿真,2019,36(8):320-324. 被引量：3
9熊雨坤,王怀彬.基于SSAE-PNN算法的网络入侵检测研究[J].天津理工大学学报,2019,35(5):6-11. 被引量：1
10王勇,滕祖伟,周杰华,肖波,赵根.AI深度学习在移动网异常小区检测分类中的应用[J].邮电设计技术,2019,0(11):11-15. 被引量：3

1战忠丽,王强,王佩霞.多Agent系统中Q学习算法研究[J].辽宁农业职业技术学院学报,2008,10(5):48-50.
2高良诚.移动自组织网络Q学习和改进蚁群QoS路由算法[J].吉林大学学报（理学版）,2015,53(3):483-488. 被引量：5
3王飞飞.基于稀疏自动编码器的近重复视频检索[J].电子技术与软件工程,2017(3):194-196. 被引量：2
4冷星峰.让你的声音“流”遍全球——用Media Encoder打造你的实时网络电台[J].电脑知识与技术（过刊）,2003(4):64-67.
5谷斌.基于Web的信息选择原则与方法研究[J].情报杂志,2006,25(1):24-25. 被引量：4
6段宝彬,韩立新.改进的深度卷积网络及在碎纸片拼接中的应用[J].计算机工程与应用,2014,50(9):176-181. 被引量：14
7方丽,李锡辉.基于Deep Web挖掘的搜索策略[J].福建电脑,2008,24(3):45-46. 被引量：1
8邹煜,刘兴旺.基于深度学习手写字符的特征抽取方法研究[J].软件,2017,38(1):23-28. 被引量：2
9刘帅师,程曦,郭文燕,陈奇.深度学习方法研究新进展[J].智能系统学报,2016,11(5):567-577. 被引量：28
10唐英.改进的Q学习算法在机器人避碰中的应用[J].景德镇高专学报,2010,25(4):4-5.

北京工业大学学报

2016年第5期

浏览历史

内容加载中请稍等...

基于深度自动编码器与Q学习的移动机器人路径规划方法被引量：14

参考文献10

二级参考文献105

共引文献340

同被引文献168

引证文献14

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于深度自动编码器与Q学习的移动机器人路径规划方法 被引量：14

参考文献10

二级参考文献105

共引文献340

同被引文献168

引证文献14

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于深度自动编码器与Q学习的移动机器人路径规划方法被引量：14