基于神经网络的强化学习在避障中的应用被引量：27

Neural network-based reinforcement learning applied to obstacle avoidance

导出

摘要为了提高移动机器人的自学习能力,在基于行为控制结构的基础上设计了智能控制结构,该结构引入了强化学习模块。神经网络具有很好的泛化能力,该文提出了基于神经网络的强化Q学习算法,克服了表格式Q学习算法只能应用到离散的状态中并需要大量存储空间的不足,最后结合智能控制结构应用到移动机器人的避障中。实验结果表明,该方法能够使移动机器人通过自学习实现自主避障。 An intelligent control architecture with reinforcement learning was designed based on a behavior-based architecture to improve the learning ability of mobile robots.Normal tabular Q-learning can only be applied to discrete states and requires a large memory.Since neural networks have good generalization,a Q-learning system was developed based on a neural network for obstacle avoidance of mobile robots.Experiments show that the mobile robot can then learn to avoid obstacles.

作者乔俊飞侯占军阮晓钢

机构地区北京工业大学人工智能与机器人研究所

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2008年第S2期1747-1750,共4页 Journal of Tsinghua University(Science and Technology)

基金国家自然科学基金资助项目(60375017) 北京市优秀人才培养资助项目(2006D0501500203) 北京市教委科技发展计划项目(KM2006100050190)

关键词移动机器人强化学习神经网络避障 mobile robot reinforcement learning neural network obstacle avoidance

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1Christopher J.C.H. Watkins,Peter Dayan. Technical Note: Q-Learning[J] 1992,Machine Learning(3-4):279～292
2Christopher J. C. H. Watkins,Peter Dayan. Q-learning[J] 1992,Machine Learning(3-4):279～292

同被引文献194

1于飞,吕冬梅,杨宗尧,刘喜梅.改进的人工势能场在足球机器人避障中的应用[J].仪器仪表学报,2006,27(z1):508-509. 被引量：3
2吴连喜,吴连喜,严泰来,张玮.基于多层感知器神经网络对遥感融合图像和TM影像进行土地覆盖分类的研究[J].土壤通报,2001,32(z1):33-36. 被引量：9
3方景龙,陈建胜.一种复杂环境下的移动机器人路径规划方法[J].杭州电子科技大学学报（自然科学版）,2009,29(6):33-36. 被引量：2
4王芳,万磊,徐玉如,张玉奎.基于改进人工势场的水下机器人路径规划[J].华中科技大学学报（自然科学版）,2011,39(S2):184-187. 被引量：15
5王帅.动态不确定环境下一种移动机器人路径规划方法[J].电气技术,2010,11(1):18-21. 被引量：3
6郭琦,洪炳熔.基于人工神经网络实现智能机器人的避障轨迹控制[J].机器人,2002,24(6):508-512. 被引量：17
7张捍东,郑睿,岑豫皖.移动机器人路径规划技术的现状与展望[J].系统仿真学报,2005,17(2):439-443. 被引量：118
8陈华华,杜歆,顾伟康.基于神经网络和遗传算法的机器人动态避障路径规划[J].传感技术学报,2004,17(4):551-555. 被引量：23
9石鸿雁,孙茂相,孙昌志.未知环境下移动机器人路径规划方法[J].沈阳工业大学学报,2005,27(1):63-69. 被引量：10
10段俊花,李孝安.基于改进遗传算法的机器人路径规划[J].微电子学与计算机,2005,22(1):70-72. 被引量：26

引证文献27

1赵祚喜,汪宁,张智刚,赵汝祺,俞龙,罗锡文.一种适用于非360°探测机器人的避障导航算法[J].机械工程学报,2010,46(19):44-52. 被引量：9
2阮晓钢,许晓明,李欣源.一种迷宫机器人的人工脑系统[J].控制工程,2010,17(5):686-690. 被引量：3
3段勇,伊婧.基于二型模糊系统的强化学习及其在机器人行为学习中的应用[J].制造业自动化,2011,33(22):20-24.
4陈自立,徐娅萍,顾立彬.基于模糊Q学习算法的AGV路径规划研究[J].制造业自动化,2012,34(11):4-6. 被引量：7
5刘奇,宋凯,张世平,王祁.基于目标向量的非全向测距机器人路径规划[J].电子测量技术,2012,35(5):73-77. 被引量：7
6刘世泽.一种利用人工神经网络解决迷宫问题的方法[J].科学与财富,2012(6):10-11.
7王荣荣,杨海忠.超声测距误差补偿算法研究[J].工矿自动化,2012,38(12):62-65. 被引量：2
8孙玉山,张英浩,常文田,李岳明.基于改进运动平衡点的水下机器人自主避障方法研究[J].中国造船,2013,54(2):17-25. 被引量：2
9刘世泽,段中兴.基于人工神经网络的迷宫路径策略问题研究[J].工业控制计算机,2013,26(6):104-105. 被引量：3
10胡敏.基于Q-learning算法的煤矿井下移动机器人路径算法研究与展望[J].煤炭技术,2013,32(9):33-34. 被引量：1

二级引证文献97

1方凯伦,王露民.基于智能算法的检修任务调度优化策略[J].企业管理,2018(S01):56-57.
2邓修朋,崔建明,李敏,张小军,宋戈.深度强化学习在机器人路径规划中的应用[J].电子测量技术,2023,46(6):1-8. 被引量：1
3王国胜,刘峰,陆明,吕强.基于MC9S12DG128单片机的迷宫机器人设计[J].微电机,2011,44(12):56-59. 被引量：3
4江济良,屠大维,许烁,赵其杰.基于生物触角的仿生条件反射机器人导航算法[J].电子学报,2013,41(2):388-394. 被引量：3
5鲁统伟,林芹,李熹,邹旭.记忆运动方向的机器人避障算法[J].武汉工程大学学报,2013,35(4):66-71. 被引量：4
6刘波,汪宇辰,梁伟健,叶波,周杰.基于MC9S12XS128MAL控制的光电导引式AGV[J].机电工程,2013,30(7):837-841. 被引量：5
7谭志斌,赵祚喜,赵汝祺,李姣姣,俞龙.非360°探测范围四轮导航车辆的平滑路径避障算法[J].机器人,2013,35(5):527-534. 被引量：7
8王子强,武继刚.基于RDC-Q学习算法的移动机器人路径规划[J].计算机工程,2014,40(6):211-214. 被引量：6
9李柏,张友民,邵之江.自动驾驶车辆运动规划方法综述[J].控制与信息技术,2018(6):1-6. 被引量：21
10千承辉,李琦,徐倩,康利利,刁庶.基于气压控制的球体升降高度自动控制系统的研究[J].实验室科学,2014,17(5):48-51.

1王富东,高衿畅,周春晖.基于黑板模型的智能控制结构[J].信息与控制,1990,19(2):1-6. 被引量：6
2孙捷先.智能机器人系统分层递阶智能控制结构的分析与综合[J].计算技术与自动化,1993,12(4):1-5.
3盛维涛,张文君,张建兴.基于神经网络的Q学习在Khepera Ⅱ机器人避障中的应用[J].世界科技研究与发展,2013,35(3):374-376.
4王艳,杨惠茹.智能化试车台控制系统[J].华东科技（学术版）,2014(8):15-15.
5姜孝华,段伟伟,诸昌钤.新型智能控制系统研究[J].仪器仪表学报,1996,17(5):489-494. 被引量：1
6马宁,王艳.大型透平压缩机组试车台控制系统[J].民营科技,2016(3):63-63.
7杨霞.基于自校正的自组织复合控制的研究[J].河北工业大学学报,2002,31(5):103-105.
8杨霞,孙一丹,苗红.交流调速系统控制策略的研究[J].沈阳工业大学学报,2002,24(2):125-127. 被引量：1
9王矛,李人厚.递阶结构智能控制系统的控制器设计[J].信息与控制,1994,23(2):124-128. 被引量：2
10马建军,吴耿峰,付忠廉.基于FLC模式的智能控制系统的探讨[J].电气自动化,1997,19(4):4-6.

清华大学学报（自然科学版）

2008年第S2期

浏览历史

内容加载中请稍等...

基于神经网络的强化学习在避障中的应用被引量：27

参考文献2

同被引文献194

引证文献27

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于神经网络的强化学习在避障中的应用 被引量：27

参考文献2

同被引文献194

引证文献27

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于神经网络的强化学习在避障中的应用被引量：27