摘要
为了提高移动机器人的自学习能力,在基于行为控制结构的基础上设计了智能控制结构,该结构引入了强化学习模块。神经网络具有很好的泛化能力,该文提出了基于神经网络的强化Q学习算法,克服了表格式Q学习算法只能应用到离散的状态中并需要大量存储空间的不足,最后结合智能控制结构应用到移动机器人的避障中。实验结果表明,该方法能够使移动机器人通过自学习实现自主避障。
An intelligent control architecture with reinforcement learning was designed based on a behavior-based architecture to improve the learning ability of mobile robots.Normal tabular Q-learning can only be applied to discrete states and requires a large memory.Since neural networks have good generalization,a Q-learning system was developed based on a neural network for obstacle avoidance of mobile robots.Experiments show that the mobile robot can then learn to avoid obstacles.
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第S2期1747-1750,共4页
Journal of Tsinghua University(Science and Technology)
基金
国家自然科学基金资助项目(60375017)
北京市优秀人才培养资助项目(2006D0501500203)
北京市教委科技发展计划项目(KM2006100050190)
关键词
移动机器人
强化学习
神经网络
避障
mobile robot
reinforcement learning
neural network
obstacle avoidance