期刊文献+

基于局部加权k近邻的多机器人系统异步互增强学习 被引量:2

Asynchronous interaction reinforcement learning for multi-robot systems based on local weighted kNN-TD
下载PDF
导出
摘要 针对多机器人系统的增强学习问题,为提高机器人的学习速度和充分利用通信范围内其他机器人的增强学习的经验和结果,给出了2类基于局部加权k近邻时间差分的多机器人系统的交互式学习策略.对于机器人之间通信无时滞情形,基于环境感测和任务信息状态描述的局部加权k近邻状态选择方法,机器人通过对自身和通信范围内其他机器人Q值表的比较和分析,对其自身的Q值表进行优化迭代更新.在此基础上,分别给出了基于全局通信条件下和局部通信条件下多机器人系统的异步的互增强学习方案.最后,通过仿真实验进一步验证了所提方案的可行性和有效性. To accelerate the learning speed of robots for multirobot systems and make full use of ex perience and results of other robots in the communication domain, two kinds of multirobot learning strategies based on the local weighted knearest neighbor temporal difference (kNNTD) algorithm are proposed. Without consideration of time delays during the communications of robots, based on the method of local weighted kNNTD state selection by using environment sense information and task destination information, the optimal iteration of Q value table of a robot is updated by the em ployment of comparison and analysis of Q value tables of itself and other communicating robots. Af ter that, asynchronous interaction reinforcement learning schemes are presented in the case of global communication and local communication in the working environment, respectively. Finally, the sim ulations verify the effectiveness and efficiency of the proposed strategy.
出处 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第A01期208-211,共4页 Journal of Southeast University:Natural Science Edition
基金 国家自然科学基金资助项目(61175111 61174046) 江苏省高校自然科学研究资助项目(10KJB510027)
关键词 多机器人系统 增强学习 K近邻 运动控制 multi-robot system reinforcement learning kNN motion control
  • 相关文献

参考文献13

二级参考文献50

共引文献292

同被引文献41

引证文献2

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部