检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到4篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于强化学习算法的多机器人系统的冲突消解策略被引量：7: 1; 作者任燚陈宗海《控制与决策》 EI CSCD 北大核心 2006年第4期430-434,439,共6页; 多机器人系统中,随着机器人数目的增加,系统中的冲突呈指数级增加,甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务,以计算机仿真为手段,以收集的... 展开更多; 关键词多机器人过程奖赏优先扫除强化学习; 下载PDF 职称材料

自主移动机器人中基于强化学习的噪声消解策略(英文): 2; 作者任燚陈宗海《系统仿真学报》 EI CAS CSCD 北大核心 2005年第7期1699-1703,共5页; 基于行为的自主移动机器人在获取外界信息时不可避免地会引入噪声,给其系统性能造成一定的影响。提出了一种基于过程奖赏和优先扫除(PS-process)的强化学习算法作为噪声消解策略。针对典型的觅食任务,以计算机仿真为手段。并与其它四种... 展开更多; 关键词移动机器人噪声过程奖赏优先扫除强化学习; 下载PDF 职称材料

自主机器人的噪声影响及其消解策略的研究: 3; 作者任燚陈宗海《计算机仿真》 CSCD 2005年第10期183-185,194,共4页; 该文针对典型的觅食任务,以计算机仿真为手段,直观地揭示噪声对机器人系统性能的影响。在此基础上,提出了以过程奖赏(process reward)代替传统的结果奖赏(resu lt reward),并与优先扫除(prioritized sweep ing)的强化学习算法结合作为... 展开更多; 关键词移动机器人噪声过程奖赏优先扫除强化学习; 下载PDF 职称材料

改进的CE-Q算法用于多Agent觅食的研究: 4; 作者雷默涵杨萍《机械设计》 CSCD 北大核心 2015年第6期1-4,共4页; 针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入对于动作过程的即时奖赏的CE-Q改进强化算法,有效地改善了上述... 展开更多; 关键词 CE-Q强化学习算法动作过程奖赏多Agent觅食任务系统效率; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部