检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到5篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于优先级扫描Dyna结构的贝叶斯Q学习方法被引量：6: 1; 作者于俊刘全 +2 位作者傅启明孙洪坤陈桂兴《通信学报》 EI CSCD 北大核心 2013年第11期129-139,共11页; 贝叶斯Q学习方法使用概率分布来描述Q值的不确定性,并结合Q值分布来选择动作,以达到探索与利用的平衡。然而贝叶斯Q学习存在着收敛速度慢且收敛精度低的问题。针对上述问题,提出一种基于优先级扫描Dyna结构的贝叶斯Q学习方法—Dyna-PS-B... 展开更多; 关键词强化学习马尔科夫决策过程优先级扫描 Dyna结构贝叶斯Q学习; 下载PDF 职称材料

基于强化学习算法的多机器人系统的冲突消解策略被引量：7: 2; 作者任燚陈宗海《控制与决策》 EI CSCD 北大核心 2006年第4期430-434,439,共6页; 多机器人系统中,随着机器人数目的增加,系统中的冲突呈指数级增加,甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务,以计算机仿真为手段,以收集的... 展开更多; 关键词多机器人过程奖赏优先扫除强化学习; 下载PDF 职称材料

自主移动机器人中基于强化学习的噪声消解策略(英文): 3; 作者任燚陈宗海《系统仿真学报》 EI CAS CSCD 北大核心 2005年第7期1699-1703,共5页; 基于行为的自主移动机器人在获取外界信息时不可避免地会引入噪声,给其系统性能造成一定的影响。提出了一种基于过程奖赏和优先扫除(PS-process)的强化学习算法作为噪声消解策略。针对典型的觅食任务,以计算机仿真为手段。并与其它四种... 展开更多; 关键词移动机器人噪声过程奖赏优先扫除强化学习; 下载PDF 职称材料

自主机器人的噪声影响及其消解策略的研究: 4; 作者任燚陈宗海《计算机仿真》 CSCD 2005年第10期183-185,194,共4页; 该文针对典型的觅食任务,以计算机仿真为手段,直观地揭示噪声对机器人系统性能的影响。在此基础上,提出了以过程奖赏(process reward)代替传统的结果奖赏(resu lt reward),并与优先扫除(prioritized sweep ing)的强化学习算法结合作为... 展开更多; 关键词移动机器人噪声过程奖赏优先扫除强化学习; 下载PDF 职称材料

多步截断优先扫描强化学习算法: 5; 作者李春贵《计算机工程》 CAS CSCD 北大核心 2005年第11期13-15,共3页; 研究了优先扫描的强化学习方法,通过定义新的迹,把多步截断即时差分学习用于集成规划的优先扫描强化学习,用多步截断即时差分来定义扫描优先权,提出一种改进的优先扫描强化学习算法并进行仿真实验,实验结果表明,新算法的学习效率有明显... 展开更多; 关键词强化学习优先扫描多步截断 MARKOV过程; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部