期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于强化学习算法的多机器人系统的冲突消解策略
被引量:
7
1
作者
任燚
陈宗海
《控制与决策》
EI
CSCD
北大核心
2006年第4期430-434,439,共6页
多机器人系统中,随着机器人数目的增加,系统中的冲突呈指数级增加,甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务,以计算机仿真为手段,以收集的...
多机器人系统中,随着机器人数目的增加,系统中的冲突呈指数级增加,甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务,以计算机仿真为手段,以收集的目标物数量为系统性能指标,以算法收敛时学习次数为学习速度指标,进行仿真研究,并与基于全局奖赏和Q学习算法等其他9种算法进行比较.结果表明所提出的基于过程奖赏和优先扫除的强化学习算法能显著减少冲突,避免死锁,提高系统整体性能.
展开更多
关键词
多机器人
过程奖赏
优先扫除
强化学习
下载PDF
职称材料
自主移动机器人中基于强化学习的噪声消解策略(英文)
2
作者
任燚
陈宗海
《系统仿真学报》
EI
CAS
CSCD
北大核心
2005年第7期1699-1703,共5页
基于行为的自主移动机器人在获取外界信息时不可避免地会引入噪声,给其系统性能造成一定的影响。提出了一种基于过程奖赏和优先扫除(PS-process)的强化学习算法作为噪声消解策略。针对典型的觅食任务,以计算机仿真为手段。并与其它四种...
基于行为的自主移动机器人在获取外界信息时不可避免地会引入噪声,给其系统性能造成一定的影响。提出了一种基于过程奖赏和优先扫除(PS-process)的强化学习算法作为噪声消解策略。针对典型的觅食任务,以计算机仿真为手段。并与其它四种算法——基于结果奖赏和优先扫除(PS-result)、基于过程奖赏和Q学习(Q-process)、基于结果奖赏和Q学习(Q-result)和基于手工编程策略(Hand)进行比较。研究结果表明比起其它四种算法,本文所提出的基于过程奖赏和优先扫除的强化学习算法能有效降低噪声的影响,提高了系统整体性能。
展开更多
关键词
移动机器人
噪声
过程奖赏
优先扫除
强化学习
下载PDF
职称材料
自主机器人的噪声影响及其消解策略的研究
3
作者
任燚
陈宗海
《计算机仿真》
CSCD
2005年第10期183-185,194,共4页
该文针对典型的觅食任务,以计算机仿真为手段,直观地揭示噪声对机器人系统性能的影响。在此基础上,提出了以过程奖赏(process reward)代替传统的结果奖赏(resu lt reward),并与优先扫除(prioritized sweep ing)的强化学习算法结合作为...
该文针对典型的觅食任务,以计算机仿真为手段,直观地揭示噪声对机器人系统性能的影响。在此基础上,提出了以过程奖赏(process reward)代替传统的结果奖赏(resu lt reward),并与优先扫除(prioritized sweep ing)的强化学习算法结合作为噪声消解策略。然后与基于结果奖赏的Q学习算法(Q-learn ing)等其它四种算法进行比较,结果表明基于过程奖赏和优先扫除的强化学习算法能显著降低噪声的影响,提高了系统整体性能。
展开更多
关键词
移动机器人
噪声
过程奖赏
优先扫除
强化学习
下载PDF
职称材料
改进的CE-Q算法用于多Agent觅食的研究
4
作者
雷默涵
杨萍
《机械设计》
CSCD
北大核心
2015年第6期1-4,共4页
针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入对于动作过程的即时奖赏的CE-Q改进强化算法,有效地改善了上述...
针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入对于动作过程的即时奖赏的CE-Q改进强化算法,有效地改善了上述问题,并在执行任务过程中对Agent进行指导,很好地提高了系统效率。最后以多Agent觅食为任务,Matlab为平台进行仿真实试验,并与普通CE-Q及FF-Q算法进行对比,验证了其在复杂环境下对于多Agent系统的有效性和优越性。
展开更多
关键词
CE-Q强化学习算法
动作
过程奖赏
多Agent觅食任务
系统效率
下载PDF
职称材料
题名
基于强化学习算法的多机器人系统的冲突消解策略
被引量:
7
1
作者
任燚
陈宗海
机构
中国科学技术大学自动化系
出处
《控制与决策》
EI
CSCD
北大核心
2006年第4期430-434,439,共6页
文摘
多机器人系统中,随着机器人数目的增加,系统中的冲突呈指数级增加,甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务,以计算机仿真为手段,以收集的目标物数量为系统性能指标,以算法收敛时学习次数为学习速度指标,进行仿真研究,并与基于全局奖赏和Q学习算法等其他9种算法进行比较.结果表明所提出的基于过程奖赏和优先扫除的强化学习算法能显著减少冲突,避免死锁,提高系统整体性能.
关键词
多机器人
过程奖赏
优先扫除
强化学习
Keywords
Multiple mobile robot system
Process reward, Prioritized sweeping
Reinforcement learning
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
自主移动机器人中基于强化学习的噪声消解策略(英文)
2
作者
任燚
陈宗海
机构
中国科学技术大学自动化系
出处
《系统仿真学报》
EI
CAS
CSCD
北大核心
2005年第7期1699-1703,共5页
文摘
基于行为的自主移动机器人在获取外界信息时不可避免地会引入噪声,给其系统性能造成一定的影响。提出了一种基于过程奖赏和优先扫除(PS-process)的强化学习算法作为噪声消解策略。针对典型的觅食任务,以计算机仿真为手段。并与其它四种算法——基于结果奖赏和优先扫除(PS-result)、基于过程奖赏和Q学习(Q-process)、基于结果奖赏和Q学习(Q-result)和基于手工编程策略(Hand)进行比较。研究结果表明比起其它四种算法,本文所提出的基于过程奖赏和优先扫除的强化学习算法能有效降低噪声的影响,提高了系统整体性能。
关键词
移动机器人
噪声
过程奖赏
优先扫除
强化学习
Keywords
mobile robot
noise
process reward
prioritized sweeping
reinforcement learning
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
自主机器人的噪声影响及其消解策略的研究
3
作者
任燚
陈宗海
机构
中国科学技术大学自动化系
出处
《计算机仿真》
CSCD
2005年第10期183-185,194,共4页
文摘
该文针对典型的觅食任务,以计算机仿真为手段,直观地揭示噪声对机器人系统性能的影响。在此基础上,提出了以过程奖赏(process reward)代替传统的结果奖赏(resu lt reward),并与优先扫除(prioritized sweep ing)的强化学习算法结合作为噪声消解策略。然后与基于结果奖赏的Q学习算法(Q-learn ing)等其它四种算法进行比较,结果表明基于过程奖赏和优先扫除的强化学习算法能显著降低噪声的影响,提高了系统整体性能。
关键词
移动机器人
噪声
过程奖赏
优先扫除
强化学习
Keywords
Mobile robot
Noise
Process reward
Prioritized sweeping
Reinforcement learning
分类号
TP21 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
改进的CE-Q算法用于多Agent觅食的研究
4
作者
雷默涵
杨萍
机构
兰州理工大学机电工程学院
出处
《机械设计》
CSCD
北大核心
2015年第6期1-4,共4页
文摘
针对对策论框架下的诸多强化学习方法在复杂环境多Agent任务中存在的缺乏理性、难以保证收敛、计算复杂度较高和效率偏低等问题,文中在CE-Q强化算法的基本理论上,提出了加入对于动作过程的即时奖赏的CE-Q改进强化算法,有效地改善了上述问题,并在执行任务过程中对Agent进行指导,很好地提高了系统效率。最后以多Agent觅食为任务,Matlab为平台进行仿真实试验,并与普通CE-Q及FF-Q算法进行对比,验证了其在复杂环境下对于多Agent系统的有效性和优越性。
关键词
CE-Q强化学习算法
动作
过程奖赏
多Agent觅食任务
系统效率
Keywords
CE-Q algorithm
reward function for action
multi-Agent forage
efficiency of system
分类号
TH122 [机械工程—机械设计及理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于强化学习算法的多机器人系统的冲突消解策略
任燚
陈宗海
《控制与决策》
EI
CSCD
北大核心
2006
7
下载PDF
职称材料
2
自主移动机器人中基于强化学习的噪声消解策略(英文)
任燚
陈宗海
《系统仿真学报》
EI
CAS
CSCD
北大核心
2005
0
下载PDF
职称材料
3
自主机器人的噪声影响及其消解策略的研究
任燚
陈宗海
《计算机仿真》
CSCD
2005
0
下载PDF
职称材料
4
改进的CE-Q算法用于多Agent觅食的研究
雷默涵
杨萍
《机械设计》
CSCD
北大核心
2015
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部