期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度强化学习的区域化视觉导航方法
被引量:
9
1
作者
李鹏
阮晓钢
+3 位作者
朱晓庆
柴洁
任顶奇
刘鹏飞
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2021年第5期575-585,共11页
针对移动机器人在分布式环境中的导航问题,提出一种基于深度强化学习的区域化视觉导航方法.首先,根据分布式环境特征,在不同区域内独立学习控制策略,同时构建区域化模型,实现导航过程中控制策略的切换和结合.然后,为使机器人具有更好的...
针对移动机器人在分布式环境中的导航问题,提出一种基于深度强化学习的区域化视觉导航方法.首先,根据分布式环境特征,在不同区域内独立学习控制策略,同时构建区域化模型,实现导航过程中控制策略的切换和结合.然后,为使机器人具有更好的目标导向行为,在区域导航子模块中增加奖励预测任务,并结合经验池回放奖励序列.最后,在原有探索策略的基础上添加景深约束,防止因碰撞导致的遍历停滞.结果表明:奖励预测和景深避障的应用有助于提升导航性能.在多区域环境测试过程中,区域化模型在训练时间和所获奖励上展现出单一模型不具备的优势,表明其能更好地应对大范围导航.此外,实验在第一人称视角的3D环境下进行,状态是部分可观察的,利于实际应用.
展开更多
关键词
深度强化学习
分布式环境
区域化模型
奖励预测
景深避障
下载PDF
职称材料
题名
基于深度强化学习的区域化视觉导航方法
被引量:
9
1
作者
李鹏
阮晓钢
朱晓庆
柴洁
任顶奇
刘鹏飞
机构
北京工业大学信息学部
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2021年第5期575-585,共11页
基金
国家自然科学基金(61773027)
北京市自然科学基金(4202005)。
文摘
针对移动机器人在分布式环境中的导航问题,提出一种基于深度强化学习的区域化视觉导航方法.首先,根据分布式环境特征,在不同区域内独立学习控制策略,同时构建区域化模型,实现导航过程中控制策略的切换和结合.然后,为使机器人具有更好的目标导向行为,在区域导航子模块中增加奖励预测任务,并结合经验池回放奖励序列.最后,在原有探索策略的基础上添加景深约束,防止因碰撞导致的遍历停滞.结果表明:奖励预测和景深避障的应用有助于提升导航性能.在多区域环境测试过程中,区域化模型在训练时间和所获奖励上展现出单一模型不具备的优势,表明其能更好地应对大范围导航.此外,实验在第一人称视角的3D环境下进行,状态是部分可观察的,利于实际应用.
关键词
深度强化学习
分布式环境
区域化模型
奖励预测
景深避障
Keywords
deep reinforcement learning
distributed environment
regionalization model
reward prediction
depth obstacle avoidance
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度强化学习的区域化视觉导航方法
李鹏
阮晓钢
朱晓庆
柴洁
任顶奇
刘鹏飞
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2021
9
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部