期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进A2C目标驱动的室内无地图导航方法
被引量:
3
1
作者
王彦臻
胡晗
+2 位作者
李文倩
袁士博
和望利
《控制工程》
CSCD
北大核心
2022年第3期474-479,共6页
室内无先验地图场景下的目标驱动式导航是机器人领域的公认难题,近年来兴起的深度强化学习方法为该问题的求解提供了新思路,同时也产生了诸如模型泛化能力不足、难以收敛的新问题。为解决上述问题,提出了一种基于深度强化学习的视觉目...
室内无先验地图场景下的目标驱动式导航是机器人领域的公认难题,近年来兴起的深度强化学习方法为该问题的求解提供了新思路,同时也产生了诸如模型泛化能力不足、难以收敛的新问题。为解决上述问题,提出了一种基于深度强化学习的视觉目标驱动式室内无地图导航方法,设计了一种新的稠密奖励机制,同时引入目标驱动模型并嵌入深度残差网络进行场景特征提取,通过Actor-Critic强化学习算法进行模型训练。以室内导航模拟器Ai2thor为仿真环境,通过对比实验验证了算法具有更快的训练收敛速率及良好的泛化性能。
展开更多
关键词
深度强化学习
室内导航
视觉目标驱动模型
A2C
模型
下载PDF
职称材料
题名
基于改进A2C目标驱动的室内无地图导航方法
被引量:
3
1
作者
王彦臻
胡晗
李文倩
袁士博
和望利
机构
华东理工大学信息科学与工程学院
华东理工大学能源化工过程智能制造教育部重点实验室
出处
《控制工程》
CSCD
北大核心
2022年第3期474-479,共6页
基金
国家优秀青年科学基金资助项目(61922030)。
文摘
室内无先验地图场景下的目标驱动式导航是机器人领域的公认难题,近年来兴起的深度强化学习方法为该问题的求解提供了新思路,同时也产生了诸如模型泛化能力不足、难以收敛的新问题。为解决上述问题,提出了一种基于深度强化学习的视觉目标驱动式室内无地图导航方法,设计了一种新的稠密奖励机制,同时引入目标驱动模型并嵌入深度残差网络进行场景特征提取,通过Actor-Critic强化学习算法进行模型训练。以室内导航模拟器Ai2thor为仿真环境,通过对比实验验证了算法具有更快的训练收敛速率及良好的泛化性能。
关键词
深度强化学习
室内导航
视觉目标驱动模型
A2C
模型
Keywords
Deep reinforcement learning
indoor navigation
a visual-target-driven model
A2C model
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进A2C目标驱动的室内无地图导航方法
王彦臻
胡晗
李文倩
袁士博
和望利
《控制工程》
CSCD
北大核心
2022
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部