期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于改进A2C目标驱动的室内无地图导航方法 被引量:3
1
作者 王彦臻 胡晗 +2 位作者 李文倩 袁士博 和望利 《控制工程》 CSCD 北大核心 2022年第3期474-479,共6页
室内无先验地图场景下的目标驱动式导航是机器人领域的公认难题,近年来兴起的深度强化学习方法为该问题的求解提供了新思路,同时也产生了诸如模型泛化能力不足、难以收敛的新问题。为解决上述问题,提出了一种基于深度强化学习的视觉目... 室内无先验地图场景下的目标驱动式导航是机器人领域的公认难题,近年来兴起的深度强化学习方法为该问题的求解提供了新思路,同时也产生了诸如模型泛化能力不足、难以收敛的新问题。为解决上述问题,提出了一种基于深度强化学习的视觉目标驱动式室内无地图导航方法,设计了一种新的稠密奖励机制,同时引入目标驱动模型并嵌入深度残差网络进行场景特征提取,通过Actor-Critic强化学习算法进行模型训练。以室内导航模拟器Ai2thor为仿真环境,通过对比实验验证了算法具有更快的训练收敛速率及良好的泛化性能。 展开更多
关键词 深度强化学习 室内导航 视觉目标驱动模型 A2C模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部