期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
采用注意力机制和奖励塑造的深度强化学习视觉目标导航方法
被引量:
1
1
作者
孟怡悦
郭迟
刘经南
《武汉大学学报(信息科学版)》
EI
CAS
CSCD
北大核心
2024年第7期1100-1108,1119,共10页
视觉目标导航作为视觉导航的重要任务之一,要求智能体在给定导航目标的前提下,仅仅依靠视觉图像信息探索环境并导航到目标跟前,并提出任务结束动作。现有视觉目标导航方法基于端到端的深度强化学习框架来解决视觉目标导航问题,仍存在导...
视觉目标导航作为视觉导航的重要任务之一,要求智能体在给定导航目标的前提下,仅仅依靠视觉图像信息探索环境并导航到目标跟前,并提出任务结束动作。现有视觉目标导航方法基于端到端的深度强化学习框架来解决视觉目标导航问题,仍存在导航成功率和效率不高的不足。为了进一步提升视觉目标导航方法下智能体的导航性能,提出了一种基于注意力机制和奖励塑造的深度强化学习视觉目标导航方法。针对强化学习中状态构建不佳和奖励稀疏问题,利用缩放点积注意力机制引入当前时间步和上一时间步的状态之间的关系,用于构建更佳的当前时间步的状态,利用奖励塑造自动化设置奖励空间,解决奖励稀疏问题。在AI2-THOR数据集上进行实验,并使用成功率和路径长度加权成功率评估方法性能。实验结果显示,相较于以往的方法,所提出的方法在成功率上提高了7%,在路径长度加权成功率上提高了20%。该方法使用注意力机制和奖励塑造构建了更好的状态和奖励空间,能够进一步提升智能体的导航成功率和效率。
展开更多
关键词
视觉
导航
视觉目标导航
深度强化学习
注意力机制
奖励塑造
原文传递
题名
采用注意力机制和奖励塑造的深度强化学习视觉目标导航方法
被引量:
1
1
作者
孟怡悦
郭迟
刘经南
机构
武汉大学卫星导航定位技术研究中心
湖北珞珈实验室
出处
《武汉大学学报(信息科学版)》
EI
CAS
CSCD
北大核心
2024年第7期1100-1108,1119,共10页
基金
湖北省重大科技专项(2022AAA009)
湖北珞珈实验室开放基金。
文摘
视觉目标导航作为视觉导航的重要任务之一,要求智能体在给定导航目标的前提下,仅仅依靠视觉图像信息探索环境并导航到目标跟前,并提出任务结束动作。现有视觉目标导航方法基于端到端的深度强化学习框架来解决视觉目标导航问题,仍存在导航成功率和效率不高的不足。为了进一步提升视觉目标导航方法下智能体的导航性能,提出了一种基于注意力机制和奖励塑造的深度强化学习视觉目标导航方法。针对强化学习中状态构建不佳和奖励稀疏问题,利用缩放点积注意力机制引入当前时间步和上一时间步的状态之间的关系,用于构建更佳的当前时间步的状态,利用奖励塑造自动化设置奖励空间,解决奖励稀疏问题。在AI2-THOR数据集上进行实验,并使用成功率和路径长度加权成功率评估方法性能。实验结果显示,相较于以往的方法,所提出的方法在成功率上提高了7%,在路径长度加权成功率上提高了20%。该方法使用注意力机制和奖励塑造构建了更好的状态和奖励空间,能够进一步提升智能体的导航成功率和效率。
关键词
视觉
导航
视觉目标导航
深度强化学习
注意力机制
奖励塑造
Keywords
visual navigation
visual target navigation
deep reinforcement learning
attention mechanism
reward shaping
分类号
P208 [天文地球—地图制图学与地理信息工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
采用注意力机制和奖励塑造的深度强化学习视觉目标导航方法
孟怡悦
郭迟
刘经南
《武汉大学学报(信息科学版)》
EI
CAS
CSCD
北大核心
2024
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部