期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
复杂可交互场景下基于异策略分层强化学习的搜救机器人自主决策
1
作者
殷辰堃
纪宏萱
张严心
《北京工业大学学报》
CAS
CSCD
北大核心
2023年第4期403-414,共12页
机器人在搜救任务中的自主决策能力对降低救援人员的风险具有重大意义.为了使机器人在面对复杂多解的搜救任务时能自主形成决策和合理的路径规划,设计了一种异策略分层强化学习算法.该算法由两层Soft Actor-Critic(SAC)智能体组成,高层...
机器人在搜救任务中的自主决策能力对降低救援人员的风险具有重大意义.为了使机器人在面对复杂多解的搜救任务时能自主形成决策和合理的路径规划,设计了一种异策略分层强化学习算法.该算法由两层Soft Actor-Critic(SAC)智能体组成,高层智能体可以自动生成低层智能体所需的目标并提供内在奖励指导其直接与环境进行交互.在分层强化学习的框架下,首先将复杂可交互场景下的机器人搜救任务描述为高层半马尔可夫决策过程与低层马尔可夫决策过程的双层结构,并针对不同层级设计不同的状态空间、动作空间与奖励函数等.其次,针对传统强化学习算法中目标与奖励函数需要人工设计且缺乏通用性的问题,应用基于SAC的异策略分层强化学习算法训练双足移动机器人与复杂场景交互,通过数据的高效利用和目标空间的调整实现救援机器人的自主决策.仿真结果验证了所设计的算法在解决复杂多路径搜救任务中的有效性和通用性.
展开更多
关键词
分层强化学习
Soft
Actor-Critic算法
搜索救援任务
双足移动机器人
自主决策
交互场景
下载PDF
职称材料
美国空军试图更新战斗搜索救援直升机
2
《环球飞行》
2004年第1期5-5,共1页
关键词
美国空军
战斗
搜索救援任务
HH-60G直升机
生存能力
原文传递
题名
复杂可交互场景下基于异策略分层强化学习的搜救机器人自主决策
1
作者
殷辰堃
纪宏萱
张严心
机构
北京交通大学电子信息工程学院
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2023年第4期403-414,共12页
基金
国家自然科学基金面上资助项目(62273028,62073025,62073026)。
文摘
机器人在搜救任务中的自主决策能力对降低救援人员的风险具有重大意义.为了使机器人在面对复杂多解的搜救任务时能自主形成决策和合理的路径规划,设计了一种异策略分层强化学习算法.该算法由两层Soft Actor-Critic(SAC)智能体组成,高层智能体可以自动生成低层智能体所需的目标并提供内在奖励指导其直接与环境进行交互.在分层强化学习的框架下,首先将复杂可交互场景下的机器人搜救任务描述为高层半马尔可夫决策过程与低层马尔可夫决策过程的双层结构,并针对不同层级设计不同的状态空间、动作空间与奖励函数等.其次,针对传统强化学习算法中目标与奖励函数需要人工设计且缺乏通用性的问题,应用基于SAC的异策略分层强化学习算法训练双足移动机器人与复杂场景交互,通过数据的高效利用和目标空间的调整实现救援机器人的自主决策.仿真结果验证了所设计的算法在解决复杂多路径搜救任务中的有效性和通用性.
关键词
分层强化学习
Soft
Actor-Critic算法
搜索救援任务
双足移动机器人
自主决策
交互场景
Keywords
hierarchical reinforcement learning
Soft Actor-Critic algorithm
searching and rescue tasks
bipedal mobile robots
autonomous decision-making
interactive environment
分类号
U461 [机械工程—车辆工程]
TP308 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
美国空军试图更新战斗搜索救援直升机
2
出处
《环球飞行》
2004年第1期5-5,共1页
关键词
美国空军
战斗
搜索救援任务
HH-60G直升机
生存能力
分类号
V275.1 [航空宇航科学与技术—飞行器设计]
E712.54 [军事—军事理论]
原文传递
题名
作者
出处
发文年
被引量
操作
1
复杂可交互场景下基于异策略分层强化学习的搜救机器人自主决策
殷辰堃
纪宏萱
张严心
《北京工业大学学报》
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
2
美国空军试图更新战斗搜索救援直升机
《环球飞行》
2004
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部