期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于LSTM深度强化学习的UAV反应式避障方法 被引量:5
1
作者 杨秀霞 高恒杰 +1 位作者 刘伟 张毅 《飞行力学》 CSCD 北大核心 2022年第4期47-55,62,共10页
针对传统避障方法难以应用于复杂多障碍的不确定环境问题,提出基于长短时记忆神经网络(LSTM)和深度确定性策略梯度算法(DDPG)的UAV反应式避障方法。首先,采用基于速度障碍法的DDPG避障方法给出了UAV在动态环境中的避障策略;其次,引入LST... 针对传统避障方法难以应用于复杂多障碍的不确定环境问题,提出基于长短时记忆神经网络(LSTM)和深度确定性策略梯度算法(DDPG)的UAV反应式避障方法。首先,采用基于速度障碍法的DDPG避障方法给出了UAV在动态环境中的避障策略;其次,引入LSTM神经网络对DDPG避障方法进行改进,解决了该方法无法表示不同数量障碍状态信息的问题;最后,设计障碍变化策略使UAV在随机训练环境中进行学习,实现了UAV在不同环境中迅速避障。在仿真实验中与多种算法进行对比分析,证明了所提算法具有良好的泛化性和有效性。 展开更多
关键词 无人机 长短时记忆神经网路 深度确定性策略梯度算法 反应式避障 不确定环境
原文传递
一种动态环境下的移动机器人避障策略 被引量:4
2
作者 郑敏捷 蔡自兴 于金霞 《高技术通讯》 CAS CSCD 北大核心 2006年第8期813-819,共7页
以激光雷达作为主要的环境感知传感器,针对动态环境设计了一种移动机器人避障策略。根据激光雷达采集的实时环境信息,检测动静态障碍物并建立障碍物链表。采用底层反应式避障和高层动态避障相结合的策略,实现了动态环境下的避障。使... 以激光雷达作为主要的环境感知传感器,针对动态环境设计了一种移动机器人避障策略。根据激光雷达采集的实时环境信息,检测动静态障碍物并建立障碍物链表。采用底层反应式避障和高层动态避障相结合的策略,实现了动态环境下的避障。使用分布式的软件设计方法,提高了系统的实时性。通过自行研制的移动机器人MORCS-1进行了实验,实验结果验证了该策略的有效性。 展开更多
关键词 动态环境 碍物检测 反应式避障 动态 激光雷达
下载PDF
基于SAC算法的矿山应急救援智能车快速避障控制 被引量:6
3
作者 单麒源 张智豪 +1 位作者 张耀心 余宗祥 《黑龙江科技大学学报》 CAS 2021年第1期14-20,共7页
针对传统反应式避障算法存在灵活度差及普适性不足的问题,提出Soft Actor-Critic深度强化学习算法的快速避障方法。通过分析SAC算法的框架及更新策略,采用ROS和RVIZ搭建实验仿真环境,优化SAC算法的状态输入,利用灾后中部车场、下部车场... 针对传统反应式避障算法存在灵活度差及普适性不足的问题,提出Soft Actor-Critic深度强化学习算法的快速避障方法。通过分析SAC算法的框架及更新策略,采用ROS和RVIZ搭建实验仿真环境,优化SAC算法的状态输入,利用灾后中部车场、下部车场虚拟环境对智能体分别进行训练和验证。结果表明,SAC算法优化后,GPU计算速度和算法添加噪声会导致智能体奖励值出现波动,但最终奖励值趋于稳定,改善了优化前越训练奖励值越低的问题,使避障性能大幅度提升,为实现矿山应急救援智能车快速避障控制提供研究基础。 展开更多
关键词 矿山应急救援 深度强化学习 反应式避障 SAC算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部