-
题名基于LSTM深度强化学习的UAV反应式避障方法
被引量:5
- 1
-
-
作者
杨秀霞
高恒杰
刘伟
张毅
-
机构
海军航空大学
-
出处
《飞行力学》
CSCD
北大核心
2022年第4期47-55,62,共10页
-
基金
山东省自然科学基金资助(ZR2020MF090)。
-
文摘
针对传统避障方法难以应用于复杂多障碍的不确定环境问题,提出基于长短时记忆神经网络(LSTM)和深度确定性策略梯度算法(DDPG)的UAV反应式避障方法。首先,采用基于速度障碍法的DDPG避障方法给出了UAV在动态环境中的避障策略;其次,引入LSTM神经网络对DDPG避障方法进行改进,解决了该方法无法表示不同数量障碍状态信息的问题;最后,设计障碍变化策略使UAV在随机训练环境中进行学习,实现了UAV在不同环境中迅速避障。在仿真实验中与多种算法进行对比分析,证明了所提算法具有良好的泛化性和有效性。
-
关键词
无人机
长短时记忆神经网路
深度确定性策略梯度算法
反应式避障
不确定环境
-
Keywords
UAV
long short term memory neural network
deep deterministic policy gradient
reactive obstacle avoidance
uncertain environment
-
分类号
V279
[航空宇航科学与技术—飞行器设计]
V249.1
[航空宇航科学与技术—飞行器设计]
-
-
题名一种动态环境下的移动机器人避障策略
被引量:4
- 2
-
-
作者
郑敏捷
蔡自兴
于金霞
-
机构
中南大学信息科学与工程学院
河南理工大学计算机科学与技术学院
-
出处
《高技术通讯》
CAS
CSCD
北大核心
2006年第8期813-819,共7页
-
基金
国家自然科学基金(60234030)资助项目.
-
文摘
以激光雷达作为主要的环境感知传感器,针对动态环境设计了一种移动机器人避障策略。根据激光雷达采集的实时环境信息,检测动静态障碍物并建立障碍物链表。采用底层反应式避障和高层动态避障相结合的策略,实现了动态环境下的避障。使用分布式的软件设计方法,提高了系统的实时性。通过自行研制的移动机器人MORCS-1进行了实验,实验结果验证了该策略的有效性。
-
关键词
动态环境
障碍物检测
反应式避障
动态避障
激光雷达
-
Keywords
dynamic environment, obstacle perception, reactive obstacle avoidance, dynamic obstacle avoidance,laser radar
-
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于SAC算法的矿山应急救援智能车快速避障控制
被引量:6
- 3
-
-
作者
单麒源
张智豪
张耀心
余宗祥
-
机构
黑龙江科技大学矿业工程学院
-
出处
《黑龙江科技大学学报》
CAS
2021年第1期14-20,共7页
-
基金
黑龙江省省属高校基本科研业务费项目(2018-KYYWF-1173)。
-
文摘
针对传统反应式避障算法存在灵活度差及普适性不足的问题,提出Soft Actor-Critic深度强化学习算法的快速避障方法。通过分析SAC算法的框架及更新策略,采用ROS和RVIZ搭建实验仿真环境,优化SAC算法的状态输入,利用灾后中部车场、下部车场虚拟环境对智能体分别进行训练和验证。结果表明,SAC算法优化后,GPU计算速度和算法添加噪声会导致智能体奖励值出现波动,但最终奖励值趋于稳定,改善了优化前越训练奖励值越低的问题,使避障性能大幅度提升,为实现矿山应急救援智能车快速避障控制提供研究基础。
-
关键词
矿山应急救援
深度强化学习
反应式避障
SAC算法
-
Keywords
mine emergency rescue
deep reinforcement learning
reactive obstacle avoidance
Soft Actor-Critic algorithm
-
分类号
TD82
[矿业工程—煤矿开采]
-