-
题名跨传感器异步迁移学习的室内单目无人机避障
被引量:2
- 1
-
-
作者
李湛
薛喜地
杨学博
孙维超
于兴虎
高会军
-
机构
哈尔滨工业大学智能控制与系统研究所
哈尔滨工业大学宁波智能装备研究院
哈尔滨工业大学机器人技术与系统国家重点实验室
-
出处
《宇航学报》
EI
CAS
CSCD
北大核心
2020年第6期811-819,共9页
-
基金
国家自然科学基金联合基金(U1964201)
黑龙江省自然科学基金(LH2019F020)。
-
文摘
针对强化学习策略由仿真环境向实际迁移困难的问题,以提高无人机采用无深度信息单目视觉时的行人规避能力为目标,提出一种基于异步深度神经网络结构的跨传感器迁移学习方法。首先,在仿真环境中仅使用虚拟单线激光雷达作为传感器,通过基于确定性策略梯度(DDPG)的深度强化学习方法,训练得到一个稳定的初级避障策略。其次,用单目摄像头和激光雷达同步采集现实环境中的视觉和深度数据集并逐帧绑定,使用上述初级避障策略对现实数据集进行自动标注,进而训练得到无需激光雷达数据的单目视觉避障策略,实现从虚拟激光雷达到现实单目视觉的跨传感器迁移学习。最后,引入YOLO v3-tiny网络与Resnet18网络组成异步深度神经网络结构,有效提高了存在行人场景下的避障性能。
-
关键词
单目视觉
深度强化学习
确定性策略梯度
跨传感器迁移学习
异步深度神经网络
-
Keywords
Monocular vision
Deep reinforcement learning
Deterministic policy gradient
Cross-sensor transfer learning
Asynchronous deep neural network
-
分类号
V19
[航空宇航科学与技术—人机与环境工程]
-