-
题名基于后继强化学习的智能小车导航策略的迁移
- 1
-
-
作者
钱浩
何军
胡昭华
-
机构
南京信息工程大学电子与信息工程学院
南京信息工程大学人工智能学院
南京信息工程大学江苏省大气环境与装备技术协同创新中心
-
出处
《现代电子技术》
2022年第6期169-174,共6页
-
基金
国家自然科学基金资助项目(61601230)。
-
文摘
针对目前智能小车导航策略在环境迁移中需要花费大量时间重新训练的问题,文中提出一种基于深度强化学习的智能小车导航策略。该策略使用后继强化学习作为智能小车的决策框架,结合特征映射,使智能小车可以将先前环境中学习的导航策略迁移到新的环境中。首先在初始环境中建立后继强化学习的控制模型,在模型的特征提取输出端加入特征映射网络,使模型可以将新环境的特征映射到旧环境之中,将智能小车在环境中提取的图像信息作为输入状态训练模型。然后将该模型迁移到新的环境之中进行训练,通过特征映射在新环境中复用旧环境的策略,从而减少在环境迁移中的训练时间。最后在仿真环境下进行训练并验证。实验结果表明,所提方法可以在自主完成导航任务的同时减少训练时间,且与传统的强化学习方法相比,在环境迁移的过程中能更快适应新的环境。
-
关键词
强化学习
自主导航
智能小车
路径规划
环境迁移
后继特征
深度学习
端到端决策
-
Keywords
reinforcement learning
autonomous navigation
mobile robot
path planning
environment migration
successor representations
deep learning
end⁃to⁃end decision⁃making
-
分类号
TN915-34
[电子电信—通信与信息系统]
TP391
[自动化与计算机技术—计算机应用技术]
-