一种基于强化学习的小库位自动平行泊车运动规划方法被引量：8

A Motion Planning Method Based on Reinforcement Learning for Automatic Parallel Parking in Small Slot

下载PDF

导出

摘要为解决传统方法或基于强化学习的方法在狭小空间下平行泊车效率较低的问题,基于蒙特卡罗树搜索(MCTS)方法,同时规划倒车入库和库位内调整阶段。在MCTS过程中同时考虑纵向动作(速度)与横向动作(转向盘转角),引入模仿学习(IL),利用非线性规划的演示数据获得初始化策略神经网络,并使用强化学习(RL)对其进行改进,训练时间从20 h缩短到1 h,采用滑模控制器作为横向控制器来跟踪规划的路径,车辆运动方向可通过绑定在规划路径上的规划速度的方向确定。仿真验证和实车测试结果表明,该方法可同时规划倒车入库阶段和库位内调整阶段,位置误差可达5 cm,航向角误差可达0.5°。 In order to solve the problem of low efficiency for parallel parking in narrow space with traditional methods or methods based on reinforcement learning,this paper proposes a Monte Carlo Tree Search(MCTS)based method to plan simultaneously reversing and adjusting stages of parallel parking in tiny parking space.In the MCTS process,longitudinal action(velocity)and lateral action(steering wheel angle)are considered at the same time.Imitation Learning(IL)is introduced,which utilizes demonstration data from non-linear programming to get an initialized policy neural network and then uses RL to improve it,which reduces the training time from 20 h to 1 h.A sliding mode controller is adopted as lateral controller to track the planned path and the direction can be determined by the planned velocity profile bound on the planned path.The results of simulations and vehicle tests show that the proposed method can plan simultaneously 2 stages of parallel parking and complete the parking in tiny slot within 5 cm position error and 0.5°heading angle error.

作者孙宏伟陈慧宋绍禹 Sun Hongwei;Chen Hui;Song Shaoyu(Tongji University,Shanghai 201804)

机构地区同济大学

出处《汽车技术》 CSCD 北大核心 2021年第9期17-26,共10页 Automobile Technology

关键词平行泊车运动规划模仿学习强化学习滑模控制器 Parallel parking Motion planning Imitation learning Reinforcement learning Sliding mode controller

分类号 U463.6 [机械工程—车辆工程]

引文网络
相关文献

同被引文献103

1赵真明,孟正大.基于加权A~*算法的服务型机器人路径规划[J].华中科技大学学报（自然科学版）,2008,36(S1):196-198. 被引量：32
2马军,贺岩松,李兴泉,徐中明,张志飞.汽车驾驶员自适应模糊PID控制模型[J].机械与电子,2007,25(2):35-38. 被引量：9
3王振华,章卫国,李广文,穆旭.基于非均匀B-样条的G2路径平滑方法[J].系统工程与电子技术,2011,33(7):1539-1543. 被引量：11
4游峰,张荣辉,王海玮,温惠英,徐建闽.基于纵向安全距离的超车安全预警模型[J].华南理工大学学报（自然科学版）,2013,41(8):87-92. 被引量：31
5罗峰,曾侠.基于多点预瞄的自动驾驶汽车轨迹跟踪算法[J].机电一体化,2018,24(6):17-22. 被引量：5
6李柏,张友民,邵之江.自动驾驶车辆运动规划方法综述[J].控制与信息技术,2018(6):1-6. 被引量：24
7刘大瑞,钱程,林涛.基于多目标A～＊算法的游戏NPC路径规划[J].计算机应用研究,2014,31(8):2279-2282. 被引量：7
8陈荣华,王可心,邵之江.自主泊车的全联立动态优化方法[J].控制理论与应用,2016,33(5):561-568. 被引量：10
9刘贵如,周鸣争,王陆林,王海.城市工况下最小安全车距控制模型和避撞算法[J].汽车工程,2016,38(10):1200-1205. 被引量：17
10黄辰,费继友,刘洋,李花,刘晓东.基于动态反馈A~*蚁群算法的平滑路径规划方法[J].农业机械学报,2017,48(4):34-40. 被引量：74

引证文献8

1胡杰,朱令磊,陈瑞楠,钟鑫凯,徐文才,张敏超.狭小车位平行泊车路径规划方法研究[J].汽车工程,2022,44(7):1040-1048. 被引量：10
2张辉,张瑞亮,许小庆,范政武.基于关键节点的改进A^(*)无人车路径规划算法[J].汽车技术,2023(3):10-18. 被引量：13
3刘平,陈卓,刘明杰,朴昌浩,Jang Soohyun,万凯林.阶段约束下Gauss配点离散化平行车位自动泊车轨迹规划[J].汽车工程,2023,45(7):1163-1173. 被引量：1
4张洪艳,陈耀威,耿旺,刘义凡,陈晓会.多曲线在狭小空间下逆向泊车[J].工业控制计算机,2023,36(10):63-65.
5李琳辉,袁世伟,连静,顾汤鹏.基于协作注意力和图神经网络的轻量化车位检测算法[J].汽车技术,2023(11):41-48. 被引量：1
6陈晓明,李柏,范丽丽,张友民.自动泊车运动规划方法综述[J].控制与信息技术,2024(1):1-13. 被引量：1
7郑川,杜煜,刘子健.自动驾驶汽车横向控制方法研究综述[J].汽车工程师,2024(5):1-10. 被引量：1
8田杰,叶青.自动泊车发展现状及运动规划研究进展[J].科学技术与工程,2024,24(21):8825-8836.

二级引证文献26

1陈思成,纪玉杰,路达.采样机器人路径规划研究[J].内燃机与配件,2022(22):96-98.
2沙飞斐.轮式沥青摊铺机施工路径规划方法[J].建筑机械,2023(3):60-64. 被引量：1
3曹彦博,颜京才,李旭升,曹立波.基于改进混合A*算法的自动泊车系统路径搜索方法[J].汽车技术,2023(6):37-41. 被引量：5
4朱茂飞,贺晨辰,张春鹏,吴琼,朱守力.基于方向引导的智能车VFH+路径规划算法研究[J].计算机应用研究,2023,40(7):2090-2095. 被引量：2
5刘平,陈卓,刘明杰,朴昌浩,Jang Soohyun,万凯林.阶段约束下Gauss配点离散化平行车位自动泊车轨迹规划[J].汽车工程,2023,45(7):1163-1173. 被引量：1
6房殿军,王少杰,蒋红琰,陆谦谦,Rolf Schmidt.融合改进A^(*)算法和动态窗口法的AGV路径规划[J].物流技术,2023,42(8):47-52. 被引量：3
7宋军.基于增强型蚁群算法的压路机工作路径规划方法[J].建筑机械,2023(11):126-131.
8何阳,曲凯,袁璞,侯明豆.基于学习型粒子群算法的巡航导弹路径规划仿真验证[J].现代电子技术,2023,46(23):114-120.
9樊康生,杨光永,黄训爱,陈旭东,徐天奇.一种改进启发函数的A^(*)算法[J].扬州大学学报（自然科学版）,2023,26(5):52-57.
10张洪昌,宁鹏,杨杰,宋建伟,郝麟,曾娟.基于双层求解策略的平行泊车轨迹规划[J].汽车工程,2023,45(12):2299-2309. 被引量：1

1刘婷婷,汪云海,屠长河,蒋鹏.基于蒙特卡罗树搜索的树图布局[J].计算机辅助设计与图形学学报,2021,33(9):1367-1376. 被引量：1
2高强,陆洲,段晨东,徐婷.汽车垂直泊车路径规划与路径跟踪研究[J].汽车工程,2021,43(7):987-994. 被引量：12
3付行,聂文福,王凯,任文峰.基于采样的无人车路径规划算法仿真与验证[J].汽车电器,2021(9):13-15. 被引量：1
4刘勍.资源分配技术在云计算系统中的应用研究[J].信息与电脑,2021,33(13):33-35.
5常秀岩,高尚,姜廷龙,侯慧贤,张建伟.基于功能安全要求的线控转向系统开发及验证[J].汽车技术,2021(9):27-32. 被引量：3
6乐晋,杨龙河.全固态捷联式惯性/天文组合导航技术[J].光学与光电技术,2021,19(3):67-74.
7庄小鹏,黄海建,陈新,陈志忠,陈小岩.卵巢转移瘤合并原发瘤二例[J].中华病理学杂志,2021,50(9):1057-1059.
8陆秋秋,易文俊.基于hp-RPM的滑翔弹道优化及制导仿真[J].兵器装备工程学报,2021,42(9):34-39. 被引量：1
9庄小鹏,黄海建,陈新,陈志忠,叶美仙,杨雄华,陈小岩.子宫体子宫内膜样癌转移至卵巢成熟性囊性畸胎瘤一例[J].中华病理学杂志,2021,50(8):953-955. 被引量：2

汽车技术

2021年第9期

浏览历史

内容加载中请稍等...

一种基于强化学习的小库位自动平行泊车运动规划方法被引量：8

同被引文献103

引证文献8

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

一种基于强化学习的小库位自动平行泊车运动规划方法 被引量：8

同被引文献103

引证文献8

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

一种基于强化学习的小库位自动平行泊车运动规划方法被引量：8