基于DDPG算法的无人车辆防碰撞控制策略被引量：9

Anti Collision Control Strategy of Unmanned Vehicle Based on DDPG Algorithm

导出

摘要目前,强化学习在无人驾驶领域得到了广泛应用,但是如何提高无人车辆的稳定性并满足在不同工况中同时完成路径跟踪和车辆避障的要求依旧是一个难题。针对无人车辆路径跟踪与避障功能需求,提出一种基于深度确定梯度策略(Deep Deterministic Policy Gradient,DDPG)算法的无人车辆防碰撞控制策略。首先,根据DDPG算法原理和车辆控制模型得到控制系统的输入输出量,并提出一种基于sin函数的变道轨迹规划方式,来提高车辆避障能力。其次,根据控制系统输入输出量设计神经网络控制器以及研究其策略探索方案,并提出一种基于对数函数的奖励塑造方案,以解决奖励稀疏问题。最后,通过仿真实验证明,基于DDPG算法的无人车辆控制策略能够更加安全、稳定地控制车辆完成路径跟踪与避障任务,且控制精度更高。 At present,reinforcement learning has been widely used in the field of unmanned driving,but how to improve the stability of unmanned vehicles and meet the requirements of path tracking and vehicle obstacle avoidance under different working conditions is still a difficult problem.Aiming at the functional requirements of path tracking and obstacle avoidance of unmanned vehicles,an anti-collision control strategy of unmanned vehicles based on deep deterministic policy gradient(DDPG)algorithm was proposed in this paper.Firstly,according to the principle of DDPG algorithm and vehicle control model,the input and output of the control system were obtained,and a lane change trajectory planning method based on sin function was proposed to improve the vehicle obstacle avoidance ability.Secondly,according to the input and output of the control system,the neural network controller was designed and its strategy exploration scheme was studied,and a reward shaping scheme based on logarithmic function was proposed to solve the problem of sparse reward.Finally,the simulation results show that the unmanned vehicle control strategy based on DDPG algorithm can control the vehicle to complete the path tracking and obstacle avoidance tasks more safely and stably,and the control accuracy is higher.

作者赖金萍李浩石英徐腊梅闫浩 LAI Jin-ping;LI Hao;SHI Ying;XU La-mei;YAN Hao(School of Automation,Wuhan University of Technology,Wuhan 430070,China;Tianjin Port Information Technology Development Co Ltd,Tianjin 300456,China)

机构地区武汉理工大学自动化学院天津港信息技术发展有限公司

出处《武汉理工大学学报》 CAS 2021年第10期68-76,共9页 Journal of Wuhan University of Technology

基金国家自然科学基金(51805388)。

关键词无人车辆强化学习 DDPG 路径跟踪防碰撞 unmanned vehicle strengthen learning DDPG path tracking anti collision

分类号 TP273.2 [自动化与计算机技术—检测技术与自动化装置] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1吴晟博,曹理想.无人驾驶车辆轨迹跟踪控制研究[J].汽车实用技术,2020,0(1):51-53. 被引量：10
2邱少林,钱立军,陆建辉.基于最优预瞄的智能车变道控制[J].中国机械工程,2019,30(23):2778-2783. 被引量：7
3赵熙俊,陈慧岩.智能车辆路径跟踪横向控制方法的研究[J].汽车工程,2011,33(5):382-387. 被引量：109

二级参考文献19

1Ackermann J, Guldner J, Utkin V I. A Robust Nonlinear Control Approach to Automatic Path Tracking of a Car[ C ]. International Conference on Control, 1994 : 196 - 201.
2Han-Shue T, Bougler B, Farrell J A, et al. Automatic Vehicle Steering Controls : DGPS/INS and Magnetic Markers [ C ]. Pro- ceedings of the American Control Conference, Denver, Colorado: IEEE ,2003160 - 65.
3Ackermann J. Robust Control: The Parameter Space Approach [ M ]. 2nd ed. London: Springer,2002.
4Broggi A, Bertozzi M, Fascioli A, et al. The ARGO Autonomous Vehicle's Vision and Control Systems [ J 1. The International Jour- nal of Intelligent Control and Systems, 1999,3 ( 4 ) :409 - 441.
5Junmin W, Steiber J, Surampudi B. Autonomous Ground Vehicle Control System for High-speed and Safe Operation[ C ]. American Control Conference ,2008:218 - 223.
6Thrun S, Montemerlo M, Dahlkamp H, et al. Stanley : The Robot that Won the DARPA Grand Challenge [ J ]. Journal of Field Ro- botics,2006,23 (9) :661 - 692.
7Urmson C, Ragusa C, Ray D, et al. A Robust Approach to High- speed Navigation for Unrehearsed Desert Terrain [ J ]. Journal of Field Robotics ,2006,23 ( 8 ) :467 - 508.
8J Y W. Theory of the Ground Vehicles [ M ]. New York : JOHN WILEY&SONS, INS,2001.
9Doff R C,Bishop R H.现代控制系统[M].北京:高等教育出版社,2001.
10Li L, Feiyue W. Advanced Motion Control and Sensing for Intelli- gent Vehicles [ M ]. Berlin : Springer,2007.

共引文献121

1陈浩,喻厚宇,黄妙华.基于距离和航向角偏差补偿的路径跟踪算法研究[J].武汉理工大学学报,2019,41(5):91-96. 被引量：2
2付景枝,尹泽凡,刘云平,范嘉宇,朱涵智.基于改进纯跟踪算法的无人车路径跟踪研究[J].机械设计,2022,39(S02):41-45. 被引量：5
3张立广,谭宝成,马天力.无人驾驶车辆路径跟踪控制器的设计及实现[J].西安工业大学学报,2013,33(8):680-684. 被引量：6
4刘坤,唐新蓬.基于微分对策的四轮转向汽车路径追踪算法研究[J].机械科学与技术,2015,34(2):291-295. 被引量：1
5李进,陈无畏.基于自适应导航参数的智能车辆视觉导航[J].农业机械学报,2012,43(6):19-24. 被引量：14
6李琳辉,李明,郭景华,连静.基于视觉的智能车辆模糊滑模横向控制[J].大连理工大学学报,2013,53(5):735-741. 被引量：22
7汪明磊,陈无畏,王家恩.基于道路势场的车道偏离自动校正自适应控制[J].中国机械工程,2013,24(24):3402-3407. 被引量：6
8郭烈,张荣辉,葛平淑,任泽建,黄晓慧.双闭环结构的智能车辆弯路换道轨迹跟踪控制[J].汽车工程学报,2014,4(4):245-252. 被引量：3
9张琨,崔胜民,王剑锋.基于模糊神经网络的智能车辆循迹控制[J].汽车工程,2015,37(1):38-42. 被引量：19
10赵伟,王宁宁,段燕燕,张明柱.载重汽车曲线行驶智能循迹控制仿真研究[J].郑州大学学报（工学版）,2015,36(2):10-13. 被引量：2

同被引文献126

1韩勇.露天煤矿车辆防碰撞升级与无人驾驶联动的智能运输管理系统[J].工矿自动化,2022,48(S01):67-71. 被引量：3
2梁帅,杨林,杨朝旭,许斌.基于Kalman滤波的变体飞行器T-S模糊控制[J].航空学报,2020(S02):61-68. 被引量：8
3刘梦奇,王维强,田良宇.基于B样条曲线的无人驾驶车辆Informed RRT^(*)算法研究[J].智能计算机与应用,2022,12(4):25-29. 被引量：5
4沈钰,孟樱,王睿晗,朋琦,陈迪,欣龙,邱意敏.基于模糊控制的智能电风扇的设计[J].湘南学院学报,2022,43(2):104-111. 被引量：2
5董力耘,孟庆勋.Effect of Relative Velocity on the Optimal Velocity Model[J].Journal of Shanghai University(English Edition),2005,9(4):283-285. 被引量：3
6董力耘,翁旭丹,李庆定.Velocity anticipation in the optimal velocity model[J].Journal of Shanghai University(English Edition),2009,13(4):327-332. 被引量：1
7韦艳芳,时伟,邝华,宋涛,董力耘.无信号交叉口行人过街决策行为分析[J].上海大学学报（自然科学版）,2013,19(3):315-318. 被引量：3
8王登贵,杨艳.基于激光测距的矿井机车防撞测距系统研究[J].工矿自动化,2014,40(7):80-83. 被引量：9
9田欢欢,董力耘,薛郁.基于非对称作用的二维优化速度改进模型[J].广西科学,2015,22(4):357-361. 被引量：2
10施伟,高军.无线传感器网络中基于RSSI的改进加权质心定位算法[J].计算机应用与软件,2015,32(12):68-70. 被引量：15

引证文献9

1卜文锐.基于多数据融合的智能定位传感器避障方法研究[J].自动化与仪器仪表,2022(10):231-236. 被引量：1
2蒲德全,高振刚,李鹏洲.矿井无轨辅助运输车辆无人驾驶研究现状分析[J].现代矿业,2023,39(6):44-51. 被引量：1
3宋涛,王彦林,魏昕恺,韦艳芳.深度确定性策略梯度算法耦合模型驱动的行人过街仿真[J].上海大学学报（自然科学版）,2023,29(4):651-665.
4任山山.基于运动学模型的无人驾驶车辆运动避障方法[J].信息与电脑,2023,35(11):71-73. 被引量：1
5邓彦波,刘钊希.基于VGGNet网络的雾霾无人车防碰撞研究[J].农机使用与维修,2023(9):24-26.
6张梅蕊,杨梅,樊垚淼,焦慧敏,焦心愿.基于DDPG的书房风扇的研究与设计[J].制造业自动化,2023,45(11):161-165.
7孙宏贤,徐兰.基于长短期记忆网络的高速公路车辆变道轨迹预测模型[J].计算机测量与控制,2023,31(12):316-321.
8张钰,李毅.基于系统物理参数测量和几何关系的车辆定位[J].无线电工程,2024,54(1):173-182.
9卢国明,邓昭.复杂交通环境无人驾驶车辆防碰撞方法仿真[J].计算机仿真,2024,41(2):441-445. 被引量：1

二级引证文献4

1高德阳.基于MPC的无人驾驶汽车轨迹跟踪及避障规划控制研究[J].汽车测试报告,2023(15):55-57. 被引量：1
2陈顺,康传山.郭屯煤矿辅助运输系统优化设计[J].现代矿业,2024,40(1):32-34.
3白雪,赵宇,温国强,王春絮,王伟.利用激光点云的智能网联汽车自主换道横向避障[J].激光杂志,2024,45(6):238-242.
4徐岩,甄实,林子圣,钱晓阳,刘长明.基于STM32的智能航行系统设计[J].应用科技,2024,51(4):25-29.

1李二超,周扬.基于分类的多策略预测方法求解动态多目标优化问题[J].控制与决策,2021,36(7):1569-1580. 被引量：2
2马占飞,江凤月,李克见,巩传胜.改进灰狼群优化算法的环境污染物预测研究[J].小型微型计算机系统,2021,42(10):2031-2037. 被引量：5
3甘丽聪.网络环境下高校学生管理工作创新探索[J].试题与研究,2021(23):143-144.
4孙亮波,刘小翠,桂慧,章德平.“机械创新设计”课程教学方案分析[J].武汉轻工大学学报,2021,40(6):113-118. 被引量：2
5姜国凯,魏贵明,李雷,杨业鑫.基于I/Q数据的5G控制信道盲检[J].移动通信,2022,46(2):80-84.
6毕蓉蓉,孙艳霞,王进科.新工科背景下多元协同实训“金课”打造的实践探索——以《学年设计》实训为例[J].时代教育（下旬）,2021(11):0235-0236.
7刘晨旻,王亚刚.基于连续空间的萤火虫算法改进[J].电子科技,2022,35(2):40-45. 被引量：3
8赵丽娟,王雅东,张美晨,金鑫,刘宏梅.复杂煤层条件下采煤机自适应截割控制策略[J].煤炭学报,2022,47(1):541-563. 被引量：28
9曹修全,陈艳.新工科背景下“传感器与工程测试技术基础”课程教学改革探索[J].黑龙江教育（理论与实践）,2022(2):90-92. 被引量：10
10Luo Yongkun,Chen Zinan.The Biden Administration's Policy Toward Southeast Asia:Momentum,Motivation and Challenges[J].和平与发展,2022(1):140-142.

武汉理工大学学报

2021年第10期

浏览历史

内容加载中请稍等...

基于DDPG算法的无人车辆防碰撞控制策略被引量：9

参考文献3

二级参考文献19

共引文献121

同被引文献126

引证文献9

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于DDPG算法的无人车辆防碰撞控制策略 被引量：9

参考文献3

二级参考文献19

共引文献121

同被引文献126

引证文献9

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于DDPG算法的无人车辆防碰撞控制策略被引量：9