基于改进DDPG的无人驾驶避障跟踪控制被引量：6

Driverless Obstacle Avoidance and Tracking Control Based on Improved DDPG

下载PDF

导出

摘要无人驾驶汽车在跟踪避障控制过程中,被控对象具有非线性特征且被控参数多变,线性模型及固定的无人驾驶车辆数学模型难以保证车辆在复杂环境下的安全性和稳定性,并且无人驾驶离散化控制过程增加了控制难度。针对此类问题,为提高无人驾驶汽车实时控制跟踪轨迹的精度,同时降低整个控制过程的难度,文中提出了一种基于蒙特卡洛-深度确定性策略梯度(MC-DDPG)的无人驾驶汽车避障跟踪控制算法。该算法基于深度强化学习网络搭建控制系统模型,在策略学习采样过程中采用优秀的训练样本,使用蒙特卡洛方法优化网络训练梯度,对算法的训练样本采取优劣区分,使用优异的样本通过梯度算法寻找最优的网络参数,从而增强网络算法的学习能力,实现无人驾驶汽车的更优连续控制。在计算机模拟环境TORCS中对该算法进行仿真实验,结果表明,应用MC-DDPG算法可以有效地实现无人驾驶汽车的避障跟踪控制,其控制的无人驾驶汽车的跟踪精度及避障效果均优于深度Q网络算法和DDPG算法。 In the process of tracking and obstacle avoidance control of driverless vehicles, the controlled object hasnonlinear characteristics and variable control parameters. The linear model and the fixed mathematical model ofdriverless vehicles are difficult to ensure the safety and stability of the vehicle in complex environments, and thedriverless discrete control process increases the difficulty of control. To address such problems, in order to improvethe accuracy of real-time control tracking trajectory of driverless vehicles, and at the same time reduce the difficultyof the whole control process, the paper proposed a Monte Carlo-depth deterministic policy gradient-based obstacleavoidance tracking control algorithm for driverless vehicles. The algorithm builds a control system model based ona deep reinforcement learning network, and adopts excellent training samples in the strategy learning samplingprocess. It optimizes the network training gradient with the Monte Carlo method, and makes a distinction betweengood and bad training samples for the algorithm. The excellent samples are used to find the optimal networkparameters through a gradient algorithm, so as to enhance the learning ability of the network algorithm and realize abetter and continuous control of the driverless vehicle. Simulation experiments of the control method were carriedout in the computer simulation environment TORCS. The results show that the proposed improved DDPG algorithmcan be applied to effectively achieve the obstacle avoidance tracking control of the driverless vehicle, and thetracking accuracy and obstacle avoidance effect of the unmanned car under its control is better than that of the deepQ network algorithm and the DDPG algorithm.

作者李新凯虎晓诚马萍张宏立 LI Xinkai;HU Xiaocheng;MA Ping;ZHANG Hongli(School of Electrical Engineering,Xinjiang University,Urumqi 830017,Xinjiang,China)

机构地区新疆大学电气工程学院

出处《华南理工大学学报（自然科学版）》 EI CAS CSCD 北大核心 2023年第11期44-55,共12页 Journal of South China University of Technology(Natural Science Edition)

基金国家自然科学基金资助项目(62263030) 新疆维吾尔自治区自然科学基金青年科学基金资助项目(2022D01C86)。

关键词无人驾驶动态避障深度确定性策略梯度轨迹跟踪梯度优化 self-driving dynamic obstacle avoidance depth deterministic policy gradient trajectory tracking gradient optimization

分类号 TP273.5 [自动化与计算机技术—检测技术与自动化装置] U461.1 [机械工程—车辆工程]

引文网络
相关文献

参考文献16

1徐向阳,胡文浩,董红磊,王琰,肖凌云,李鹏辉.自动驾驶汽车测试场景构建关键技术综述[J].汽车工程,2021,43(4):610-619. 被引量：30
2熊璐,杨兴,卓桂荣,冷搏,章仁夑.无人驾驶车辆的运动控制发展现状综述[J].机械工程学报,2020,56(10):127-143. 被引量：148
3于向军,槐元辉,姚宗伟,孙中朝,俞安.工程车辆无人驾驶关键技术[J].吉林大学学报（工学版）,2021,51(4):1153-1168. 被引量：20
4张家旭,杨雄,施正堂,赵健,朱冰.汽车紧急换道避障的路径规划与跟踪控制[J].华南理工大学学报（自然科学版）,2020,48(9):86-93. 被引量：9
5王涛,江进丰,林佑廷,林秋丰,张文明.基于CarSim软件的闪避障碍物驾驶者模型[J].农业工程学报,2010,26(5):159-163. 被引量：2
6樊晓平,李双艳,陈特放.基于新人工势场函数的机器人动态避障规划[J].控制理论与应用,2005,22(5):703-707. 被引量：40
7杨志成,冯豫韬,张利霞,齐华山,倪景秀.基于神经网络前馈补偿的欠驱动机器人越障控制[J].测控技术,2017,36(11):89-92. 被引量：3
8姚强强,田颖,王圣渊,刘嘉琪,王承强.基于力驱动的智能汽车路径跟踪控制策略[J].华南理工大学学报（自然科学版）,2022,50(2):33-41. 被引量：1
9卢笑,竺一薇,阳牡花,周炫余,王耀南.联合图像与单目深度特征的强化学习端到端自动驾驶决策方法[J].武汉大学学报（信息科学版）,2021,46(12):1862-1871. 被引量：3
10张守武,王恒,陈鹏,张笑语,李擎.神经网络在无人驾驶车辆运动控制中的应用综述[J].工程科学学报,2022,44(2):235-243. 被引量：18

二级参考文献159

1徐兴,汤赵,王峰,陈龙.基于变权重系数的分布式驱动无人车轨迹跟踪[J].中国公路学报,2019,32(12):36-45. 被引量：22
2孙富春,李莉,孙增圻.非线性系统神经网络自适应控制的发展现状及展望[J].控制理论与应用,2005,22(2):254-260. 被引量：13
3凌波,吴婧,叶秀清,顾伟康.最大熵原理在非结构化道路图像识别中的应用[J].电路与系统学报,2005,10(4):78-81. 被引量：5
4李兴泉,贺岩松,徐中明,张志飞.汽车方向控制驾驶员模型[J].重庆大学学报（自然科学版）,2006,29(4):5-8. 被引量：15
5张华,李祖枢,古建功,陈桂强,谭智.三连杆单杠体操机器人的仿人智能运动控制[J].重庆大学学报（自然科学版）,2007,30(3):74-78. 被引量：7
6Jansson J,Gustafsson F,Ekmark J.Decision making for collision avoidance system[Z].Detroit,MI,USA:SAE 2002 World Congress & Exhibition,2002.
7Janssona J,Gustafsson F.A framework and automotive application of collision avoidance decision making[J].Automatica,2008,44(9):2347-2351.
8Active Safety Demonstration 2006 – VCC internal[Z].Booklet in A5.
9Jansson J,Gustafsson F.Multiple object collision avoidance decision making[J].Submitted to IEEE Transactions on Control Systems Technology – Special issue on Automotive Control,2006.
10Jansson J,Gustafsson F.A framework and Automotive Application of Collision Avoidance Decision Making[M].Submitted to International Federation of Automatic Control Journal:Automatica,2006.

共引文献457

1崔驰,游聪,李晓冲.针对自动驾驶车辆的对抗攻击与防御研究进展[J].郑州师范教育,2021,10(6):18-22.
2迟瑞娟,熊泽鑫,姜龙腾,马悦琦,黄修炼,朱晓龙.基于模型预测的插秧机路径跟踪控制算法[J].农业机械学报,2022,53(11):22-30. 被引量：15
3刘峰波,党飞飞,杨满囤,马平,赵俊达.井下防淤积清仓机器人行走机构纠偏控制研究[J].煤炭工程,2022,54(S01):195-199.
4南晓虎,丁雷.深度学习的典型目标检测算法综述[J].计算机应用研究,2020,37(S02):15-21. 被引量：57
5宋绍京,陆婷婷,孙翔,龚玉梅,陈建.面向自动驾驶的多任务环境感知算法[J].电子测量技术,2023,46(24):157-163. 被引量：2
6冉险生,李锐,贺帅.基于改进YOLOv5s的道路障碍物检测算法[J].电子测量技术,2023,46(22):177-185. 被引量：2
7黄陶陶,刘放,宋泽鹏.基于快速非奇异终端滑模的隧道工程车辆轨迹跟踪研究[J].电子测量技术,2023,46(6):9-14. 被引量：1
8刘春阳,程亿强,柳长安.基于改进势场法的移动机器人避障路径规划[J].东南大学学报（自然科学版）,2009,39(S1):116-120. 被引量：11
9李双艳,刘长生,邓旻涯.AGV航向跟踪预测优化自适应PI控制器[J].物流技术,2006,25(11):25-28.
10张捍东,王丽华,岑豫皖.基于遗传改进协调场的移动机器人避障策略[J].系统仿真学报,2007,19(24):5742-5746. 被引量：3

同被引文献70

1马军伟,徐琛,陶洪峰,杨慧中.基于双行动者深度确定性策略梯度算法的间歇过程控制[J].信息与控制,2023,52(6):773-783. 被引量：1
2迟瑞娟,熊泽鑫,姜龙腾,马悦琦,黄修炼,朱晓龙.基于模型预测的插秧机路径跟踪控制算法[J].农业机械学报,2022,53(11):22-30. 被引量：15
3徐雄,林海军,刘悠勇,胡边.融合PCA与自适应K-Means聚类的水电机组故障检测在线方法[J].电子测量与仪器学报,2022,36(3):260-267. 被引量：16
4郭俊,周建中,周超,王光谦,张勇传.概念性流域水文模型参数多目标优化率定[J].水科学进展,2012,23(4):447-456. 被引量：26
5李谦,张静,宫辉力.基于SUFI-2算法和SWAT模型的妫水河流域水文模拟及参数不确定性分析[J].水文,2015,35(3):43-48. 被引量：20
6张质明,王晓燕,潘润泽.一种改进的不确定性水质模型参数率定方法[J].中国环境科学,2017,37(3):956-962. 被引量：11
7吴广昊,王玲玲.基于模拟退火算法的河道糙率反演[J].水电能源科学,2018,36(1):28-31. 被引量：6
8佘纬,夏永波.基于并行交叉遗传粒子群算法的水文频率参数估计[J].中南民族大学学报（自然科学版）,2018,37(2):147-150. 被引量：2
9陈亮,梁宸,张景异,刘韵婷.Actor-Critic框架下一种基于改进DDPG的多智能体强化学习算法[J].控制与决策,2021,36(1):75-82. 被引量：23
10伍鑫,陈植欣,温庆博,王忠静,胡黎明.基于强化学习的非常规水资源优化配置模型[J].水力发电学报,2021,40(7):23-31. 被引量：11

引证文献6

1刘德强,刘勇,渠立臣.安防反恐用多监控手段集控动态目标跟踪控制方法[J].中国新技术新产品,2024(12):142-144.
2白冰,董飞,彭文启,刘晓波.基于深度强化学习的水质模型参数率定[J].环境科学学报,2024,44(7):271-280. 被引量：1
3卢越,朱省委,吴晓蕊.无人驾驶拖拉机田间运行轨迹跟踪控制系统设计[J].农机使用与维修,2024(9):27-31. 被引量：1
4张雪敏.基于毫米波雷达的无人驾驶电动汽车换道动态避障控制方法[J].计算机测量与控制,2024,32(9):193-199.
5李雪林.基于多传感器融合的自动驾驶汽车障碍定位方法[J].汽车测试报告,2024(13):14-16.
6邵雯,李纬捷,欧洋.胸外科护理扫描仪成像故障检测方法研究[J].自动化与仪器仪表,2024(11):312-317.

二级引证文献2

1朱兆松,周云磊,张胜伟.基于人工智能的高炉冶炼焦炭质量预测[J].机电工程技术,2024,53(9):47-50.
2王萍,杨玉娟.农业机械自动驾驶技术发展现状与未来趋势[J].农机使用与维修,2024(11):64-67.

1王宇平.结构化道路场景的自动驾驶车辆轨迹规划与跟踪控制算法研究[J].汽车周刊,2023(12):37-39.
2王玥.基于电气技术的自动驾驶汽车避障系统设计[J].汽车测试报告,2023(14):10-12.
3张立霞,张莉莉,刘晋丽.基于强化学习优化汽车智能换道与间距预警的汽车避障系统[J].自动化与仪器仪表,2023(8):139-143. 被引量：2
4陈江义,殷笑勇,王婷婷,秦东晨.基于改进斥力模型的人工势场局部路径规划[J].郑州大学学报（工学版）,2023,44(3):83-87. 被引量：2
5宋尚飞,刘轩章,陈宏举,康琦,李宸轩,邓涛,吴海浩,史博会,宫敬.PID控制参数对重力式三相分离器生产工艺的影响[J].石油科学通报,2023,8(2):179-192. 被引量：3
6党豫欢,张小东.X射线能谱CT最佳参数选取方法研究[J].核电子学与探测技术,2023,43(4):856-860.
7万羿岑,王喆鉴,李磊.基于虚拟现实技术的机械装配仿真与优化[J].葡萄酒,2023(14):64-66.
8吴晨,宋真玉,陈玮.自动驾驶车辆横向控制模型研究综述[J].自动化技术与应用,2023,42(12):5-9. 被引量：1
9仝光,尹浩,朱金栋.智能扫路车行驶轨迹跟踪控制算法研究[J].计算机应用与软件,2023,40(12):101-107. 被引量：1
10徐青.基于现场总线技术的分布式控制系统设计研究[J].信息记录材料,2023,24(11):132-134.

华南理工大学学报（自然科学版）

2023年第11期

浏览历史

内容加载中请稍等...

基于改进DDPG的无人驾驶避障跟踪控制被引量：6

参考文献16

二级参考文献159

共引文献457

同被引文献70

引证文献6

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于改进DDPG的无人驾驶避障跟踪控制 被引量：6

参考文献16

二级参考文献159

共引文献457

同被引文献70

引证文献6

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于改进DDPG的无人驾驶避障跟踪控制被引量：6