一种基于深度强化学习的自适应巡航控制算法被引量：13

An Adaptive Cruise Control Algorithm Based on Deep Reinforcement Learning

下载PDF

导出

摘要自适应巡航控制是智能驾驶领域的核心技术,可通过分层控制或参数可变控制算法实现,但这些算法无法有效应对突发的跟车路况。为此,将深度强化学习与自适应巡航控制相结合,提出基于确定性策略梯度算法的自适应巡航控制算法,使智能车辆可以在自学习过程中完成自适应巡航并不断改进。在开源平台上的测试结果表明,该算法可以使智能驾驶车辆在跟车时加速度保持在1.8 m/s^2以内的比例超过90%,达到人类驾驶员的巡航跟车水平。 Adaptive Cruise Control（ ACC） is one of the most core technologies in the field of smart driving.Researchers mostly use traditional hierarchical control methods or variable control algorithms to implement this technology. These algorithms can not respond effectively to unexpected follow-up road conditions. For this reason,this paper combines deep reinforcement learning with ACC, and proposes an ACC algorithm based on deterministic strategy gradient algorithm, so that the intelligent vehicle can complete adaptive cruise and continue to improve in the continuous self-learning process. The test results under the open source platform show that this algorithm can make the ratio of the acceleration of the smart driving vehicle within 1. 8 m/s^2 within 90% of the follow-up acceleration,which can reach the level of the cruise control of the human pilot.

作者韩向敏鲍泓梁军潘峰玄祖兴 HAN Xiangmin;BAO Hong;LIANG Jun;PAN Feng;XUAN Zuxing(Beijing Key Laboratory of Information Service Engineering,Beijing Union University,Beijing 100101,China)

机构地区北京联合大学北京信息服务工程重点实验室

出处《计算机工程》 CAS CSCD 北大核心 2018年第7期32-35,41,共5页 Computer Engineering

基金国家自然科学基金"视听觉信息的认知计算"重大研究计划重点支持项目"智能车驾驶脑认知技术平台与转化研究"(91420202) 英国皇家工程院牛顿基金(UK-CIAPP/324) 北京市属高校高水平教师队伍建设支持计划项目(IDHT20170511) 北京市教委科研计划项目(KM201811417006)

关键词智能驾驶自动控制自适应巡航控制深度强化学习确定性策略梯度算法 smart driving automatic control Adaptive Cruise Control （ ACC） deep reinforcement learning deterministicstrategy gradient algorithm

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1王景武,金立生.车辆自适应巡航控制系统控制技术的发展[J].汽车技术,2004(7):1-4. 被引量：19
2陆涛,刘箴,刘婷婷,刘翠娟,柴艳杰,方昊.基于跟驰模型的车辆虚拟仿真方法[J].计算机工程,2016,42(6):305-309. 被引量：5
3徐洪智,李仁发,曾理宁.基于Ptolemy的自适应巡航系统建模与仿真[J].计算机工程,2015,41(6):28-32. 被引量：3
4赵冬斌,邵坤,朱圆恒,李栋,陈亚冉,王海涛,刘德荣,周彤,王成红.深度强化学习综述:兼论计算机围棋的发展[J].控制理论与应用,2016,33(6):701-717. 被引量：127
5张德兆,王建强,刘佳熙,李克强,连小珉.加速度连续型自适应巡航控制模式切换策略[J].清华大学学报（自然科学版）,2010,50(8):1277-1281. 被引量：30
6凌滨,宋梦实.汽车自适应巡航系统车距控制策略研究[J].计算机仿真,2017,34(11):143-148. 被引量：14

二级参考文献178

1王景武,金立生.车辆自适应巡航控制系统控制技术的发展[J].汽车技术,2004(7):1-4. 被引量：19
2吴利军,刘昭度,马岳峰.Longitudinal Control Strategy for Vehicle Adaptive Cruise Control Systems[J].Journal of Beijing Institute of Technology,2007,16(1):28-33. 被引量：2
3[1]Schiehlen J et al. Adaptive Cruise Control for Coaches. AVEC′96 Int. Symposium on Advanced Vehicle Control Aachen University of Technology,Ger. 1996.
4[2]Lu Jiang et al. New Adaptive Cruise Control Method,Journal of Beijing Institute of Technology,2000,9 (4)
5[3]Winner H et al. Major Design Parameters of Adaptive Cruise Control. AVEC9837553
6[4]Fancher P S et al. Comparative Analyses of Three Types of Headway Control Systems for Heavy Commercial Vehicles. In Proceedings of the IAVSD Symposium on the Dynamics of Vehicles on Roads and Tracks,at Ann Arbor, MI,USA, 1995.
7[5]Kyongsu Yi et al.A Vehicle Control Algorithm for Stop-andGo Cruise Control. Proceedings of the Institution of Mechanical Engineers Vol215 Part D,October 2001.
8[6]Yanakiev D et al. Analysis, Design, and Evaluation of AVCS for Heavy-Duty Vehicle with Actuator Delay,California PATH Research Report. UCB-ITS-PRR-98-18.
9[7]Brackstone M et al. Car Following: a Historical Review,Transportation Research,Part F 2,1999.
10[8]Drew M C.Coordinated Adaptive Cruise Control:Design and Simulation,M.S.Thesis,University of California,Berkeley,2002.

共引文献190

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：35
2舒忠.基于深度学习的图像样本标签赋值校正算法实现[J].数字印刷,2019(4):38-45. 被引量：2
3陈帅,张洁,雷斌,张帅,王文军,王志军.乘用车自适应巡航控制主观评价方法研究[J].中国汽车,2020(9):58-62. 被引量：1
4陈帅,马文博,张帅,李振中,陈振宇.自适应巡航系统测试方法研究[J].中国汽车,2020,0(2):33-37. 被引量：3
5吴利军,刘昭度,马岳峰.Longitudinal Control Strategy for Vehicle Adaptive Cruise Control Systems[J].Journal of Beijing Institute of Technology,2007,16(1):28-33. 被引量：2
6杨坤,李静,李幼德,荣睿,谭树梁,郭立书.电子机械制动系统在汽车自适应巡航控制中的应用[J].农业机械学报,2008,39(12):34-38. 被引量：7
7张德兆,王建强,刘佳熙,李克强,连小珉.加速度连续型自适应巡航控制模式切换策略[J].清华大学学报（自然科学版）,2010,50(8):1277-1281. 被引量：30
8陈木元.Camry巡航控制系统的结构原理与检测[J].汽车电器,2012(5):58-65. 被引量：1
9裴晓飞,刘昭度,马国成,齐志权.汽车自适应巡航系统的多模式切换控制[J].机械工程学报,2012,48(10):96-102. 被引量：32
10张建伟.世嘉定速巡航系统偶有失灵故障分析[J].科技致富向导,2012(30):219-219.

同被引文献96

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：35
2扶文远.人工智能在车辆自动驾驶中的应用实践探索[J].交通科技与管理,2021(29):0069-0070. 被引量：1
3王洪升,曾连荪,田蔚风.人工智能在车辆自动驾驶中的应用[J].自动化技术与应用,2004,23(6):5-7. 被引量：6
4张强,曲仕茹.车辆自适应巡航控制系统的模糊PID实现[J].汽车工程,2008,30(7):569-572. 被引量：11
5ZONG Changfu,ZHU Tianjun,WANG Chang,LIU Haizhen.Multi-objective Stability Control Algorithm of Heavy Tractor Semi-trailer Based on Differential Braking[J].Chinese Journal of Mechanical Engineering,2012,25(1):88-97. 被引量：13
6罗锡文,张智刚,赵祚喜,陈斌,胡炼,吴晓鹏.东方红X-804拖拉机的DGPS自动导航控制系统[J].农业工程学报,2009,25(11):139-145. 被引量：183
7Li-hua LUO Hong LIU Ping LI Hui WANG.Model predictive control for adaptive cruise control with multi-objectives: comfort,fuel-economy,safety and car-following[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2010,11(3):191-201. 被引量：34
8丁海涛,郭孔辉,李飞,张建伟.基于加速度反馈的任意道路和车速跟随控制驾驶员模型[J].机械工程学报,2010,46(10):116-120. 被引量：60
9李升波,王建强,李克强,张磊.MPC实用化问题处理及在车辆ACC中的应用[J].清华大学学报（自然科学版）,2010,50(5):645-648. 被引量：22
10朱大奇,颜明重.移动机器人路径规划技术综述[J].控制与决策,2010,25(7):961-967. 被引量：316

引证文献13

1赵健,宋东鉴,朱冰,刘斌,陈志成,张培兴.基于自学习和监督学习混合驱动的智能汽车跟驰控制策略[J].中国公路学报,2022,35(3):55-65. 被引量：3
2李传海,陈勇,刘海艳.一种基于驾驶风格的自适应巡航控制算法[J].自动化与仪器仪表,2020(9):161-165. 被引量：1
3王毅然,经小川,贾福凯,孙宇健,佟轶.基于多智能体协同强化学习的多目标追踪方法[J].计算机工程,2020,46(11):90-96. 被引量：4
4董永峰,杨琛,董瑶,屈向前,肖华昕,王子秋.基于改进的DQN机器人路径规划[J].计算机工程与设计,2021,42(2):552-558. 被引量：17
5潘峰,鲍泓.强化学习的自动驾驶控制技术研究进展[J].中国图象图形学报,2021,26(1):28-35. 被引量：13
6赵玉新,杜登辉,成小会,周迪,邓雄,刘延龙.基于强化学习的海洋移动观测网络观测路径规划方法[J].智能系统学报,2022,17(1):192-200. 被引量：3
7厉子凡,王浩,方宝富.一种基于多步竞争网络的多智能体协作方法[J].计算机工程,2022,48(5):74-81.
8徐广飞,陈美舟,金诚谦,苗河泉,逄焕晓,刁培松.拖拉机自动驾驶关键技术综述[J].中国农机化学报,2022,43(6):126-134. 被引量：7
9潘峰,潘振华,熊亮,潘卫国.人工智能技术在智能驾驶控制中的应用[J].北京联合大学学报,2022,36(3):30-37.
10郁洲,毕敬,苑海涛.基于改进DQN算法的复杂海战场路径规划方法[J].智能科学与技术学报,2022,4(3):418-425. 被引量：1

二级引证文献54

1李朝阳.基于遗传算法的航海路径规划优化研究[J].中国水运（下半月）,2023,23(8):41-43. 被引量：1
2卢立阳,朱丽丽,刘楠,刘博.基于云边端协同的高速公路云控系统能力验证研究[J].公路交通科技,2022,39(S01):154-160. 被引量：1
3张荣霞,武长旭,孙同超,赵增顺.深度强化学习及在路径规划中的研究进展[J].计算机工程与应用,2021,57(19):44-56. 被引量：18
4耿俊香,姜静,魏胜楠,段昶.CIDDPG的多智能体通信优化方法研究[J].沈阳理工大学学报,2021,40(4):29-34. 被引量：1
5王仕雄,许王勇,张本松.自动驾驶实验车故障诊断实验综述报告[J].延安职业技术学院学报,2021,35(5):98-101.
6杨钦宁,佘浩平,庞羽佳.基于改进Mask R-CNN的卫星目标部位检测方法[J].计算机测量与控制,2021,29(11):12-17. 被引量：1
7陈曦,刘学斌.基于双视线特征感知编组的多目标跟踪方法[J].计算机仿真,2021,38(10):189-192. 被引量：2
8赵玉新,杜登辉,成小会,周迪,邓雄,刘延龙.基于强化学习的海洋移动观测网络观测路径规划方法[J].智能系统学报,2022,17(1):192-200. 被引量：3
9张婷婷,蓝羽石,宋爱国.无人集群系统行为决策学习奖励机制[J].北京航空航天大学学报,2021,47(12):2442-2451.
10孟晨阳,郝崇清,李冉,王晓博,王昭雷,赵江.基于改进DDPG算法的复杂环境下AGV路径规划方法研究[J].计算机应用研究,2022,39(3):681-687. 被引量：7

1杨艳霞,伍永豪,李龙飞.基于开源平台Arduino的大学创客人才培养的探索[J].福建电脑,2018,34(7):60-61.
2唐振韬,邵坤,赵冬斌,朱圆恒.深度强化学习进展:从AlphaGo到AlphaGo Zero[J].控制理论与应用,2017,34(12):1529-1546. 被引量：85
3鲍日勤.人工智能时代的教与学变迁与开放大学2.0新探[J].远程教育杂志,2018,36(3):25-33. 被引量：39
4王冲鶄,陈丝.人工智能开源平台发展态势研究[J].信息通信技术与政策,2018,0(8):56-61. 被引量：3
5王振武.基于阿里云大数据平台的“数据挖掘”课程实验教学方法探讨[J].实验室研究与探索,2018,37(6):192-196. 被引量：8
6王玲,关士岩.自学习电梯轿厢位置监控兼容装置的设计[J].电工技术,2018(14):9-10.
7唐丽丽,朱海军,朱斐.一种基于核的在线策略梯度算法[J].新疆大学学报（自然科学版）,2018,35(2):209-216.
8张晓强,王雪松.基于Matlab GUI的图像处理演示平台设计[J].中国医学教育技术,2018,32(3):279-281. 被引量：3
9刘党伟,武红霞,赵广文,李辉元.基于Creo的阴极辊产品Top-Down参数化设计[J].装备制造技术,2018(2):27-29. 被引量：1
10周闻胜,郭冬冬.校车严重超载危险驾驶获刑[J].公民与法（检察版）,2018,0(6):34-34.

计算机工程

2018年第7期

浏览历史

内容加载中请稍等...

一种基于深度强化学习的自适应巡航控制算法被引量：13

参考文献6

二级参考文献178

共引文献190

同被引文献96

引证文献13

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

一种基于深度强化学习的自适应巡航控制算法 被引量：13

参考文献6

二级参考文献178

共引文献190

同被引文献96

引证文献13

二级引证文献54

相关作者

相关机构

相关主题

浏览历史

一种基于深度强化学习的自适应巡航控制算法被引量：13