基于强化学习的智能车人机共融转向驾驶决策方法被引量：1

Human-machine integration method for steering decision-making of intelligent vehicle based on reinforcement learning

导出

摘要针对智能车人机共融驾驶系统中人和自主驾驶系统的驾驶权连续动态分配问题,尤其是因建模误差导致的权重分配方法适应性低的难题,提出了基于强化学习的人机共融转向驾驶决策方法;考虑驾驶人的转向特性,搭建了基于双点预瞄的驾驶人模型,并采用预测控制理论建立了智能车自主转向控制模型,构建了智能车人机同时在环的转向控制框架;基于Actor-Critic强化学习架构,设计了用于人机驾驶权分配的深度确定性策略梯度(DDPG)智能体,以曲率契合度、跟踪精确性和乘坐舒适性为目标,提出了基于模型的收益函数;构建了人机共融驾驶权分配强化学习框架,包含驾驶人模型、自主转向模型、驾驶权分配智能体以及收益函数;为了验证方法的有效性,招募了8位驾驶人开展共计48人次的模拟驾驶试验。研究结果表明:在曲率适应性验证中,人机共融-DDPG方法优于人工驾驶和人机共融-Fuzzy方法,跟踪性平均提升70.69%、39.67%,舒适性平均提升18.34%、7.55%;在速度适应性验证中,车速为40、60和80 km·h条件下,驾驶人权重大于0.5的时间占比分别为90.00%、85.76%、60.74%,且跟踪性相轨迹和舒适性相轨迹都能有效收敛。可见,提出的方法能够适应曲率和车速变化,在保证安全性的前提下提升了跟踪性和舒适性。 In terms of the continuous dynamic allocation problem of driving weights between human and autonomous driving systems in the human-machine integration(HMI) driving system of intelligent vehicles, especially the low adaptability problem of weight allocation methods caused by modeling errors, a HMI steering decision-making method based on the reinforcement learning was proposed. In view of drivers’ steering characteristics, a driver model based on the two-point preview was built, and an autonomous steering control model of intelligent vehicles was established by adopting the predictive control theory. On this basis, a steering control framework of simultaneous human-machine in-loop for intelligent vehicles was constructed. According to the Actor-Critic reinforcement learning framework, a deep deterministic policy gradient(DDPG) agent for the human-machine driving weight allocation was designed, and a model-based gain function was proposed with the curvature adaptability, tracking accuracy, and ride comfort as targets. A reinforcement learning framework for the HMI driving weight allocation was constructed, which contains a driver model, an autonomous steering model, a driving weight allocation agent, and a gain function. To verify the effectiveness of the proposed method, eight drivers were recruited, and a total of 48 simulated driving experiments were carried out. Research results show that in the verification of curvature adaptability, the HMI-DDPG method is superior to the manned driving and HMI-Fuzzy methods. The trackability improves by an average of 70.69% and 39.67%, respectively, and the comfortability increases by an average of 18.34% and 7.55%, respectively. In the verification of speed adaptability, under the conditions of a vehicle speed of 40, 60, and 80 km·h, the time proportion is 90.00%, 85.76%, and 60.74%, respectively, when the driver’s weight is greater than 0.5. The phase trajectories of both the trackability and the comfort can effectively converge. Therefore, the proposed method can adapt to changes in curvature and vehicle speed and improve the trackability and comfort on the premise of ensuring safety. 5 tabs, 14 figs, 31 refs.

作者吴超仲冷姚陈志军罗鹏 WU Chao-zhong;LENG Yao;CHEN Zhi-jun;LUO Peng(Intelligent Transportation Systems Research Center,Wuhan University of Technology,Wuhan 430063,Hubei,China;School of Transportation and Logistics Engineering,Wuhan University of Technology,Wuhan 430063,Hubei,China;School of Computer Science and Artificial Intelligence,Wuhan University of Technology,Wuhan 430063,Hubei,China)

机构地区武汉理工大学智能交通系统研究中心武汉理工大学交通与物流工程学院武汉理工大学计算机与人工智能学院

出处《交通运输工程学报》 EI CSCD 北大核心 2022年第3期55-67,共13页 Journal of Traffic and Transportation Engineering

基金国家自然科学基金项目(52172394) 国家重点研发计划(2018YFB1600600) 湖北省科技重大专项(2020AAA001)。

关键词智能车人机共融转向驾驶决策驾驶权分配强化学习 intelligent vehicle human-machine integration steering decision-making driving weight allocation reinforcement learning

分类号 U461.9 [机械工程—车辆工程]

引文网络
相关文献

参考文献13

1姚荣涵,祁文彦,郭伟伟.自动驾驶环境下驾驶人接管行为结构方程模型[J].交通运输工程学报,2021,21(2):209-221. 被引量：7
2胡云峰,曲婷,刘俊,施竹清,朱冰,曹东璞,陈虹.智能汽车人机协同控制的研究现状与展望[J].自动化学报,2019,45(7):1261-1280. 被引量：62
3Wenshuo Wang,Xiaoxiang Na,Dongpu Cao,Jianwei Gong,Junqiang Xi,Yang Xing,Fei-Yue Wang.Decision-Making in Driver-Automation Shared Control:A Review and Perspectives[J].IEEE/CAA Journal of Automatica Sinica,2020,7(5):1289-1307. 被引量：19
4宗长富,代昌华,张东.智能汽车的人机共驾技术研究现状和发展趋势[J].中国公路学报,2021,34(6):214-237. 被引量：48
5Chen Lv,Dongpu Cao,Yifan Zhao,Daniel J. Auger,Mark Sullman,Huaji Wang,Laura Millen Dutka,Lee Skrypchuk,Alexandros Mouzakitis.Analysis of Autopilot Disengagements Occurring During Autonomous Vehicle Testing[J].IEEE/CAA Journal of Automatica Sinica,2018,5(1):58-68. 被引量：20
6吴超仲,吴浩然,吕能超.人机共驾智能汽车的控制权切换与安全性综述[J].交通运输工程学报,2018,18(6):131-141. 被引量：47
7郭烈,马跃,岳明,秦增科.驾驶特性的识别评估及其在智能汽车上的应用综述[J].交通运输工程学报,2021,21(2):7-20. 被引量：9
8何仁,赵晓聪,杨奕彬,王建强.基于驾驶人风险响应机制的人机共驾模型[J].吉林大学学报（工学版）,2021,51(3):799-809. 被引量：18
9郭烈,葛平淑,夏文旭,秦增科.基于人机共驾的车道保持辅助控制系统研究[J].中国公路学报,2019,32(12):46-57. 被引量：15
10陈无畏,王其东,丁雨康,赵林峰,王慧然,谢有浩.基于预期偏移距离的人机权值分配策略研究[J].汽车工程,2020,42(4):513-521. 被引量：4

二级参考文献63

1郭烈,葛平淑,夏文旭,秦增科.基于人机共驾的车道保持辅助控制系统研究[J].中国公路学报,2019,32(12):46-57. 被引量：15
2许洪国,张慧永,宗芳.交通事故致因分析的贝叶斯网络建模[J].吉林大学学报（工学版）,2011,41(S1):89-94. 被引量：18
3李百川,殷国祥,苏如玉.汽车驾驶员反应特性与交通事故关系的分析研究[J].人类工效学,1995,1(2):26-31. 被引量：10
4杨啟梁,钟东阶.侧风对高速汽车行驶稳定性影响的仿真分析[J].汽车科技,2005(4):18-20. 被引量：15
5李兴泉,贺岩松,徐中明,张志飞.汽车方向控制驾驶员模型[J].重庆大学学报（自然科学版）,2006,29(4):5-8. 被引量：15
6李力,王飞跃,郑南宁,张毅.驾驶行为智能分析的研究与发展[J].自动化学报,2007,33(10):1014-1022. 被引量：34
7肖献强,王其东,潘盛辉.基于视觉及TLC概念的车辆跑偏检测方法研究[J].汽车工程,2010,32(1):77-80. 被引量：12
8吕岸,胡振程,陈慧.基于高斯混合隐马尔科夫模型的高速公路超车行为辨识与分析[J].汽车工程,2010,32(7):630-634. 被引量：28
9张泽星,宗长富,马福良,王畅.基于多维高斯隐马尔科夫模型的驾驶员转向行为辨识方法[J].汽车技术,2011(7):1-3. 被引量：4
10秦建军,杨运平,吴一鸣.我国城市道路、桥梁车道宽度标准研究[J].公路,2011,56(7):81-84. 被引量：14

共引文献191

1谭浩,张迎丽.面向安全的智能汽车信息与交互设计研究[J].装饰,2022(8):22-27. 被引量：9
2朱冰,党瑞捷,赵健,陈志成,隋清海,官浩,劳德杏,刘志鹏.智能汽车冗余电控制动系统电流传感器故障容错控制[J].中国公路学报,2023,36(4):249-260. 被引量：4
3赵轩,王姝,马建,余强,郑字琛.分布式驱动电动汽车底盘集成控制技术综述[J].中国公路学报,2023,36(4):221-248. 被引量：9
4刘卓凡,丁涛,吴付威,张海伦.平直高速公路低交通量下L2自动驾驶对驾驶人心理负荷的影响[J].中国公路学报,2022,35(4):256-266. 被引量：3
5范佳琦,李鑫,霍天娇,洪金龙,高炳钊,陈虹.基于单阶段算法的智能汽车跨域检测研究[J].中国公路学报,2022,35(3):249-262. 被引量：8
6韩嘉懿,朱冰,赵健,马驰.基于握力分布的驾驶人人机共驾状态识别研究[J].中国公路学报,2022,35(3):166-176. 被引量：4
7郭柏苍,王胤霖,谢宪毅,金立生,韩广德.基于人-车风险状态的人机共驾控制权决策方法[J].中国公路学报,2022,35(3):153-165. 被引量：4
8刘俊,时婉晴,郭洪艳,戴启坤,高振海.一种驾驶权动态调整的人机主从博弈共驾方法[J].中国公路学报,2022,35(3):127-138. 被引量：3
9吴超仲,吴浩然,吕能超.基于间接共享控制的智能车协同接管方法[J].中国公路学报,2022,35(3):101-114. 被引量：3
10曹丹妮,吴建军,屈云超,刘浩.考虑自动车队强度的高速公路非常规瓶颈交通流控制策略研究[J].中国公路学报,2022,35(3):78-88. 被引量：5

同被引文献4

1吕能超,王玉刚,周颖,吴超仲.道路交通安全分析与评价方法综述[J].中国公路学报,2023,36(4):183-201. 被引量：15
2袁伟,张雅丽,王虹霞,葛振振,付锐,王畅,曹龙.纯电动公交车交叉口节能驾驶策略[J].中国公路学报,2021,34(7):54-66. 被引量：7
3陆丽萍,程垦,褚端峰,吴超仲,邱雨洁.基于竞争循环双Q网络的自适应交通信号控制[J].中国公路学报,2022,35(8):267-277. 被引量：5
4陈越,焦朋朋,白如玉,李汝鉴.基于深度强化学习的自动驾驶车辆跟驰行为建模[J].交通信息与安全,2023,41(2):67-75. 被引量：6

引证文献1

1姜涵,张健,张海燕,郝威,马昌喜.基于强化学习的交叉口智能网联车多目标通行控制方法[J].交通信息与安全,2024,42(1):84-93.

1施国标,张洪泉,王帅,桑冬岗.商用车电液复合转向系统的车道保持策略[J].中国公路学报,2021,34(9):101-110. 被引量：5
2赵健,宋东鉴,朱冰,刘斌,陈志成,张培兴.基于自学习和监督学习混合驱动的智能汽车跟驰控制策略[J].中国公路学报,2022,35(3):55-65. 被引量：4
3黄亚江,李书全,李益锌,郑涵.基于DEMATEL-ISM-ANP的地铁运营安全韧性综合评价[J].中国安全科学学报,2022,32(6):171-177. 被引量：21
4宗长富,代昌华,张东.智能汽车的人机共驾技术研究现状和发展趋势[J].中国公路学报,2021,34(6):214-237. 被引量：48
5郭应时,张洪加,付锐,王畅.基于神经工效学的智能车辆横向控制模型研究[J].汽车工程,2021,43(7):1057-1065. 被引量：6
6朱洁玉,马艳丽.合流区域多车交互风险实时评估方法[J].吉林大学学报（工学版）,2022,52(7):1574-1581. 被引量：3
7裴华鑫,杨敬轩,胡坚明,张毅.大规模路网中分布式车辆群体协同决策方法[J].交通运输工程学报,2022,22(3):174-183. 被引量：3
8任亚雄,HECHT Matthias,ADAMS Christian,MELZ Tobias.电动车尾门电动推杆用低音调齿轮的开发与验证[J].同济大学学报（自然科学版）,2021,49(S01):108-113.
9贺正冰.微观交通模型:智能网联化转型与通用驾驶人模型框架[J].交通运输工程与信息学报,2022,20(2):1-13. 被引量：5
10聂光明,谢波,田彦涛.基于Frenet框架的协同自适应巡航控制算法设计[J].吉林大学学报（工学版）,2022,52(7):1687-1695. 被引量：3

交通运输工程学报

2022年第3期

浏览历史

内容加载中请稍等...

基于强化学习的智能车人机共融转向驾驶决策方法被引量：1

参考文献13

二级参考文献63

共引文献191

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的智能车人机共融转向驾驶决策方法 被引量：1

参考文献13

二级参考文献63

共引文献191

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的智能车人机共融转向驾驶决策方法被引量：1