基于生成对抗模仿学习的路段非机动车行为仿真

Generative Adversarial Imitation Learning Based Bicycle Behaviors Simulation on Road Segments

下载PDF

导出

摘要为精准复现路段非机动车干扰行为,满足自动驾驶仿真测试需求,本文提出一种位置奖励增强的生成对抗模仿学习(Position Reward Augmented Generative Adversarial Imitation Learning,PRA-GAIL)方法训练仿真模型。城市道路中,干扰行为主要由电动自行车产生,故以电动自行车作为研究对象。在构建的仿真环境中,使用生成对抗模仿学习(GAIL)更新仿真模型使仿真轨迹逐步逼近真实轨迹,同时加入位置奖励与Lagrangian约束方法以解决现有仿真方法中的均质化和行为不可控的问题。结果表明:在测试集表现上,GAIL和PRA-GAIL方法平均每步长距离误差相比于常用的行为克隆方法下降了61.7%和65.8%。在行为层仿真精度上,与GAIL相比,PRAGAIL的加速度分布与真实分布间的KL散度显著降低,越线、超车数量的百分比误差下降了7.2%和20.2%。使用Lagrangian方法添加安全约束使有危险行为的智能体数量相比于常用的奖励增强方法下降了75.8%。在轨迹层仿真精度上,整体仿真环境下,PRA-GAIL的平均每步长距离误差相比于GAIL下降了17.5%。本文模型真实再现了非机动车超车时的操作空间,说明PRAGAIL方法对非机动车行为仿真有良好的适用性。本文提出的改动有效提升了仿真效果,最终所得的仿真模型能够真实地再现路段非机动车的干扰行为,能够应用于自动驾驶仿真测试。 In order to accurately reproduce the interaction behavior of bicycles to meet the needs of autonomous driving simulation testing,a Position Reward Augmented Generative Adversarial Imitation Learning(PRA-GAIL)method is proposed.In urban roads,since the disturbance behavior is mainly generated by electric bicycles,electric bicycles are selected as the research object.In the constructed simulation environment,Generative Adversarial Imitation Learning(GAIL)is used to make the simulated trajectories approximate the real trajectories,while Position Reward and Lagrangian Constraint methods are added to solve the homogenization and uncontrollable behaviors of existing simulation methods.In the test set validation,the average displacement error of the GAIL and PRA-GAIL methods decreased by 61.7%and 65.8%,respectively,compared to the behavioral cloning method.In the behavioral performance validation,the KL divergence of acceleration distributions between simulation and reality was significantly reduced in PRA-GAIL compared to GAIL,and the percentage error of overtaking and illegal lane-changing behaviors decreased by 7.2%and 20.2%,respectively.Using the Lagrangian method to add constraints resulted in a 75.8%reduction in the number of agents with risky behavior compared to commonly used reward augmentation methods.In trajectory validation,in the simulation environment,the average displacement error of PRA-GAIL is reduced by 17.5%compared to GAIL.The resulting model realistically reproduces the overtaking maneuver space of cyclists.The results show that the method adopted in this paper is suitable for bicycle behavior simulation,the proposed modifications effectively enhance the simulation performance,and the obtained simulation model accurately reproduces the disturbance behavior of bicycles on road segments,which can be applied to automated vehicle simulation tests.

作者魏书樵倪颖孙剑邱红桐 WEI Shuqiao;NI Ying;SUN Jian;QIU Hongtong(Key Laboratory of Road and Traffic Engineering of the Ministry of Education,Tongji University,Shanghai 201804,China;Traffic Management Research Institute of the Ministry of Public Security,Wuxi 214151,Jiangsu,China)

机构地区同济大学公安部交通管理科学研究所

出处《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第4期105-115,共11页 Journal of Transportation Systems Engineering and Information Technology

基金国家重点研发计划(2019YFB1600200) 国家自然科学基金(52072262)。

关键词交通工程非机动车行为强化学习生成对抗模仿学习自动驾驶测试微观交通仿真 traffic engineering bicycle behavior reinforcement learning generative adversarial imitation learning automatic vehicle test micro traffic simulation

分类号 U491.2 [交通运输工程—交通运输规划与管理]

引文网络
相关文献

参考文献3

1马依宁,姜为,吴靖宇,陈君毅,李南,徐志刚,熊璐.基于不同风格行驶模型的自动驾驶仿真测试自演绎场景研究[J].中国公路学报,2023,36(2):216-228. 被引量：10
2李逸昕,倪颖,孙剑.混合交通流交叉口共享空间交互行为建模及仿真[J].交通运输系统工程与信息,2022,22(3):255-266. 被引量：4
3倪颖,李逸昕,李旭红,孙剑.机非物理隔离路段非机动车行为建模仿真[J].同济大学学报（自然科学版）,2019,47(6):778-786. 被引量：5

二级参考文献10

1朱宇,赵祥模,徐志刚,王润民.基于蒙特卡洛模拟的无人车高速公路变道虚拟测试场景自动生成算法[J].中国公路学报,2022,35(3):89-100. 被引量：11
2梁肖,毛保华,许奇.自行车微观行为的心理生理力模型[J].交通运输系统工程与信息,2012,12(2):91-97. 被引量：11
3石京,柳美玉.基于驾驶模拟实验的驾驶风格对高速公路换道行为的影响[J].东南大学学报（自然科学版）,2017,47(5):1037-1041. 被引量：14
4侯海晶,金立生,关志伟,杜海兴,李敬君.驾驶风格对驾驶行为的影响[J].中国公路学报,2018,31(4):18-27. 被引量：41
5朱冰,张培兴,赵健,陈虹,徐志刚,赵祥模,邓伟文.基于场景的自动驾驶汽车虚拟测试研究进展[J].中国公路学报,2019,32(6):1-19. 被引量：121
6余荣杰,田野,孙剑.高等级自动驾驶汽车虚拟测试:研究进展与前沿[J].中国公路学报,2020,33(11):125-138. 被引量：32
7詹骄,郭迟,雷婷婷,屈宜琪,吴杭彬,刘经南.自动驾驶地图的数据标准比较研究[J].中国图象图形学报,2021,26(1):36-48. 被引量：26
8王润民,朱宇,赵祥模,徐志刚,周文帅,刘童.自动驾驶测试场景研究进展[J].交通运输工程学报,2021,21(2):21-37. 被引量：30
9邓伟文,李江坤,任秉韬,王文奇,丁娟.面向自动驾驶的仿真场景自动生成方法综述[J].中国公路学报,2022,35(1):316-333. 被引量：33
10倪颖,李逸昕,李旭红,孙剑.机非物理隔离路段非机动车行为建模仿真[J].同济大学学报（自然科学版）,2019,47(6):778-786. 被引量：5

共引文献16

1李逸昕,倪颖,孙剑.混合交通流交叉口共享空间交互行为建模及仿真[J].交通运输系统工程与信息,2022,22(3):255-266. 被引量：4
2张蕊,郝嘉田,张士杰,程世达.考虑被超非机动车偏移减速的改进社会力模型[J].科学技术与工程,2022,22(34):15367-15371. 被引量：1
3杨明辉,张蕊,严巧兵,王嘉贺.基于非机动车主动超越行为的社会力模型改进研究[J].系统仿真学报,2023,35(4):871-877. 被引量：1
4翟洋,陈蔯,史泽翔.基于ASAM OpenDRIVE标准的静态场景编辑器研究进展[J].中国汽车,2023(7):45-49.
5杨明航,张蕊,费硕,侯先磊.基于社会力模型的复合型通道行人仿真建模及设施布局研究[J].交通工程,2023,23(6):122-128. 被引量：1
6黄刚,史雪静.面向自动驾驶的虚拟仿真测试平台架构设计[J].地理空间信息,2024,22(1):96-101.
7赵祥模国家重点研发计划(2021YFB2501200)团队.自动驾驶测试与评价技术研究进展[J].交通运输工程学报,2023,23(6):10-77. 被引量：8
8朱顺应,王宇,吴景安,陈秋成,王韡.混合流下非机动车道基本需求宽度的设计[J].重庆交通大学学报（自然科学版）,2024,43(3):73-83.
9张坤鹏,常成,王世璞,张佐,李力.自动驾驶汽车仿真器综述:能力、挑战和发展方向[J].交通运输工程与信息学报,2024,22(1):1-24. 被引量：3
10桑明,蒋拯民,李慧云.自动驾驶汽车的高效对抗性场景测试方法研究[J].集成技术,2024,13(2):15-28. 被引量：3

1廖瑗,褚观耀,程前.自动驾驶仿真测试场景库体系建设方法综述[J].机械制造与自动化,2024,53(4):271-275.
2张申,桂南,杨星团,屠基元,姜胜耀.折流板液滴分离的OpenFOAM模拟及验证[J].核动力工程,2023,44(S02):171-175.
3崔欣宇,周晨静,宋霞飞,高亚聪.微观仿真参数敏感性自动化分析方法与实证[J].计算机仿真,2024,41(5):127-132.
4张婷,张小猛.全视网膜光凝治疗糖尿病视网膜病变对视野影响的研究进展[J].国际眼科杂志,2024,24(7):1093-1097. 被引量：1
5周铮.自适应神经网络控制在车辆自主驾驶中的应用[J].时代汽车,2024(12):40-42.
6尚永毅,何廷全,卢国华,张惠昕,罗薇,周晨静.微观交通仿真参数校正下高速公路合流区交通运行状态研究[J].交通工程,2024,24(8):31-37.
7田智睿,付维达,郝龙,张小新,蒋丹青,胡涛,陈超越,余建波,谭毅,任忠鸣,无.静磁场下电子束运动行为仿真[J].中国有色金属学报,2024,34(7):2343-2355.
8周敬轩,包卫东,王吉,张大宇.基于编-解码器结构的无人机群多任务联邦学习[J].西南交通大学学报,2024,59(4):933-941.
9赵文杰,于永达,王淼.集聚优势视角下北京智能网联汽车产业发展路径探析[J].科技管理研究,2024,44(12):94-103.
10张小矛.提高汽油机气道流动仿真精度的分析[J].汽车与新动力,2024,7(4):113-119.

交通运输系统工程与信息

2024年第4期

浏览历史

内容加载中请稍等...

基于生成对抗模仿学习的路段非机动车行为仿真

参考文献3

二级参考文献10

共引文献16

相关作者

相关机构

相关主题

浏览历史