-
题名基于动作约束深度强化学习的安全自动驾驶方法
被引量:16
- 1
-
-
作者
代珊珊
刘全
-
机构
苏州大学计算机科学与技术学院
苏州大学江苏省计算机信息处理技术重点实验室
吉林大学符号计算与知识工程教育部重点实验室
软件新技术与产业化协同创新中心
-
出处
《计算机科学》
CSCD
北大核心
2021年第9期235-243,共9页
-
基金
国家自然科学基金(61772355,61702055,61502323,61502329)
江苏省高等学校自然科学研究重大项目(18KJA520011,17KJA520004)
+2 种基金
吉林大学符号计算与知识工程教育部重点实验室资助项目(93K172014K04,93K172017K18)
苏州市应用基础研究计划工业部分(SYG201422)
江苏高校优势学科建设工程资助项目。
-
文摘
随着人工智能的发展,自动驾驶领域的研究也日益壮大。深度强化学习(Deep Reinforcement Learning,DRL)方法是该领域的主要研究方法之一。其中,安全探索问题是该领域的一个研究热点。然而,大部分DRL算法为了提高样本的覆盖率并没有对探索方法进行安全限制,使无人车探索时会陷入某些危险状态,从而导致学习失败。针对该问题,提出了一种基于动作约束的软行动者-评论家算法(Constrained Soft Actor-critic,CSAC),该方法首先对环境奖赏进行了合理限制。无人车动作转角过大时会产生抖动,因此在奖赏函数中加入惩罚项,使无人车尽量避免陷入危险状态。另外,CSAC方法又对智能体的动作进行了约束。当目前状态选择动作后使无人车偏离轨道或者发生碰撞时,标记该动作为约束动作,在之后的训练中通过合理约束来更好地指导无人车选择新动作。为了体现CSAC方法的优势,将CSAC方法应用在自动驾驶车道保持任务中,并与SAC算法进行对比。结果表明,引入安全机制的CSAC方法可以有效避开不安全动作,提高自动驾驶过程中的稳定性,同时还加快了模型的训练速度。最后,将训练好的模型移植到带有树莓派的无人车上,进一步验证了模型的泛用性。
-
关键词
安全自动驾驶
深度强化学习
软行动者-评论家
车道保持
无人车
-
Keywords
Safe automatic driving
Deep reinforcement learning
Soft actor-critic
Lane-keeping
Driverless cars
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名针对自动驾驶智能模型的攻击与防御
被引量:1
- 2
-
-
作者
马晨
沈超
蔺琛皓
李前
王骞
李琦
管晓宏
-
机构
西安交通大学电子与信息学部网络空间安全学院
智能网络与网络安全教育部重点实验室(西安交通大学)
武汉大学国家网络安全学院
清华大学网络科学与网络空间研究院
-
出处
《计算机学报》
EI
CAS
CSCD
北大核心
2024年第6期1431-1452,共22页
-
基金
科技创新2030-“新一代人工智能”重大项目(2020AAA0107702)
国家自然科学基金(U21B2018,62161160337,6213201162376210,62006181,U20B2049,U20A20177,62206217)
陕西省重点研发计划项目(2021ZDLGY01-02,2023-ZDLGY-38)资助.
-
文摘
近年来,以深度学习算法为代表的人工智能技术为人类生产生活的方方面面带来了巨大的革新,尤其是在自动驾驶领域,部署着自动驾驶系统的智能汽车已经走进入们的生活,成为了重要的生产力工具.然而,自动驾驶系统中的人工智能模型面临着潜在的安全隐患和风险,这给人民群众生命财产安全带来了严重威胁.本文通过回顾自动驾驶智能模型攻击和防御的相关研究工作,揭示自动驾驶系统在物理世界下面临的安全风险并归纳总结了相应的防御对策.具体来说,本文首先介绍了包含攻击面、攻击能力和攻击目标的自动驾驶系统安全风险模型.其次,面向自动驾驶系统的三个关键功能层——传感器层、感知层和决策层,本文依据受攻击的智能模型和攻击手段归纳、分析了对应的攻击方法以及防御对策,并探讨了现有方法的局限性.最后,本文讨论和展望了自动驾驶智能模型攻击与防御技术面临的难题与挑战,并指出了未来潜在的研究方向和发展趋势.
-
关键词
自动驾驶安全
人工智能安全
信息物理系统安全
物理对抗攻击
防御策略
-
Keywords
autonomous driving security
artificial intelligence security
cyber-physical system security
physical adversarial attack
defense strategy
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于FMEA的SOTIF危害分析方法
- 3
-
-
作者
杨宝淇
Unal Yildirim
郑冬黎
-
机构
湖北汽车工业学院汽车工程学院
-
出处
《湖北汽车工业学院学报》
2024年第4期26-32,共7页
-
基金
湖北汽车工业学院博士科研启动基金(BK202204)。
-
文摘
针对自动驾驶等复杂系统的预期功能安全问题,提出了一种基于FMEA的SOTIF危害分析方法。侧重于自动驾驶系统的功能不足,从具有可测量属性的功能概念角度出发,详细定义了功能不足,完善了现有的失效模式分类,通过建立失效模式与功能不足之间的联系,增强了FMEA在SOTIF危害分析中的应用。通过对自适应巡航控制系统的案例研究,证明了扩展AIAG&VDA失效模式分类对SOTIF问题的适用性及文中方法的优势。
-
关键词
预期功能安全
失效模式与影响分析
功能不足
危害分析
自动驾驶安全
-
Keywords
safety of intended functionality
failure mode and effect analysis
functional insufficiency
hazard analysis
autonomous driving safety
-
分类号
U461.91
[机械工程—车辆工程]
-