期刊文献+
共找到315篇文章
< 1 2 16 >
每页显示 20 50 100
Role-based Bayesian decision framework for autonomous unmanned systems
1
作者 PANG Weijian MA Xinyi +2 位作者 LIANG Xueming LIU Xiaogang DONG Erwa 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2023年第6期1397-1408,共12页
In the process of performing a task,autonomous unmanned systems face the problem of scene changing,which requires the ability of real-time decision-making under dynamically changing scenes.Therefore,taking the unmanne... In the process of performing a task,autonomous unmanned systems face the problem of scene changing,which requires the ability of real-time decision-making under dynamically changing scenes.Therefore,taking the unmanned system coordinative region control operation as an example,this paper combines knowledge representation with probabilistic decisionmaking and proposes a role-based Bayesian decision model for autonomous unmanned systems that integrates scene cognition and individual preferences.Firstly,according to utility value decision theory,the role-based utility value decision model is proposed to realize task coordination according to the preference of the role that individual is assigned.Then,multi-entity Bayesian network is introduced for situation assessment,by which scenes and their uncertainty related to the operation are semantically described,so that the unmanned systems can conduct situation awareness in a set of scenes with uncertainty.Finally,the effectiveness of the proposed method is verified in a virtual task scenario.This research has important reference value for realizing scene cognition,improving cooperative decision-making ability under dynamic scenes,and achieving swarm level autonomy of unmanned systems. 展开更多
关键词 autonomous unmanned systems multi-entity Bayesian network(MEBN) situation awareness decision modeling.
下载PDF
Autonomous air combat maneuver decision using Bayesian inference and moving horizon optimization 被引量:54
2
作者 HUANG Changqiang DONG Kangsheng +2 位作者 HUANG Hanqiao TANG Shangqin ZHANG Zhuoran 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2018年第1期86-97,共12页
To reach a higher level of autonomy for unmanned combat aerial vehicle(UCAV) in air combat games, this paper builds an autonomous maneuver decision system. In this system,the air combat game is regarded as a Markov pr... To reach a higher level of autonomy for unmanned combat aerial vehicle(UCAV) in air combat games, this paper builds an autonomous maneuver decision system. In this system,the air combat game is regarded as a Markov process, so that the air combat situation can be effectively calculated via Bayesian inference theory. According to the situation assessment result,adaptively adjusts the weights of maneuver decision factors, which makes the objective function more reasonable and ensures the superiority situation for UCAV. As the air combat game is characterized by highly dynamic and a significant amount of uncertainty,to enhance the robustness and effectiveness of maneuver decision results, fuzzy logic is used to build the functions of four maneuver decision factors. Accuracy prediction of opponent aircraft is also essential to ensure making a good decision; therefore, a prediction model of opponent aircraft is designed based on the elementary maneuver method. Finally, the moving horizon optimization strategy is used to effectively model the whole air combat maneuver decision process. Various simulations are performed on typical scenario test and close-in dogfight, the results sufficiently demonstrate the superiority of the designed maneuver decision method. 展开更多
关键词 autonomous air combat maneuver decision Bayesian inference moving horizon optimization situation assessment fuzzy logic
下载PDF
A distributed decision method for missiles autonomous formation based on potential game 被引量:2
3
作者 JIA Xiang WU Sentang +1 位作者 WEN Yongming YAO Zheng 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2019年第4期738-748,共11页
The distributed cooperative decision problems of missiles autonomous formation with network packet loss are investigated by using the potential game based on formation principles.In particular,a dynamic target allocat... The distributed cooperative decision problems of missiles autonomous formation with network packet loss are investigated by using the potential game based on formation principles.In particular,a dynamic target allocation method for missiles formation is provided based on the potential game and formation principles,after the introduction of cooperative guidance and control system of the missiles formation.Then we seek the optimization of a global utility function through autonomous missiles that are capable of making individually rational decisions to optimize their own utility functions.The first important aspect of the problem is to design an individual utility function considering the characteristics of the missiles formation,with which the objective of the missiles are localized to each missile yet aligned with the global utility function.The second is to equip the missiles with an appropriate coordination mechanism with each missile pursuing the optimization of its own utility function.We present the design procedure for the utility,and present a coordination mechanism based on spatial adaptive play and then introduce the idea of“cyclical selected spatial adaptive play”and“negotiation based on time division multiple address(TDMA)protocol formation support network”.Finally,we present simulations for the distributed dynamic target allocation on the comprehensive digital simulation system,and the results illustrate the effectiveness and engineering applicability of the method. 展开更多
关键词 DISTRIBUTED decision dynamic target ALLOCATION missiles autonomous FORMATION potential GAME
下载PDF
Autonomous Maneuver Decisions via Transfer Learning Pigeon-Inspired Optimization for UCAVs in Dogfight Engagements 被引量:6
4
作者 Wanying Ruan Haibin Duan Yimin Deng 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2022年第9期1639-1657,共19页
This paper proposes an autonomous maneuver decision method using transfer learning pigeon-inspired optimization(TLPIO)for unmanned combat aerial vehicles(UCAVs)in dogfight engagements.Firstly,a nonlinear F-16 aircraft... This paper proposes an autonomous maneuver decision method using transfer learning pigeon-inspired optimization(TLPIO)for unmanned combat aerial vehicles(UCAVs)in dogfight engagements.Firstly,a nonlinear F-16 aircraft model and automatic control system are constructed by a MATLAB/Simulink platform.Secondly,a 3-degrees-of-freedom(3-DOF)aircraft model is used as a maneuvering command generator,and the expanded elemental maneuver library is designed,so that the aircraft state reachable set can be obtained.Then,the game matrix is composed with the air combat situation evaluation function calculated according to the angle and range threats.Finally,a key point is that the objective function to be optimized is designed using the game mixed strategy,and the optimal mixed strategy is obtained by TLPIO.Significantly,the proposed TLPIO does not initialize the population randomly,but adopts the transfer learning method based on Kullback-Leibler(KL)divergence to initialize the population,which improves the search accuracy of the optimization algorithm.Besides,the convergence and time complexity of TLPIO are discussed.Comparison analysis with other classical optimization algorithms highlights the advantage of TLPIO.In the simulation of air combat,three initial scenarios are set,namely,opposite,offensive and defensive conditions.The effectiveness performance of the proposed autonomous maneuver decision method is verified by simulation results. 展开更多
关键词 autonomous maneuver decisions dogfight engagement game mixed strategy transfer learning pigeon-inspired optimization(TLPIO) unmanned combat aerial vehicle(UCAV)
下载PDF
Driving decision-making analysis of car-following for autonomous vehicle under complex urban environment 被引量:2
5
作者 陈雪梅 金敏 +1 位作者 苗一松 张强 《Journal of Central South University》 SCIE EI CAS CSCD 2017年第6期1476-1482,共7页
The decision-making under complex urban environment become one of the key issues that restricts the rapid development of the autonomous vehicles. The difficulty in making timely and accurate decisions like human being... The decision-making under complex urban environment become one of the key issues that restricts the rapid development of the autonomous vehicles. The difficulty in making timely and accurate decisions like human beings under highly dynamic traffic environment is a major challenge for autonomous driving. Car-following has been regarded as the simplest but essential driving behavior among driving tasks and has received extensive attention from researchers around the world. This work addresses this problem and proposes a novel method RSAN(rough-set artificial neural network) to learn the decisions from excellent human drivers. A virtual urban traffic environment was built by Pre Scan and driving simulation was conducted to obtain a broad set of relevant data such as experienced drivers' behavior data and surrounding vehicles' motion data. Then, rough set was used to preprocess these data to extract the key influential factors on decision and reduce the impact of uncertain data and noise data. And the car-following decision was learned by neural network in which key factor was the input and acceleration was the output. The result shows the better convergence speed and the better decision accuracy of RSAN than ANN. Findings of this work contributes to the empirical understanding of driver's decision-making process and it provides a theoretical basis for the study of car-following decision-making under complex and dynamic environment. 展开更多
关键词 autonomous vehicle CAR-FOLLOWING decision-MAKING ROUGH set (RS) artificial NEURAL network (ANN) PreScan
下载PDF
无人集群博弈对抗系统仿真验证及决策关键技术综述
6
作者 梁晓龙 杨爱武 +4 位作者 张佳强 侯岳奇 王宁 黄骁 龚俊斌 《系统仿真学报》 CAS CSCD 北大核心 2024年第4期805-816,共12页
无人集群博弈对抗是一种新兴的作战样式,在智能化战争扮演着至关重要的作用,其核心是自主生成博弈对抗决策序列,为集群“赋能”。分析了无人集群博弈对抗系统仿真验证的进展;从基于专家系统和博弈论的技术、基于群体智能和优化理论的技... 无人集群博弈对抗是一种新兴的作战样式,在智能化战争扮演着至关重要的作用,其核心是自主生成博弈对抗决策序列,为集群“赋能”。分析了无人集群博弈对抗系统仿真验证的进展;从基于专家系统和博弈论的技术、基于群体智能和优化理论的技术,以及基于神经网络和强化学习的技术三个方面论述了自主决策关键技术,以及课题组在自主决策上开展的相关工作;提出了无人集群博弈对抗的发展方向。 展开更多
关键词 无人集群 博弈对抗 自主决策 系统仿真验证
下载PDF
自主水下航行器集群组网技术发展与展望
7
作者 于洋 孙思卿 +2 位作者 张立川 潘光 王鹏 《水下无人系统学报》 2024年第2期194-207,共14页
自主水下航行器(AUV)可借助水声通信、协同探测和控制决策等关键技术实现集群组网,形成同构或异构集群进行协同作业。通过集群组网,可以充分发挥不同航行器平台的能力优势,实现多平台之间的信息共享、任务协同和资源整合,从而自主完成... 自主水下航行器(AUV)可借助水声通信、协同探测和控制决策等关键技术实现集群组网,形成同构或异构集群进行协同作业。通过集群组网,可以充分发挥不同航行器平台的能力优势,实现多平台之间的信息共享、任务协同和资源整合,从而自主完成更复杂的海上作业任务。这种集群化的作业方式不仅提高了任务执行效率,还可降低作业成本,并提升海洋领域的探测、监测和应对能力。文中介绍了国内外AUV集群组网研究现状,总结了集群组网通信、集群感知、控制决策等关键技术和挑战,并针对AUV集群组网的应用需求,其在探测、通信、控制方面的发展趋势进行了展望,为开展AUV集群基础理论研究与实践应用研究提供参考。 展开更多
关键词 自主水下航行器集群 组网技术 水声通信 协同探测 控制决策
下载PDF
基于柔性演员-评论家算法的决策规划协同研究
8
作者 唐斌 刘光耀 +3 位作者 江浩斌 田宁 米伟 王春宏 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第2期105-113,187,共10页
为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与... 为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与基于规则的决策规划方法相结合设计自动驾驶决策规划协同智能体。结合自注意力机制(Self Attention Mechanism, SAM)和门控循环单元(Gate Recurrent Unit, GRU)构建预处理网络;根据规划模块的具体实现方式设计动作空间;运用信息反馈思想设计奖励函数,给智能体添加车辆行驶条件约束,并将轨迹信息传递给决策模块,实现决策规划的信息协同。在CARLA自动驾驶仿真平台中搭建交通场景对智能体进行训练,并在不同场景中将所提出的决策规划协同方法与常规的基于SAC算法的决策规划方法进行比较,结果表明,本文所设计的自动驾驶决策规划协同智能体学习速度提高了25.10%,由其决策结果生成的平均车速更高,车速变化率更小,更接近道路期望车速,路径长度与曲率变化率更小。 展开更多
关键词 智能交通 自动驾驶 柔性演员-评论家算法 决策规划协同 深度强化学习
下载PDF
引力理论框架下基于综合竞争力的自动驾驶拟人换道决策模型
9
作者 裴玉龙 傅博涵 +1 位作者 王子奇 张杰 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第1期66-80,共15页
为有效刻画城市快速路中自动驾驶环境下的车辆换道决策机理,考虑主车与周边车辆的位置属性、驾驶风格属性及车辆运动属性对主车换道行为的影响,建立基于综合竞争力的拟人换道决策模型。首先,以邻近前车间距、邻近前车速度差及驾驶风格这... 为有效刻画城市快速路中自动驾驶环境下的车辆换道决策机理,考虑主车与周边车辆的位置属性、驾驶风格属性及车辆运动属性对主车换道行为的影响,建立基于综合竞争力的拟人换道决策模型。首先,以邻近前车间距、邻近前车速度差及驾驶风格这3种因素作为自动驾驶车辆的拟人化换道意愿属性,量化表征主车的换道意愿;然后,基于人类决策中的悲观主义准则,分析换道过程中周边车辆与主车可能产生的竞争行为,利用车头间距比和驾驶风格差异提出潜在竞争强度概念;其次,考虑环境稳定性对驾驶舒适性的影响,提出“速度伪距”“加速度伪距”概念,衡量换道后的环境稳定性;最后,结合引力理论建立以车辆横向速度为求解目标的综合竞争力换道决策模型。在模型标定中,筛选Ubiquitous Traffic Eyes开源数据集,得到非强制换道片段数据,利用蚁群算法标定模型参数。采用随机排列交叉验证方法进行验证,以正确率为模型精度和泛化能力的评价指标,并将其与传统模型进行对比。结果表明,将训练与验证比设置为72%∶28%、65%∶35%、57%∶43%和50%∶50%时,平均正确率区间为87.67%~90.34%,说明该模型具有较强的鲁棒性和可行性,相比于传统模型,本文模型具有更高的预测精度,可为自动驾驶环境下车辆的车道选择提供依据。 展开更多
关键词 智能交通 换道决策 综合竞争力 自动驾驶 横向速度 轨迹数据
下载PDF
激波/湍流边界层干扰中的自适应控制技术
10
作者 黄伟 吴瀚 +2 位作者 钟翔宇 杜兆波 柳军 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第2期49-61,共13页
从激波/湍流边界层干扰机理以及流动控制的迫切需求入手,从自适应涡流发生器、自适应鼓包、自适应微射流以及自适应次流循环四个方面对激波/湍流边界层干扰中的自适应控制技术研究进展进行了总结。分析认为,结合AI技术发展自适应流动控... 从激波/湍流边界层干扰机理以及流动控制的迫切需求入手,从自适应涡流发生器、自适应鼓包、自适应微射流以及自适应次流循环四个方面对激波/湍流边界层干扰中的自适应控制技术研究进展进行了总结。分析认为,结合AI技术发展自适应流动控制技术,加速控制方式智能化,可作为新一代高超声速飞行器宽速域飞行的重要技术手段。具体来说,就是通过调节外加激励对高超声速飞行器不同区域实现局部流动加/减速、气动热防护、气动控制等功能,根据流场参数建立控制反馈回路,自适应调整局部流场结构,以满足工程实际需求。 展开更多
关键词 自适应流动控制 激波/湍流边界层干扰 高超声速飞行器 自主决策 分离 热流峰值
下载PDF
多车环境下智能货车的紧急转向决策及轨迹规划
11
作者 田国富 张森 《科学技术与工程》 北大核心 2024年第5期2083-2089,共7页
决策与规划是实现自动驾驶的关键技术,针对自动驾驶货车在紧急转向避障时需要考虑换道时目标车道的安全性和规划出最优避障轨迹的问题,采用将换道时左右车道上的车辆与自车的相对距离和换道的最小安全距离的差值分别建立模糊关系的方法... 决策与规划是实现自动驾驶的关键技术,针对自动驾驶货车在紧急转向避障时需要考虑换道时目标车道的安全性和规划出最优避障轨迹的问题,采用将换道时左右车道上的车辆与自车的相对距离和换道的最小安全距离的差值分别建立模糊关系的方法,通过比较模糊规则推理设计的安全值,选择更安全的车道进行转向避障,为了迅速规划出最优避障轨迹,采用三阶贝塞尔曲线,通过设计4个控制点坐标形成避障曲线,为了防止转向时横向加速度过大导致货车发生侧翻和速度过快与前车发生碰撞,设计车辆的稳定性边界和碰撞边界对控制点进行约束,使用MATLAB中的函数求解出不同车速下的最优换道轨迹,最后使用仿真软件进行仿真验证,结果表明设计出的避障决策和轨迹规划可以安全、有效地避开障碍。 展开更多
关键词 自动驾驶 转向避障 模糊规则 轨迹规划 换道决策
下载PDF
基于深度强化学习的无信号灯路口决策研究
12
作者 傅明建 郭福强 《计算机工程》 CAS CSCD 北大核心 2024年第5期91-99,共9页
无信号灯左转路口是自动驾驶场景中最为危险的场景之一,如何实现高效安全的左转决策是自动驾驶领域的重大难题。深度强化学习(DRL)算法在自动驾驶决策领域具有广阔应用前景。但是,深度强化学习在自动驾驶场景中存在样本效率低、奖励函... 无信号灯左转路口是自动驾驶场景中最为危险的场景之一,如何实现高效安全的左转决策是自动驾驶领域的重大难题。深度强化学习(DRL)算法在自动驾驶决策领域具有广阔应用前景。但是,深度强化学习在自动驾驶场景中存在样本效率低、奖励函数设计困难等问题。提出一种基于专家先验的深度强化学习算法(CBAMBC SAC)来解决上述问题。首先,利用SMARTS仿真平台获得专家先验知识;然后,使用通道-空间注意力机制(CBAM)改进行为克隆(BC)方法,在专家先验知识的基础上预训练模仿专家策略;最后,使用模仿专家策略指导深度强化学习算法的学习过程,并在无信号灯路口左转决策中进行验证。实验结果表明,基于专家先验的DRL算法比传统的DRL算法更具优势,不仅可以免去人为设置奖励函数的工作量,而且可以显著提高样本效率从而获得更优性能。在无信号灯路口左转场景下,CBAM-BC SAC算法与传统DRL算法(SAC)、基于传统行为克隆的DRL算法(BC SAC)相比,平均通行成功率分别提高了14.2和2.2个百分点。 展开更多
关键词 深度强化学习 自动驾驶 模仿学习 行为克隆 驾驶决策
下载PDF
基于强化学习的飞行器自主规避决策方法
13
作者 窦立谦 任梦圆 +1 位作者 张秀云 宗群 《航空科学技术》 2024年第6期96-103,共8页
考虑飞行器在执行任务过程中存在诸多不可预知的威胁或障碍,为保障飞行器的安全性,本文进行飞行器面向威胁目标的自主规避决策方法研究。首先综合考虑飞行器与威胁目标行为之间的相互影响,提出了基于深度长短期记忆(LSTM)神经网络的轨... 考虑飞行器在执行任务过程中存在诸多不可预知的威胁或障碍,为保障飞行器的安全性,本文进行飞行器面向威胁目标的自主规避决策方法研究。首先综合考虑飞行器与威胁目标行为之间的相互影响,提出了基于深度长短期记忆(LSTM)神经网络的轨迹预测算法,实现对威胁目标未来轨迹的预测;然后结合预测信息构建拦截场景下规避机动的马尔可夫决策过程,设计了基于改进双延迟深度确定性策略梯度(P-TD3)的飞行器规避决策方法,以最大化规避过程的总收益为优化目标,实现飞行器自主规避决策。最后通过在虚拟仿真交互平台的试验验证,本文的决策方法提升了网络的收敛速度,具有84%的规避成功率,提高了飞行器对潜在威胁的成功规避概率,有利于增强飞行器的自主性与安全性。 展开更多
关键词 高超声速飞行器 强化学习 双延迟深度确定性策略梯度 自主规避 机动决策
下载PDF
不确定性环境下的自动驾驶汽车行为决策方法 被引量:1
14
作者 付新科 蔡英凤 +2 位作者 陈龙 王海 刘擎超 《汽车工程》 EI CSCD 北大核心 2024年第2期211-221,259,共12页
在真实驾驶环境中,由于感知数据的噪声和其他交通参与者难以预测的行为意图,自动驾驶汽车如何在高度交互的复杂驾驶环境中考虑不确定性因素的影响,做出合理的决策,是当前决策规划系统须解决的主要问题之一。本文提出了一种不确定性环境... 在真实驾驶环境中,由于感知数据的噪声和其他交通参与者难以预测的行为意图,自动驾驶汽车如何在高度交互的复杂驾驶环境中考虑不确定性因素的影响,做出合理的决策,是当前决策规划系统须解决的主要问题之一。本文提出了一种不确定性环境下的自动驾驶汽车行为决策方法,为消除不确定性的影响,将行为决策过程转化为部分可观察马尔可夫决策过程(POMDP)。同时为解决POMDP模型计算复杂度过高的问题,首次将复杂网络理论应用于自动驾驶汽车周围微观的驾驶环境,对自动驾驶汽车驾驶环境进行动态建模,实现了车辆节点间交互关系的有效刻画,并对重要车辆节点进行科学筛选,用于指导自车的行为决策,实现对关键车辆节点的精准识别和决策空间的剪枝。在仿真环境中验证了所提方法的有效性,实验结果表明,与现有最先进的行为决策方法相比,所提出的方法拥有更高的计算效率,且拥有更好的性能和灵活性。 展开更多
关键词 自动驾驶汽车 行为决策 部分可观察马尔可夫决策过程 复杂网络
下载PDF
基于深度强化学习的火电机组制粉系统自启停智能决策 被引量:1
15
作者 蔡佳辰 李军 +3 位作者 高明 高林 高耀岿 昌鹏 《热力发电》 CAS CSCD 北大核心 2024年第3期146-152,共7页
针对目前人工决策基础上的制粉系统一键启停技术存在决策主观经验性强、操盘劳动强度大、节能优化潜力难以发掘等问题,提出了一种综合考虑制粉系统能耗与机组负荷跟踪性能的制粉系统启停决策评价模型,以安全引入网调负荷计划指令信号作... 针对目前人工决策基础上的制粉系统一键启停技术存在决策主观经验性强、操盘劳动强度大、节能优化潜力难以发掘等问题,提出了一种综合考虑制粉系统能耗与机组负荷跟踪性能的制粉系统启停决策评价模型,以安全引入网调负荷计划指令信号作为输入,研究了基于深度强化学习的制粉系统自启停智能决策方法,开发了制粉系统自启停决策闭环控制系统。研究结果通过仿真验证,并已在某超超临界1000 MW机组常用磨煤机上成功应用,节能降耗效果显著。研究结果可为火电机组少人、无人化运行技术提供有效借鉴。 展开更多
关键词 深度强化学习 制粉系统 自启停控制 智能决策
下载PDF
基于持续强化学习的自动驾驶赛车决策算法研究 被引量:1
16
作者 牛京玉 胡瑜 +1 位作者 李玮 韩银和 《高技术通讯》 CAS 北大核心 2024年第1期1-14,共14页
赛道形状与路面材质变化对自动驾驶赛车的行为决策带来了严峻挑战。为应对道路间的动力学差异,本文提出一种基于持续强化学习(CRL)的高速赛车决策算法。该算法将不同道路看作独立任务。算法的第1训练阶段负责提取描述不同任务上赛车动... 赛道形状与路面材质变化对自动驾驶赛车的行为决策带来了严峻挑战。为应对道路间的动力学差异,本文提出一种基于持续强化学习(CRL)的高速赛车决策算法。该算法将不同道路看作独立任务。算法的第1训练阶段负责提取描述不同任务上赛车动力学的低维特征,从而计算出任务间的相似性关系。算法的第2训练阶段负责为策略学习过程提供2个持续强化学习约束:其一是权重正则化约束,策略网络中对于旧任务重要的权重将在新任务学习期间被限制更新,其限制力度由任务相似性自适应调节;其二是奖励函数约束,鼓励在新任务学习期间策略的旧任务性能不下降。设计不同任务排序下的赛车实验和持续强化学习评价指标以评估算法性能。实验结果表明,所提算法能在既不存储旧任务数据也不扩展策略网络的条件下获得比基准方法更出色的驾驶性能。 展开更多
关键词 强化学习(RL) 持续学习 行为决策 自动驾驶赛车 动力学特征提取
下载PDF
基于强化学习的智能车避障决策算法
17
作者 宋倩 蓝俊欢 +1 位作者 罗富贵 李明珍 《电子设计工程》 2024年第12期181-186,共6页
针对当下智能车避障多采用建立地图模型和路径规划方法,其建模参数契合度较低的问题,提出一种基于强化学习的智能车避障决策算法。在未知动态环境中,构建了智能车自主避障决策的网络模型,考虑优先级的相互避障决策行为。在TORCS仿真平... 针对当下智能车避障多采用建立地图模型和路径规划方法,其建模参数契合度较低的问题,提出一种基于强化学习的智能车避障决策算法。在未知动态环境中,构建了智能车自主避障决策的网络模型,考虑优先级的相互避障决策行为。在TORCS仿真平台中验证了避障决策算法的有效性,较原始的DDPG算法可加快学习效率,训练后的TDDPG具备自适应能力,能快速自主避障决策。 展开更多
关键词 自主避障 强化学习 DDPG 智能决策
下载PDF
考虑驾驶风格的高速行驶工况自动换道决策规划研究
18
作者 张新锋 汪亚君 +2 位作者 张浩杰 赵娟 贾瑞豪 《汽车技术》 CSCD 北大核心 2024年第7期17-28,共12页
为了解决高速行驶工况下自动驾驶车辆决策模型的车间互动性不足、规划控制匹配性差等问题,构建了基于斯塔克尔伯格(Stackelberg)博弈的闭环换道决策模型,将障碍车响应纳入自车换道决策中,同时引入驾驶风格特征优化多目标决策成本函数,... 为了解决高速行驶工况下自动驾驶车辆决策模型的车间互动性不足、规划控制匹配性差等问题,构建了基于斯塔克尔伯格(Stackelberg)博弈的闭环换道决策模型,将障碍车响应纳入自车换道决策中,同时引入驾驶风格特征优化多目标决策成本函数,并使用粒子群优化(PSO)算法求解博弈决策模型,采用考虑质心侧偏角影响下的运动学模型预测车辆状态,设计了基于动态风险势场法的非线性模型预测规划控制器。仿真结果表明,所提出的闭环换道决策模型可有效结合车间互动行为与驾驶风格特征输出正确的决策指令并完成相应的运动规划和控制。 展开更多
关键词 自动驾驶车辆 换道决策规划 驾驶风格 斯塔克尔伯格博弈
下载PDF
基于深度强化学习的智能车辆行为决策研究
19
作者 周恒恒 高松 +2 位作者 王鹏伟 崔凯晨 张宇龙 《科学技术与工程》 北大核心 2024年第12期5194-5203,共10页
自动驾驶车辆决策系统直接影响车辆综合行驶性能,是实现自动驾驶技术需要解决的关键难题之一。基于深度强化学习算法DDPG(deep deterministic policy gradient),针对此问题提出了一种端到端驾驶行为决策模型。首先,结合驾驶员模型选取... 自动驾驶车辆决策系统直接影响车辆综合行驶性能,是实现自动驾驶技术需要解决的关键难题之一。基于深度强化学习算法DDPG(deep deterministic policy gradient),针对此问题提出了一种端到端驾驶行为决策模型。首先,结合驾驶员模型选取自车、道路、干扰车辆等共64维度状态空间信息作为输入数据集对决策模型进行训练,决策模型输出合理的驾驶行为以及控制量,为解决训练测试中的奖励和控制量突变问题,改进DDPG决策模型对决策控制效果进行优化,并在TORCS(the open racing car simulator)平台进行仿真实验验证。结果表明:所提出的决策模型可以根据车辆和环境实时状态信息输出合理的驾驶行为以及控制量,与DDPG模型相比,改进的模型具有更好的控制精度,且车辆横向速度显著减小,车辆舒适性以及车辆稳定性明显改善。 展开更多
关键词 自动驾驶 行为决策 深度强化学习 深度确定性策略梯度算法
下载PDF
长江下游桥区动态自适应自主航行决策方法
20
作者 曾美玲 黄立文 +1 位作者 贺益雄 李浩宇 《中国航海》 CSCD 北大核心 2024年第2期8-18,共11页
针对长江下游桥区环境复杂且时变,存在特殊航行规则、可航水域受限等问题,提出一种自主航行决策方法。在该类水域,基于数字化交通环境模型,结合导航模型、船舶操纵运动数学模型(MMG)、航向航迹控制方法构建自动航行模型。以航行规则和... 针对长江下游桥区环境复杂且时变,存在特殊航行规则、可航水域受限等问题,提出一种自主航行决策方法。在该类水域,基于数字化交通环境模型,结合导航模型、船舶操纵运动数学模型(MMG)、航向航迹控制方法构建自动航行模型。以航行规则和良好船艺为前提计算可行操纵区间,依靠时序滚动框架消除剩余误差和自适应目标船(TS)机动,求取自主航行决策方案。仿真结果表明:该方法能自适应时变环境,实现自适应多目标避让,并沿推荐航线安全通过,为桥区水域自主航行提供一种自适应的决策方法。 展开更多
关键词 自动航行模型 自主航行决策 桥区水域 长江下游
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部