-
题名基于安全强化学习的多智能体覆盖路径规划
- 1
-
-
作者
李松
麻壮壮
张蕴霖
邵晋梁
-
机构
电子科技大学自动化工程学院
深圳市人工智能与机器人研究院群体频谱智能研究中心
电磁空间认知与智能控制技术实验室
-
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2023年第S02期101-113,共13页
-
基金
国家自然科学基金项目(62273077)
深圳市人工智能与机器人研究院项目(AC01202201002)。
-
文摘
覆盖路径规划的目的是为智能体找到一条安全的轨迹,其不仅可以有效覆盖任务区域,而且可以避开障碍物与邻近智能体。在执行覆盖任务时,复杂的大面积任务区域总是不可避免的。如何在保证智能体安全的前提下加强智能体之间的协同合作,以改善集群任务效率低、能力不足的缺点是值得探索的问题。为此,利用栅格地图建立离散的覆盖路径规划数学模型,提出一种基于值分解网络的安全多智能体强化学习算法,并通过理论证明论证其合理性。该算法通过分解群体价值函数以避免智能体的虚假奖励,有助于加强智能体之间协同覆盖策略的学习,以提高算法的收敛速度。通过在训练过程中引入屏蔽器以修正智能体的出界和碰撞等行为,保证智能体在整个任务过程中的安全。仿真和半实物实验结果表明,新算法不仅可以保证智能体的覆盖效率,同时还能有效维护智能体的安全。
-
关键词
多智能体系统
覆盖路径规划
安全强化学习
值分解网络
-
Keywords
multi-agent system
coverage path planning
safe reinforcement learning
value decomposition network
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名未知环境下基于控制障碍函数的无人车轨迹规划
- 2
-
-
作者
方秋雨
张蕴霖
麻壮壮
邵晋梁
-
机构
电子科技大学自动化工程学院
深圳市人工智能与机器人研究院群体频谱智能研究中心
电磁空间认知与智能控制技术实验室
-
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2023年第S02期90-100,共11页
-
基金
国家自然科学基金项目(62273077)
深圳市人工智能与机器人研究院项目(AC01202201002)。
-
文摘
无人车凭借其适应性强、成本低的优点,成为代替人类前往高风险、高污染区域执行任务的一种切实可行的方案。轨迹规划作为无人车任务系统的关键技术,其目的是根据任务目标制定满足约束条件的运动轨迹。然而,目前的导航控制器主要依赖于预先获取的地图和先验知识,对未知环境的应对能力有所欠缺,无法适应复杂多变的任务环境。为此,提出了一种基于控制障碍函数的轨迹规划方法,用于解决无人车在未知环境下的自主避障、轨迹规划问题。该方法前端利用激光雷达感知环境深度信息,后端采用最小二乘支持向量机拟合障碍物边界,以估计控制障碍函数,并对负样本错分类进行补偿,最终通过求解二次规划得到安全控制指令。针对无人车可能陷入停滞状态的死锁问题,提出一种分段式的检测与消除方法来避免。数值仿真实验和半实物实验结果表明,所提方法在多种障碍物环境下具备较好的避障避撞和轨迹规划能力,在路径长度等方面优于传统的控制方法。
-
关键词
无人车
轨迹规划
控制障碍函数
最小二乘支持向量机
-
Keywords
unmanned ground vehicle
trajectory planning
control barrier function
least squares support vector machine
-
分类号
TP273.1
[自动化与计算机技术—检测技术与自动化装置]
-