期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
一种多机器人协作追捕-逃跑问题策略研究
1
作者 李珺 潘启树 洪炳镕 《小型微型计算机系统》 CSCD 北大核心 2009年第6期1180-1183,共4页
提出一种多机器人协作追捕多个移动目标策略.基于主从式协作结构提出了分区主从式协作方法,在确定追捕目标点后通过引入追捕意向、追捕耗时、心智态度等三个指标概念选择最优合作追捕团队成员,并根据逃跑者状况以及协作效用判断追捕结果... 提出一种多机器人协作追捕多个移动目标策略.基于主从式协作结构提出了分区主从式协作方法,在确定追捕目标点后通过引入追捕意向、追捕耗时、心智态度等三个指标概念选择最优合作追捕团队成员,并根据逃跑者状况以及协作效用判断追捕结果,评价追捕效率.仿真试验结果证明该策略的可行性及有效性. 展开更多
关键词 多机器人 追捕-逃跑问题 主从式组织结构
下载PDF
动压-过载约束下无人机追逃最优机动决策研究 被引量:1
2
作者 范跃杰 刘世前 +1 位作者 柴树梁 朱家强 《计算机仿真》 CSCD 北大核心 2013年第8期46-49,388,共5页
针对动压-过载约束下的无人机追逃机动控制问题,为优化设计,提出了采用微分对策的时间最优机动决策算法。首先建立无人机追逃质点动力学模型,然后根据双方极值原理,建立系统在动压-过载约束与追逃性能指标下的哈密顿-雅可比方程,通过此... 针对动压-过载约束下的无人机追逃机动控制问题,为优化设计,提出了采用微分对策的时间最优机动决策算法。首先建立无人机追逃质点动力学模型,然后根据双方极值原理,建立系统在动压-过载约束与追逃性能指标下的哈密顿-雅可比方程,通过此方程将无人机追逃机动控制问题转化为两点边值优化问题,并利用配点法求解两点边值问题的数值解,从而获得相应无人机的最优机动控制策略。最后以某型无人机纵向追逃控制为例进行数值仿真。仿真结果表明,改进算法不仅能有效求解无人机追逃双方的最优机动控制策略,而且满足期望的追踪性能指标和动压-过载约束条件。 展开更多
关键词 无人机 追逃问题 微分对策 两点边值问题 约束优化
下载PDF
基于距离信息的追逃策略:信念状态连续随机博弈 被引量:1
3
作者 陈灵敏 冯宇 李永强 《自动化学报》 EI CAS CSCD 北大核心 2024年第4期828-840,共13页
追逃问题的研究在对抗、追踪以及搜查等领域极具现实意义.借助连续随机博弈与马尔科夫决策过程(Markov decision process, MDP),研究使用测量距离求解多对一追逃问题的最优策略.在此追逃问题中,追捕群体仅领导者可测量与逃逸者间的相对... 追逃问题的研究在对抗、追踪以及搜查等领域极具现实意义.借助连续随机博弈与马尔科夫决策过程(Markov decision process, MDP),研究使用测量距离求解多对一追逃问题的最优策略.在此追逃问题中,追捕群体仅领导者可测量与逃逸者间的相对距离,而逃逸者具有全局视野.追逃策略求解被分为追博弈与马尔科夫决策两个过程.在求解追捕策略时,通过分割环境引入信念区域状态以估计逃逸者位置,同时使用测量距离对信念区域状态进行修正,构建起基于信念区域状态的连续随机追博弈,并借助不动点定理证明了博弈平稳纳什均衡策略的存在性.在求解逃逸策略时,逃逸者根据全局信息建立混合状态下的马尔科夫决策过程及相应的最优贝尔曼方程.同时给出了基于强化学习的平稳追逃策略求解算法,并通过案例验证了该算法的有效性. 展开更多
关键词 追逃问题 信念区域状态 连续随机博弈 马尔科夫决策过程 强化学习
下载PDF
时间固定的两航天器追逃策略及数值求解 被引量:16
4
作者 张秋华 孙松涛 +1 位作者 谌颖 孙毅 《宇航学报》 EI CAS CSCD 北大核心 2014年第5期537-544,共8页
针对时间固定的两航天器追逃问题,基于微分对策理论研究了追逃双方的最优控制策略及求解方法。研究在两航天器均为连续小推力假设条件下,以终端距离为支付函数,追踪器希望支付最小,逃逸器希望支付最大,并考虑时变的轨道高度及时变的角... 针对时间固定的两航天器追逃问题,基于微分对策理论研究了追逃双方的最优控制策略及求解方法。研究在两航天器均为连续小推力假设条件下,以终端距离为支付函数,追踪器希望支付最小,逃逸器希望支付最大,并考虑时变的轨道高度及时变的角速度建立对策模型,模型具有高维时变特征;由对策必要条件,对策研究最终转化为高维时变非线性两点边值问题的求解。提出采用多重打靶法和多目标遗传算法的混合算法,可以解决航天器追逃这类两点边值问题,并给出数值求解的具体方法。方法中,涉及边值问题中的协态变量初值估计时,采用多目标遗传算法给出初值估计,再由多重打靶法求两点边值问题的解。仿真实例表明:混合算法针对这类追逃问题,既能保证计算精度,又具有较好的鲁棒性,算例最终给出了追逃双方的最优控制策略和相应的追逃轨迹。 展开更多
关键词 航天器追逃 微分对策 控制策略 两点边值问题 混合算法
下载PDF
拦截机动目标的模糊导引律研究 被引量:5
5
作者 萧昌美 张福恩 尔联结 《航空学报》 EI CAS CSCD 北大核心 1998年第3期299-304,共6页
使用模糊方法研究了三维实际追逃问题的最小能量导引律问题。首先,通过对一些状态变量的定义域进行在线模糊分区,一方面,将非线性模型变为模糊T-S线性模型;另一方面,又能方便地处理目标的任意机动而引起的目标运动方向的变化。... 使用模糊方法研究了三维实际追逃问题的最小能量导引律问题。首先,通过对一些状态变量的定义域进行在线模糊分区,一方面,将非线性模型变为模糊T-S线性模型;另一方面,又能方便地处理目标的任意机动而引起的目标运动方向的变化。其次,利用RH(RecedingHori-zon)控制方法和伴随技术,在目标作对抗性机动条件下,获得了一个有效拦截的导引律。数值仿真结果表明,由这种导引律导引的导弹能够精确拦截任意机动的目标。 展开更多
关键词 三维追逃问题 模糊分区 导引律 机动目标 导弹
下载PDF
考虑约束追踪对策最优开环对策的必要条件 被引量:5
6
作者 吴文海 程文俊 沈春林 《飞机设计》 2003年第3期60-66,共7页
介绍了针对状态变量不等式约束的复杂追踪对策问题的一阶、二阶最优性必要条件 ,尤其是详细探讨了由状态约束和非平滑数据产生的奇异面问题。这些必要条件所对应的多点边界问题 ,类似于求解最优控制问题的必要条件。利用这种方法 。
关键词 状态变量不等式约束 奇异面 最优控制 空战 导弹 飞机 目标追踪 开环控制
下载PDF
无人机三维追逃问题的半直接法求解 被引量:2
7
作者 徐光延 史光普 《电光与控制》 北大核心 2017年第10期27-31,共5页
提出一种新颖的无人机三维追逃问题的求解方法,该方法结合变分法和伪谱法,是一种半直接法求解思想。求解过程首先应用变分法给出求解一个局中人最优控制律的微分方程组及其约束条件,将微分对策问题转换为最优控制问题,然后通过伪谱法再... 提出一种新颖的无人机三维追逃问题的求解方法,该方法结合变分法和伪谱法,是一种半直接法求解思想。求解过程首先应用变分法给出求解一个局中人最优控制律的微分方程组及其约束条件,将微分对策问题转换为最优控制问题,然后通过伪谱法再将最优控制问题转换成非线性规划问题,最后利用SNOPT求解器对其进行数值求解,并进行了数值仿真。对仿真结果的分析表明,追逃双方在博弈过程中都采取了各自最优的控制策略,验证了该方法的正确性、有效性和快速性。 展开更多
关键词 无人机 三维追逃问题 控制科学与技术 变分法 伪谱法
下载PDF
半直接配点法在航天器追逃问题求解中的应用 被引量:10
8
作者 郝志伟 孙松涛 +1 位作者 张秋华 谌颖 《宇航学报》 EI CAS CSCD 北大核心 2019年第6期628-635,共8页
采用半直接配点法求解时间固定两航天器追逃问题,提出一种新的数值求解追逃双方最优控制策略的方式,避免了求解非线性两点边值问题。在两航天器均为连续小推力假设条件下,以终端距离为支付函数,给出了半直接配点法求解此追逃问题的过程... 采用半直接配点法求解时间固定两航天器追逃问题,提出一种新的数值求解追逃双方最优控制策略的方式,避免了求解非线性两点边值问题。在两航天器均为连续小推力假设条件下,以终端距离为支付函数,给出了半直接配点法求解此追逃问题的过程。在此数值方法中,根据半直接转换将微分对策问题转化为一个最优控制问题,由Gauss-Lobbato配点法最终将此最优问题转化为非线性规划问题,继而通过序列二次规划方法求解。这种半直接配点法避免微分对策问题最优策略的必要条件(两点边值问题)求解,并且数值稳定性好。数值仿真给出了追逃双发的最优控制策略和相应的追逃轨迹。 展开更多
关键词 航天器追逃问题 微分对策 最优控制 两点边值问题 半直接配点法
下载PDF
基于微分博弈的追逃问题最优策略设计 被引量:6
9
作者 刘坤 郑晓帅 +2 位作者 林业茗 韩乐 夏元清 《自动化学报》 EI CAS CSCD 北大核心 2021年第8期1840-1854,共15页
本文设计了基于线性二次型微分博弈的多个攻击者、多个防御者和单个目标的追逃问题最优策略.首先,针对攻防双方保持聚合状态的情形,基于攻击方内部、防御方内部以及双方之间的通信拓扑,分别给出了目标沿固定轨迹运动和目标采取逃跑时攻... 本文设计了基于线性二次型微分博弈的多个攻击者、多个防御者和单个目标的追逃问题最优策略.首先,针对攻防双方保持聚合状态的情形,基于攻击方内部、防御方内部以及双方之间的通信拓扑,分别给出了目标沿固定轨迹运动和目标采取逃跑时攻防双方的最优策略.其次,针对攻防双方保持分散状态的情形,利用二分图最大匹配算法分配相应的防御者与攻击者,将多攻击者、多防御者追逃问题转化为多组两人零和微分博弈,并求解出了攻防双方的最优策略.最后,数值仿真验证了所提策略的有效性. 展开更多
关键词 微分博弈 追逃问题 团队聚合 线性二次型博弈 目标–攻击者–防御者
下载PDF
自利Agent追捕联盟生成算法
10
作者 吕磊 王浩 +1 位作者 林航 方宝富 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2017年第6期769-774,828,共7页
多Agent合作追捕是多Agent系统研究的经典问题,在机器人等领域具有重要的应用前景。文章提出了面向任务的自利Agent联盟生成算法,该算法能同时处理多个不同类型的逃跑Agent的任务分配问题;因为追捕Agent和逃跑Agent速度相等,追捕联盟成... 多Agent合作追捕是多Agent系统研究的经典问题,在机器人等领域具有重要的应用前景。文章提出了面向任务的自利Agent联盟生成算法,该算法能同时处理多个不同类型的逃跑Agent的任务分配问题;因为追捕Agent和逃跑Agent速度相等,追捕联盟成员位置的分布十分关键,所以提出了基于贡献度的联盟成员选择策略;同时为了较好地体现追捕Agent的自利性,定义了需求度作为自利性的度量,解决了冲突协商且有利于资源的优化配置。通过与经典拍卖算法的比较表明,该算法显著提高了追捕成功率。 展开更多
关键词 追捕-逃跑问题 自利Agent 追捕联盟 贡献度 需求度
下载PDF
基于CW方程的航天器追逃问题半直接求解方法 被引量:1
11
作者 孙松涛 祝强军 宋斌 《上海航天》 CSCD 2019年第3期68-74,共7页
针对时间固定的两航天器追逃问题,提出一种以半直接配点法研究追逃双方最优控制策略的求解方法。航天器追逃问题是基于微分对策的追逃问题,该问题是含有追逐者和逃逸者控制变量的两点边值问题。若采用必要条件求解,则对迭代初值要求高,... 针对时间固定的两航天器追逃问题,提出一种以半直接配点法研究追逃双方最优控制策略的求解方法。航天器追逃问题是基于微分对策的追逃问题,该问题是含有追逐者和逃逸者控制变量的两点边值问题。若采用必要条件求解,则对迭代初值要求高,收敛困难。在两航天器均为连续小推力的假设条件下,以终端距离为支付函数,给出半直接配点法的求解过程。在此数值方法中,根据半直接转换将微分对策问题转化为最优控制问题,采用Gauss-Lobbato配点法将此最优问题最终转化为非线性规划问题,继而通过序列二次规划算法求解。这种半直接配点法避免了对微分对策问题最优策略的必要条件(两点边值问题)求解。采用该方法求解对迭代初值不敏感,且数值稳定性好。数值仿真实例验证了这种求解方法的可行性。该方法提高了求解两点边值问题的收敛性,为求解含有双方控制变量的微分对策问题提供了一种思路。 展开更多
关键词 航天器追逃问题 微分对策 最优控制 两点边值问题 半直接配点法 非线性规划
下载PDF
基于Metlab的多机器人围捕问题的研究
12
作者 王艳 《价值工程》 2014年第20期48-49,共2页
本文将追捕-逃跑问题按空间、时间离散化后转为一个对策模型,并利用Matlab软件,采用栅格建模的方法来模拟仿真环境,对四个追捕机器人追捕一个目标机器人的实例进行了仿真。通过仿真发现了该支付函数的缺陷。基于此原因,重新定义了局中... 本文将追捕-逃跑问题按空间、时间离散化后转为一个对策模型,并利用Matlab软件,采用栅格建模的方法来模拟仿真环境,对四个追捕机器人追捕一个目标机器人的实例进行了仿真。通过仿真发现了该支付函数的缺陷。基于此原因,重新定义了局中人的支付函数,通过衰减因子μ,在追捕的不同阶段,根据追捕的具体情况灵活地调整距离影响系数和有效包围系数的权重,从而提高了追捕的效率。 展开更多
关键词 机器人 对策论 追捕-逃跑问题
下载PDF
A multiagent reinforcement learning approach based on different states
13
作者 李珺 潘启树 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2010年第3期419-423,共5页
In this paper we describe a new reinforcement learning approach based on different states. When the multiagent is in coordination state,we take all coordinative agents as players and choose the learning approach based... In this paper we describe a new reinforcement learning approach based on different states. When the multiagent is in coordination state,we take all coordinative agents as players and choose the learning approach based on game theory. When the multiagent is in indedependent state,we make each agent use the independent learning. We demonstrate that the proposed method on the pursuit-evasion problem can solve the dimension problems induced by both the state and the action space scale exponentially with the number of agents and no convergence problems,and we compare it with other related multiagent learning methods. Simulation experiment results show the feasibility of the algorithm. 展开更多
关键词 MAS reinforcement learning Q-LEARNING pursuit-evasion problem
下载PDF
基于半直接法的无人机多对一追逃问题研究
14
作者 史光普 《电光与控制》 CSCD 北大核心 2021年第8期48-52,76,共6页
介绍了一种新颖的、基于半直接法的无人机多对一追逃问题求解方法。首先,介绍了半直接法的理论,并通过变分法将双边最优化问题转换为单边最优化问题,通过Legendre伪谱法将单边最优化问题转换成非线性规划问题,建立多对一追逃双方的数学... 介绍了一种新颖的、基于半直接法的无人机多对一追逃问题求解方法。首先,介绍了半直接法的理论,并通过变分法将双边最优化问题转换为单边最优化问题,通过Legendre伪谱法将单边最优化问题转换成非线性规划问题,建立多对一追逃双方的数学模型并给出各自的目标函数,创新性地使用半直接法对追逃路径进行求解;然后,在Matlab编程环境下利用Snopt求解器进行数值仿真,验证了该算法的正确性、有效性和快速性;最后,通过与传统的比例导引法进行对比,验证了该算法具有良好的适用性和协同性。 展开更多
关键词 追逃问题 无人机 多对一 半直接法
下载PDF
多追捕者-单-逃跑者追逃问题实现成功捕获的约束条件 被引量:10
15
作者 方宝富 潘启树 +2 位作者 洪炳镕 丁磊 蔡则苏 《机器人》 EI CSCD 北大核心 2012年第3期282-291,共10页
针对包含有n个追捕者及1个逃跑者的2维平面多机器人追逃问题,对实现成功捕获的约束条件进行了研究.经过理论分析得出:在机器人拥有全局视野的情况下,即使单一逃跑者性能优于每个追捕者,只要满足追捕者与逃跑者的速率比大于sin(π/n),逃... 针对包含有n个追捕者及1个逃跑者的2维平面多机器人追逃问题,对实现成功捕获的约束条件进行了研究.经过理论分析得出:在机器人拥有全局视野的情况下,即使单一逃跑者性能优于每个追捕者,只要满足追捕者与逃跑者的速率比大于sin(π/n),逃跑机器人落在追捕机器人所构成的凸多边形内部且逃跑者和追捕者构成的相邻追-逃阿波罗尼奥斯圆满足两两相交(相切)这2个约束条件,则追捕者通过选择合适的追捕策略就一定可以实现成功抓捕.此外,还给出了在此约束条件下的追捕者和逃跑者的追逃策略.多组仿真实验同样证明了本文提出的约束条件是正确的. 展开更多
关键词 多机器人系统 追逃问题 阿波罗尼奥斯圆 约束条件 追逃策略
原文传递
基于分支深度强化学习的非合作目标追逃博弈策略求解 被引量:15
16
作者 刘冰雁 叶雄兵 +2 位作者 高勇 王新波 倪蕾 《航空学报》 EI CAS CSCD 北大核心 2020年第10期343-353,共11页
为解决航天器与非合作目标的空间交会问题,缓解深度强化学习在连续空间的应用限制,提出了一种基于分支深度强化学习的追逃博弈算法,以获得与非合作目标的空间交会策略。对于非合作目标的空间交会最优控制,运用微分对策描述为连续推力作... 为解决航天器与非合作目标的空间交会问题,缓解深度强化学习在连续空间的应用限制,提出了一种基于分支深度强化学习的追逃博弈算法,以获得与非合作目标的空间交会策略。对于非合作目标的空间交会最优控制,运用微分对策描述为连续推力作用下的追逃博弈问题;为避免传统深度强化学习应对连续空间存在维数灾难问题,通过构建模糊推理模型来表征连续空间,提出了一种具有多组并行神经网络和共享决策模块的分支深度强化学习架构。实现了最优控制与博弈论的结合,有效解决了微分对策模型高度非线性且难于利用经典最优控制理论进行求解的难题,进一步提升了深度强化学习对离散行为的学习能力,并通过算例仿真检验了该算法的有效性。 展开更多
关键词 非合作目标 空间交会 航天器追逃问题 连续空间 微分对策 深度强化学习 分支架构
原文传递
2020年中国研究生数学建模竞赛D题综述
17
作者 刘卫东 《数学的实践与认识》 2021年第23期234-239,共6页
叙述了2020年中国研究生数学建模竞赛D题“无人机集群协同对抗”的命题背景和目的,分析了本赛题的建模及求解思路,对评阅中发现的问题进行了综述,最后讨论了本赛题还需继续思考的问题.
关键词 数学建模 无人机集群 协同对抗 微分对策 追逃问题
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部