期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于D3QN的无人机编队控制技术
1
作者 赵启 甄子洋 +3 位作者 龚华军 曹红波 李荣 刘继承 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第8期2137-2146,共10页
针对无人机编队中控制器设计需要基于模型信息,以及无人机智能化程度低等问题,采用深度强化学习解决编队控制问题。针对编队控制问题设计对应强化学习要素,并设计基于深度强化学习对偶双重深度Q网络(D3QN)算法的编队控制器,同时提出一... 针对无人机编队中控制器设计需要基于模型信息,以及无人机智能化程度低等问题,采用深度强化学习解决编队控制问题。针对编队控制问题设计对应强化学习要素,并设计基于深度强化学习对偶双重深度Q网络(D3QN)算法的编队控制器,同时提出一种优先选择策略与多层动作库结合的方法,加快算法收敛速度并使僚机最终能够保持到期望距离。通过仿真将设计的控制器与PID控制器、Backstepping控制器对比,验证D3QN控制器的有效性。仿真结果表明:该控制器可应用于无人机编队,提高僚机智能化程度,自主学习保持到期望距离,且控制器设计无需模型精确信息,为无人机编队智能化控制提供了依据与参考。 展开更多
关键词 无人机编队 编队控制 深度强化学习 深度q网络 对偶双重深度q网络
下载PDF
跳过程的不变测度与q对的不变测度 被引量:1
2
作者 徐侃 张绍义 《数学杂志》 CSCD 北大核心 2001年第4期476-478,共3页
本文讨论了一般状态空间上具有不变测度的 q对的对偶 q对的构造问题 ,证明了正则 q对的不变测度是它的相应跳过程的不变测度的充要条件是该 q对的对偶
关键词 q对 跳过程 不变测度 对偶q对 充要条件 概率核
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部