题名 小天体多节点着陆器强化学习任务规划方法
1
作者
路思遥
徐瑞
高艾
李朝玉
王棒
朱圣英
李超博
机构
北京理工大学宇航学院
深空自主导航与控制工信部重点实验室(北京理工大学)
上海卫星工程研究所
出处
《宇航学报》
EI
CAS
CSCD
北大核心
2024年第6期831-841,共11页
基金
国家重点研发计划(2019YFA0706500)
空间碎片专项(KJSP2020020302)
国家自然科学基金(62006019)。
文摘
针对中国提出的小天体多节点着陆器节点运动强耦合,着陆规划过程复杂、执行易偏差、重新规划速度慢特点,提出一种多节点着陆器强化学习任务规划方法。该方法首先将状态空间规划逻辑模型描述为矩阵,利用模型矩阵将任务规划建模为马尔科夫过程,之后通过状态哈希的广度优先搜索算法筛选随机生成状态,生成有效多节点着陆器状态空间始末状态,构建虚拟状态空间训练环境,随机切换始末状态训练强化学习智能体,提升节点的规划适应能力,实现多种条件下的任务规划。对着陆任务进行仿真,实验表明训练后智能体成功完成所有测试任务,且规划效率比POPF3规划器更高,在方案频繁调整的短序列任务上规划速度优势更大,可以更好地应用于多节点着陆器的任务规划。
关键词
任务规划
强化学习
多节点着陆器
状态 空间
Keywords
Task planning
Reinforcement learning
Multi-node lander
State space
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
V1
[航空宇航科学与技术—人机与环境工程]
题名 改进状态转移集的动态规划检测前跟踪算法
被引量:1
2
作者
邢浩
索继东
孙博
机构
大连海事大学信息科学技术学院
出处
《现代电子技术》
北大核心
2020年第19期1-5,共5页
基金
国家科技支撑计划子课题(2015BAG20B02)
辽宁省博士启动基金(201601065)
福建海事局项目(2018Z0093)。
文摘
针对传统动态规划检测前跟踪(DP-TBD)算法能够覆盖的目标机动范围受限于固定转移步长的缺陷,提出一种改进状态转移集的动态规划检测前跟踪(ISTS-DP-TBD)算法。通过状态转移策略的优化,提高了对机动目标的状态搜索效率;通过在传统算法的能量积累过程中引入Kalman滤波,状态转移集能够随目标速度的变化而及时调整,使新算法能按照机动目标的运动趋势进行能量积累。仿真结果表明,ISTS-DP-TBD算法对强机动和弱机动目标都能进行有效检测和跟踪。
关键词
检测前 跟踪
动态规划
机动目标搜索
状态 转移集
速度调整
能量积累
Keywords
track-before-detect
dynamic programming
maneuvering target search
state transition set
speed adjustment
energy accumulation
分类号
TN957.51-34
[电子电信—信号与信息处理]
题名 海洋多平台多传感器协同监测任务智能规划技术
被引量:3
3
作者
侯睿
程宇婷
李晖
赵曼
应文
机构
中国地质大学(武汉)地质探测与评估教育部重点实验室
中国电子科学研究院
出处
《海洋信息》
2020年第3期11-19,共9页
基金
地质探测与评估教育部重点实验室主任基金和中央高校基本科研业务费(编号GLAB2019ZR13)。
文摘
海洋多平台多传感器协同监测任务智能规划技术面向大型复杂海洋传感网络,能够在海洋信息平台及传感设备大规模海上部署的情况下进行大批量的任务规划和观测资源分配,形成海洋情报分析-系统行动规划-行动规划实施-精确情报再收集的良性闭环监测模式。针对重要海上态势,能够通过多平台、多传感器协同行动规划手段,对情报进行持续的、多手段协同的精确观测,有效提升海洋传感网络的监测效率和精确度,显著降低系统对指挥调度人员的素质经验要求,极大提升了海洋传感网络系统的指挥调度智能化自动化水平。该技术全面分析了海洋传感网络的共性特点和特性差异,充分考虑了海上环境、能源、通信等多方面制约因素,建立具有广泛适应性的海洋多平台多传感器协同监测任务智能规划问题模型,能够快速移植到不同的海洋传感网络,采用差分进化、蚁群、贪心等多种群体人工智能算法和状态空间启发式搜索算法,满足不同业务场景规划的需求,同时具备智能约束匹配和规划冲突消解的能力,实现运行规划动态调整、系统资源实时匹配和协同保障。
关键词
多平台多传感器
海洋传感网络
任务规划
群体人工智能算法
状态 空间 启发式搜索 算法
Keywords
multi-platform and multi-sensor
ocean sensor network
task planning
group artificial intelligence algorithm
state space heuristic search algorithm
分类号
TP212.9
[自动化与计算机技术—检测技术与自动化装置]
题名 一种支持状态优劣的路径搜索算法
4
作者
叶涛
机构
青海民族学院
出处
《甘肃科技》
2008年第22期30-31,共2页
文摘
文章描述一种支持状态优劣的高效增量搜索算法。在大规模状态空间的搜索算法中,通过探询节点间状态的优劣来剪枝,可以极大的提高搜索算法的速度。本算法保留了D*Lite的算法简单性和增量搜索能力,还极大的提高了对大规模状态空间的优劣排序速度。
关键词
状态 空间
增量搜索
路径规划 算法
分类号
TP242
[自动化与计算机技术—检测技术与自动化装置]
题名 基于深度学习和智能规划的行为识别
被引量:12
5
作者
郑兴华
孙喜庆
吕嘉欣
鲜征征
李磊
机构
中山大学数据科学与计算机学院
广东金融学院互联网金融与信息工程学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2019年第8期1661-1668,共8页
基金
广东省自然科学基金(No.2017A030313391)
广东省科技厅国际合作项目(No.2017A050501042)
文摘
现有行为识别方法在未能持续覆盖造成视频监控盲区所引起行为数据缺失的情况,难以有效实施特征分析、行为分类补全,无法准确识别出智能体完整的行为动作序列.为此,本文提出一种基于深度学习和智能规划的行为识别方法.首先,利用深度残差网络对图像进行分类训练,然后使用递归神经网络对图像特征进行提取深度信息以增强分类效果;其次,运用智能规划的STRIPS(Stanford Research Institute Problem Solver)模型,将深度学习提取的图像特征命题信息转化为规划领域的模型描述文档,并使用前向状态空间搜索规划器推导出完整的行为动作序列.在HMDB51等行为识别公共数据集中,本方法与生成式对抗网络、深度卷积逆向图网络、深度信念网络、支持向量机等同类先进方法相比展现出更好的性能.
关键词
行为识别
深度学习
智能规划
深度残差网络
递归神经网络
STRIPS规划 模型
前向状态空间搜索规划器
Keywords
action recognition
deep learning
artificial intelligence planning
deep residual network
recurrent neural network
STRIPS planning model
forward state-space search planner
分类号
TP302
[自动化与计算机技术—计算机系统结构]
题名 多股流换热器自动最优控制过程的模拟
被引量:1
6
作者
李科群
罗行
马虎根
机构
上海理工大学动力工程学院
出处
《动力工程》
EI
CSCD
北大核心
2006年第4期495-498,共4页
基金
上海理工大学科研项目
文摘
为了模拟多股流换热器自动控制过程,应用特别适用于“多输入-多输出”系统的状态空间方法。该方法的调节依据是状态参数的反馈,状态参数不仅包括输出参数,还包括输出参数变化的速度和加速度及高阶导数等。利用实验所得的动态特性,导出了多股流换热器的状态方程和输出方程,并用动态规划方法对其自动最优控制过程进行了模拟。给出了一个四股流换热器自动最优控制过程模拟实例。结果表明:状态空间方法和动态规划方法可有效地应用于多股流换热器的最优反馈控制设计。
关键词
自动控制技术
多股流换热器
状态 空间 方法
动态规划 方法
Keywords
automatic control
simulation
multi-flow heat exchanger
state-space method
dynamic programming method
分类号
TM621.4
[电气工程—电力系统及自动化]
TP272
[自动化与计算机技术—检测技术与自动化装置]
题名 基于多值表示的并行规划方法
7
作者
史晶晶
刘大有
蔡敦波
吕帅
江鸿
机构
吉林大学计算机科学与技术学院
吉林大学符号计算与知识工程教育部重点实验室
出处
《计算机科学》
CSCD
北大核心
2009年第9期186-192,共7页
基金
国家自然科学基金重大项目(60496321)
国家自然科学基金项目(60573073
+8 种基金
60503016
60603030
60773099
60703022
60873149)
国家863高技术研究发展计划项目(2006AA10Z245
2006AA10A309)
吉林省科技发展计划重点项目(20060213)
欧盟项目TH/AsiaLink/010(111084)资助
文摘
Fast Downward规划系统是第四届国际规划竞赛的冠军。以高效的串行规划系统Fast Downward为基础,设计并实现了并行规划系统Parallel Downward。首先提出4个并行规划的相关定义;之后提出多值规划任务下动作互斥的定义、充要条件,并实现了动作互斥判断算法;在此基础上设计了候选并行动作集的生成算法;然后为提高系统求解质量重新设计了新的搜索控制策略;最后,给出剪枝策略来抑制并行规划状态空间的指数级膨胀。通过对国际规划竞赛测试问题的实验,Parallel Downward表现出良好的规划效率和规划质量,相比Sapa规划系统Parallel Down-ward具有较好的可扩展性。
关键词
并行规划
多值规划 任务
状态 空间 启发式搜索
因果图启发式
Keywords
Parallel planning, Multi-valued planning task, Planning as heuristic search in state space,Causal graph heuristic
分类号
TP242.6
[自动化与计算机技术—检测技术与自动化装置]
TP301.6
[自动化与计算机技术—计算机系统结构]