考虑移动目标不确定行为方式的轨迹预测方法被引量：1

A Trajectory Prediction Method Considering Uncertain Behavior Patterns of Moving Targets

下载PDF

导出

摘要针对现有方法难以预测出符合飞行移动目标不确定行为方式轨迹的问题,提出基于逆强化学习的飞行移动目标轨迹预测方法,通过学习目标行为偏好以及模拟目标行为决策过程的方式预测目标的移动轨迹。首先基于深度神经网络建立目标的行为决策模型与行为偏好模型,然后通过最大熵逆强化学习方法交替地学习模型参数。为了有效地学习目标的不确定行为特征,采用监督学习的方法学习出目标示例轨迹概率分布模型,用于指导目标行为偏好模型的训练以及初始化目标行为决策模型,同时通过对目标行为偏好模型进行预训练的方式提高其训练质量。仿真结果表明,提出的飞行移动目标轨迹预测方法可通过学习到的目标行为决策模型较为准确地模拟目标的行为方式,预测的目标轨迹分布与真实的目标轨迹分布在Kullback-Leibler(KL)散度下的相似度可达0.24。 Aiming at the problem that the existing methods are difficult to predict the trajectory of the flying moving target with uncertain behavior patterns,a trajectory prediction method for flying moving targets based on inverse reinforcement learning is proposed,which can predict the moving trajectory by learning the behavior preference of the target and simulating the decision-making process of the target behavior.Firstly,the behavior decision model and behavior preference model of the target are established based on deep neural networks,and then the model parameters are alternately learned by a maximum entropy inverse reinforcement learning method.In order to effectively learn the uncertain behavior characteristics of the target,the supervised learning method is used to learn the probability distribution model of the target sample trajectories,which are then used to guide the training of the target behavior preference model and initialize the target behavior decision model.Meanwhile,the training quality of the target behavior preference model is improved by pre-training.The simulation results show that the proposed method can accurately simulate the behavior patterns of the target through the learned target behavior decision model,and the similarity between the predicted target trajectory distribution and the real target trajectory distribution under Kullback-Leibler(KL)divergence can reach 0.24.

作者颜鹏郭继峰白成超 YAN Peng;GUO Jifeng;BAI Chengchao(School of Astronautics,Harbin Institute of Technology,Harbin 150001,China)

机构地区哈尔滨工业大学航天学院

出处《宇航学报》 EI CAS CSCD 北大核心 2022年第8期1040-1051,共12页 Journal of Astronautics

基金国家自然科学基金(61973101)。

关键词轨迹预测飞行移动目标不确定行为方式逆强化学习深度神经网络 Trajectory prediction Flying moving targets Uncertain behavior patterns Inverse reinforcement learning Deep neural networks

分类号 V19 [航空宇航科学与技术—人机与环境工程]

引文网络
相关文献

参考文献10

1黄艳龙,徐德,谭民.机器人运动轨迹的模仿学习综述[J].自动化学报,2022,48(2):315-334. 被引量：11
2张凯,熊家军,李凡,付婷婷.基于意图推断的高超声速滑翔目标贝叶斯轨迹预测[J].宇航学报,2018,39(11):1258-1265. 被引量：28
3王开园,许志,唐硕,万佳庆.一种基于飞行任务的临近空间短距滑翔飞行器弹道预示方法[J].宇航学报,2021,42(1):50-60. 被引量：4
4叶泽浩,毕红葵,谭贤四,曲智国,张裕禄,程杨.改进的平方根UKF在再入滑翔目标跟踪中的应用[J].宇航学报,2019,40(2):215-222. 被引量：18
5金泽明,汪玲,刘柯,杜荣华,张翔.联合EKF和EKPF的空间非合作目标单目位姿估计[J].宇航学报,2021,42(7):907-916. 被引量：5
6乔少杰,韩楠,朱新文,舒红平,郑皎凌,元昌安.基于卡尔曼滤波的动态轨迹预测算法[J].电子学报,2018,46(2):418-423. 被引量：87
7刘文,胡琨林,李岩,刘钊.移动目标轨迹预测方法研究综述[J].智能科学与技术学报,2021,3(2):149-160. 被引量：6
8赵良玉,雍恩米,王波兰.反临近空间高超声速飞行器若干研究进展[J].宇航学报,2020,41(10):1239-1250. 被引量：32
9游航航,余敏建,吕艳,杨海燕,韩其松.基于改进灰狼算法优化的UKF在空战轨迹预测中的应用[J].战术导弹技术,2020(1):91-98. 被引量：6
10乔少杰,韩楠,丁治明,金澈清,孙未未,舒红平.多模式移动对象不确定性轨迹预测模型[J].自动化学报,2018,44(4):608-618. 被引量：12

二级参考文献135

1温美玲,路鹏远,蔡林,程洋溢.基于轨迹大数据的交通拥堵评估和预测[J].数字制造科学,2021(1):77-80. 被引量：3
2熊少锋,魏明英,赵明元,熊华,王卫红,周本春.逆轨拦截机动目标的三维最优制导律[J].宇航学报,2020,41(1):80-90. 被引量：16
3李林,王国宏,张翔宇,于洪波.多尺度搜索补偿的临近空间高超声速目标相参积累算法[J].宇航学报,2020,41(1):71-79. 被引量：3
4潘泉,杨峰,叶亮,梁彦,程咏梅.一类非线性滤波器——UKF综述[J].控制与决策,2005,20(5):481-489. 被引量：230
5马国兵,张楠.一种基于神经网络的机动目标轨迹预测方法[J].青岛理工大学学报,2006,27(5):108-111. 被引量：9
6葛致磊,孙琦.交会角对制导性能的影响[J].宇航学报,2008,29(5):1492-1495. 被引量：6
7唐婷,何子述,程婷,韩春林.一种改进的自适应网格交互多模型跟踪算法[J].信号处理,2009,25(5):816-819. 被引量：6
8张胜涛,陈方,刘洪.近空间高超飞行器气动热红外特性数值仿真[J].计算机仿真,2010,27(1):114-118. 被引量：7
9李鹏,宋申民,陈兴林.自适应平方根无迹卡尔曼滤波算法[J].控制理论与应用,2010,27(2):143-146. 被引量：14
10黄伟,罗世彬,王振国.临近空间高超声速飞行器关键技术及展望[J].宇航学报,2010,31(5):1259-1265. 被引量：108

共引文献182

1董金鲁,龚晓刚,张曦,宋加洪,马悦萌,周荻.基于反馈线性化的直接侧向力与襟翼复合控制[J].战术导弹技术,2022(6):81-92.
2游航航,余敏建,吕艳,杨海燕,韩其松.基于改进灰狼算法优化的UKF在空战轨迹预测中的应用[J].战术导弹技术,2020(1):91-98. 被引量：6
3吴玉祥.基于STM32的岸桥司机驾驶技术评估系统的设计[J].中国新技术新产品,2020(15):7-9.
4钱来,王伟.一种基于C-GRU飞行轨迹预测方法[J].电子测量技术,2022,45(10):87-92. 被引量：2
5吴怀宇.卡尔曼滤波算法及其在真实成绩预测中的应用[J].中国新通信,2018,20(23):125-126. 被引量：2
6苏莉.概率频繁模式挖掘算法研究综述[J].电子技术与软件工程,2017(8):184-184. 被引量：1
7王大志.试论飞行器航迹预测方法研究[J].信息技术与信息化,2018(7):192-194.
8薛骐.基于小波神经网络模型的高铁沉降预测方法研究[J].铁道勘察,2018,44(4):13-16. 被引量：1
9李晨朋,韩印,王馨玉.车联网环境下公交路径交通状态估计方法研究[J].交通运输研究,2018,4(5):29-34. 被引量：3
10文峰,张国.基于SVR的短时交通流量预测[J].科技创新导报,2018,15(25):189-190. 被引量：1

同被引文献12

1水尊师,周军,葛致磊.基于高斯伪谱方法的再入飞行器预测校正制导方法研究[J].宇航学报,2011,32(6):1249-1255. 被引量：39
2曾志峰,汤一华,徐敏,陈士橹.基于神经网络的飞行器再入制导研究[J].飞行力学,2011,29(3):64-67. 被引量：2
3王帅,尚海滨,崔平远,黄翔宇.小推力地球卫星圆轨道同轨调相设计方法研究[J].宇航学报,2013,34(1):1-8. 被引量：6
4刘磊,刘勇,曹建峰,唐歌实,周建亮.“嫦娥二号”探测小行星任务转移轨道设计[J].宇航学报,2014,35(3):262-268. 被引量：13
5李昭莹,张冉,李惠峰.RLV轨迹在线重构与动态逆控制跟踪[J].宇航学报,2015,36(2):196-202. 被引量：9
6黄煌.一种基于深度神经网络的非线性控制分配方法[J].战术导弹技术,2017(4):90-94. 被引量：4
7朱俊鹏,赵洪利,杜鑫,蒋勇.长短时记忆神经网络在卫星轨道预报中的研究[J].兵器装备工程学报,2017,38(10):127-132. 被引量：11
8赵吉松,王江华,王泊乔,张金明,朱航标.探月返回飞行器跳跃式再入轨迹优化[J].宇航学报,2021,42(2):211-219. 被引量：5
9刘宇航,杨洪伟,李爽.小推力最优轨迹协态估计的高效机器学习方法[J].宇航学报,2022,43(5):593-602. 被引量：5
10邓雁鹏,穆荣军,彭娜,吴鹏.月面着陆动力下降段最优轨迹序列凸优化方法[J].宇航学报,2022,43(8):1029-1039. 被引量：9

引证文献1

1黄旭辰,黄旭星,杨彬,李爽.面向GEO空间碎片清除任务的智能轨迹制导算法[J].宇航学报,2023,44(5):719-730.

1刘少瑜,董璐,陶伊奇,苗奕佳,赖鸿展.人因情景驱动下适老化的物联网建筑空间设计嬗变及实践研究[J].世界建筑导报,2022,37(4):39-41.
2杨阳,王佳杰.基于GIS的城市公园夜晚灯光对游人行为偏好影响的研究[J].西南大学学报（自然科学版）,2022,44(9):205-214. 被引量：3
3赵鲁臻,张铃敏.大学生网络关注热点及行为偏好调查研究[J].华北理工大学学报（社会科学版）,2022,22(5):88-92.
4刘天扬,梁海英,冯一鸣,刘杨,王雨婷,徐杨茗,张一鸣.改进NOFRFS加权贡献率在转子碰摩故障诊断的应用[J].机械设计与研究,2022,38(3):93-99. 被引量：1
5胡玲,顾力天,赵亚琳,陈挺帅.城建系统植物园露地专类园设计研究——以绍兴植物园为例[J].中国园林,2022,38(S01):39-44. 被引量：2
6江雨燕,吕魏,李平,邵金.基于无监督的非对称度量学习优化行人再识别[J].计算机技术与发展,2022,32(9):126-133.
7许朵,姚崇,马骋,宋恩哲.船用双燃料发动机综合性能预测及优化[J].内燃机学报,2022,40(5):403-411. 被引量：6
8严玲艳,杨思洛.学术社交网站用户使用偏好比较分析——基于学术身份与学科视角[J].图书馆杂志,2022,41(8):62-68. 被引量：2
9林映强.国家治理视角下税收征管制度改革研究[J].铜陵学院学报,2022,21(3):24-28.
10马晓剑,赵法舜,刘艳宾.多特征准则融合的遥感图像脉冲噪声的识别处理[J].自然资源遥感,2022,34(3):17-26.

宇航学报

2022年第8期

浏览历史

内容加载中请稍等...

考虑移动目标不确定行为方式的轨迹预测方法被引量：1

参考文献10

二级参考文献135

共引文献182

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

考虑移动目标不确定行为方式的轨迹预测方法 被引量：1

参考文献10

二级参考文献135

共引文献182

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

考虑移动目标不确定行为方式的轨迹预测方法被引量：1