面向无人机救援搜寻的多轨迹策略优化方法被引量：1

A multi-trajectory policy optimization for UAV rescue search

下载PDF

导出

摘要无人机在应急救援中能有效辅助搜救人员缩短搜寻时间,减小生命财产损失。针对无人机搜寻规模变大时传统方法运行时间较长的问题,提出一种基于注意力机制的多轨迹策略优化方法。该方法基于深度强化学习算法,引入多轨迹采样技术,避免轨迹数据产生采样偏差;引入数据增强技术,进一步丰富轨迹数据特征;提出结合信息熵的目标损失函数,指导模型探索更优可行解空间。网络模型采用编码-解码框架,通过调整注意力机制网络提升编码器学习能力,利用添加残差子层提升解码器泛化能力。采用随机数据集和公共数据集分别验证模型的优化效果和泛化性能。试验结果显示,基于注意力机制的多轨迹策略优化方法相比理论最优解,在计算时间方面平均缩短了94.3%。此外,基于注意力机制的多轨迹策略优化方法相比对照方法的解,在平均差距方面相对提升了95.1%,在标准差方面降低了4.4%,为提升无人机救援搜寻效率提供了技术参考。 In emergency rescue,Unmanned Aerial Vehicles(UAVs) can effectively assist staff in shortening the search time and reducing the loss of life and property caused by disasters.The Traveling Salesman Problem(TSP) can be used to plan UAV search paths.But when the size of the search target increases,the traditional methods have the issue of a long running time.To address this problem,we proposed an Attention-based Multi-Trajectory Policy Optimization(AMTPO) method.Based on deep reinforcement learning,we used a multi-trajectory sampling technique to avoid any sampling bias in the trajectory data,which can prevent the omission of identical loop trajectories from different initial points.To further enhance the features of the trajectory data,we devised an instance augmentation strategy that can improve the network model's generalization performance.Entropy loss was added to the object loss function to improve network model exploration during training,which can guide the model to explore a more feasible solution space.The network model in this paper adopted the encoder-decoder framework.The encoder's learning capability was enhanced by adjusting the attention mechanism network.The decoder's generalization capability was improved by adding a residual sublayer.In the comparison experiments.We verified the optimization performance of AMTPO with three types of random instances.In the generalization experiments,we validated the generalization performance of the model with TSPLIB instances based on the distribution characteristics of several rescue search regions.In the ablation experiments,we tested the learning performance of different structural models,fully evaluated each innovation point of AMTPO,and selected the best-performing network model as the final model of this paper used for different test instances.The experimental results show that AMTPO has a calculation time that is on average about 94.3% shorter than Concorde's,an average gap is about 95.1% less than POMO's in relative terms,and a standard deviation of path length is about 4.4% lower than POMO's,providing a technical reference for improving the efficiency of UAV rescue searches.

作者王鹏王小清吴仁彪 WANG Peng;WANG Xiaoqing;WU Renbiao(Tianjin Key Laboratory of Intelligent Signal and Image Processing,Civil Aviation University of China,Tianjin 300300,China)

机构地区中国民航大学天津市智能信号与图像处理重点实验室

出处《安全与环境学报》 CAS CSCD 北大核心 2023年第12期4381-4391,共11页 Journal of Safety and Environment

基金国家自然科学基金委员会-中国民用航空局民航联合研究基金项目(U2133204) 国家自然科学基金项目(62141108) 中国民航大学国家自然科学基金配套专项(3122022PT01)。

关键词公共安全救援搜寻旅行商问题深度强化学习注意力机制多轨迹采样数据增强 public safety rescue search traveling salesman problem deep reinforcement learning attention mechanism multi⁃trajectory sampling instance augmentation

分类号 X949 [环境科学与工程—安全科学]

引文网络
相关文献

参考文献2

1郭庆华,胡天宇,刘瑾,金时超,肖青,杨贵军,高显连,许强,谢品华,彭炽刚,闫利.轻小型无人机遥感及其行业应用进展[J].地理科学进展,2021,40(9):1550-1569. 被引量：48
2李大伟,吴疆.基于无线图传技术的搜救犬应用指挥系统[J].中国工作犬业,2019,0(6):45-48. 被引量：3

二级参考文献27

1张增,王兵,伍小洁,赵恩伟.无人机森林火灾监测中火情检测方法研究[J].遥感信息,2015,30(1):107-110. 被引量：35
2丁丽霞,周斌,王人潮.遥感监测中5种相对辐射校正方法研究[J].浙江大学学报（农业与生命科学版）,2005,31(3):269-276. 被引量：36
3李德仁,童庆禧,李荣兴,龚健雅,张良培.高分辨率对地观测的若干前沿科学问题[J].中国科学：地球科学,2012,42(6):805-813. 被引量：160
4周帅.无人直升机在民用行业的应用与发展[J].舰船电子对抗,2013,36(1):117-120. 被引量：8
5郭庆华,刘瑾,陶胜利,薛宝林,李乐,徐光彩,李文楷,吴芳芳,李玉美,陈琳海,庞树鑫.激光雷达在森林生态系统监测模拟中的应用现状与展望[J].科学通报,2014,59(6):459-478. 被引量：79
6单杰,秦昆,黄长青,胡翔云,余洋,胡庆武,林志勇,陈江平,贾涛.众源地理数据处理与分析方法探讨[J].武汉大学学报（信息科学版）,2014,39(4):390-396. 被引量：76
7李德仁,李明.无人机遥感系统的研究进展与应用前景[J].武汉大学学报（信息科学版）,2014,39(5):505-513. 被引量：768
8汪沛,罗锡文,周志艳,臧英,胡炼.基于微小型无人机的遥感信息获取关键技术综述[J].农业工程学报,2014,30(18):1-12. 被引量：200
9轩俊伟,郑江华,倪亦非,穆晨.基于动力三角翼平台的草原鼠害遥感监测研究[J].中国植保导刊,2015,35(2):52-55. 被引量：12
10邢宇.小波变换在遥感图像相对辐射校正中的应用[J].测绘与空间地理信息,2015,38(6):13-14. 被引量：3

共引文献49

1唐伟,王英,梁东,丁喜莲,乔庆伟.构建新时代国土空间生态修复智慧监管平台系统[J].智慧农业导刊,2021,1(16):1-5. 被引量：5
2刁云飞.遥感航测技术在地图测绘中的应用[J].工程技术研究,2021,6(22):249-250. 被引量：2
3涂柯,侯宏录,苏炜.改进人工势场法的无人机避障路径规划[J].西安工业大学学报,2022,42(2):170-177. 被引量：13
4石越峰,危凤海,付卫霖,蔡德钩,姚建平,魏少伟.面向防洪管理的铁路无人机巡检体系研究与应用[J].铁道建筑,2022,62(4):120-125. 被引量：2
5王晧,雍歧卫,段纪淼,方钢,孙综理.机载激光雷达技术在战场油料保障中的应用研究[J].舰船电子工程,2022,42(4):135-140. 被引量：1
6王志勇.无人机遥感技术在工程测量中的应用[J].世界有色金属,2022,47(4):173-175. 被引量：2
7程根德,刘曼.无人机在农业植保领域应用探析[J].合作经济与科技,2022(13):8-11. 被引量：5
8颜志榕.基于卷积注意力的无人机影像城市建筑检测方法研究[J].测绘与空间地理信息,2022,45(S01):265-268. 被引量：1
9陈曦,高旭园,何洁,陈伟,赵希梅,邹家龙,李燕丽,卢碧林,李继福.农用无人机技术在江汉平原农业领域的应用[J].现代农业科技,2022(14):105-109. 被引量：2
10王浩.轻型无人机的设计与开发[J].河南科技,2022,41(14):51-54.

同被引文献9

1陈小龙,陈唯实,饶云华,黄勇,关键,董云龙.飞鸟与无人机目标雷达探测与识别技术进展与展望[J].雷达学报（中英文）,2020,9(5):803-827. 被引量：45
2陈唯实,黄毅峰,陈小龙,卢贤锋,张洁.机场探鸟雷达技术发展与应用综述[J].航空学报,2022,43(1):176-196. 被引量：13
3胡嘉悦,李广文,章卫国,张超,贾乾磊.面向有人/无人机协同远程作战的IVMS架构[J].航空学报,2022,43(3):459-470. 被引量：5
4周世阳,程郁凡,徐丰,雷霞.基于深度强化学习的无人机间通信链路智能决策[J].信号处理,2022,38(7):1424-1433. 被引量：5
5张皓,吴虎胜,彭强.“低慢小”无人机反制装备及关键技术发展需求综述[J].航空兵器,2022,29(5):43-52. 被引量：6
6DUAN Jia,ZHANG Lei,WU Yifeng,ZHANG Yue,ZHAO Zeya,GUO Xinrong.Classification of birds and drones by exploiting periodical motions in Doppler spectrum series[J].Journal of Systems Engineering and Electronics,2023,34(1):19-27. 被引量：1
7郭瑞,张月,田彪,肖钰,胡俊,徐世友,陈曾平.全息凝视雷达系统技术与发展应用综述[J].雷达学报（中英文）,2023,12(2):389-411. 被引量：5
8周登科,郭星辰,史凯特,汤鹏,郑开元,马鹏阁.风电场无人机巡检红外叶片图像拼接算法[J].红外技术,2023,45(11):1161-1168. 被引量：2
9石永磊,周凯,申鑫,崔天翔,曹林.基于无人机遥感的林木表型监测进展与展望[J].中南林业科技大学学报,2023,43(11):13-27. 被引量：5

引证文献1

1宋强,彭翔宇,黄仕林,张月,邓振淼,陈小龙.基于序贯特征提取的无人机与飞鸟目标分类[J].信号处理,2024,40(5):839-852.

1刘畅,张学锋.量子近似优化算法在约束优化问题中的应用[J].重庆工商大学学报（自然科学版）,2023,40(6):68-73.
2常晟铭,王超,孙聪,丁恩宝.基于TOPSIS方法的半浸桨叶剖面的优化设计[J].华中科技大学学报（自然科学版）,2023,51(10):57-63.

安全与环境学报

2023年第12期

浏览历史

内容加载中请稍等...

面向无人机救援搜寻的多轨迹策略优化方法被引量：1

参考文献2

二级参考文献27

共引文献49

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向无人机救援搜寻的多轨迹策略优化方法 被引量：1

参考文献2

二级参考文献27

共引文献49

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向无人机救援搜寻的多轨迹策略优化方法被引量：1