基于多智能体近端策略优化的无人机城市高层消防

UAV urban high-rise firefighting based on multi agent proximal policy optimization

下载PDF

导出

摘要城市高层消防一直是具有挑战性的问题,利用无人机来执行消防任务是一个有效的解决方案。在这项工作中,我们将城市高层消防问题表述为一个部分可观测的马尔可夫决策过程(POMDP),并提出一种带有β-变分自动编码器(β-VAE)的多智能体近端策略优化(MAPPO)算法来解决它。该算法基于Actor-Critic体系结构,采用包含全局信息的评论家网络和共享信息的行动者网络。β-VAE是处理视觉感知信息的有效手段,有助于深度强化学习(DRL),使无人机因接近火灾区域并成功完成消防任务而获得奖励。为了评估文中提出的方法,基于AirSim和UrbanScene3D构建了一个大规模复杂的城市火灾环境,并将文中算法与多智能体深度确定性策略梯度(MADDPG)进行比较。实验结果表明,MAPPO算法用来解决城市高层消防问题是有效的,并且明显优于MADDPG算法。 Urban high-rise firefighting has been a challenging problem,where unmanned aerial vehicles(UAVs)is to provide an effective solution.In this work,we formulate the problem of urban high-rise firefighting as a Partially Observable Markov Decision Process(POMDP)and propose a multi agent proximal policy optimization(MAPPO)algorithm withβ-Variational auto-encoder(β-VAE)to solve it.MAPPO is a multi-agent extension of Proximal Policy Optimization(PPO)that allows agents to cooperate with each other.Based on Actor-Critic architecture,the algorithm employs a critic network containing global information and an actor network of shared information.β-VAE works as an efficient means to process visual perception information to help assist deep reinforcement learning(DRL).UAVs are rewarded for approaching the fire area and successfully completing firefighting tasks.To evaluate our proposed method,we build a large-scale complex urban fire environment based on AirSim and UrbanScene3D and compare our algorithm with multi-agent deep deterministic policy gradient(MADDPG).The results of our experiments demonstrate that MAPPO algorithm is effective in urban high-rise firefighting problem and is significantly better than MADDPG.

作者赵小虎吴若诚江涵立 ZHAO Xiaohu;WU Ruocheng;JIANG Hanli(China Academy of Electronics and Information Technology,Beijing 1300041,China;Zhejiang Petrochemical Trading Center,Zhoushan 316000,China;Anhui Province Key Laboratory of Cyberspace Security Situation Awareness and Evaluation,Hefei 241002,China)

机构地区中国电子科技集团有限公司电子科学研究院浙江国际油气交易中心有限公司安徽省网络空间安全态势感知与评估重点实验室

出处《长春工业大学学报》 CAS 2023年第6期552-562,共11页 Journal of Changchun University of Technology

基金安徽省网络空间安全态势感知与评估重点实验室开放基金项目(CSSAE-2021-004)。

关键词无人机导航深度强化学习多智能体协作 UAV navigation deep reinforcement learning multi agent collaboration

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1杨海川,茹志鹏,张诗雨.基于无人机遥感图像的森林火灾检测[J].宁夏大学学报（自然科学版）,2022,43(1):17-21. 被引量：2
2皮骏,刘宇恒,李久昊.基于YOLOv5s的轻量化森林火灾检测算法研究[J].图学学报,2023,44(1):26-32. 被引量：17
3王林,赵红.改进YOLOv3的火灾检测[J].计算机系统应用,2022,31(4):143-153. 被引量：7
4韩磊,曲娜,隋宇凡,谭丽丽.基于BSO-ELM算法的火灾检测研究[J].消防科学与技术,2023,42(1):103-106. 被引量：2

二级参考文献20

1程彩霞,孙富春,周心权.One Fire Detection Method Using Neural Networks[J].Tsinghua Science and Technology,2011,16(1):31-35. 被引量：13
2甄斌,吴玺宏,刘志敏,迟惠生.语音识别和说话人识别中各倒谱分量的相对重要性[J].北京大学学报（自然科学版）,2001,37(3):371-378. 被引量：74
3李红娣,袁非牛.采用金字塔纹理和边缘特征的图像烟雾检测[J].中国图象图形学报,2015,20(6):772-780. 被引量：23
4仲亭玉,刘文萍,刘鹏举.基于分数阶微分视频融合的森林烟火检测算法[J].北京林业大学学报,2017,39(3):24-31. 被引量：9
5刘凯,魏艳秀,许京港,赵永政,蔡志勇.基于计算机视觉的森林火灾识别算法设计[J].森林工程,2018,34(4):89-95. 被引量：26
6杜晨锡,严云洋,刘以安,高尚兵.基于YOLOv2的视频火焰检测方法[J].计算机科学,2019,46(6):301-304. 被引量：9
7李巨虎,范睿先,陈志泊.基于颜色和纹理特征的森林火灾图像识别[J].华南理工大学学报（自然科学版）,2020,48(1):70-83. 被引量：45
8Teng Wang,Leping Bu,Zhikai Yang,Peng Yuan,Jineng Ouyang.A New Fire Detection Method Using a Multi-Expert System Based on Color Dispersion, Similarity and Centroid Motion in Indoor Environment[J].IEEE/CAA Journal of Automatica Sinica,2020,7(1):263-275. 被引量：7
9赵飞扬,罗兵,林国军,杨平先,吴浩.基于改进YOLOv3的火焰检测[J].中国科技论文,2020,15(7):820-826. 被引量：11
10赵益,张志梅.基于YOLOv3的车辆检测算法[J].青岛大学学报（自然科学版）,2020,33(3):57-64. 被引量：4

共引文献24

1钱承山,沈有为,孙宁,戴仁天.基于Transformer改进YOLOv5的山火检测方法研究[J].电子测量技术,2023,46(16):46-56. 被引量：2
2王一早,马纪颖,罗星,王书哲.基于SPMYOLOv3的水面垃圾目标检测[J].计算机系统应用,2023,32(3):163-170. 被引量：7
3薛颂东,曹旺旺,王斌.面向轻量化网络的火焰快速识别[J].计算机系统应用,2023,32(4):274-282.
4张迪,张睿卓,龙云涛,侯笑宇,关茜,刘飞.输电线路走廊山火监测遥感技术应用现状[J].世界科技研究与发展,2023,45(2):200-209. 被引量：2
5王甜甜,吕宗旺,唐浩然.基于K210的手势识别装置[J].电子质量,2023(4):1-5. 被引量：1
6李智,彭抗非,丁耀晖,薛博元,阮士峰.基于改进YOLOv7的森林火灾检测[J].中国新技术新产品,2023(12):140-142.
7谢振.基于无人机摄影的森林火情早期探测系统[J].中阿科技论坛（中英文）,2023(8):97-102. 被引量：1
8刘天亮,王金凯.基于深度学习和自相似的物流安全场景创建早期火灾检测教学演示平台的研究[J].物流科技,2023,46(16):151-155.
9何盼霞,张梅,齐至家.基于改进YOLO v5的森林火灾检测算法研究[J].兰州工业学院学报,2023,30(4):73-78. 被引量：3
10章曙光,唐锐,邵政瑞,鲍锐.一种基于小波变换的YOLOv5火灾检测改进算法[J].无线电工程,2023,53(10):2303-2310. 被引量：1

1李莹.智能电梯系统在城市高层建筑中的应用分析[J].中国机械,2023(35):60-63. 被引量：1
2刘思琦.基于GPS技术的城市高层建筑变形监测应用研究[J].中文科技期刊数据库（全文版）工程技术,2024(3):0134-0137.
3朱鹰.城市高层建筑玻璃幕墙防雷技术研究[J].中文科技期刊数据库（全文版）工程技术,2024(3):0136-0139.
4陈明强,张勇,冯树娟,周子杨,解靖涛.一种基于改进ORB特征匹配的无人机视觉导航方法[J].电讯技术,2024,64(3):382-389.
5崔中耀,赵凤君,赵爽,费腾,叶江霞.基于多光谱无人机及机器学习的林木火灾受损信息提取研究[J].自然灾害学报,2024,33(1):99-108.

长春工业大学学报

2023年第6期

浏览历史

内容加载中请稍等...

基于多智能体近端策略优化的无人机城市高层消防

参考文献4

二级参考文献20

共引文献24

相关作者

相关机构

相关主题

浏览历史