循环神经网络多标签航空图像分类被引量：11

Recurrent neural network multi-label aerial images classification

下载PDF

导出

摘要由于航空图像背景复杂,包含的物体类别多样,航空图像分类任务仍然面临困难。针对传统航空图像多标签分类算法准确率低、泛化性差的问题,本文提出了一种基于循环神经网络多标签航空图像分类方法。首先,采用超像素分割获取图像的低层特征,通过注意力机制生成注意力特征图;接着,采用交叉验证的方式获取最佳的图像尺度,将多尺度注意力特征图嵌入卷积神经网络中对图像进行特征提取;最后,采用改进的双向长短期记忆网络挖掘标签之间的相关性,改进的双向长短期记忆网络增加了输入门到输出门之间的连接,使输入状态可以更好地控制每一内存单元输出的信息,并且将遗忘门和输入门合并成单一的更新门,使得改进的双向长短期记忆网络可以学到更长时期的历史信息。结果显示,在图像变换尺度为1,1.3,2时,模型在UCM多标签数据集上的精确率和召回率分别达到了85.33%和87.05%,F1值达到了0.862。本文方法相比于原始VGGNet16模型,精确率提高了7.25%,召回率提高了8.94%。实验表明,该方法可以有效提高航空图像多标签分类任务的准确率。 Due to the complexity of the background in aerial images and the diversity of object categories, aerial image classification is a challenging task. In order to address the problems of low accuracy and poor generalization in traditional multi-label aerial image classification methods, a method based on recurrent neural networks was proposed.In this method, the super-pixel segmentation algorithm was first used to obtain the low-level features of the image from which an attention map was generated. Subsequently, the best image scale was obtained by cross-validation,and multi-scale attention feature graphs were embedded into aconvolutional neural network in order to extract the features of the image.Finally, tomine the correlation between labels,an improved bidirectional Long Short-Term Memory(LSTM)network was proposed, which increases the connection from the input gate to the output gate, so that the input state can efficiently control the output information of each memory unit. The forget gate and the input gate were combined into a single update gate so that the improved bidirectional LSTM network can learn long-term historical information. The results obtained by applying the proposed method to the UCM multi-label dataset indicate that for scale values of 1,1.3, and 2, the accuracy and recall rates of the model are 85.33% and 87.05% respectively,while the F1 score reached 0.862. The accuracyand recall rates are found to be higher than those of theVGGNet16 model by 7.25% and 8.94% respectively.The experimental results thus indicate that the proposed method can effectively increase the accuracy of multi-label aerial image classification.

作者陈科峻张叶 CHEN Ke-jun;ZHANG Ye(Changchun Institute of Optics Fine Mechanics and Physics,Chinese Academy of Sciences,State Key Laboratory of Applied Optics,Changchun,130033,China;Chinese Academy of Sciences.Beijing 100039,China)

机构地区中国科学院大学长春光学精密机械与物理研究所应用光学国家重点实验室中国科学院大学

出处《光学精密工程》 EI CAS CSCD 北大核心 2020年第6期1404-1413,共10页 Optics and Precision Engineering

基金中国科学院青年创新促进协会基金资助项目(No.2016201)。

关键词航空图像分类多标签注意力机制多尺度卷积神经网络长短期记忆网络 satellite images classification muilti-label attention mechanisms multi-scale convolutional neural network Long Short-Term Memory(LSTM)network

分类号 TP391.7 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1邓凌云.遥感图像分类中的遗传算法LVQ神经网络运用[J].现代电子技术,2020,43(1):40-43. 被引量：5
2李晓斌,江碧涛,王生进.光学遥感图像场景分类技术综述和比较[J].无线电工程,2019,49(4):265-271. 被引量：13
3郑远攀,李广阳,李晔.深度学习在图像识别中的应用研究综述[J].计算机工程与应用,2019,55(12):20-36. 被引量：366
4李宇,刘雪莹,张洪群,李湘眷,孙晓瑶.基于卷积神经网络的光学遥感图像检索[J].光学精密工程,2018,26(1):200-207. 被引量：39
5杨州,慕晓冬,王舒洋,马晨晖.基于多尺度特征融合的遥感图像场景分类[J].光学精密工程,2018,26(12):3099-3107. 被引量：33
6边小勇,费雄君,穆楠.基于尺度注意力网络的遥感图像场景分类[J].计算机应用,2020,40(3):872-877. 被引量：23

二级参考文献40

1孙翠娟.基于K型核函数的支持向量机[J].淮海工学院学报（自然科学版）,2006,15(4):4-7. 被引量：17
2高恒振,万建伟,粘永健,王力宝,徐湛.组合核函数支持向量机高光谱图像融合分类[J].光学精密工程,2011,19(4):878-883. 被引量：23
3孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：602
4朱小燕,王昱,徐伟.基于循环神经网络的语音识别模型[J].计算机学报,2001,24(2):213-218. 被引量：22
5张剑,屈丹,李真.基于词向量特征的循环神经网络语言模型[J].模式识别与人工智能,2015,28(4):299-305. 被引量：38
6郭丽丽,丁世飞.深度学习研究进展[J].计算机科学,2015,42(5):28-33. 被引量：195
7马晓,张番栋,封举富.基于深度学习特征的稀疏表示的人脸识别方法[J].智能系统学报,2016,11(3):279-286. 被引量：30
8许夙晖,慕晓冬,赵鹏,马骥.利用多尺度特征与深度网络对遥感影像进行场景分类[J].测绘学报,2016,45(7):834-840. 被引量：62
9孔英会,王之涵,车辚辚.基于卷积神经网络(CNN)和CUDA加速的实时视频人脸识别[J].科学技术与工程,2016,16(35):96-100. 被引量：21
10罗家祥,林畅赫,王加朋,胡跃明.结合深度卷积网络与加速鲁棒特征配准的图像精准定位[J].光学精密工程,2017,25(2):469-476. 被引量：7

共引文献468

1安子栋,敬卿,郝志超,余奕.基于生成式AI技术的图书馆文献资源管理创新策略[J].图书馆工作与研究,2023(S01):9-16. 被引量：5
2宋子龙.基于卷积神经网络的花卉种类识别系统[J].计算机产品与流通,2019,8(12):91-91. 被引量：2
3杨茹冰,朱莉,王玺昊.毫米波亚毫米波成像在人体检测中的研究综述[J].微波学报,2023,39(S01):318-323. 被引量：1
4高园,罗悦,陈菊,冯杰,彭安杰,刘思涵.基于人工神经网络技术构建中医思维模型的研究[J].辽宁中医杂志,2022,49(7):48-51.
5陈为,梁晨红.基于SSD算法的航空发动机内部凸台缺陷检测[J].电子测量技术,2020(9):29-34. 被引量：8
6李明节,陶洪铸,许洪强,刘金波,张强,张伟.电网调控领域人工智能技术框架与应用展望[J].电网技术,2020,44(2):393-400. 被引量：76
7万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：58
8刘强.商标相似性人工智能判断机制研究——以图形商标相似性判断为例[J].西部法学评论,2020,0(1):57-69. 被引量：3
9施伟红.生物流化床在废水处理中的应用[J].上海化工,2000,25(6):15-16. 被引量：6
10张金钟.医改与医学模式转变[J].医学与哲学,2000,21(5):11-13. 被引量：6

同被引文献81

1南方哲,钱育蓉,行艳妮,赵京霞.基于深度学习的单图像超分辨率重建研究综述[J].计算机应用研究,2020,37(2):321-326. 被引量：23
2陈明惠,王帆,张晨曦,李福刚,郑刚.基于压缩感知的频域OCT图像稀疏重构[J].光学精密工程,2020,28(1):189-199. 被引量：18
3薄华,马缚龙,焦李成.图像纹理的灰度共生矩阵计算问题的分析[J].电子学报,2006,34(1):155-158. 被引量：203
4蔡怀平,陈英武.武器-目标分配(WTA)问题研究进展[J].火力与指挥控制,2006,31(12):11-15. 被引量：68
5马德锋,李培军.加入多尺度图像纹理的岩性分类[J].岩石学报,2008,24(6):1425-1430. 被引量：16
6刘丽,匡纲要.图像纹理特征提取方法综述[J].中国图象图形学报,2009,14(4):622-635. 被引量：427
7郑永斌,黄新生,丰松江.SIFT和旋转不变LBP相结合的图像匹配算法[J].计算机辅助设计与图形学学报,2010,22(2):286-292. 被引量：111
8徐绍莲,解绍芹.ICU转出病人重返原因分析及护理对策[J].护理研究（上旬版）,2012,26(6):1500-1501. 被引量：20
9李博,曹鹏,栗伟,赵大哲.基于尺度空间中多特征融合的医学影像分类[J].计算机应用,2013,33(4):1108-1111. 被引量：7
10侯毅,周石琳,雷琳,赵键.基于Gabor滤波器组的多特征尺度不变特征提取方法[J].电子学报,2013,41(6):1146-1152. 被引量：23

引证文献11

1田大鹏,邵晓鹏.航空光学成像与测量技术新进展[J].光学精密工程,2020,28(6):1221-1225. 被引量：10
2李弘宸,杨忠,姜遇红,韩家明,赖尚祥,张秋雁.基于优化ResNet的输电线路航拍图像分类方法[J].应用科技,2021,48(2):64-68. 被引量：4
3徐哲,耿杰,蒋雯,张卓,曾庆捷.联合训练生成对抗网络的半监督分类方法[J].光学精密工程,2021,29(5):1127-1135. 被引量：4
4肖术明,王绍举,常琳,冯汝鹏.面向手写数字图像的压缩感知快速分类[J].光学精密工程,2021,29(7):1709-1719. 被引量：3
5慕晓冬,白坤,尤轩昂,朱永清,陈雪冰.基于对比学习方法的遥感影像特征提取与分类[J].光学精密工程,2021,29(9):2222-2234. 被引量：13
6杨敏航,陈龙,刘慧,钱育蓉.基于图卷积网络的多标签遥感图像分类[J].计算机应用研究,2021,38(11):3439-3445. 被引量：7
7彭思意,魏涛,李旭英,陈勇,李金花,林小平.重返ICU风险预测模型的研究进展[J].中国护理管理,2021,21(11):1730-1735. 被引量：3
8毛琳,高航,杨大伟,张汝波.视频描述中链式语义生成网络[J].光学精密工程,2022,30(24):3198-3209.
9田志新,徐震,茅健,林彬彬,廖薇.基于多尺度特征融合的钢材表面缺陷分类方法[J].电子科技,2024,37(2):87-94.
10马悦,王尧,孙杰.基于深度学习的作战任务分配方法研究[J].军事运筹与评估,2024,39(1):68-74.

二级引证文献43

1肖保正.硫酸尾气制取亚硫酸铵经验点滴[J].硫酸工业,2000(1):56-56.
2黄硕,王彪,戴童欣,连厚泉,程林祥,俞泳波.用于CO激光TDLAS型气体检测系统的光电检测电路研制[J].激光杂志,2021,42(2):62-65. 被引量：8
3雷俊锋,董宇轩,眭海刚.基于先验显著性的卫星视频微小运动车辆检测[J].光学精密工程,2021,29(1):130-141.
4王正玺,贺柏根,朱小伟.基于卡尔曼滤波算法的加速度反馈控制在航空光电稳定平台中的应用[J].兵工学报,2021,42(6):1257-1264. 被引量：5
5满意,杨轻云,陈涛.空间目标光度测量的消光修正拟合[J].光学精密工程,2021,29(7):1511-1517. 被引量：1
6孙晓宇,蔡祥.基于多通道数据融合的无人机遥感影像地物目标提取方法[J].地理与地理信息科学,2021,37(6):41-45. 被引量：7
7杨嘉楠,王忠昊,王昊霖,耿国华,曹欣.改进BYOL的非小细胞肺癌表皮生长因子受体基因突变预测[J].光学精密工程,2022,30(9):1080-1090. 被引量：1
8刘光辉,王秦蒙,陈宣润,孟月波.多元信息聚合的人群密度估计与计数[J].光学精密工程,2022,30(10):1228-1239. 被引量：1
9时弘易.基于模糊理论的光成像技术网络课程质量评价系统[J].激光杂志,2022,43(6):216-220. 被引量：1
10陈燕茹,鲁红霞,王鑫钰,苏文丽,黄亚楠,陈孝利,燕芳红,武国德,韩琳,马玉霞.MCI向AD转化的预测因素及风险预测模型的研究进展[J].中华神经医学杂志,2022,21(6):629-635.

1冯广,孔立斌,石鸣鸣,贺敏慧,何雅萱.基于Inception与Residual组合网络的农作物病虫害识别[J].广东工业大学学报,2020,37(3):17-22. 被引量：3
2邵凯旋,余映,钱俊,吴青龙,杨鉴.基于边缘信息结合空间权重的图像显著性检测算法研究[J].云南大学学报（自然科学版）,2020,42(3):429-436. 被引量：4
3夏竹青.风扇热运转试验炉及其控制系统设计[J].电工技术（下半月）,2016(10):131-132.
4李冉,苏志刚,张海刚,杨金锋.改进GCNs在指静脉特征表达中的应用[J].信号处理,2020,36(4):550-561. 被引量：1
5杨国鹏,周欣,韦红波,邢平.面阵摆扫航空相机序列图像的大区域无缝拼接[J].测绘科学,2020,45(3):46-52. 被引量：2
6叶子琦,王晓寅,张恒瑞.基于Faster R-CNN的遥感图像目标检测技术[J].电子世界,2020(8):63-64. 被引量：3
7罗平,王瑞雪,覃海洋.多协议仲裁加解密读写CPU内存的IP核设计[J].计算机工程与设计,2020,41(5):1248-1252.
8胡伟,高博川,黄振航,李瑞瑞.树形结构卷积神经网络优化的城区遥感图像语义分割[J].中国图象图形学报,2020,25(5):1043-1052. 被引量：7
9张桐,郑恩让,沈钧戈,高安同.基于深度多分支特征融合网络的光学遥感场景分类[J].光子学报,2020,49(5):160-171. 被引量：10
10陈本刚,宋礼鹏.网页内容链接层次语义树的恶意网页检测方法[J].计算机工程与应用,2020,56(11):90-97. 被引量：1

光学精密工程

2020年第6期

浏览历史

内容加载中请稍等...

循环神经网络多标签航空图像分类被引量：11

参考文献6

二级参考文献40

共引文献468

同被引文献81

引证文献11

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

循环神经网络多标签航空图像分类 被引量：11

参考文献6

二级参考文献40

共引文献468

同被引文献81

引证文献11

二级引证文献43

相关作者

相关机构

相关主题

浏览历史

循环神经网络多标签航空图像分类被引量：11