基于多尺度与注意力特征增强的遥感图像描述生成方法被引量：5

Remote Sensing Image Description Generation Method Based on Attention and Multi-scale Feature Enhancement

下载PDF

导出

摘要遥感图像描述生成是同时涉及计算机视觉和自然语言处理领域的热门研究话题,其主要工作是对于给定的图像自动地生成一个对该图像的描述语句。文中提出了一种基于多尺度与注意力特征增强的遥感图像描述生成方法,该方法通过软注意力机制实现生成单词与图像特征之间的对齐关系。此外,针对遥感图像分辨率较高、目标尺度变化较大的特点,还提出了一种基于金字塔池化和通道注意力机制的特征提取网络(Pyramid Pool and Channel Attention Network,PCAN),用于捕获遥感图像多尺度以及局部跨通道交互信息。将该模型提取到的图像特征作为描述生成阶段软注意力机制的输入,通过计算得到上下文信息,然后将该上下文信息输入至LSTM网络中,得到最终的输出序列。在RSICD与MSCOCO数据集上对PCAN及软注意力机制进行有效性实验,结果表明,PCAN及软注意力机制的加入能够提升生成语句的质量,实现单词与图像特征之间的对齐。通过对软注意力机制的可视化分析,提高了模型结果的可信度。此外,在语义分割数据集上进行实验,结果表明所提PCAN对于语义分割任务同样具有有效性。 Remote sensing image description generation is a hot research topic involving both computer vision and natural language processing.Its main work is to automatically generate a description sentence for a given image.This paper proposes a remote sensing image description generation method based on multi-scale and attention feature enhancement.The alignment relationship between generated words and image features is realized through soft attention mechanism,which improves the pre-interpretability of the model.In addition,in view of the high resolution of remote sensing images and large changes in target scale,this paper proposes a feature extraction network(Pyramid Pool and Channel Attention Network,PCAN)based on pyramid pooling and channel attention mechanism to capture of multi-scale remote sensing image and local cross-channel mutual information.Image features extracted by the model are used as the input to describe the soft attention mechanism of the generation stage,thereby calculating the context information,and then inputting the context information into the LSTM network to obtain the final output sequence.Effectiveness experiments of PCAN and soft attention mechanism on RSICD and MSCOCO datasets prove that the joi-ning of PCAN and soft attention mechanism can improve the quality of generated sentences and realize the alignment between words and image features.Through the visualization analysis of the soft attention mechanism,the credibility of the model results is improved.In addition,experiments on the semantic segmentation dataset prove that the proposed PCAN is also effective for semantic segmentation tasks.

作者赵佳琦王瀚正周勇张迪周子渊 ZHAO Jia-qi;WANG Han-zheng;ZHOU Yong;ZHANG Di;ZHOU Zi-yuan(School of Computer Science and Technology,China University of Mining and Technology,Xuzhou,Jiangsu 221116,China;Engineering Research Center of Mine Digitization,Ministry of Education of People’s Republic of China,Xuzhou,Jiangsu 221116,China;Innovation Research Center of Disaster Intelligent Prevention and Emergency Rescue,Xuzhou,Jiangsu 221116,China)

机构地区中国矿业大学计算机科学与技术学院矿山数字化教育部工程研究中心灾害智能防控与应急救援创新研究中心

出处《计算机科学》 CSCD 北大核心 2021年第1期190-196,共7页 Computer Science

基金国家自然科学基金(61806206) 江苏省自然科学基金(BK20180639) 电子元器件可靠性物理及其应用技术重点实验室开放基金(614280620190403-1)。

关键词注意力机制特征增强长短期记忆网络遥感图像描述生成 Attention mechanism Feature enhancement Long short-term memory Remote sensing image description generation

分类号 TP753 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献4

1刘俊琦,李智,张学阳.可见光遥感图像海面目标检测技术综述[J].计算机科学,2020,47(3):116-123. 被引量：9
2崔璐,张鹏,车进.基于深度神经网络的遥感图像分类算法综述[J].计算机科学,2018,45(B06):50-53. 被引量：24
3纪守领,李进锋,杜天宇,李博.机器学习模型可解释性方法、应用与安全研究综述[J].计算机研究与发展,2019,56(10):2071-2096. 被引量：153
4尹雅,黄海,张志祥.基于光学遥感图像的舰船目标检测技术研究[J].计算机科学,2019,46(3):82-87. 被引量：17

二级参考文献33

1侯蕾,尹东,尤晓建.一种遥感图像中建筑物的自动提取方法[J].计算机仿真,2006,23(4):184-187. 被引量：23
2储昭亮,王庆华,陈海林,徐守时.基于极小误差阈值分割的舰船自动检测方法[J].计算机工程,2007,33(11):239-241. 被引量：25
3尹汪宏,李朝峰,张俊本,王正友.基于混合核函数的自组织神经网络遥感图像分类[J].计算机工程与设计,2009,30(2):388-391. 被引量：7
4瞿继双,瞿松柏,王自杰.基于特征的模糊神经网络遥感图像目标分类识别[J].遥感学报,2009,13(1):67-74. 被引量：14
5张毅,徐智勇,陈武凡,彭晓明.基于Retinex理论和灰度形态学的红外弱小目标增强方法研究[J].红外技术,2010,32(1):46-51. 被引量：4
6任军号,吉沛琦,耿跃.SOM神经网络改进及在遥感图像分类中的应用[J].计算机应用研究,2011,28(3):1170-1172. 被引量：18
7张兵.智能遥感卫星系统[J].遥感学报,2011,15(3):415-431. 被引量：62
8许军毅,计科峰,雷琳,杜春.基于GLRT的光学卫星遥感图像舰船目标检测[J].遥感技术与应用,2012,27(4):616-622. 被引量：8
9卢柳叶,张青峰,李光录.基于BP神经网络的遥感影像分类研究[J].测绘科学,2012,37(6):140-143. 被引量：30
10席学强,王润生.一个针对遥感图像特定目标的自动识别系统[J].遥感技术与应用,2000,15(3):179-183. 被引量：14

共引文献199

1段梦岩,高开秀,汪善勤.冬油菜多源多尺度遥感监测技术[J].中国农技推广,2019(S01):40-42.
2童小钟,魏俊宇,苏绍璟,孙备,左震.融合注意力和多尺度特征的典型水面小目标检测[J].仪器仪表学报,2023,44(1):212-222. 被引量：12
3廖廓,彭中,姜亚珍,党皓飞.基于深度神经网络联合AMSR2和MODIS数据估算全球蒸散发研究[J].遥感技术与应用,2022,37(4):878-887. 被引量：1
4付佳俊,卢梅丽,曹一凡,郭兆桦,高资成.基于深度学习的t-fMRI脑状态解码[J].天津职业技术师范大学学报,2022,32(4):45-50.
5马舒岑,史建琦,黄滟鸿,秦胜潮,侯哲.基于最小不满足核的随机森林局部解释性分析[J].软件学报,2022,33(7):2447-2463. 被引量：2
6宋志娜,眭海刚,李永成.高分辨率可见光遥感图像舰船目标检测综述[J].武汉大学学报（信息科学版）,2021,46(11):1703-1715. 被引量：12
7潘泽民,覃亚丽,郑欢,王荣芳,任宏亮.基于深度神经网络的块压缩感知图像重构[J].计算机科学,2022,49(S02):510-518. 被引量：5
8赵岩,罗岱,樊娟娟,封少东.船舶与海上设施数字孪生系统评价体系[J].船舶工程,2022,44(S01):548-553.
9李艳红,姚元庆,姚兵,黄威权,杨梦庚.原癌基因c-myc产物在小鼠早期胚胎中的表达[J].第四军医大学学报,2000,21(2):253-254. 被引量：1
10周宇,周宏杰,王海华,钱前,景丽艳.基于BP神经网络的仪器校准因子运用[J].中国卫生检验杂志,2019,29(13):1658-1660.

同被引文献18

1魏忠钰,范智昊,王瑞泽,承怡菁,赵王榕,黄萱菁.从视觉到文本:图像描述生成的研究进展综述[J].中文信息学报,2020(7):19-29. 被引量：14
2王千,王成,冯振元,叶金凤.K-means聚类算法研究综述[J].电子设计工程,2012,20(7):21-24. 被引量：306
3朱明明,许悦雷,马时平,唐红,辛鹏,马红强.改进区域卷积神经网络的机场检测方法[J].光学学报,2018,38(7):322-327. 被引量：18
4朱茂桃,张鸿翔,方瑞华.基于RCNN的车辆检测方法研究[J].机电工程,2018,35(8):880-885. 被引量：13
5赵增顺,高寒旭,孙骞,滕升华,常发亮,Dapeng Oliver Wu.生成对抗网络理论框架、衍生模型与应用最新进展[J].小型微型计算机系统,2018,39(12):2602-2606. 被引量：19
6姚群力,胡显,雷宏.基于多尺度卷积神经网络的遥感目标检测研究[J].光学学报,2019,39(11):338-345. 被引量：35
7张萌,王仕成,杨东方.重点区域注意力学习的空对地目标检测算法[J].激光与光电子学进展,2020,57(4):86-93. 被引量：5
8董永峰,仉长涛,汪鹏,冯哲.基于深度学习的光学遥感图像飞机检测算法[J].激光与光电子学进展,2020,57(4):94-100. 被引量：20
9黄远,白琮,李宏凯,张敬林,陈胜勇.基于条件生成对抗网络的图像描述生成方法[J].计算机辅助设计与图形学学报,2020,32(6):911-918. 被引量：14
10石磊,王毅,成颖,魏瑞斌.自然语言处理中的注意力机制研究综述[J].数据分析与知识发现,2020,4(5):1-14. 被引量：63

引证文献5

1农元君,王俊杰.基于注意力和强化学习的遥感图像描述方法[J].光学学报,2021,41(22):198-206. 被引量：5
2丛犁,黄成斌,刘彬,张超,李锐.基于改进YOLOv4的车辆检测算法研究[J].电力信息与通信技术,2022,20(8):130-136. 被引量：2
3蔺泽浩,李国趸,曾祥极,邓悦,张寅,庄越挺.基于跨媒体解纠缠表示学习的风格化图像描述生成[J].计算机学报,2022,45(12):2510-2527. 被引量：1
4于兴超,岳耀,陈庆.基于CNN-Transformer的SAR图像语义描述方法[J].资源导刊,2024(16):37-40.
5李远丽,刘伟,李润生,牛朝阳,李芳润,卢万杰.光学遥感图像语义描述的深度学习方法[J].信息工程大学学报,2024,25(5):532-537.

二级引证文献8

1陈志琳,齐华,王相超.基于改进YOLOv5算法的口罩佩戴检测研究[J].电子设计工程,2022,30(22):67-72. 被引量：4
2赵燕姣,李钢,姚琼辛,任杰.基于改进YOLOv4算法在车辆检测中的应用[J].电子设计工程,2022,30(24):37-42. 被引量：3
3林浩,王春东,孙永杰.面向社交媒体数据的人格识别研究进展[J].计算机科学与探索,2023,17(5):1002-1016. 被引量：2
4王慧赢,王春平,付强,韩子硕,张冬冬.面向嵌入式平台的轻量级光学遥感图像舰船检测[J].光学学报,2023,43(12):113-126. 被引量：15
5何鑫宇,陆陈鑫,冯书谊,欧阳尚荣,穆文涛.面向嵌入式平台的光学遥感图像舰船检测识别[J].计算机科学,2024,51(S01):482-488.
6于兴超,岳耀,陈庆.基于CNN-Transformer的SAR图像语义描述方法[J].资源导刊,2024(16):37-40.
7李国燕,田明达,董春华,郝志鹏.面向遥感图像的结构化图像描述网络[J].电子测量与仪器学报,2024,38(5):148-157.
8李远丽,刘伟,李润生,牛朝阳,李芳润,卢万杰.光学遥感图像语义描述的深度学习方法[J].信息工程大学学报,2024,25(5):532-537.

1谢雨杰,杜友田,张潇.面向新概念学习的图像描述生成模型[J].西安交通大学学报,2020,54(12):37-44.
2陈景香,于忠清,杨熙鑫,郭璐.基于PCANet_SVM的滚动轴承故障诊断[J].青岛大学学报（自然科学版）,2020,33(4):37-42. 被引量：1
3陈羽立,孙付春,郭兴华,郭地伟,刘李逵,张廷婷.基于EfficientNet的鸡蛋裂纹检测研究[J].成都大学学报（自然科学版）,2020,39(4):385-389. 被引量：6
4刘媛.基于深度学习的遥感图像目标检测方法[J].科学技术创新,2021(3):84-85. 被引量：1
5石晋,李本.新冠肺炎疫情下中国注资IMF紧急融资机制问题探讨[J].金融理论与实践,2021(1):104-108.
6谭建豪,殷旺,刘力铭,王耀南.引入全局上下文特征模块的DenseNet孪生网络目标跟踪[J].电子与信息学报,2021,43(1):179-186. 被引量：5
7黄涛,秦密密.合作治理在乡村振兴中的运用研究——以郝堂村模式为例[J].信阳师范学院学报（哲学社会科学版）,2021,41(1):26-33. 被引量：7
8王天保,刘昱,郭继昌,晋玮佩.图卷积神经网络行人轨迹预测算法[J].哈尔滨工业大学学报,2021,53(2):53-60. 被引量：8
9薛军,闫思程.内涵式发展下高校人员总量管理与测算方法研究[J].大理大学学报,2021,6(1):117-123. 被引量：2
10陈亮.多中心治理:研究生培养机制的善治之路[J].四川师范大学学报（社会科学版）,2021,48(1):122-127. 被引量：6

计算机科学

2021年第1期

浏览历史

内容加载中请稍等...

基于多尺度与注意力特征增强的遥感图像描述生成方法被引量：5

参考文献4

二级参考文献33

共引文献199

同被引文献18

引证文献5

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于多尺度与注意力特征增强的遥感图像描述生成方法 被引量：5

参考文献4

二级参考文献33

共引文献199

同被引文献18

引证文献5

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于多尺度与注意力特征增强的遥感图像描述生成方法被引量：5