卷积神经网络与视觉Transformer联合驱动的跨层多尺度融合网络高光谱图像分类方法被引量：1

Convolutional Neural Network and Vision Transformer-driven Cross-layer Multi-scale Fusion Network for Hyperspectral Image Classification

下载PDF

导出

摘要高光谱图像(HSI)分类是地球科学和遥感影像处理任务中最受关注的研究热点之一。近年来,卷积神经网络(CNN)和视觉Transformer相结合的方法,通过综合考虑局部-全局信息,在HSI分类任务中取得了成功。然而,HSI中地物具有丰富的纹理信息和复杂多样的结构,且不同地物之间存在尺度差异。现有的二者结合的方法通常对多尺度地物目标的纹理和结构信息的提取能力有限。为了克服上述局限性,该文提出CNN与视觉Transformer联合驱动的跨层多尺度融合网络HSI分类方法。首先,从结合CNN与视觉Transformer的角度出发,设计了跨层多尺度局部-全局特征提取模块分支,其主要由卷积嵌入的视觉Transformer和跨层特征融合模块构成。具体来说,卷积嵌入的视觉Transformer通过深度融合多尺度CNN与视觉Transformer实现了多尺度局部-全局特征信息的有效提取,从而增强网络对不同尺度地物的关注。进一步地,跨层特征融合模块深度聚合了不同层次的多尺度局部-全局特征信息,以综合考虑地物的浅层纹理信息和深层结构信息。其次,构建了分组多尺度卷积模块分支来挖掘HSI中密集光谱波段潜在的多尺度特征。最后,为了增强网络对HSI中局部波段细节和整体光谱信息的挖掘,设计了残差分组卷积模块对局部-全局光谱特征进行提取。Indian Pines, Houston 2013和Salinas Valley 3个HSI数据集上的实验结果证实了所提方法的有效性。 HyperSpectral Image(HSI)classification is one of the most prominent research topics in geoscience and remote sensing image processing tasks.In recent years,the combination of Convolutional Neural Network(CNN)and vision transformer has achieved success in HSI classification tasks by comprehensively considering local-global information.Nevertheless,the ground objects of HSIs vary in scale,containing rich texture information and complex structures.The current methods based on the combination of CNN and vision transformer usually have limited capability to extract texture and structural information of multi-scale ground objects.To overcome the above limitations,a CNN and vision transformer-driven cross-layer multi-scale fusion network is proposed for HSI classification.Firstly,from the perspective of combining CNN and visual transformer,a cross-layer multi-scale local-global feature extraction module branch is constructed,which is composed of a convolution embedded vision transformer architecture and a cross-layer feature fusion module.Specifically,to enhance attention to multi-scale ground objects in HSIs,the convolution embedded vision transformer captures multi-scale local-global features effectively by organically combining multi-scale CNN and vision transformer.Furthermore,the cross-layer feature fusion module aggregates hierarchical multi-scale localglobal features,thereby combining shallow texture information and deep structural information of ground objects.Secondly,a group multi-scale convolution module branch is designed to explore the potential multiscale features from abundant spectral bands in HSIs.Finally,to mine local spectral details and global spectral information in HSIs,a residual group convolution module is designed to extract local-global spectral features.Experimental results on Indian Pines,Houston 2013,and Salinas Valley datasets confirm the effectiveness of the proposed method.

作者赵凤耿苗苗刘汉强张俊杰於俊 ZHAO Feng;GENG Miaomiao;LIU Hanqiang;ZHANG Junjie;YU Jun(School of Communications and Information Engineering,Xi’an University of Posts and Telecommunications,Xi’an 710121,China;School of Computer Science,Shaanxi Normal University,Xi’an 710119,China;University of Science and Technology of China,Hefei 223700,China)

机构地区西安邮电大学通信与信息工程学院陕西师范大学计算机科学学院中国科学技术大学信息科学技术学院

出处《电子与信息学报》 EI CAS CSCD 北大核心 2024年第5期2237-2248,共12页 Journal of Electronics & Information Technology

基金国家自然科学基金(62071379,62071378,62106196) 陕西高校青年创新团队。

关键词高光谱图像分类卷积神经网络视觉Transformer 多尺度特征融合网络 HyperSpectral Image(HSI)classification Convolutional Neural Network(CNN) Vision transformer Multi-scale features Fusion network

分类号 TN911.73 [电子电信—通信与信息系统] TP751 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献1

1刘娜,李伟,陶然.图信号处理在高光谱图像处理领域的典型应用[J].电子与信息学报,2023,45(5):1529-1540. 被引量：3

二级参考文献1

1王保云,李沛.分析大数据:非规则结构与图信号[J].南京邮电大学学报（自然科学版）,2020,40(5):112-116. 被引量：7

共引文献2

1蔡轶珩,谭美伶,潘建军,何楷祺.基于多尺度非对称密集网络的高光谱图像分类[J].电子与信息学报,2024,46(4):1448-1457.
2谭婷芳,蔡万源,蒋俊正.稀疏分解和图拉普拉斯正则化的图像前景背景分割方法[J].浙江大学学报（工学版）,2024,58(5):979-987.

同被引文献5

1陈刚,侯宾杰.基于生成对抗网络的高斯型数据的过采样算法[J].信息与控制,2024,53(2):182-190. 被引量：1
2宁方立,王珂,郝明阳.融合CNN和ViT的声信号轴承故障诊断方法[J].振动与冲击,2024,43(3):158-163. 被引量：3
3王硕,贾锋,周全,符杨.基于MTF-ResNet-ViT的风电机组精细级联故障预警[J].上海电力大学学报,2024,40(1):17-24. 被引量：1
4陶加贵,韩飞,汪伦,赵恒.基于机器视觉和卷积神经网络的无人化智能装卸研究[J].自动化技术与应用,2024,43(4):26-30. 被引量：2
5张铁志,陈萃华,黄华,周杰峰.基于卷积神经网络的无人机成像桥梁裂缝检测方法研究[J].世界桥梁,2024,52(3):111-118. 被引量：2

引证文献1

1解程林,常怀艳,于鑫,景国邦,李为梁.融合视觉变换器与随机森林的昆虫识别系统研究[J].智慧农业导刊,2024,4(21):21-24.

1高玉鹏,闫伟红,潘新.基于卷积神经网络与注意力机制的高光谱图像分类[J].光电子．激光,2024,35(5):483-489.
2莫艳萍.基于中华传统文化的高职美育教育创新研究[J].湖北开放职业学院学报,2024,37(7):3-5.
3刘敬,李银桥,刘逸.主动学习联合聚类分组网络的高光谱遥感图像分类[J].光学精密工程,2024,32(9):1395-1407.
4王超学,代宁.融合双分支语义增强感知的遥感图像超分辨率重建算法[J].计算机科学与探索,2024,18(5):1271-1285.
5刘运,邓伍健,杜志杰.基于高光谱遥感图像的分类网络模型设计与研究[J].巢湖学院学报,2023,25(6):111-116.
6陆美,李佳田,李文,胡明洪,杨佳欣.融合多尺度低秩表示与双向递归滤波的高光谱图像分类[J].遥感技术与应用,2024,39(2):393-404.
7张凡,Mickey LV,刘华,马特,王浩坤,Sherry,刘洋(摄影),李银银(摄影),Po Wai(摄影),Charles(CJ)Karam(摄影).找到人生网球[J].智族,2023(1).
8迈克尔·图雷克.阿根廷大萨利纳斯盐沼(Argentina,Salinas Grandes)[J].时尚旅游,2023(11):18-19.
9吴长柯,陈虎,潘涛,黄菊,刘洪,张萍,吴志红,苏强.基于多光谱交互注意力融合的多尺度无人机小目标检测[J].四川大学学报（自然科学版）,2024,61(3):136-143.
10蔡轶珩,谭美伶,潘建军,何楷祺.基于多尺度非对称密集网络的高光谱图像分类[J].电子与信息学报,2024,46(4):1448-1457.

电子与信息学报

2024年第5期

浏览历史

内容加载中请稍等...

卷积神经网络与视觉Transformer联合驱动的跨层多尺度融合网络高光谱图像分类方法被引量：1

参考文献1

二级参考文献1

共引文献2

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

卷积神经网络与视觉Transformer联合驱动的跨层多尺度融合网络高光谱图像分类方法 被引量：1

参考文献1

二级参考文献1

共引文献2

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

卷积神经网络与视觉Transformer联合驱动的跨层多尺度融合网络高光谱图像分类方法被引量：1