当前场景分类任务大多面向高分辨率遥感图像,由于缺乏光谱信息限制了它的场景鉴别能力,而高光谱遥感图像具有“空谱合一”的特性,在场景分类问题上具有独特优势。针对高光谱遥感图像中地物分布复杂,以及高光谱图像中维度高、存在冗余等...当前场景分类任务大多面向高分辨率遥感图像,由于缺乏光谱信息限制了它的场景鉴别能力,而高光谱遥感图像具有“空谱合一”的特性,在场景分类问题上具有独特优势。针对高光谱遥感图像中地物分布复杂,以及高光谱图像中维度高、存在冗余等问题,本文提出一种高光谱场景分类流形蒸馏网络(hyperspectral scene classification manifold distillation network,HSCMDNet),有效提高了分类性能。对于遥感图像地物分布复杂问题,HSCMDNet模型使用基于移位窗口的层次化视觉Transformer(hierarchical vision transformer using shifted windows,SwinT)作为教师网络来充分挖掘高光谱图像的长距离依赖信息,捕获不同波段之间的关系。在此基础上,在教师网络与ResNet-18学生网络之间设计流形蒸馏损失,通过在流形空间中匹配学生和教师的中间层输出特征实现教师模型的知识更有效地向轻量化学生模型转移,缓解了高光谱图像中维数高导致的高计算复杂性问题。在欧比特高光谱图像场景分类数据集(Orbita hyperspectral image scene classification dataset,OHID-SC)及天宫二号遥感图像自然场景分类数据集(natural scene classification with Tiangong-2 remotely sensed imagery,NaSC-TG2)上,所提出的HSCMDNet网络的最佳分类精度分别达到了93.60%和94.55%。展开更多
场景是视频结构中的语义单元。因此基于场景的视频分割,将会对视频的内容分析、检索和浏览提供有益的帮助。提出了一种新的场景分割算法,它利用流形学习理论获得视频的结构特征,然后用马尔科夫链蒙特卡罗方法(Markov chain Monte Carlo,...场景是视频结构中的语义单元。因此基于场景的视频分割,将会对视频的内容分析、检索和浏览提供有益的帮助。提出了一种新的场景分割算法,它利用流形学习理论获得视频的结构特征,然后用马尔科夫链蒙特卡罗方法(Markov chain Monte Carlo,MCMC)动态地进行模拟采样,寻找场景边界的最大后验概率分布,完成场景的自动分割。通过发掘视频结构的内在特征并考虑它的局部信息,使算法能够适合不同类型的视频数据。实验结果也证明了该方法的有效性。展开更多
文摘当前场景分类任务大多面向高分辨率遥感图像,由于缺乏光谱信息限制了它的场景鉴别能力,而高光谱遥感图像具有“空谱合一”的特性,在场景分类问题上具有独特优势。针对高光谱遥感图像中地物分布复杂,以及高光谱图像中维度高、存在冗余等问题,本文提出一种高光谱场景分类流形蒸馏网络(hyperspectral scene classification manifold distillation network,HSCMDNet),有效提高了分类性能。对于遥感图像地物分布复杂问题,HSCMDNet模型使用基于移位窗口的层次化视觉Transformer(hierarchical vision transformer using shifted windows,SwinT)作为教师网络来充分挖掘高光谱图像的长距离依赖信息,捕获不同波段之间的关系。在此基础上,在教师网络与ResNet-18学生网络之间设计流形蒸馏损失,通过在流形空间中匹配学生和教师的中间层输出特征实现教师模型的知识更有效地向轻量化学生模型转移,缓解了高光谱图像中维数高导致的高计算复杂性问题。在欧比特高光谱图像场景分类数据集(Orbita hyperspectral image scene classification dataset,OHID-SC)及天宫二号遥感图像自然场景分类数据集(natural scene classification with Tiangong-2 remotely sensed imagery,NaSC-TG2)上,所提出的HSCMDNet网络的最佳分类精度分别达到了93.60%和94.55%。
文摘场景是视频结构中的语义单元。因此基于场景的视频分割,将会对视频的内容分析、检索和浏览提供有益的帮助。提出了一种新的场景分割算法,它利用流形学习理论获得视频的结构特征,然后用马尔科夫链蒙特卡罗方法(Markov chain Monte Carlo,MCMC)动态地进行模拟采样,寻找场景边界的最大后验概率分布,完成场景的自动分割。通过发掘视频结构的内在特征并考虑它的局部信息,使算法能够适合不同类型的视频数据。实验结果也证明了该方法的有效性。