期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
遥感场景理解中视觉Transformer的参数高效微调
1
作者
尹文昕
于海琛
+2 位作者
刁文辉
孙显
付琨
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024年第9期3731-3738,共8页
随着深度学习和计算机视觉技术的飞速发展,遥感场景分类任务对预训练模型的微调通常需要大量的计算资源。为了减少内存需求和训练成本,该文提出一种名为“多尺度融合适配器微调(MuFA)”的方法,用于遥感模型的微调。MuFA引入了一个多尺...
随着深度学习和计算机视觉技术的飞速发展,遥感场景分类任务对预训练模型的微调通常需要大量的计算资源。为了减少内存需求和训练成本,该文提出一种名为“多尺度融合适配器微调(MuFA)”的方法,用于遥感模型的微调。MuFA引入了一个多尺度融合模块,将不同下采样倍率的瓶颈模块相融合,并与原始视觉Transformer模型并联。在训练过程中,原始视觉Transformer模型的参数被冻结,只有MuFA模块和分类头会进行微调。实验结果表明,MuFA在UCM和NWPU-RESISC45两个遥感场景分类数据集上取得了优异的性能,超越了其他参数高效微调方法。因此,MuFA不仅保持了模型性能,还降低了资源开销,具有广泛的遥感应用前景。
展开更多
关键词
遥感图像
场景分类
参数高效
深度学习
下载PDF
职称材料
基于编解码网络的航空影像像素级建筑物提取
被引量:
21
2
作者
陈凯强
高鑫
+2 位作者
闫梦龙
张跃
孙显
《遥感学报》
EI
CSCD
北大核心
2020年第9期1134-1142,共9页
建筑物提取在城市规划等土地利用分析中发挥着重要作用。用于提取建筑物的传统方法通常基于手工特征和分类器,导致精度较低。本文基于编解码结构的卷积神经网络CNN(Convolutional Neural Networks),自主学习多级的和具有区分度的特征来...
建筑物提取在城市规划等土地利用分析中发挥着重要作用。用于提取建筑物的传统方法通常基于手工特征和分类器,导致精度较低。本文基于编解码结构的卷积神经网络CNN(Convolutional Neural Networks),自主学习多级的和具有区分度的特征来更好地辨识建筑物和背景,实现航空影像中的像素级建筑物提取。该网络由编码子网络和解码子网络两部分组成,编码子网络对输入图像进行空间分辨率压缩,完成特征提取;解码子网络从特征中提升空间分辨率,完成像素级的建筑物提取。此外,本文使用视野增强FoVE(Field-of-View Enhancement)方法减轻边缘现象(切片边缘附近的建筑物提取精度通常低于中心区域附近的精度)的影响,并分别在两个建筑物提取标准数据集上的实验表明,编解码卷积神经网络能有效实现像素级建筑物提取,FoVE能有效提高建筑物提取准确率;通过改变预测时切片大小和重叠度,分析其对建筑物提取结果的影响,揭示了FoVE的饱和性。
展开更多
关键词
遥感
建筑物提取
卷积神经网络
深度学习
航空影像
原文传递
数据受限条件下的多模态处理技术综述
被引量:
9
3
作者
王佩瑾
闫志远
+5 位作者
容雪娥
李俊希
路晓男
胡会扬
严启炜
孙显
《中国图象图形学报》
CSCD
北大核心
2022年第10期2803-2834,共32页
随着多媒体技术的发展,可获取的媒体数据在种类和量级上大幅提升。受人类感知方式的启发,多种媒体数据互相融合处理,促进了人工智能在计算机视觉领域的研究发展,在遥感图像解译、生物医学和深度估计等方面有广泛的应用。尽管多模态数据...
随着多媒体技术的发展,可获取的媒体数据在种类和量级上大幅提升。受人类感知方式的启发,多种媒体数据互相融合处理,促进了人工智能在计算机视觉领域的研究发展,在遥感图像解译、生物医学和深度估计等方面有广泛的应用。尽管多模态数据在描述事物特征时具有明显优势,但仍面临着较大的挑战。1)受到不同成像设备和传感器的限制,难以收集到大规模、高质量的多模态数据集;2)多模态数据需要匹配成对用于研究,任一模态的缺失都会造成可用数据的减少;3)图像、视频数据在处理和标注上需要耗费较多的时间和人力成本,这些问题使得目前本领域的技术尚待攻关。本文立足于数据受限条件下的多模态学习方法,根据样本数量、标注信息和样本质量等不同的维度,将计算机视觉领域中的多模态数据受限方法分为小样本学习、缺乏强监督标注信息、主动学习、数据去噪和数据增强5个方向,详细阐述了各类方法的样本特点和模型方法的最新进展。并介绍了数据受限前提下的多模态学习方法使用的数据集及其应用方向(包括人体姿态估计、行人重识别等),对比分析了现有算法的优缺点以及未来的发展方向,对该领域的发展具有积极的意义。
展开更多
关键词
多模态数据
数据受限
深度学习
融合算法
计算机视觉
原文传递
题名
遥感场景理解中视觉Transformer的参数高效微调
1
作者
尹文昕
于海琛
刁文辉
孙显
付琨
机构
中国科学院
空
天
信息
创新
研究院
中国科学院
大学电子电气与通信工程
学院
中国科学院空天信息创新研究院网络信息体系技术科技创新重点实验室
出处
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024年第9期3731-3738,共8页
基金
国家重点研发计划(2022ZD0118401)。
文摘
随着深度学习和计算机视觉技术的飞速发展,遥感场景分类任务对预训练模型的微调通常需要大量的计算资源。为了减少内存需求和训练成本,该文提出一种名为“多尺度融合适配器微调(MuFA)”的方法,用于遥感模型的微调。MuFA引入了一个多尺度融合模块,将不同下采样倍率的瓶颈模块相融合,并与原始视觉Transformer模型并联。在训练过程中,原始视觉Transformer模型的参数被冻结,只有MuFA模块和分类头会进行微调。实验结果表明,MuFA在UCM和NWPU-RESISC45两个遥感场景分类数据集上取得了优异的性能,超越了其他参数高效微调方法。因此,MuFA不仅保持了模型性能,还降低了资源开销,具有广泛的遥感应用前景。
关键词
遥感图像
场景分类
参数高效
深度学习
Keywords
Remote sensing
Scene classification
Parameter efficient
Deep learning
分类号
TN919.81 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于编解码网络的航空影像像素级建筑物提取
被引量:
21
2
作者
陈凯强
高鑫
闫梦龙
张跃
孙显
机构
中国科学院空天信息创新研究院网络信息体系技术科技创新重点实验室
中国科学院
大学
出处
《遥感学报》
EI
CSCD
北大核心
2020年第9期1134-1142,共9页
基金
国家自然科学基金(编号:41801349)。
文摘
建筑物提取在城市规划等土地利用分析中发挥着重要作用。用于提取建筑物的传统方法通常基于手工特征和分类器,导致精度较低。本文基于编解码结构的卷积神经网络CNN(Convolutional Neural Networks),自主学习多级的和具有区分度的特征来更好地辨识建筑物和背景,实现航空影像中的像素级建筑物提取。该网络由编码子网络和解码子网络两部分组成,编码子网络对输入图像进行空间分辨率压缩,完成特征提取;解码子网络从特征中提升空间分辨率,完成像素级的建筑物提取。此外,本文使用视野增强FoVE(Field-of-View Enhancement)方法减轻边缘现象(切片边缘附近的建筑物提取精度通常低于中心区域附近的精度)的影响,并分别在两个建筑物提取标准数据集上的实验表明,编解码卷积神经网络能有效实现像素级建筑物提取,FoVE能有效提高建筑物提取准确率;通过改变预测时切片大小和重叠度,分析其对建筑物提取结果的影响,揭示了FoVE的饱和性。
关键词
遥感
建筑物提取
卷积神经网络
深度学习
航空影像
Keywords
remote sensing
building extraction
convolutional neural network
deep learning
aerial imagery
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TP751 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
数据受限条件下的多模态处理技术综述
被引量:
9
3
作者
王佩瑾
闫志远
容雪娥
李俊希
路晓男
胡会扬
严启炜
孙显
机构
中国科学院
空
天
信息
创新
研究院
中国科学院
大学电子电气与通信工程
学院
中国科学院空天信息创新研究院网络信息体系技术科技创新重点实验室
出处
《中国图象图形学报》
CSCD
北大核心
2022年第10期2803-2834,共32页
基金
国家自然科学基金项目(62171436)。
文摘
随着多媒体技术的发展,可获取的媒体数据在种类和量级上大幅提升。受人类感知方式的启发,多种媒体数据互相融合处理,促进了人工智能在计算机视觉领域的研究发展,在遥感图像解译、生物医学和深度估计等方面有广泛的应用。尽管多模态数据在描述事物特征时具有明显优势,但仍面临着较大的挑战。1)受到不同成像设备和传感器的限制,难以收集到大规模、高质量的多模态数据集;2)多模态数据需要匹配成对用于研究,任一模态的缺失都会造成可用数据的减少;3)图像、视频数据在处理和标注上需要耗费较多的时间和人力成本,这些问题使得目前本领域的技术尚待攻关。本文立足于数据受限条件下的多模态学习方法,根据样本数量、标注信息和样本质量等不同的维度,将计算机视觉领域中的多模态数据受限方法分为小样本学习、缺乏强监督标注信息、主动学习、数据去噪和数据增强5个方向,详细阐述了各类方法的样本特点和模型方法的最新进展。并介绍了数据受限前提下的多模态学习方法使用的数据集及其应用方向(包括人体姿态估计、行人重识别等),对比分析了现有算法的优缺点以及未来的发展方向,对该领域的发展具有积极的意义。
关键词
多模态数据
数据受限
深度学习
融合算法
计算机视觉
Keywords
multimodal data
limited data
deep learning
fusion algorithms
computer vision
分类号
TP37 [自动化与计算机技术—计算机系统结构]
原文传递
题名
作者
出处
发文年
被引量
操作
1
遥感场景理解中视觉Transformer的参数高效微调
尹文昕
于海琛
刁文辉
孙显
付琨
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
基于编解码网络的航空影像像素级建筑物提取
陈凯强
高鑫
闫梦龙
张跃
孙显
《遥感学报》
EI
CSCD
北大核心
2020
21
原文传递
3
数据受限条件下的多模态处理技术综述
王佩瑾
闫志远
容雪娥
李俊希
路晓男
胡会扬
严启炜
孙显
《中国图象图形学报》
CSCD
北大核心
2022
9
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部