期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
基于Depth-wise卷积和视觉Transformer的图像分类模型
1
作者 张峰 黄仕鑫 +1 位作者 花强 董春茹 《计算机科学》 CSCD 北大核心 2024年第2期196-204,共9页
图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关... 图像分类作为一种常见的视觉识别任务,有着广阔的应用场景。在处理图像分类问题时,传统的方法通常使用卷积神经网络,然而,卷积网络的感受野有限,难以建模图像的全局关系表示,导致分类精度低,难以处理复杂多样的图像数据。为了对全局关系进行建模,一些研究者将Transformer应用于图像分类任务,但为了满足Transformer的序列化和并行化要求,需要将图像分割成大小相等、互不重叠的图像块,破坏了相邻图像数据块之间的局部信息。此外,由于Transformer具有较少的先验知识,模型往往需要在大规模数据集上进行预训练,因此计算复杂度较高。为了同时建模图像相邻块之间的局部信息并充分利用图像的全局信息,提出了一种基于Depth-wise卷积的视觉Transformer(Efficient Pyramid Vision Transformer,EPVT)模型。EPVT模型可以实现以较低的计算成本提取相邻图像块之间的局部和全局信息。EPVT模型主要包含3个关键组件:局部感知模块(Local Perceptron Module,LPM)、空间信息融合模块(Spatial Information Fusion,SIF)和“+卷积前馈神经网络(Convolution Feed-forward Network,CFFN)。LPM模块用于捕获图像的局部相关性;SIF模块用于融合相邻图像块之间的局部信息,并利用不同图像块之间的远距离依赖关系,提升模型的特征表达能力,使模型学习到输出特征在不同维度下的语义信息;CFFN模块用于编码位置信息和重塑张量。在图像分类数据集ImageNet-1K上,所提模型优于现有的同等规模的视觉Transformer分类模型,取得了82.6%的分类准确度,证明了该模型在大规模数据集上具有竞争力。 展开更多
关键词 深度学习 图像分类 depth-wise卷积 视觉Transformer 注意力机制
下载PDF
基于伪点云特征增强的多模态三维目标检测方法
2
作者 孔德明 李晓伟 杨庆鑫 《计算机学报》 EI CAS CSCD 北大核心 2024年第4期759-775,共17页
环境感知是自动驾驶汽车落地的关键技术之一,它对于提高自动驾驶汽车的安全性和可靠性至关重要.三维目标检测是其中的一项核心任务,旨在识别和定位三维空间中的物体,为后续决策提供重要的信息.点云和图像是该任务最常用的输入数据,点云... 环境感知是自动驾驶汽车落地的关键技术之一,它对于提高自动驾驶汽车的安全性和可靠性至关重要.三维目标检测是其中的一项核心任务,旨在识别和定位三维空间中的物体,为后续决策提供重要的信息.点云和图像是该任务最常用的输入数据,点云由三维空间中不规则分布的点组成,而图像则是由二维空间上规则分布的像素组成.因此,点云和图像之间难以进行有效的融合.而伪点云作为一种点云表征的图像信息,近几年受到了该领域学者的广泛关注.现阶段基于伪点云的三维目标检测方法还存在伪点云特征提取粗糙和相应感兴趣区域(Region-of-Intersts,RoI)特征表征能力差的问题.本文针对上述问题开展研究,分别提出细粒度注意力卷积和多尺度分组稀疏卷积.细粒度注意力卷积将规则图像处理中常用的深度可分离卷积引入不规则点云的处理流程,并在此基础上嵌入通道和分组注意力机制,进行精细的特征提取,增强伪点云特征;多尺度分组稀疏卷积将格网池化后的Ro I特征分组,进行差异化特征学习,获取不同尺度的Ro I特征,增强伪点云Ro I格网特征的表征能力.基于此,本文在SFD(Sparse Fuse Dense)网络的伪点云特征提取流程中引入细粒度注意力卷积,同时在其伪点云Ro I特征学习流程中引入多尺度分组稀疏卷积,构建SFD++多模态三维目标检测网络.在权威KITTI自动驾驶数据集上的实验结果表明,SFD++每秒可以处理8.33帧数据,其精度在简单、中等和困难的三维汽车检测上达到95.74%、88.80%和86.04%,比次优SFD的精度高出0.15%、0.84%和0.58%.除此之外,一系列消融和补充实验结果验证了所提出卷积的有效性和相关参数设置的合理性. 展开更多
关键词 自动驾驶 三维目标检测 伪点云 注意力机制 深度可分离卷积 组卷积
下载PDF
复杂场景下自适应注意力机制融合实时语义分割
3
作者 陈丹 刘乐 +2 位作者 王晨昊 白熙茹 王子晨 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3334-3342,共9页
实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息... 实现高准确度和低计算负担是卷积神经网络(CNN)实时语义分割面临的严峻挑战。针对复杂城市街道场景目标种类众多、光照变化大等特点,该文设计了一种高效的实时语义分割自适应注意力机制融合网络(AAFNet)分别提取图像空间细节和语义信息,再经过特征融合网络(FFN)获得准确语义图像。AAFNet采用扩展的深度可分离卷积(DDW)可增大语义特征提取感受野,提出自适应平均池化(Avp)和自适应最大池化(Amp)构成自适应注意力机制融合模块(AAFM),可细化目标边缘分割效果并降低小目标的漏分率。最后在复杂城市街道场景Cityscapes和CamVid数据集上分别进行了语义分割实验,所设计的AAFNet以32帧/s(Cityscapes)和52帧/s(CamVid)的推理速度获得73.0%和69.8%的平均分割精度(mIoU),且与扩展的空间注意力网络(DSANet)、多尺度上下文融合网络(MSCFNet)以及轻量级双边非对称残差网络(LBARNet)相比,AAFNet平均分割精度最高。 展开更多
关键词 卷积神经网络 复杂城市街道场景 扩展的深度可分离卷积 自适应注意力机制融合 分割精度
下载PDF
改进YOLOv7网络在遥感影像建筑垃圾识别的应用
4
作者 陈炳瑞 王井利 +1 位作者 江滨 吴冬 《遥感信息》 CSCD 北大核心 2024年第2期79-86,共8页
针对现有的目标检测算法对于高分遥感影像建筑垃圾识别效率不高的问题,提出一种基于改进的YOLOv7的目标检测模型,提高建筑垃圾的检测效果。该方法使用高分二号卫星影像数据,首先用SIoU来优化模型的目标框回归,加快模型的收敛速度;然后... 针对现有的目标检测算法对于高分遥感影像建筑垃圾识别效率不高的问题,提出一种基于改进的YOLOv7的目标检测模型,提高建筑垃圾的检测效果。该方法使用高分二号卫星影像数据,首先用SIoU来优化模型的目标框回归,加快模型的收敛速度;然后用漏斗激活函数FReLU扩大卷积层的感受野范围,以提高模型的特征提取能力;最后使用深度可分离卷积核,在提高检测精度的同时也减小了模型的参数量。实验结果表明,改进后的YOLOv7模型相比其他模型平均精度、准确率和召回率分别提升了5.8%、6.4%和8%,具有较好的识别效果,为遥感影像建筑垃圾识别提供了可靠的方法。 展开更多
关键词 损失函数 深度可分离卷积 激活函数 建筑垃圾识别 目标检测
下载PDF
结合密集残差块和注意力的真实图像去噪网络
5
作者 余卓璞 周冬明 +2 位作者 周联敏 赵倩 尹稳 《计算机工程与设计》 北大核心 2024年第6期1812-1821,共10页
为有效去除真实图像噪声并保留图像边缘信息,提出一种结合密集网络思想和并行极化自注意力机制的真实去噪算法。使用3条并行结构处理不同尺度的特征信息,其中每条分支由两个密集注意力块串联而成,形成残差结构。使用选择性核融合机制,... 为有效去除真实图像噪声并保留图像边缘信息,提出一种结合密集网络思想和并行极化自注意力机制的真实去噪算法。使用3条并行结构处理不同尺度的特征信息,其中每条分支由两个密集注意力块串联而成,形成残差结构。使用选择性核融合机制,获取不同深度下的特征信息,将其融合并使用注意力机制去除冗余信息,获取干净图像。实验结果表明,该算法在SIDD、DND、PolyU测试集上的峰值信噪比分别为39.32 dB、39.52 dB和37.36 dB,结构相似性分别为0.908、0.951和0.952,在SIDD和PolyU测试集上的图像通用质量指标值为0.992和0.982,在去噪任务上可以达到较好的性能,提高了图像视觉的质量。 展开更多
关键词 真实图像去噪 深度学习 卷积神经网络 密集残差网络 多尺度 注意力机制 深度卷积
下载PDF
基于轻量级金字塔网络的种子分选方法研究
6
作者 李卫杰 桑肖婷 +2 位作者 李环宇 魏平俊 李骁 《计算机测量与控制》 2024年第3期239-246,共8页
针对目前卷积神经网络种子分选方法存在识别精度不高、模型参数量大、推理速度慢且难于部署等问题,提出了基于轻量级金字塔空洞卷积网络的种子分选方法;该网络提出了残差空间金字塔模块,利用不同扩张率的空洞卷积扩大感受野,更有效地提... 针对目前卷积神经网络种子分选方法存在识别精度不高、模型参数量大、推理速度慢且难于部署等问题,提出了基于轻量级金字塔空洞卷积网络的种子分选方法;该网络提出了残差空间金字塔模块,利用不同扩张率的空洞卷积扩大感受野,更有效地提取多尺度特征;再结合深度可分离卷积技术减少模型参数量和计算复杂度;在网络结构中引入轻量级注意力机制模块,利用局部跨通道交互方式关注重要的信息,提高种子关键特征提取能力;实验结果表明,提出网络参数量仅为0.13 M,在玉米和红芸豆数据集上准确率高达96.00%和97.38%,在NVIDIA Quadro板卡上识别单张图片时间仅为4.51 ms,均优于主流轻量级网络MobileNetv2、Shufflenetv2和PPLC-Net等,可以满足工业现场实时识别的要求。 展开更多
关键词 种子分选 轻量化网络 ECA注意力机制 深度可分离卷积 空洞卷积
下载PDF
基于深度可分离卷积神经网络的端到端高效车牌识别方法
7
作者 林璐颖 《九江学院学报(自然科学版)》 CAS 2024年第2期82-86,共5页
车牌识别易受到天气或光照条件等不可预见干扰的影响。因此,文章提出了一种无需分割的车牌识别框架,该网络模型结合了先进的深度学习方法和设计思想,采用了深度可分离卷积来极大地降低计算量。与之前相比,它以更低的计算要求实现了更高... 车牌识别易受到天气或光照条件等不可预见干扰的影响。因此,文章提出了一种无需分割的车牌识别框架,该网络模型结合了先进的深度学习方法和设计思想,采用了深度可分离卷积来极大地降低计算量。与之前相比,它以更低的计算要求实现了更高的识别精度。在两个不同的数据集上对所提方法的有效性进行了评估,并获得了超过99%识别准确率和70以上的帧率,该方法稳健高效,值得推广。 展开更多
关键词 车牌识别 深度学习 深度可分离卷积
下载PDF
面向电子装备装配引导的AR跟踪方法研究
8
作者 杜小东 王鹏 +2 位作者 史建成 王月 帅昊 《应用科学学报》 CAS CSCD 北大核心 2024年第3期416-424,共9页
为了提高面向电子装备装配引导的增强现实(augmented reality,AR)跟踪方法的鲁棒性与适用性,在像素投票姿态估计网络结构的基础上,结合深度可分离卷积和通道注意力机制对AR跟踪算法进行优化。首先,针对电子装备六自由度姿态公共数据集... 为了提高面向电子装备装配引导的增强现实(augmented reality,AR)跟踪方法的鲁棒性与适用性,在像素投票姿态估计网络结构的基础上,结合深度可分离卷积和通道注意力机制对AR跟踪算法进行优化。首先,针对电子装备六自由度姿态公共数据集稀缺与使用约束较多的问题,使用RGB-D相机采集并制作AR装配引导的电子装备的六自由度姿态训练数据集。然后,在基于像素投票的姿态估计网络结构基础上,使用深度可分离卷积对网络进行轻量化,并引入通道注意力机制对通道进行权重评估,以弥补网络轻量化造成的精度损失。最后,通过电子装备装配任务对提出的方法进行AR装配引导验证。实验结果表明:提出的跟踪注册方法相对于修改前的跟踪方法具有较好的鲁棒性,同时保持了装配引导的精度,能够对弱纹理的电子装备进行跟踪。 展开更多
关键词 电子装备 增强现实 三维跟踪 深度可分离卷积 通道注意力
下载PDF
基于YOLOv3-Tiny改进的船舶目标检测研究
9
作者 朱伟 段先华 程婧怡 《计算机应用与软件》 北大核心 2024年第6期169-174,229,共7页
针对船舶实时性检测中出现的检测精度低、漏检问题,改进一种基于YOLOv3-Tiny的船舶目标检测算法。通过引入深度可分离卷积作为主干网络,提高通道数量,减少模型的参数量和运算量;采用H-Swish和Leaky ReLU激活函数改进卷积结构,提取更多... 针对船舶实时性检测中出现的检测精度低、漏检问题,改进一种基于YOLOv3-Tiny的船舶目标检测算法。通过引入深度可分离卷积作为主干网络,提高通道数量,减少模型的参数量和运算量;采用H-Swish和Leaky ReLU激活函数改进卷积结构,提取更多特征信息;利用GIOU(Generalized Intersection Over Union)损失优化边界框,突显目标区域重合度,提高精度。在混合船舶数据集上检测结果表明,改进后YOLOv3-Tiny的检测精度为83.40%,较原算法提高5.33百分点,召回率和检测速度也均优于原算法,适用于船舶实时性检测。 展开更多
关键词 船舶检测 YOLOv3-Tiny 深度可分离卷积 H-Swish GIOU
下载PDF
基于级联网络的肝脏肿瘤CT图像分割
10
作者 莫亚霓 陈晓婕 张本鑫 《电视技术》 2024年第1期38-41,共4页
肝脏肿瘤计算机断层扫描(Computed Tomography,CT)图像分割是肝癌诊断与治疗过程的重要环节。近年来,基于U型结构的卷积神经网络在该分割任务取得了巨大的成功,但仍存在一些挑战,如肿瘤边界分割不精确、小肿瘤难以检测等。为提高肝脏肿... 肝脏肿瘤计算机断层扫描(Computed Tomography,CT)图像分割是肝癌诊断与治疗过程的重要环节。近年来,基于U型结构的卷积神经网络在该分割任务取得了巨大的成功,但仍存在一些挑战,如肿瘤边界分割不精确、小肿瘤难以检测等。为提高肝脏肿瘤的分割精度,提出一种级联网络MCPUNet用于肝脏肿瘤分割任务。MCPUNet引入MDB(MDconv Block)和MP(Mixing Pooling)以获取上下文信息,MDB通过混合深度可分离卷积和坐标注意力机制提取图像的多尺度特征,MP用于下采样减少图像尺寸。实验证明,与原始的U-Net模型相比,该模型在肝脏肿瘤分割任务上的交并比(Intersection over Union,IoU)、准确度和召回率指标分别提高3.8%、2.5%和2.0%,为肝癌诊断和治疗提供了可靠依据。 展开更多
关键词 肝脏肿瘤分割 混合深度可分离卷积 级联网络 多尺度 注意力机制
下载PDF
基于改进YOLOv4的航空发动机损伤检测方法 被引量:2
11
作者 蔡舒妤 闫子砚 师利中 《现代制造工程》 CSCD 北大核心 2023年第2期99-108,共10页
针对现有目标检测模型参数量大、检测速度慢,难以适应航空发动机孔探检测轻量化应用需求的问题,提出了基于YOLOv4目标检测算法的轻量化航空发动机损伤检测模型。设计了基于深度可分离卷积的轻量化特征融合结构,在YOLOv4的颈部结构(Neck)... 针对现有目标检测模型参数量大、检测速度慢,难以适应航空发动机孔探检测轻量化应用需求的问题,提出了基于YOLOv4目标检测算法的轻量化航空发动机损伤检测模型。设计了基于深度可分离卷积的轻量化特征融合结构,在YOLOv4的颈部结构(Neck)中,将普通卷积重构为逐通道卷积和逐点卷积的形式,有效减少了网络中的冗余参数;为进一步降低模型参数量,使用MobileNetv3作为特征提取网络。在减少参数量的同时,2种轻量化改进方法有效提高了模型的检测速度;在轻量化后的路径聚合网络(Path Aggregation Network,PANet)中加入卷积注意力模块(Convolutional Block Attention Module,CBAM),通过仅引入少量的参数来提高轻量化网络的损伤检测精度。实验结果表明,改进YOLOv4算法的平均精度均值(mean Average Precision,mAP)为89.82%,模型大小为73.29 MB,检测速度为37.3 FPS。与YOLOv4目标检测算法相比,改进YOLOv4算法以3.55%的mAP损失,使模型参数量降低了约2/3,检测速度提高了1.6倍,综合检测性能更优,可更好地满足孔探检测应用的需求,为航空发动机损伤智能化检测提供轻量化模型支撑。 展开更多
关键词 损伤检测 YOLOv4 深度可分离卷积 MobileNetv3 卷积注意力模块
下载PDF
基于残差结构的棉花异性纤维检测算法 被引量:1
12
作者 师红宇 位营杰 +1 位作者 管声启 李怡 《纺织学报》 EI CAS CSCD 北大核心 2023年第12期35-42,共8页
针对棉花中异性纤维检测精度低、异性纤维隐藏或边角位置不易识别等原因导致检测效果不佳的问题,提出一种基于残差结构的棉花异性纤维检测算法。首先,针对异性纤维检测目标,提出一种棉花异性纤维在线检测方案;其次,针对异性纤维颜色、... 针对棉花中异性纤维检测精度低、异性纤维隐藏或边角位置不易识别等原因导致检测效果不佳的问题,提出一种基于残差结构的棉花异性纤维检测算法。首先,针对异性纤维检测目标,提出一种棉花异性纤维在线检测方案;其次,针对异性纤维颜色、纹理、位置等特征,构建深浅层混合数据集;在此基础上设计了残差结构的异性纤维检测网络模型算法,解决了现有检测算法精度低、异性纤维隐藏或边角位置的问题;最后,将该算法与传统经典算法对比实验。结果表明:在深浅层混合数据集下,与经典算法对比,该算法具有较高的准确性和实时性,其平均检测准确率达到88.48%,1张图像的检测速度为0.019 s,满足工业现场实时检测需求,为棉花中异性纤维检测提供了一种新方法。 展开更多
关键词 异性纤维检测 棉花 注意力机制 残差结构 深度可分离卷积 网络模型
下载PDF
改进YOLOv3算法下通航机场场面运动目标检测 被引量:2
13
作者 夏正洪 魏汝祥 李彦冬 《中国安全科学学报》 CAS CSCD 北大核心 2023年第2期82-88,共7页
为获得更好的检测精度和更快的检测速度,保障通航机场场面运行安全,提出一种改进的YOLOv3算法,分别从网络结构和损失函数2方面进行改进。首先,在主干网络中使用深度可分离卷积代替原卷积,构建基于距离交并比(DIoU)的目标框回归损失函数... 为获得更好的检测精度和更快的检测速度,保障通航机场场面运行安全,提出一种改进的YOLOv3算法,分别从网络结构和损失函数2方面进行改进。首先,在主干网络中使用深度可分离卷积代替原卷积,构建基于距离交并比(DIoU)的目标框回归损失函数;然后,以某通航机场为研究对象,搭建通航机场场面目标检测场景,采用迁移学习和冻结训练相结合的训练方法,以提升场面目标检测的速度;最后,比较分析所提算法与传统的YOLOv3、YOLOv4算法的识别效果。结果表明:飞机目标的检测效果明显优于车辆和人员目标,改进的YOLOv3算法对目标的检测精度、召回率、全类平均精度(mAP)分别达到92.96%、80.51%、91.96%,图形处理器处理速度高达74帧/s,较传统的YOLOv3、YOLOv4算法性能均有明显提升,可实现通航机场场面运动目标的有效检测。 展开更多
关键词 改进YOLOv3算法 通航机场 目标检测 深度可分离卷积 距离交并比(DIoU)
下载PDF
SepFE:Separable Fusion Enhanced Network for Retinal Vessel Segmentation 被引量:1
14
作者 Yun Wu Ge Jiao Jiahao Liu 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第9期2465-2485,共21页
The accurate and automatic segmentation of retinal vessels fromfundus images is critical for the early diagnosis and prevention ofmany eye diseases,such as diabetic retinopathy(DR).Existing retinal vessel segmentation... The accurate and automatic segmentation of retinal vessels fromfundus images is critical for the early diagnosis and prevention ofmany eye diseases,such as diabetic retinopathy(DR).Existing retinal vessel segmentation approaches based on convolutional neural networks(CNNs)have achieved remarkable effectiveness.Here,we extend a retinal vessel segmentation model with low complexity and high performance based on U-Net,which is one of the most popular architectures.In view of the excellent work of depth-wise separable convolution,we introduce it to replace the standard convolutional layer.The complexity of the proposed model is reduced by decreasing the number of parameters and calculations required for themodel.To ensure performance while lowering redundant parameters,we integrate the pre-trained MobileNet V2 into the encoder.Then,a feature fusion residual module(FFRM)is designed to facilitate complementary strengths by enhancing the effective fusion between adjacent levels,which alleviates extraneous clutter introduced by direct fusion.Finally,we provide detailed comparisons between the proposed SepFE and U-Net in three retinal image mainstream datasets(DRIVE,STARE,and CHASEDB1).The results show that the number of SepFE parameters is only 3%of U-Net,the Flops are only 8%of U-Net,and better segmentation performance is obtained.The superiority of SepFE is further demonstrated through comparisons with other advanced methods. 展开更多
关键词 Retinal vessel segmentation U-Net depth-wise separable convolution feature fusion
下载PDF
基于YOLOv7模型改进的轻量级鱼类目标检测方法
15
作者 梅海彬 黄政 袁红春 《大连海洋大学学报》 CAS CSCD 北大核心 2023年第6期1032-1043,共12页
为了解决商业渔船电子监控系统中鱼类检测和识别依赖于人工完成的问题,提出一种基于YOLOv7的轻量级鱼类实时检测模型YOLOv7-MRN,将YOLOv7的骨干网络替换为MobileNetv3骨干网络,以降低运算量,并添加了感受野模块RFB来增强网络的特征提取... 为了解决商业渔船电子监控系统中鱼类检测和识别依赖于人工完成的问题,提出一种基于YOLOv7的轻量级鱼类实时检测模型YOLOv7-MRN,将YOLOv7的骨干网络替换为MobileNetv3骨干网络,以降低运算量,并添加了感受野模块RFB来增强网络的特征提取能力;通过引入基于归一化的注意力机制模块NAM,重新设计颈部特征融合网络,以抑制无关紧要的权重。结果表明:在HNY768远洋渔船电子监控视频渔业数据集上,YOLOv7-MRN模型的mAP@0.5为86.5%,运算量仅为原模型YOLOv7的9.8%,模型在GPU和CPU上的推理速度分别提高了121.69%和219.09%;相较于其他模型,YOLOv7-MRN模型的实际检测效果更好,尤其是在强日光场景下。研究表明,本文中提出的YOLOv7-MRN模型对鱼类的检测效果好,消耗的计算资源更少,可将该模型部署在电子渔船监控系统中。 展开更多
关键词 YOLOv7 基于归一化的注意力机制 深度可分离卷积 鱼类目标检测
下载PDF
Sea-Land Segmentation of Remote Sensing Images Based on SDW-UNet
16
作者 Tianyu Liu Pengyu Liu +3 位作者 Xiaowei Jia Shanji Chen Ying Ma Qian Gao 《Computer Systems Science & Engineering》 SCIE EI 2023年第5期1033-1045,共13页
Image segmentation of sea-land remote sensing images is of great importance for downstream applications including shoreline extraction,the monitoring of near-shore marine environment,and near-shore target recognition.... Image segmentation of sea-land remote sensing images is of great importance for downstream applications including shoreline extraction,the monitoring of near-shore marine environment,and near-shore target recognition.To mitigate large number of parameters and improve the segmentation accuracy,we propose a new Squeeze-Depth-Wise UNet(SDW-UNet)deep learning model for sea-land remote sensing image segmentation.The proposed SDW-UNet model leverages the squeeze-excitation and depth-wise separable convolution to construct new convolution modules,which enhance the model capacity in combining multiple channels and reduces the model parameters.We further explore the effect of position-encoded information in NLP(Natural Language Processing)domain on sea-land segmentation task.We have conducted extensive experiments to compare the proposed network with the mainstream segmentation network in terms of accuracy,the number of parameters and the time cost for prediction.The test results on remote sensing data sets of Guam,Okinawa,Taiwan China,San Diego,and Diego Garcia demonstrate the effectiveness of SDW-UNet in recognizing different types of sea-land areas with a smaller number of parameters,reduces prediction time cost and improves performance over other mainstream segmentation models.We also show that the position encoding can further improve the accuracy of model segmentation. 展开更多
关键词 Sea-land segmentation UNet depth-wise separable convolution squeeze-excitation position encoding
下载PDF
Dimensionality Reduction Using Optimized Self-Organized Map Technique for Hyperspectral Image Classification
17
作者 S.Srinivasan K.Rajakumar 《Computer Systems Science & Engineering》 SCIE EI 2023年第11期2481-2496,共16页
The high dimensionalhyperspectral image classification is a challenging task due to the spectral feature vectors.The high correlation between these features and the noises greatly affects the classification performanc... The high dimensionalhyperspectral image classification is a challenging task due to the spectral feature vectors.The high correlation between these features and the noises greatly affects the classification performances.To overcome this,dimensionality reduction techniques are widely used.Traditional image processing applications recently propose numerous deep learning models.However,in hyperspectral image classification,the features of deep learning models are less explored.Thus,for efficient hyperspectral image classification,a depth-wise convolutional neural network is presented in this research work.To handle the dimensionality issue in the classification process,an optimized self-organized map model is employed using a water strider optimization algorithm.The network parameters of the self-organized map are optimized by the water strider optimization which reduces the dimensionality issues and enhances the classification performances.Standard datasets such as Indian Pines and the University of Pavia(UP)are considered for experimental analysis.Existing dimensionality reduction methods like Enhanced Hybrid-Graph Discriminant Learning(EHGDL),local geometric structure Fisher analysis(LGSFA),Discriminant Hyper-Laplacian projection(DHLP),Group-based tensor model(GBTM),and Lower rank tensor approximation(LRTA)methods are compared with proposed optimized SOM model.Results confirm the superior performance of the proposed model of 98.22%accuracy for the Indian pines dataset and 98.21%accuracy for the University of Pavia dataset over the existing maximum likelihood classifier,and Support vector machine(SVM). 展开更多
关键词 Hyperspectral image dimensionality reduction depth-wise separable model water strider optimization self-organized map
下载PDF
融合注意力机制的轨道入侵异物检测轻量级模型研究 被引量:4
18
作者 管岭 贾利民 谢征宇 《铁道学报》 EI CAS CSCD 北大核心 2023年第5期72-81,共10页
基于智能视频分析的轨道线路环境入侵物自主识别是保障轨道交通运营安全的关键技术之一。然而基于神经网络的高精度目标检测模型严重依赖算力,部署成本高,很难普及运用。为此,提出一种改进yolov4-tiny的轻量级网络模型。在网络主干,通... 基于智能视频分析的轨道线路环境入侵物自主识别是保障轨道交通运营安全的关键技术之一。然而基于神经网络的高精度目标检测模型严重依赖算力,部署成本高,很难普及运用。为此,提出一种改进yolov4-tiny的轻量级网络模型。在网络主干,通过融合跨阶段结构和通道混洗策略,提出CSPShuffleNet结构,加快网络推理;在网络颈部,引入多头注意力机制,增强网络目标定位能力;在网络头部,使用深度可分离卷积替换传统卷积,进一步压缩网络参数量。基于铁路异物数据集的实验结果表明:相比于原始yolov4-tiny,本模型的均值平均精度最大提高1.4%,参数量减少49.9%,模型容量减少55.4%。验证了本模型对于固定平台和移动平台检测系统的普适性,从而为铁路安全保障提供决策支持。 展开更多
关键词 异物入侵检测 轻量化神经网络 深度可分离卷积 通道混洗 多头注意力机制
下载PDF
A Light-weight Deep Neural Network for Vehicle Detection in Complex Tunnel Environments
19
作者 ZHENG Lie REN Dandan 《Instrumentation》 2023年第1期32-44,共13页
With the rapid development of social economy,transportation has become faster and more efficient.As an important part of goods transportation,the safe maintenance of tunnel highways has become particularly important.T... With the rapid development of social economy,transportation has become faster and more efficient.As an important part of goods transportation,the safe maintenance of tunnel highways has become particularly important.The maintenance of tunnel roads has become more difficult due to problems such as sealing,narrowness and lack of light.Currently,target detection methods are advantageous in detecting tunnel vehicles in a timely manner through monitoring.Therefore,in order to prevent vehicle misdetection and missed detection in this complex environment,we propose aYOLOv5-Vehicle model based on the YOLOv5 network.This model is improved in three ways.Firstly,The backbone network of YOLOv5 is replaced by the lightweight MobileNetV3 network to extract features,which reduces the number of model parameters;Next,all convolutions in the neck module are improved to the depth-wise separable convolutions to further reduce the number of model parameters and computation,and improve the detection speed of the model;Finally,to ensure the accuracy of the model,the CBAM attention mechanism is introduced to improve the detection accuracy and precision of the model.Experiments results demonstrate that the YOLOv5-Vehicle model can improve the accuracy. 展开更多
关键词 CBAM depth-wise Separable Convolution MobileNetV3 Vehicle Detection YOLOV5
下载PDF
面向雷达行为识别的多尺度卷积注意力网络
20
作者 熊敬伟 潘继飞 +1 位作者 毕大平 杜明洋 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2023年第6期62-74,共13页
针对低信噪比条件下雷达信号特征提取难、识别稳定性低的问题,提出了一种基于深度分组卷积、多尺度卷积和自注意力机制的雷达行为模式识别算法,在不增加训练难度的情况下提高复杂环境下的识别能力。该算法先采用深度分组卷积在浅层网络... 针对低信噪比条件下雷达信号特征提取难、识别稳定性低的问题,提出了一种基于深度分组卷积、多尺度卷积和自注意力机制的雷达行为模式识别算法,在不增加训练难度的情况下提高复杂环境下的识别能力。该算法先采用深度分组卷积在浅层网络分离弱相关的通道,再通过多尺度卷积代替常规卷积实现多维特征的提取,最后利用自注意力机制调整优化不同特征图的权值,抑制低相关和负相关的通道与空间带来的影响。对比实验表明,所提MSCANet在0~50%丢失脉冲和虚假脉冲条件下平均识别率达到约92.25%,与基线网络AlexNet、ConvNet、ResNet、VGGNet相比,准确率提升了约5%~20%,不同雷达行为模式识别稳定,模型具有更好的泛化性和鲁棒性。同时,消融实验证明了深度分组卷积、多尺度卷积和自注意力机制对模式识别的有效性。 展开更多
关键词 深度学习 机器学习 模式识别 深度分组卷积 多尺度卷积 自注意力机制
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部