期刊文献+
共找到208篇文章
< 1 2 11 >
每页显示 20 50 100
FIBTNet:Building Change Detection for Remote Sensing Images Using Feature Interactive Bi-Temporal Network
1
作者 Jing Wang Tianwen Lin +1 位作者 Chen Zhang Jun Peng 《Computers, Materials & Continua》 SCIE EI 2024年第9期4621-4641,共21页
In this paper,a feature interactive bi-temporal change detection network(FIBTNet)is designed to solve the problem of pseudo change in remote sensing image building change detection.The network improves the accuracy of... In this paper,a feature interactive bi-temporal change detection network(FIBTNet)is designed to solve the problem of pseudo change in remote sensing image building change detection.The network improves the accuracy of change detection through bi-temporal feature interaction.FIBTNet designs a bi-temporal feature exchange architecture(EXA)and a bi-temporal difference extraction architecture(DFA).EXA improves the feature exchange ability of the model encoding process through multiple space,channel or hybrid feature exchange methods,while DFA uses the change residual(CR)module to improve the ability of the model decoding process to extract different features at multiple scales.Additionally,at the junction of encoder and decoder,channel exchange is combined with the CR module to achieve an adaptive channel exchange,which further improves the decision-making performance of model feature fusion.Experimental results on the LEVIR-CD and S2Looking datasets demonstrate that iCDNet achieves superior F1 scores,Intersection over Union(IoU),and Recall compared to mainstream building change detectionmodels,confirming its effectiveness and superiority in the field of remote sensing image change detection. 展开更多
关键词 Change detection change residual module feature exchange mechanism feature fusion
下载PDF
Siamese Dense Pixel-Level Fusion Network for Real-Time UAV Tracking 被引量:1
2
作者 Zhenyu Huang Gun Li +4 位作者 Xudong Sun Yong Chen Jie Sun Zhangsong Ni Yang Yang 《Computers, Materials & Continua》 SCIE EI 2023年第9期3219-3238,共20页
Onboard visual object tracking in unmanned aerial vehicles(UAVs)has attractedmuch interest due to its versatility.Meanwhile,due to high precision,Siamese networks are becoming hot spots in visual object tracking.Howev... Onboard visual object tracking in unmanned aerial vehicles(UAVs)has attractedmuch interest due to its versatility.Meanwhile,due to high precision,Siamese networks are becoming hot spots in visual object tracking.However,most Siamese trackers fail to balance the tracking accuracy and time within onboard limited computational resources of UAVs.To meet the tracking precision and real-time requirements,this paper proposes a Siamese dense pixel-level network for UAV object tracking named SiamDPL.Specifically,the Siamese network extracts features of the search region and the template region through a parameter-shared backbone network,then performs correlationmatching to obtain the candidate regionwith high similarity.To improve the matching effect of template and search features,this paper designs a dense pixel-level feature fusion module to enhance the matching ability by pixel-wise correlation and enrich the feature diversity by dense connection.An attention module composed of self-attention and channel attention is introduced to learn global context information and selectively emphasize the target feature region in the spatial and channel dimensions.In addition,a target localization module is designed to improve target location accuracy.Compared with other advanced trackers,experiments on two public benchmarks,which are UAV123@10fps and UAV20L fromthe unmanned air vehicle123(UAV123)dataset,show that SiamDPL can achieve superior performance and low complexity with a running speed of 100.1 fps on NVIDIA TITAN RTX. 展开更多
关键词 Siamese network UAV object tracking dense pixel-level feature fusion attention module target localization
下载PDF
DB-DCAFN:dual-branch deformable cross-attention fusion network for bacterial segmentation
3
作者 Jingkun Wang Xinyu Ma +6 位作者 Long Cao Yilin Leng Zeyi Li Zihan Cheng Yuzhu Cao Xiaoping Huang Jian Zheng 《Visual Computing for Industry,Biomedicine,and Art》 EI 2023年第1期155-170,共16页
Sputum smear tests are critical for the diagnosis of respiratory diseases. Automatic segmentation of bacteria from spu-tum smear images is important for improving diagnostic efficiency. However, this remains a challen... Sputum smear tests are critical for the diagnosis of respiratory diseases. Automatic segmentation of bacteria from spu-tum smear images is important for improving diagnostic efficiency. However, this remains a challenging task owing to the high interclass similarity among different categories of bacteria and the low contrast of the bacterial edges. To explore more levels of global pattern features to promote the distinguishing ability of bacterial categories and main-tain sufficient local fine-grained features to ensure accurate localization of ambiguous bacteria simultaneously, we propose a novel dual-branch deformable cross-attention fusion network (DB-DCAFN) for accurate bacterial segmen-tation. Specifically, we first designed a dual-branch encoder consisting of multiple convolution and transformer blocks in parallel to simultaneously extract multilevel local and global features. We then designed a sparse and deformable cross-attention module to capture the semantic dependencies between local and global features, which can bridge the semantic gap and fuse features effectively. Furthermore, we designed a feature assignment fusion module to enhance meaningful features using an adaptive feature weighting strategy to obtain more accurate segmentation. We conducted extensive experiments to evaluate the effectiveness of DB-DCAFN on a clinical dataset comprising three bacterial categories: Acinetobacter baumannii, Klebsiella pneumoniae, and Pseudomonas aeruginosa. The experi-mental results demonstrate that the proposed DB-DCAFN outperforms other state-of-the-art methods and is effective at segmenting bacteria from sputum smear images. 展开更多
关键词 Bacterial segmentation Dual-branch parallel encoder Deformable cross-attention module feature assignment fusion module
下载PDF
RF-Net: Unsupervised Low-Light Image Enhancement Based on Retinex and Exposure Fusion
4
作者 Tian Ma Chenhui Fu +2 位作者 Jiayi Yang Jiehui Zhang Chuyang Shang 《Computers, Materials & Continua》 SCIE EI 2023年第10期1103-1122,共20页
Low-light image enhancement methods have limitations in addressing issues such as color distortion,lack of vibrancy,and uneven light distribution and often require paired training data.To address these issues,we propo... Low-light image enhancement methods have limitations in addressing issues such as color distortion,lack of vibrancy,and uneven light distribution and often require paired training data.To address these issues,we propose a two-stage unsupervised low-light image enhancement algorithm called Retinex and Exposure Fusion Network(RFNet),which can overcome the problems of over-enhancement of the high dynamic range and under-enhancement of the low dynamic range in existing enhancement algorithms.This algorithm can better manage the challenges brought about by complex environments in real-world scenarios by training with unpaired low-light images and regular-light images.In the first stage,we design a multi-scale feature extraction module based on Retinex theory,capable of extracting details and structural information at different scales to generate high-quality illumination and reflection images.In the second stage,an exposure image generator is designed through the camera response mechanism function to acquire exposure images containing more dark features,and the generated images are fused with the original input images to complete the low-light image enhancement.Experiments show the effectiveness and rationality of each module designed in this paper.And the method reconstructs the details of contrast and color distribution,outperforms the current state-of-the-art methods in both qualitative and quantitative metrics,and shows excellent performance in the real world. 展开更多
关键词 Low-light image enhancement multiscale feature extraction module exposure generator exposure fusion
下载PDF
基于改进Faster R CNN的光伏组件红外热斑检测算法 被引量:1
5
作者 季瑞瑞 梅远 +5 位作者 杨思凡 骆丰凯 储小帅 张龙 王朵 李珂明 《激光与红外》 CAS CSCD 北大核心 2024年第4期584-592,共9页
光伏故障检测对光伏电站智能运维具有重要意义。针对光伏组件红外图像中热斑目标小、难检测的问题,研究了基于改进Faster R CNN的光伏组件红外热斑故障检测模型。将Swin Transformer作为Faster R CNN模型中的特征提取模块,捕获图像的全... 光伏故障检测对光伏电站智能运维具有重要意义。针对光伏组件红外图像中热斑目标小、难检测的问题,研究了基于改进Faster R CNN的光伏组件红外热斑故障检测模型。将Swin Transformer作为Faster R CNN模型中的特征提取模块,捕获图像的全局信息,建立特征之间的依赖关系,提高模型的建模能力;进一步利用BiFPN进行特征融合,改善了热斑故障由于目标小和特征不明显容易被模型忽略掉的问题;同时为了抑制光伏红外图像中背景和噪声的干扰,加入轻量级注意力模块CBAM,使模型更加关注重要通道和关键区域,提高对热斑故障检测精度。在自建光伏组件图像数据集上进行实验,热斑故障检测精度高达915,验证了本文模型对光伏组件热斑故障检测的有效性。 展开更多
关键词 光伏组件 红外图像 故障检测 Faster RCNN 特征融合
下载PDF
一种基于SAM-MSFF网络的低照度目标检测方法
6
作者 江泽涛 李慧 +3 位作者 雷晓春 朱玲红 施道权 翟丰硕 《电子学报》 EI CAS CSCD 北大核心 2024年第1期81-93,共13页
由于低照度图像具有对比度低、细节丢失严重、噪声大等缺点,现有的目标检测算法对低照度图像的检测效果不理想.为此,本文提出一种结合空间感知注意力机制和多尺度特征融合(Spatial-aware Attention Mechanism and Multi-Scale Feature F... 由于低照度图像具有对比度低、细节丢失严重、噪声大等缺点,现有的目标检测算法对低照度图像的检测效果不理想.为此,本文提出一种结合空间感知注意力机制和多尺度特征融合(Spatial-aware Attention Mechanism and Multi-Scale Feature Fusion,SAM-MSFF)的低照度目标检测方法 .该方法首先通过多尺度交互内存金字塔融合多尺度特征,增强低照度图像特征中的有效信息,并设置内存向量存储样本的特征,捕获样本之间的潜在关联性;然后,引入空间感知注意力机制获取特征在空间域的长距离上下文信息和局部信息,从而增强低照度图像中的目标特征,抑制背景信息和噪声的干扰;最后,利用多感受野增强模块扩张特征的感受野,对具有不同感受野的特征进行分组重加权计算,使检测网络根据输入的多尺度信息自适应地调整感受野的大小.在ExDark数据集上进行实验,本文方法的平均精度(mean Average Precision,mAP)达到77.04%,比现有的主流目标检测方法提高2.6%~14.34%. 展开更多
关键词 低照度图像 目标检测 空间感知注意力机制 多尺度特征融合 多感受野增强模块
下载PDF
基于残差卷积网络的多传感器融合永磁同步电机故障诊断
7
作者 邱建琪 沈佳晨 +2 位作者 史涔溦 史婷娜 李鸿杰 《电机与控制学报》 EI CSCD 北大核心 2024年第7期24-33,42,共11页
作为工业生产与日常生活的常见设备,永磁同步电机的故障诊断研究具有十分重要的意义。以永磁同步电机的匝间短路、退磁、轴承故障为诊断目标,提出一种新型的多传感器特征融合网络(MSFFN),结合多传感器融合技术与卷积神经网络实现永磁同... 作为工业生产与日常生活的常见设备,永磁同步电机的故障诊断研究具有十分重要的意义。以永磁同步电机的匝间短路、退磁、轴承故障为诊断目标,提出一种新型的多传感器特征融合网络(MSFFN),结合多传感器融合技术与卷积神经网络实现永磁同步电机的可靠故障诊断。网络采用2个带有残差模块的卷积神经网络,对输入的电流信号与振动信号并行提取隐藏特征,并设计一种中间特征融合模块(IFFM)有效融合电流和振动的各层隐藏特征,IFFM基于注意力机制对网络中的电流特征与振动特征进行筛选,自适应关注不同信号的内在相关特征,以实现更好的诊断效果。搭建了故障样机测试平台进行数据采集与实验验证,实验结果表明,提出方法具有更高的诊断准确率,同时在叠加了强噪声的条件下,具备更强的抗干扰能力。 展开更多
关键词 多传感器融合 卷积神经网络 中间特征融合模块 残差模块 永磁同步电机 故障诊断
下载PDF
基于双向加权特征融合网络的铸件内部缺陷检测方法
8
作者 王蕾 贺万山 +1 位作者 张泽琳 夏绪辉 《铸造》 CAS 2024年第6期843-851,共9页
针对X射线无损探伤过程中铸件内部缺陷小、对比度弱、人工识别效率低等问题,提出了一种基于双向加权特征融合网络的铸件内部缺陷检测方法。在YOLOv5网络模型基础上引入改进的坐标注意力模块(NCA),以提高网络对不规则缺陷和小缺陷的学习... 针对X射线无损探伤过程中铸件内部缺陷小、对比度弱、人工识别效率低等问题,提出了一种基于双向加权特征融合网络的铸件内部缺陷检测方法。在YOLOv5网络模型基础上引入改进的坐标注意力模块(NCA),以提高网络对不规则缺陷和小缺陷的学习能力;引入双向特征金字塔网络(BiFPN)代替原有路径聚合网络(PANet),以实现缺陷特征多尺度高效融合,并使用EIoU Loss回归损失函数提高缺陷边界框定位的精度。试验结果表明,本文所提方法对铸件内部小目标、弱对比度缺陷具有良好的检测性能。 展开更多
关键词 铸件 缺陷检测 深度学习 注意力模块 双向加权特征融合
下载PDF
基于高阶空间交互网络的光伏组件热斑故障检测
9
作者 郝帅 王海莹 +3 位作者 马旭 吴瑛琦 何田 李嘉豪 《太阳能学报》 EI CAS CSCD 北大核心 2024年第8期358-366,共9页
针对传统红外热斑故障检测算法由于特征表达能力不佳造成算法易受复杂背景干扰以及对密集目标、小目标故障检测精度低的问题,提出一种基于高阶空间交互的光伏组件热斑故障检测网络。首先,设计高阶空间交互模块,并将其引入YOLOv5主干网... 针对传统红外热斑故障检测算法由于特征表达能力不佳造成算法易受复杂背景干扰以及对密集目标、小目标故障检测精度低的问题,提出一种基于高阶空间交互的光伏组件热斑故障检测网络。首先,设计高阶空间交互模块,并将其引入YOLOv5主干网络进行全局交互建模,提升网络对密集目标的检测精度;其次,为突出复杂背景下故障目标的关键特征,设计基于协同注意力的特征提取模块重构颈部网络;然后,在颈部网络设计多尺度特征增强融合模块以提高检测网络对不同尺度特征的充分利用;最后,设计自适应特征融合检测头以提高模型对小目标的感知能力。实验结果表明,相较于7种经典检测算法,所提出的算法检测精度最高,精度可达84.3%。 展开更多
关键词 光伏组件 故障检测 深度学习 热斑效应 高阶空间交互 特征融合
下载PDF
复杂作业场景下的反光衣和安全帽检测方法
10
作者 谢国波 肖峰 +2 位作者 林志毅 谢建辉 吴陈锋 《安全与环境学报》 CAS CSCD 北大核心 2024年第9期3513-3521,共9页
针对现有算法在复杂的工地环境中进行反光衣和安全帽检测时存在的无法有效区分目标和背景的微小差异问题,提出了一种改进YOLOX的反光衣和安全帽检测算法。首先,将主干网络中空间金字塔池化中的最大池化替换为平均池化,减少特征图的信息... 针对现有算法在复杂的工地环境中进行反光衣和安全帽检测时存在的无法有效区分目标和背景的微小差异问题,提出了一种改进YOLOX的反光衣和安全帽检测算法。首先,将主干网络中空间金字塔池化中的最大池化替换为平均池化,减少特征图的信息损失和过拟合风险;其次,设计一种带权注意力模块(Weighted Convolutional Block Attention Module,W-CBAM)嵌入特征融合层,通过权重系数提升对特征图空间维度的关注,增强特征图的表达能力;最后,添加自适应特征融合(Adaptively Spatial Feature Fusion,ASFF)模块,解决多尺度特征融合时存在的不一致性问题。在扩充后的公开反光衣安全帽数据集的试验结果表明,所提算法精度高达98.79%,优于原始的YOLOX算法和其他先进算法,同时具有较快的检测速度,满足施工环境检测需求。 展开更多
关键词 安全工程 反光衣检测 安全帽检测 YOLOX 注意力模块 自适应特征融合
下载PDF
基于双阶段特征解耦网络的单幅图像去雨方法
11
作者 汤红忠 熊珮全 +2 位作者 王蔚 王晒雅 陈磊 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第2期273-282,共10页
针对现有的单幅图像去雨方法无法有效地平衡背景图像细节恢复与有雨分量去除问题,提出一种基于双阶段特征解耦网络的单幅图像去雨方法,采用渐进式的学习方式从粗到细分阶段进行单幅图像去雨.首先构建压缩激励残差模块,实现背景图像与有... 针对现有的单幅图像去雨方法无法有效地平衡背景图像细节恢复与有雨分量去除问题,提出一种基于双阶段特征解耦网络的单幅图像去雨方法,采用渐进式的学习方式从粗到细分阶段进行单幅图像去雨.首先构建压缩激励残差模块,实现背景图像与有雨分量的初步分离;然后设计全局特征融合模块,其中特别引入特征解耦模块分离有雨分量和背景图像的特征,实现细粒度的图像去雨;最后利用重构损失、结构相似损失、边缘感知损失和纹理一致性损失构成的复合损失函数训练网络,实现高质量的无雨图像重构.实验结果表明,在Test100合成雨图数据集上,所提方法峰值信噪比为25.57dB,结构相似性为0.89;在100幅真实雨图上,所提方法的自然图像质量评估器为3.53,无参考图像空间质量评估器为20.16;在去雨后的RefineNet目标分割任务中,平均交并比为29.41%,平均像素精度为70.06%;视觉效果上,该方法能保留更多的背景图像特征,有效地辅助下游的目标分割任务的开展. 展开更多
关键词 特征解耦网络 压缩激励残差模块 全局特征融合模块 复合损失函数 单幅图像去雨
下载PDF
基于预训练固定参数和深度特征调制的红外与可见光图像融合网络
12
作者 徐少平 周常飞 +2 位作者 肖建 陶武勇 戴田宇 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第8期3305-3313,共9页
为了更好地利用红外与可见光图像中互补的图像信息,得到符合人眼感知特性的融合图像,该文采用两阶段训练策略提出一种基于预训练固定参数和深度特征调制的红外与可见光图像融合网络(PDNet)。具体地,在自监督预训练阶段,以大量清晰的自... 为了更好地利用红外与可见光图像中互补的图像信息,得到符合人眼感知特性的融合图像,该文采用两阶段训练策略提出一种基于预训练固定参数和深度特征调制的红外与可见光图像融合网络(PDNet)。具体地,在自监督预训练阶段,以大量清晰的自然图像分别作为U型网络结构(UNet)的输入和输出,采用自编码器技术完成预训练。所获得编码器模块能有效提取输入图像的多尺度深度特征功能,而解码器模块则能将其重构为与输入图像差异极小的输出图像;在无监督融合训练阶段,将预训练编码器和解码器模块的网络参数保持固定不变,而在两者之间新增包含Transformer结构的融合模块。其中,Transformer结构中的多头自注意力机制能对编码器分别从红外和可见光图像提取到的深度特征权重进行合理分配,从而在多个尺度上将两者融合调制到自然图像深度特征的流型空间上来,进而保证融合特征经解码器重构后所获得融合图像的视觉感知效果。大量实验表明:与当前主流的融合模型(算法)相比,所提PDNet模型在多个客观评价指标方面具有显著优势,而在主观视觉评价上,也更符合人眼视觉感知特点。 展开更多
关键词 红外与可见光图像 图像融合 自监督预训练 无监督融合训练 固定参数 深度特征调制
下载PDF
基于双流自适应时空增强图卷积网络的手语识别
13
作者 金彦亮 吴筱溦 《应用科学学报》 CAS CSCD 北大核心 2024年第2期189-199,共11页
针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使... 针对提取手语特征过程中出现的信息表征能力差、信息不完整问题,设计了一种双流自适应时空增强图卷积网络(two-stream adaptive enhanced spatial temporal graph convolutional network,TAEST-GCN)实现基于孤立词的手语识别。该网络使用人体身体、手部和面部节点作为输入,构造基于人体关节和骨骼的双流结构。通过自适应时空图卷积模块生成不同部位之间的连接,并充分利用其中的位置和方向信息。同时采用残差连接方式设计自适应多尺度时空注意力模块,进一步增强该网络在空域和时域的卷积能力。将双流网络提取到的有效特征进行加权融合,可以分类输出手语词汇。最后在公开的中文手语孤立词数据集上进行实验,在100类词汇和500类词汇分类任务中准确率达到了95.57%和89.62%。 展开更多
关键词 骨架数据 双流结构 自适应时空图卷积模块 自适应多尺度时空注意力模块 特征融合
下载PDF
基于改进YOLOv5s的跌倒行为检测
14
作者 朱正林 钱予阳 +2 位作者 马辰宇 王悦炜 史腾 《计算机测量与控制》 2024年第10期26-31,38,共7页
为了实现电厂人员跌倒行为的实时检测,防止跌倒昏迷而无法被及时发现并救援的事件发生,针对跌倒行为检测实时性以及特征提取能力不足的问题,提出了一种改进YOLOv5s的跌倒行为检测算法网络:在YOLOv5s模型中引入SKAttention注意力模块,使... 为了实现电厂人员跌倒行为的实时检测,防止跌倒昏迷而无法被及时发现并救援的事件发生,针对跌倒行为检测实时性以及特征提取能力不足的问题,提出了一种改进YOLOv5s的跌倒行为检测算法网络:在YOLOv5s模型中引入SKAttention注意力模块,使得网络可以自动地利用对分类有效的感受野捕捉到的信息,这种新的深层结构允许CNN在卷积核心上执行动态选择机制,从而自适应地调整其感受野的大小;同时结合ASFF自适应空间融合,并在其中充分利用不同特征,又在算法中引入权重参数,以多层次功能为基础,实现了水下目标识别精度提升的目标;加入空间金字塔池化结构SPPFCSPC,大幅缩短了推理时间;实验结果表明,相比于原始YOLOv5s,新网络在mAP平均精度均值方面提升了2.1%,查全率提升了16%;改进后的网络在感知细节和空间建模方面更加强大,能够更准确地捕捉到人员跌倒的异常行为,检测效果有了显著提升。 展开更多
关键词 SKAttention注意力模块 卷积核 ASFF 权重参数 空间金字塔池化
下载PDF
基于双注意力机制的FMCW雷达人体行为识别
15
作者 卓智海 祝文胜 王双龙 《北京信息科技大学学报(自然科学版)》 2024年第5期58-66,共9页
为了提高调频连续波(frequency modulated continuous wave,FMCW)雷达人体行为识别的分类精度和泛化性能,提出了一种基于双注意力机制的特征融合方法。通过设置阈值,对距离-时间谱图和微多普勒谱图中的有效频谱进行提取、拼接后送入Alex... 为了提高调频连续波(frequency modulated continuous wave,FMCW)雷达人体行为识别的分类精度和泛化性能,提出了一种基于双注意力机制的特征融合方法。通过设置阈值,对距离-时间谱图和微多普勒谱图中的有效频谱进行提取、拼接后送入AlexNet和VGG16神经网络来提取特征;加入空间注意力和改进的通道注意力模块,丢弃冗余信息,以增强对重要信息的关注,获取更感兴趣的特征进行特征融合分类。实验结果表明,该方法对6种日常人体行为的平均识别准确率高达97.0%。 展开更多
关键词 调频连续波雷达 特征融合 通道注意力 空间注意力 人体行为识别
下载PDF
基于多尺度特征融合的光伏组件缺陷检测 被引量:2
16
作者 田浩 周强 贺晨龙 《计算机工程与应用》 CSCD 北大核心 2024年第3期340-347,共8页
针对光伏组件缺陷背景复杂,缺陷尺度差异较大,小目标缺陷较多等传统目标检测算法无法解决的问题,提出了一种基于多尺度特征融合的光伏组件缺陷检测算法。算法以YOLOv5s为框架,在主干网络中嵌入坐标注意力机制,用于提取重要的缺陷形态,... 针对光伏组件缺陷背景复杂,缺陷尺度差异较大,小目标缺陷较多等传统目标检测算法无法解决的问题,提出了一种基于多尺度特征融合的光伏组件缺陷检测算法。算法以YOLOv5s为框架,在主干网络中嵌入坐标注意力机制,用于提取重要的缺陷形态,增强网络特征提取能力;在颈部网络中使用双向特征金字塔,以自适应权重的方式融合不同尺度的图像特征;在预测层添加微小目标检测层,并结合ASFF检测头自适应融合不同输出层,减少目标特征信息丢失。在光伏组件数据集上进行验证,实验表明改进后的算法可以快速精准识别缺陷,其中mAP达到了91.9%,召回率达到了90.8%,相比于YOLOv5s网络,mAP和召回率分别提升了3.2、4.5个百分点。 展开更多
关键词 光伏组件 YOLOv5 缺陷检测 特征融合
下载PDF
基于弱光环境的车辆识别研究 被引量:2
17
作者 张峻祎 丁冰 丁洁 《现代电子技术》 北大核心 2024年第7期17-24,共8页
由于图像在弱光环境下具有低曝光、前景背景融合、对比度低等问题,因此难以在弱光环境下有效、实时检测图像中的目标车辆。目前为了提高检测效果,通常需要设计较为复杂的神经网络结构或建立额外的对比数据集,但这不仅降低了网络速度,也... 由于图像在弱光环境下具有低曝光、前景背景融合、对比度低等问题,因此难以在弱光环境下有效、实时检测图像中的目标车辆。目前为了提高检测效果,通常需要设计较为复杂的神经网络结构或建立额外的对比数据集,但这不仅降低了网络速度,也会提升网络训练成本。为了解决这一问题,提出一种弱光环境下的车辆识别网络,在该网络中一方面设计了特征提取模块与特征融合模块以提高网络在弱光环境下的检测能力,另一方面使用模块结构重参数化的方法以提高网络的检测速度。实验表明,该网络可在保证检测速度的同时有效地识别弱光环境下的车辆。 展开更多
关键词 弱光环境 车辆检测 神经网络 特征提取 特征融合 模块结构重参数化
下载PDF
基于改进YOLOv5s的绝缘子缺陷检测算法研究 被引量:1
18
作者 刘超 李英娜 杨莉 《陕西理工大学学报(自然科学版)》 2024年第3期26-34,共9页
绝缘子缺陷检测是智能化电网发展中关键的一步,基于计算机视觉的绝缘子缺陷检测已经被大量应用于智能巡检中,选择YOLOv5s模型作为基础网络,在保证网络运行速度的前提下提升了检测精度。首先在主干特征提取网络中加入CBAM注意力模块,以... 绝缘子缺陷检测是智能化电网发展中关键的一步,基于计算机视觉的绝缘子缺陷检测已经被大量应用于智能巡检中,选择YOLOv5s模型作为基础网络,在保证网络运行速度的前提下提升了检测精度。首先在主干特征提取网络中加入CBAM注意力模块,以增强模型的特征提取能力;其次在颈部结构采用BiFPN结构融合多尺度特征,减少特征丢失情况,以提升模型的特征融合能力;最后采用EIoU Loss作为网络回归损失的损失函数,解决了对航拍图像中各种尺度绝缘子敏感的问题,并提升网络的收敛速度。经过实验验证,在检测速度变化不大的情况下改进后的网络模型,平均精度均值(mAP)达到了94.13%,召回率(Recall)达到了84.94%,较YOLOv5s网络模型相比提升了5.71%和14.57%,同时模型的体积减小为13.5 MB,与其他改进模型相比,精度、召回率都有了明显提高,能够更好地满足实际应用的需求。 展开更多
关键词 输电线路 绝缘子缺陷检测 CBAM注意力模块 特征融合 卷积神经网络
下载PDF
融合监督注意力模块和跨阶段特征融合的图像修复改进网络 被引量:1
19
作者 黄巧玲 郑伯川 +1 位作者 丁梓成 吴泽东 《计算机应用》 CSCD 北大核心 2024年第2期572-579,共8页
非规则缺失区域的图像修复技术用途广泛但具有挑战性。针对现有修复方法对高分辨率图像可能会产生伪影、扭曲结构和模糊纹理的问题,提出一种融合监督注意力模块(SAM)和跨阶段特征融合(CSFF)的图像修复改进网络(Gconv_CS)。在Gconv的两... 非规则缺失区域的图像修复技术用途广泛但具有挑战性。针对现有修复方法对高分辨率图像可能会产生伪影、扭曲结构和模糊纹理的问题,提出一种融合监督注意力模块(SAM)和跨阶段特征融合(CSFF)的图像修复改进网络(Gconv_CS)。在Gconv的两阶段网络模型上,引入了SAM与CSFF模块。SAM通过提供真实图像监督信号,监督上阶段输出特征,确保传入下阶段特征信息的有效性。CSFF将上阶段编码器-解码器的特征融合后送入下阶段的编码器,以弥补上阶段修复中特征信息的损失。实验结果表明,在缺失区域占比为1%~10%时,相较于基线模型Gconv,Gconv_CS在CelebA-HQ数据集上峰值信噪比(PSNR)和结构相似性指数(SSIM)分别提高了1.5%和0.5%,Fréchet起始距离(FID)和L1损失分别降低了21.8%、14.8%;在Place2数据集上,前2个指标分别提高了26.7%和0.8%,后2个指标分别降低了7.9%、37.9%。将Gconv_CS用于去除大熊猫面部遮挡物时,取得了较好的修复视觉效果。 展开更多
关键词 图像修复 两阶段网络 跨阶段特征融合 监督注意力模块 门控卷积
下载PDF
基于改进YOLOX的自然环境下核桃识别算法研究
20
作者 钟正扬 云利军 +1 位作者 杨璇玺 陈载清 《河南农业科学》 北大核心 2024年第1期152-161,共10页
针对现有目标检测算法对自然环境下核桃识别存在漏检、误检等问题,提出了一种基于Swin Transformer多层特征融合改进的YOLOX-S核桃识别算法。首先,在主干特征提取网络中引入基于Swin Transformer的多层特征融合模块,借助Swin Transforme... 针对现有目标检测算法对自然环境下核桃识别存在漏检、误检等问题,提出了一种基于Swin Transformer多层特征融合改进的YOLOX-S核桃识别算法。首先,在主干特征提取网络中引入基于Swin Transformer的多层特征融合模块,借助Swin Transformer的多头注意力机制对小目标的特征信息进行提取并与特征图进行融合,可以有效解决因网络层数加深导致的高层特征图中小目标特征信息丢失问题;其次,为了提高算法的检测精度,引入更高效的Repblock模块对原网络中的CSP模块进行替换;最后,为了提高下采样效果,使用更为优秀的Transition Block模块作为主干特征提取网络的下采样模块。结果表明,改进后的YOLOX-S模型在采集的自然环境下核桃数据集上平均精度AP50达到96.72%,分别比Faster-RCNN、YOLOv5-S、YOLOX-S算法提高7.36、1.38、0.62百分点,检测速度达到46 f/s,模型参数大小为20.55 M。改进后的YOLOX-S算法具有更好的精度,改善了漏检和误检问题,对自然环境下的核桃有更好的识别效果。 展开更多
关键词 核桃识别 Swin Transformer 多层特征融合模块 YOLOX-S 深度学习
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部