期刊文献+
共找到533篇文章
< 1 2 27 >
每页显示 20 50 100
Deep neural network based on multi-level wavelet and attention for structured illumination microscopy
1
作者 Yanwei Zhang Song Lang +2 位作者 Xuan Cao Hanqing Zheng Yan Gong 《Journal of Innovative Optical Health Sciences》 SCIE EI CSCD 2024年第2期12-23,共12页
Structured illumination microscopy(SIM)is a popular and powerful super-resolution(SR)technique in biomedical research.However,the conventional reconstruction algorithm for SIM heavily relies on the accurate prior know... Structured illumination microscopy(SIM)is a popular and powerful super-resolution(SR)technique in biomedical research.However,the conventional reconstruction algorithm for SIM heavily relies on the accurate prior knowledge of illumination patterns and signal-to-noise ratio(SNR)of raw images.To obtain high-quality SR images,several raw images need to be captured under high fluorescence level,which further restricts SIM’s temporal resolution and its applications.Deep learning(DL)is a data-driven technology that has been used to expand the limits of optical microscopy.In this study,we propose a deep neural network based on multi-level wavelet and attention mechanism(MWAM)for SIM.Our results show that the MWAM network can extract high-frequency information contained in SIM raw images and accurately integrate it into the output image,resulting in superior SR images compared to those generated using wide-field images as input data.We also demonstrate that the number of SIM raw images can be reduced to three,with one image in each illumination orientation,to achieve the optimal tradeoff between temporal and spatial resolution.Furthermore,our MWAM network exhibits superior reconstruction ability on low-SNR images compared to conventional SIM algorithms.We have also analyzed the adaptability of this network on other biological samples and successfully applied the pretrained model to other SIM systems. 展开更多
关键词 Super-resolution reconstruction multi-level wavelet packet transform residual channel attention selective kernel attention
下载PDF
Scheme Based on Multi-Level Patch Attention and Lesion Localization for Diabetic Retinopathy Grading
2
作者 Zhuoqun Xia Hangyu Hu +4 位作者 Wenjing Li Qisheng Jiang Lan Pu Yicong Shu Arun Kumar Sangaiah 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第7期409-430,共22页
Early screening of diabetes retinopathy(DR)plays an important role in preventing irreversible blindness.Existing research has failed to fully explore effective DR lesion information in fundus maps.Besides,traditional ... Early screening of diabetes retinopathy(DR)plays an important role in preventing irreversible blindness.Existing research has failed to fully explore effective DR lesion information in fundus maps.Besides,traditional attention schemes have not considered the impact of lesion type differences on grading,resulting in unreasonable extraction of important lesion features.Therefore,this paper proposes a DR diagnosis scheme that integrates a multi-level patch attention generator(MPAG)and a lesion localization module(LLM).Firstly,MPAGis used to predict patches of different sizes and generate a weighted attention map based on the prediction score and the types of lesions contained in the patches,fully considering the impact of lesion type differences on grading,solving the problem that the attention maps of lesions cannot be further refined and then adapted to the final DR diagnosis task.Secondly,the LLM generates a global attention map based on localization.Finally,the weighted attention map and global attention map are weighted with the fundus map to fully explore effective DR lesion information and increase the attention of the classification network to lesion details.This paper demonstrates the effectiveness of the proposed method through extensive experiments on the public DDR dataset,obtaining an accuracy of 0.8064. 展开更多
关键词 DDR dataset diabetic retinopathy lesion localization multi-level patch attention mechanism
下载PDF
Two-Layer Attention Feature Pyramid Network for Small Object Detection
3
作者 Sheng Xiang Junhao Ma +2 位作者 Qunli Shang Xianbao Wang Defu Chen 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第10期713-731,共19页
Effective small object detection is crucial in various applications including urban intelligent transportation and pedestrian detection.However,small objects are difficult to detect accurately because they contain les... Effective small object detection is crucial in various applications including urban intelligent transportation and pedestrian detection.However,small objects are difficult to detect accurately because they contain less information.Many current methods,particularly those based on Feature Pyramid Network(FPN),address this challenge by leveraging multi-scale feature fusion.However,existing FPN-based methods often suffer from inadequate feature fusion due to varying resolutions across different layers,leading to suboptimal small object detection.To address this problem,we propose the Two-layerAttention Feature Pyramid Network(TA-FPN),featuring two key modules:the Two-layer Attention Module(TAM)and the Small Object Detail Enhancement Module(SODEM).TAM uses the attention module to make the network more focused on the semantic information of the object and fuse it to the lower layer,so that each layer contains similar semantic information,to alleviate the problem of small object information being submerged due to semantic gaps between different layers.At the same time,SODEM is introduced to strengthen the local features of the object,suppress background noise,enhance the information details of the small object,and fuse the enhanced features to other feature layers to ensure that each layer is rich in small object information,to improve small object detection accuracy.Our extensive experiments on challenging datasets such as Microsoft Common Objects inContext(MSCOCO)and Pattern Analysis Statistical Modelling and Computational Learning,Visual Object Classes(PASCAL VOC)demonstrate the validity of the proposedmethod.Experimental results show a significant improvement in small object detection accuracy compared to state-of-theart detectors. 展开更多
关键词 Small object detection two-layer attention module small object detail enhancement module feature pyramid network
下载PDF
Intelligent identification of oceanic eddies in remote sensing data via Dual-Pyramid UNet
4
作者 Nan Zhao Baoxiang Huang +2 位作者 Xinmin Zhang Linyao Ge Ge Chen 《Atmospheric and Oceanic Science Letters》 CSCD 2023年第4期29-36,共8页
海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池... 海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池化金字塔(ASPP)构造了Dual-Pyramid UNet模型,以平面异常和海表面温度数据中进行海洋涡旋的识别.实验在北大西洋和南大西洋两个涡旋活跃区域进行并选用多个评价指标对识别结果进行评价以证明模型的优异性能. 展开更多
关键词 海洋涡旋识别 深度学习 金字塔分割注意 空洞空间卷积池化金字塔 U型网络架构
下载PDF
基于跨模态注意力融合的煤炭异物检测方法 被引量:1
5
作者 曹现刚 李虎 +3 位作者 王鹏 吴旭东 向敬芳 丁文韬 《工矿自动化》 CSCD 北大核心 2024年第1期57-65,共9页
为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采... 为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采用浅层的特征提取策略提取Depth图像的低级特征,用深度边缘与深度纹理等基础特征辅助RGB图像深层特征,以有效获得2种特征的互补信息,从而丰富异物特征的空间与边缘信息,提高检测精度;构建了基于坐标注意力与改进空间注意力的跨模态注意力融合模块(CAFM),以协同优化并融合RGB特征与Depth特征,增强网络对特征图中被遮挡异物可见部分的关注度,提高被遮挡异物检测精度;使用区域卷积神经网络(R-CNN)输出煤炭异物的分类、回归与分割结果。实验结果表明:在检测精度方面,该方法的AP相较两阶段模型中较优的Mask transfiner高3.9%;在检测效率方面,该方法的单帧检测时间为110.5 ms,能够满足异物检测实时性需求。基于跨模态注意力融合的煤炭异物检测方法能够以空间特征辅助色彩、形状与纹理等特征,准确识别煤炭异物之间及煤炭异物与输送带之间的差异,从而有效提高对复杂特征异物的检测精度,减少误检、漏检现象,实现复杂特征下煤炭异物的精确检测与像素级分割。 展开更多
关键词 煤炭异物检测 实例分割 双特征金字塔网络 跨模态注意力融合 Depth图像 坐标注意力 改进空间注意力
下载PDF
融合多维特征的街景图像语义分割方法
6
作者 朱磊 车晨洁 +2 位作者 姚同钰 潘杨 张博 《液晶与显示》 CAS CSCD 北大核心 2024年第7期980-989,共10页
为进一步提升深度学习语义分割方法在复杂街景图像上的分割精度,本文基于PointRend网络提出了一种融合多维特征(Multi-Dimensional Features,MDF)的街景图像语义分割网络(MDFNet)。首先,通过构建目标区域增强模块优化特征提取子网络,在... 为进一步提升深度学习语义分割方法在复杂街景图像上的分割精度,本文基于PointRend网络提出了一种融合多维特征(Multi-Dimensional Features,MDF)的街景图像语义分割网络(MDFNet)。首先,通过构建目标区域增强模块优化特征提取子网络,在深度网络的每个卷积块自适应地细化中间特征图,从而强化对复杂街景图像多维特征信息的精细提取;接着,在特征融合时引入特征金字塔网格,使用不同的卷积核处理不同尺度的街景图像,从而更加全面地获取复杂街景图像各类目标的不同分辨率特征;最后,使用双解码头对图像细节进行更细致的恢复,得到逐像素分类的结果。实验结果表明,本文网络与DeepLabV3、SegFormer等其他优秀分割网络相比,在Cityscapes复杂街景数据集上分割精度更高,平均交并比达到了80.11%,相比于其他网络提升了3.51%以上,对复杂街景图像的理解力更强。 展开更多
关键词 语义分割 目标区域增强 注意力机制 特征金字塔网格 多维特征
下载PDF
基于YOLOv5s和超声图像的儿童肠套叠特征检测模型
7
作者 陈星 俞凯 +2 位作者 袁贞明 黄坚 李哲明 《杭州师范大学学报(自然科学版)》 CAS 2024年第1期10-19,共10页
为帮助医生快速寻找到儿童腹部超声中肠套叠的病变特征并实现肠套叠超声诊后数据的快速质检,文章将目标检测算法应用于儿童腹部超声图像检测肠套叠“同心圆”征.首先探索了基于YOLOv5s的儿童肠套叠检测模型,发现该模型检测肠套叠“同心... 为帮助医生快速寻找到儿童腹部超声中肠套叠的病变特征并实现肠套叠超声诊后数据的快速质检,文章将目标检测算法应用于儿童腹部超声图像检测肠套叠“同心圆”征.首先探索了基于YOLOv5s的儿童肠套叠检测模型,发现该模型检测肠套叠“同心圆”征的精确度、召回率、F 1分数、mAP@0.5、FPS以及参数量等方面均优于Faster RCNN.进一步,为解决肉眼难以观察的“同心圆”征的检测问题,使用双向特征金字塔网络,并将注意力机制加入YOLOv5s网络,形成基于YOLOv5s_BiFPN_SE框架的儿童肠套叠“同心圆”征检测模型.该模型检测的精确率、召回率、F 1分数、mAP@0.5分别达到了91.33%、90.73%、91.03%、88.77%,性能更优于YOLOv5s. 展开更多
关键词 目标检测 肠套叠 超声图像 “同心圆”征 双向特征金字塔网络 注意力机制
下载PDF
基于改进Faster R-CNN的苹果采摘视觉定位与检测方法
8
作者 李翠明 杨柯 +1 位作者 申涛 尚拯宇 《农业机械学报》 EI CAS CSCD 北大核心 2024年第1期47-54,共8页
针对采摘机器人对场景中目标分布密集、果实相互遮挡的检测及定位能力不理想问题,提出一种引入高效通道注意力机制(ECA)和多尺度融合特征金字塔(FPN)改进Faster R-CNN果实检测及定位方法。首先,利用表达能力较强的融合FPN的残差网络ResN... 针对采摘机器人对场景中目标分布密集、果实相互遮挡的检测及定位能力不理想问题,提出一种引入高效通道注意力机制(ECA)和多尺度融合特征金字塔(FPN)改进Faster R-CNN果实检测及定位方法。首先,利用表达能力较强的融合FPN的残差网络ResNet50替换原VGG16网络,消除了网络退化问题,进而提取更加抽象和丰富的语义信息,提升模型对多尺度和小目标的检测能力;其次,引入注意力机制ECA模块,使特征提取网络聚焦特征图像的局部高效信息,减少无效目标的干扰,提升模型检测精度;最后,采用一种枝叶插图数据增强方法改进苹果数据集,解决图像数据不足问题。基于构建的数据集,使用遗传算法优化K-means++聚类生成自适应锚框,提高模型定位准确性。试验结果表明,改进模型对可抓取和不可直接抓取苹果的精度均值分别为96.16%和86.95%,平均精度均值为92.79%,较传统Faster R-CNN提升15.68个百分点;对可抓取和不可直接抓取的苹果定位精度分别为97.14%和88.93%,较传统Faster R-CNN分别提高12.53个百分点和40.49个百分点;内存占用量减少38.20%,每帧平均计算时间缩短40.7%,改进后的模型参数量小且实时性好,能够更好地应用于果实采摘机器人视觉系统。 展开更多
关键词 苹果采摘机器人 目标定位与检测 Faster R-CNN 注意力机制 特征金字塔
下载PDF
融合注意力和扩张卷积的遥感影像道路信息提取方法
9
作者 肖振久 郝明 +1 位作者 曲海成 侯佳兴 《遥感信息》 CSCD 北大核心 2024年第1期18-25,共8页
针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标... 针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标注意力(coordinate attention,CA)模块,捕捉道路位置、方向和跨通道信息,精确定位道路信息。其次,针对网络对细节特征丢失的敏感问题,在编码器的末端利用不同扩张率的空洞卷积构建多尺度特征融合的空洞空间金字塔池化模块(multi-scale Atrous spatial pyramid pooling module,MASPPM)来获得更大的感受野,提高网络性能。最后,为了避免U-Net中纯跳跃连接在语义上不相似特征的融合,在编码器和解码器的跳跃连接之间增加了双通道注意力机制来实现门控筛选,抑制非目标区域的特征,提高网络的分割精度。实验在公共道路数据集Massachusetts上对网络模型进行测试,OA(准确率)、交并比(IoU)、平均交并比(mIoU)和F1等评价指标分别达到98.07%、64.39%、81.20%和88.67%。与主流方法U-Net和DDUNet进行比较,mIoU分别提升了3.07%、0.22%,IoU分别提升了1.98%、0.52%。实验结果表明,所提出的方法优于所有的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 语义分割 道路提取 注意力机制 U-Net 空洞空间金字塔池化
下载PDF
基于改进YOLOv5s的轻量级绝缘子缺失检测
10
作者 池小波 张伟杰 +1 位作者 贾新春 续泽晋 《测试技术学报》 2024年第1期19-26,共8页
针对现有绝缘子缺失检测模型计算复杂度高和小目标难以检测等问题,提出一种基于改进的YOLOv5s轻量级检测模型。首先,移除主干网络中的C3模块来减少模型的参数量。其次,在多尺度特征融合网络中引入卷积块注意力机制来提高复杂背景下模型... 针对现有绝缘子缺失检测模型计算复杂度高和小目标难以检测等问题,提出一种基于改进的YOLOv5s轻量级检测模型。首先,移除主干网络中的C3模块来减少模型的参数量。其次,在多尺度特征融合网络中引入卷积块注意力机制来提高复杂背景下模型的特征提取能力。同时,采用加权双向特征金字塔网络结构对特征进行双向跨尺度加权融合,提升网络在遮挡物、相似目标干扰下目标的检测性能。最后,选用SIoU损失函数提升网络的收敛速度和检测精度。实验结果表明,所提模型的平均精准率为96.8%,浮点运算数为2.8 GFLOPS,而原始YOLOv5s在保证97.4%的平均精准率下的浮点运算数为16.3 GFLOPS。相较于原始模型,所提模型对小目标、遮挡目标以及模糊等场景有着较强的鲁棒性,且在保证近似检测精度的同时极大减少了计算量。 展开更多
关键词 绝缘子检测 YOLOv5s模型 卷积块注意力机制 加权双向特征金字塔网络 轻量化网络
下载PDF
基于金字塔注意力机制的遥感图像超分辨率网络
11
作者 段锦 李豪 +1 位作者 祝勇 莫苏新 《吉林大学学报(信息科学版)》 CAS 2024年第3期446-456,共11页
针对超分辨率算法重建的遥感图像细节等信息丢失的问题,为保证遥感重建图像包含较多的纹理、高频信息,在生成对抗网络基础上提出一种基于金字塔注意力机制的遥感图像超分辨率网络。设计了一种全新的金字塔双重注意力模块,包括通道注意... 针对超分辨率算法重建的遥感图像细节等信息丢失的问题,为保证遥感重建图像包含较多的纹理、高频信息,在生成对抗网络基础上提出一种基于金字塔注意力机制的遥感图像超分辨率网络。设计了一种全新的金字塔双重注意力模块,包括通道注意力网络和空间注意力网络。通道注意力网络中采用金字塔池化取代平均池化和最大池化,该结构设计从全局和局部信息角度出发增强特征表述能力;空间注意力网络则采用大尺度卷积,以加强局部信息的提取程度,可有效提取纹理、高频等信息。设计密集多尺度特征模块,利用非对称卷积提取不同尺度的特征信息,通过密集连接融合多层级尺度特征以加强纹理、高频等信息的提取精度。在公开的NWPU-RESISC45数据集上进行实验验证,实验结果分析表明,该算法在主观视觉效果和客观评价指标上均优于对比方法,重建性能相对较好。 展开更多
关键词 遥感图像 超分辨率 金字塔双重注意力 密集多尺度特征 非对称卷积
下载PDF
基于改进DeepLabv3+网络的沥青道路裂缝检测方法
12
作者 陈昌川 郝晓严 +1 位作者 龙虹毓 孙霞 《半导体光电》 CAS 北大核心 2024年第3期493-500,共8页
针对传统的语义分割技术对于沥青道路裂缝的检测存在检测精度低、误差大的问题,提出了一个基于改进DeepLabv3+网络的语义分割方法。该方法在编码器阶段,采用轻量级MobileNetv2取代DeepLabv3+的主干网络Xception,从而减少参数量;在解码... 针对传统的语义分割技术对于沥青道路裂缝的检测存在检测精度低、误差大的问题,提出了一个基于改进DeepLabv3+网络的语义分割方法。该方法在编码器阶段,采用轻量级MobileNetv2取代DeepLabv3+的主干网络Xception,从而减少参数量;在解码器阶段,引入双注意力机制以进一步提高网络的分割精度;使用Dice Loss函数与原始交叉熵损失函数混合,以缓解样本中前景和背景不平衡问题。最后以道路实时检测的数据为对象进行了大量的实验,结果表明,该方法与原始DeepLabv3+相比,平均交并比(mIoU)、平均像素精度(mPA)分别提升了8.98%和17.39%。与其他主流语义分割模型相比,改进后的DeepLabv3+在沥青道路裂缝的检测上也取得了较好的效果。 展开更多
关键词 图像分割 DeepLabv3+ 注意力机制 特征金字塔
下载PDF
基于改进YOLOv5s算法的禁捕期长江渔船识别及应用研究
13
作者 崔秀芳 王认认 +2 位作者 林浩涛 夏霖波 韩沛霖 《海洋渔业》 CSCD 北大核心 2024年第3期371-380,共10页
长江实行十年禁渔是长江生态环境修复的关键环节,针对禁渔期间长江非法捕捞渔船目标小、背景复杂、流动大等问题,提出了一种基于改进YOLOv5s的目标检测算法。该算法优化多尺度自适应锚框模块,采用改进的K-means++聚类算法,重新匹配适合... 长江实行十年禁渔是长江生态环境修复的关键环节,针对禁渔期间长江非法捕捞渔船目标小、背景复杂、流动大等问题,提出了一种基于改进YOLOv5s的目标检测算法。该算法优化多尺度自适应锚框模块,采用改进的K-means++聚类算法,重新匹配适合长江船舶尺寸的锚框;使用轻量高效的坐标注意力(coordinate attention,CA)机制,提升模型关注目标通道信息特征的能力;采用SPPCSPPC(spatial pyramid pooling and context-aware spatial pyramid pooling combination)对特征图进行池化,提高小目标检测能力;通过构建长江船舶数据集训练得到最优权值模型。结果显示,改进后的模型在准确率、召回率、mAP0.5、mAP0.5∶0.9和原模型相比分别提高了1.5%、3.0%、2.4%、7.7%,且训练过程损失收敛更快,收敛值更低,能够准确快速识别出长江上的渔船目标。研究结果可为长江十年禁渔提供技术支持。 展开更多
关键词 目标检测 YOLOv5s 聚类算法 注意力机制 空间金字塔池化
下载PDF
小样本下基于改进度量学习的轨面状态识别
14
作者 于惠钧 彭慈兵 +2 位作者 刘建华 张锦圣 刘丽丽 《计算机与现代化》 2024年第6期89-94,102,共7页
为解决小样本下轨面状态识别过程中存在的关键特征信息提取不充分、区分度信息易丢失的问题,提出一种基于改进度量学习的轨面状态识别方法。该方法在特征提取网络部分引入金字塔拆分注意力机制,实现特征图空间信息多尺度提取、跨维度通... 为解决小样本下轨面状态识别过程中存在的关键特征信息提取不充分、区分度信息易丢失的问题,提出一种基于改进度量学习的轨面状态识别方法。该方法在特征提取网络部分引入金字塔拆分注意力机制,实现特征图空间信息多尺度提取、跨维度通道注意力与空间注意力特征交互,以解决轨面状态样本少导致的关键特征信息提取不充分的问题。利用深度局部拼接符对查询集与各类支撑集特征图进行局部特征两两拼接,代替传统度量学习的全局特征拼接,筛选背景等干扰信息,较大程度地保留有显著区分度的特征信息。在自建小样本轨面状态数据集上进行性能验证,并与常规小样本学习方法进行对比实验,实验结果表明,本文方法能够有效识别轨面状态,识别准确率、精度、召回率、F1值分别达到97.96%、98.61%、98.07%、98.34%,相比于性能较好的小样本学习方法 DN4网络,各项指标分别提升了5.75个百分点、5.83个百分点、5.95个百分点、5.89个百分点。 展开更多
关键词 轨面状态识别 小样本 度量学习 金字塔拆分注意力 深度局部拼接
下载PDF
融合位置注意力机制与轻量化STDC网络的非结构化场景语义分割
15
作者 陈晔 杨长春 +2 位作者 杨森 王宇鹏 王彭 《计算机系统应用》 2024年第4期254-262,共9页
近年来,非结构化道路分割已成为计算机视觉领域的重要研究方向之一.现有的大多数方法适合结构化道路的分割并无法满足非结构化道路分割的准确性与实时性需求.为了解决上述问题,本文对STDC网络进行改进,引入残差连接来更好地融合多尺度... 近年来,非结构化道路分割已成为计算机视觉领域的重要研究方向之一.现有的大多数方法适合结构化道路的分割并无法满足非结构化道路分割的准确性与实时性需求.为了解决上述问题,本文对STDC网络进行改进,引入残差连接来更好地融合多尺度语义信息,还提出一种嵌入位置注意力模块的空洞空间卷积池化金字塔(PAASPP)来增强网络对道路等特定区域的位置感知能力.本文在RUGD与RELLIS-3D两个数据集上进行实验,所提出方法的MIoU在两个数据集的测试集上分别达到了50.78%和49.96%. 展开更多
关键词 非结构化环境 语义分割 PA-ASPP STDC
下载PDF
基于双支路卷积网络的步态识别方法
16
作者 王晓路 千王菲 《计算机应用》 CSCD 北大核心 2024年第6期1965-1971,共7页
针对步态识别易受拍摄视角、外观变化等影响的问题,提出一种基于双支路卷积网络的步态识别方法。首先,提出随机裁剪随机遮挡的数据增强方法RRDA(Restricted Random Data Augmentation),以扩展外观变化的数据样本,提高模型遮挡的鲁棒性;... 针对步态识别易受拍摄视角、外观变化等影响的问题,提出一种基于双支路卷积网络的步态识别方法。首先,提出随机裁剪随机遮挡的数据增强方法RRDA(Restricted Random Data Augmentation),以扩展外观变化的数据样本,提高模型遮挡的鲁棒性;其次,采用结合注意力机制的两路复合卷积层(C-Conv)提取步态特征,一个分支通过水平金字塔映射(HPM)提取行人外观全局和最具辨识度的信息;另一分支通过多个并行的微动作捕捉模块(MCM)提取短时间的步态时空信息;最后,将两个分支的特征信息相加融合,再通过全连接层实现步态识别。基于平衡样本特征的区分能力和模型的收敛性构造联合损失函数,以加速模型的收敛。在CASIA-B步态数据集上进行实验,所提方法在3种行走状态下的平均识别率分别达到97.40%、93.67%和81.19%,均高于GaitSet方法、CapsNet方法、双流步态方法和GaitPart方法;在正常行走状态下比GaitSet方法的识别准确率提升了1.30个百分点,在携带背包状态下提升了2.87个百分点,在穿着外套状态下提升了10.89个百分点。实验结果表明,所提方法是可行、有效的。 展开更多
关键词 步态识别 双支路卷积网络 注意力机制 金字塔映射 深度学习
下载PDF
结合注意力和多路径融合的实时肺结节检测算法
17
作者 赵奎 仇慧琪 +1 位作者 李旭 徐知非 《计算机应用》 CSCD 北大核心 2024年第3期945-952,共8页
现有单阶段目标检测算法在肺结节检测中结节检出不敏感,卷积神经网络(CNN)在特征提取时多次上采样导致微小结节特征提取困难、检测效果差,并且现存肺结节检测算法模型复杂,不利于实际应用部署落地。针对上述问题,提出一种结合注意力机... 现有单阶段目标检测算法在肺结节检测中结节检出不敏感,卷积神经网络(CNN)在特征提取时多次上采样导致微小结节特征提取困难、检测效果差,并且现存肺结节检测算法模型复杂,不利于实际应用部署落地。针对上述问题,提出一种结合注意力机制和多路径融合的实时肺结节检测算法,并在此基础上改进上采样算法,提升肺部结节的检测精度和模型推理速度,且模型的权重小容易部署。首先,在特征提取的主干网络部分融合通道和空间的混合注意力机制;其次,改进采样算法,提高生成特征图的质量;最后在加强特征提取网络部分,在不同路径之间建立通道,实现深层和浅层特征的融合,将不同尺度的语义和位置信息融合。在LUNA16数据集的实验结果表明,相较于原始YOLOv5s算法,所提算法的精确率、敏感度和平均精度分别提升9.5、6.9和8.7个百分点,帧率达到131.6 frame/s,模型权重文件仅有14.2 MB,表明了所提算法可以实时检测肺结节,并且精度远高于YOLOv3和YOLOv8等现有单阶段检测算法。 展开更多
关键词 深度学习 肺结节检测 注意力机制 上采样算法 双向特征金字塔
下载PDF
基于改进Yolov3-Tiny的加油站目标检测算法研究
18
作者 张利巍 杨万帅 《吉林大学学报(信息科学版)》 CAS 2024年第3期559-566,共8页
针对加油站场景中的目标检测算法存在检测精度低的问题,提出一种基于Yolov3-Tiny的加油站场景目标检测改进算法。该算法以Yolov3-Tiny模型为基础网络,引入Yolov4算法提出的Mosaic图像增强方式进行数据预处理,采用密集连接模块重构特征... 针对加油站场景中的目标检测算法存在检测精度低的问题,提出一种基于Yolov3-Tiny的加油站场景目标检测改进算法。该算法以Yolov3-Tiny模型为基础网络,引入Yolov4算法提出的Mosaic图像增强方式进行数据预处理,采用密集连接模块重构特征提取网络,并将CBAM(Convolutional Block Attention Module)注意力模块与金字塔池化模块(Pyramid Pooling Module)加入到网络中,最终实现了加油站场景下的目标检测。实验结果表明,改进的算法相比于原算法的总体mAP提升了8.2%,能更有效地应用于加油站目标检测中。 展开更多
关键词 目标检测 密集连接模块 注意力机制 金字塔池化模块 图像增强
下载PDF
基于YOLOv8的气象设备识别监控算法
19
作者 王祝先 叶润泽 +4 位作者 徐翌博 凌霄 白玉 宋邦钰 杨博寓 《应用科技》 CAS 2024年第4期83-90,共8页
在人烟稀少的地区,气象设备的监测与检查面临设备安置位置偏僻、缺乏实时巡检等问题。为解决这一难题,基于在图像识别领域表现卓越的YOLOv8算法,提出了一种新的气象设备识别监控模型,通过将原有的高效的空间金字塔池化(spatial pyramid ... 在人烟稀少的地区,气象设备的监测与检查面临设备安置位置偏僻、缺乏实时巡检等问题。为解决这一难题,基于在图像识别领域表现卓越的YOLOv8算法,提出了一种新的气象设备识别监控模型,通过将原有的高效的空间金字塔池化(spatial pyramid pooling-fast,SPPF)层替换为空间金字塔池化-全连接空间金字塔卷积(spatial pyramid pooling-fully connected spatial pyramid convolution,SPPFCSPC)层,成功降低了计算量,提升了气象设备检测的速度。为了进一步提升模型在复杂环境下的性能,提出了YOLOv8-SA模型,通过在主干网络(backbone)中加入多头自注意力机制,更精准地捕获图像中不同区域之间的关联性,有力地提高了模型的准确性。为了验证模型的有效性,创建了一个专门的气象设备数据集,并进行了对比实验。实验结果表明,本文提出的YOLOv8-SA模型在检测速度和准确性方面均取得了显著的提升,在自制的数据集中检测精度为98.6%,与传统的YOLOv8模型相比,检测精度提升了0.6%。该模型可有效解决人烟稀少地区气象设备的监测问题,为提升监测系统的实用性和效率提供新思路。 展开更多
关键词 气象设备 机器学习 深度学习 图像识别 YOLOv8 YOLOv8-SA 空间金字塔池化-全连接空间金字塔卷积 多头自注意力
下载PDF
多尺度特征金字塔融合的街景图像语义分割
20
作者 曲海成 王莹 +1 位作者 董康龙 刘万军 《计算机系统应用》 2024年第3期73-84,共12页
针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失... 针对街景图像语义分割任务中的目标尺寸差异大、多尺度特征难以高效提取的问题,本文提出了一种语义分割网络(LDPANet).首先,将空洞卷积与引入残差学习单元的深度可分离卷积结合,来优化编码器结构,在降低了计算复杂度的同时缓解梯度消失的问题.然后利用层传递的迭代空洞空间金字塔,将自顶向下的特征信息依次融合,提高了上下文信息的有效交互能力;在多尺度特征融合之后引入属性注意力模块,使网络抑制冗余信息,强化重要特征.再者,以通道扩展上采样代替双线插值上采样作为解码器,进一步提升了特征图的分辨率.最后,LDPANet方法在Cityscapes和CamVid数据集上的精度分别达到了91.8%和87.52%,与近几年网络模型相比,本文网络模型可以精确地提取像素的位置信息以及空间维度信息,提高了语义分割的准确率. 展开更多
关键词 语义分割 MDSDC IDCP-LC 属性注意力 通道扩展上采样 特征融合
下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部