期刊文献+
共找到472篇文章
< 1 2 24 >
每页显示 20 50 100
A multivariate grey incidence model for different scale data based on spatial pyramid pooling 被引量:4
1
作者 ZHANG Ke CUI Le YIN Yao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第4期770-779,共10页
In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of ... In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of multivariate time series on different scales are pooled and aggregated by spatial pyramid pooling to construct n levels feature pooling matrices on the same scale. Secondly,Deng's multivariate grey incidence model is introduced to measure the degree of incidence between feature pooling matrices at each level. Thirdly, grey incidence degrees at each level are integrated into a global incidence degree. Finally, the performance of the proposed model is verified on two data sets compared with a variety of algorithms. The results illustrate that the proposed model is more effective and efficient than other similarity measure algorithms. 展开更多
关键词 grey system spatial pyramid pooling grey incidence multivariate time series
下载PDF
IMTNet:Improved Multi-Task Copy-Move Forgery Detection Network with Feature Decoupling and Multi-Feature Pyramid
2
作者 Huan Wang Hong Wang +2 位作者 Zhongyuan Jiang Qing Qian Yong Long 《Computers, Materials & Continua》 SCIE EI 2024年第9期4603-4620,共18页
Copy-Move Forgery Detection(CMFD)is a technique that is designed to identify image tampering and locate suspicious areas.However,the practicality of the CMFD is impeded by the scarcity of datasets,inadequate quality a... Copy-Move Forgery Detection(CMFD)is a technique that is designed to identify image tampering and locate suspicious areas.However,the practicality of the CMFD is impeded by the scarcity of datasets,inadequate quality and quantity,and a narrow range of applicable tasks.These limitations significantly restrict the capacity and applicability of CMFD.To overcome the limitations of existing methods,a novel solution called IMTNet is proposed for CMFD by employing a feature decoupling approach.Firstly,this study formulates the objective task and network relationship as an optimization problem using transfer learning.Furthermore,it thoroughly discusses and analyzes the relationship between CMFD and deep network architecture by employing ResNet-50 during the optimization solving phase.Secondly,a quantitative comparison between fine-tuning and feature decoupling is conducted to evaluate the degree of similarity between the image classification and CMFD domains by the enhanced ResNet-50.Finally,suspicious regions are localized using a feature pyramid network with bottom-up path augmentation.Experimental results demonstrate that IMTNet achieves faster convergence,shorter training times,and favorable generalization performance compared to existingmethods.Moreover,it is shown that IMTNet significantly outperforms fine-tuning based approaches in terms of accuracy and F_(1). 展开更多
关键词 Image copy-move detection feature decoupling multi-scale feature pyramids passive forensics
下载PDF
Intelligent identification of oceanic eddies in remote sensing data via Dual-Pyramid UNet 被引量:1
3
作者 Nan Zhao Baoxiang Huang +2 位作者 Xinmin Zhang Linyao Ge Ge Chen 《Atmospheric and Oceanic Science Letters》 CSCD 2023年第4期29-36,共8页
海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池... 海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池化金字塔(ASPP)构造了Dual-Pyramid UNet模型,以平面异常和海表面温度数据中进行海洋涡旋的识别.实验在北大西洋和南大西洋两个涡旋活跃区域进行并选用多个评价指标对识别结果进行评价以证明模型的优异性能. 展开更多
关键词 海洋涡旋识别 深度学习 金字塔分割注意 空洞空间卷积池化金字塔 U型网络架构
下载PDF
融合注意力和扩张卷积的遥感影像道路信息提取方法 被引量:1
4
作者 肖振久 郝明 +1 位作者 曲海成 侯佳兴 《遥感信息》 CSCD 北大核心 2024年第1期18-25,共8页
针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标... 针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标注意力(coordinate attention,CA)模块,捕捉道路位置、方向和跨通道信息,精确定位道路信息。其次,针对网络对细节特征丢失的敏感问题,在编码器的末端利用不同扩张率的空洞卷积构建多尺度特征融合的空洞空间金字塔池化模块(multi-scale Atrous spatial pyramid pooling module,MASPPM)来获得更大的感受野,提高网络性能。最后,为了避免U-Net中纯跳跃连接在语义上不相似特征的融合,在编码器和解码器的跳跃连接之间增加了双通道注意力机制来实现门控筛选,抑制非目标区域的特征,提高网络的分割精度。实验在公共道路数据集Massachusetts上对网络模型进行测试,OA(准确率)、交并比(IoU)、平均交并比(mIoU)和F1等评价指标分别达到98.07%、64.39%、81.20%和88.67%。与主流方法U-Net和DDUNet进行比较,mIoU分别提升了3.07%、0.22%,IoU分别提升了1.98%、0.52%。实验结果表明,所提出的方法优于所有的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 语义分割 道路提取 注意力机制 U-Net 空洞空间金字塔池化
下载PDF
基于DeeplabV3+网络的轻量化语义分割算法
5
作者 张秀再 张昊 杨昌军 《科学技术与工程》 北大核心 2024年第24期10382-10393,共12页
针对传统语义分割模型参数量大、计算速度慢且效率不高等问题,改进一种基于DeeplabV3+网络的轻量化语义分割模型Faster-DeeplabV3+。Faster-DeeplabV3+模型采用轻量级MobilenetV2代替Xception作为主干特征提取网络,大幅减少参数量,提高... 针对传统语义分割模型参数量大、计算速度慢且效率不高等问题,改进一种基于DeeplabV3+网络的轻量化语义分割模型Faster-DeeplabV3+。Faster-DeeplabV3+模型采用轻量级MobilenetV2代替Xception作为主干特征提取网络,大幅减少参数量,提高计算速度;引入深度可分离卷积(deep separable convolution, DSC)与空洞空间金字塔(atrous spatia pyramid pooling, ASPP)中的膨胀卷积设计成新的深度可分离膨胀卷积(depthwise separable dilated convolution, DSD-Conv),即组成深度可分离空洞空间金字塔模块(DP-ASPP),扩大感受野的同时减少原本卷积参数量,提高运算速度;加入改进的双注意力机制模块分别对编码区生成的低级特征图和高级特征图进行处理,增强网络对不同维度特征信息提取的敏感性和准确性;融合使用交叉熵和Dice Loss两种损失函数,为模型提供更全面、更多样的优化。改进模型在PASCAL VOC 2012数据集上进行测试。实验结果表明:平均交并比由76.57%提升至79.07%,分割准确度由91.2%提升至94.3%。改进模型的网络参数量(params)减少了3.86×10~6,浮点计算量(GFLOPs)减少了117.98 G。因此,Faster-DeeplabV3+算法在大幅降低参数量、提高运算速度的同时保持较高语义分割效果。 展开更多
关键词 语义分割 DeeplabV3+ 轻量化 深度可分离卷积(DSC) 空洞空间金字塔池化(ASPP)
下载PDF
融合位置注意力机制与轻量化STDC网络的非结构化场景语义分割
6
作者 陈晔 杨长春 +2 位作者 杨森 王宇鹏 王彭 《计算机系统应用》 2024年第4期254-262,共9页
近年来,非结构化道路分割已成为计算机视觉领域的重要研究方向之一.现有的大多数方法适合结构化道路的分割并无法满足非结构化道路分割的准确性与实时性需求.为了解决上述问题,本文对STDC网络进行改进,引入残差连接来更好地融合多尺度... 近年来,非结构化道路分割已成为计算机视觉领域的重要研究方向之一.现有的大多数方法适合结构化道路的分割并无法满足非结构化道路分割的准确性与实时性需求.为了解决上述问题,本文对STDC网络进行改进,引入残差连接来更好地融合多尺度语义信息,还提出一种嵌入位置注意力模块的空洞空间卷积池化金字塔(PAASPP)来增强网络对道路等特定区域的位置感知能力.本文在RUGD与RELLIS-3D两个数据集上进行实验,所提出方法的MIoU在两个数据集的测试集上分别达到了50.78%和49.96%. 展开更多
关键词 非结构化环境 语义分割 PA-ASPP STDC
下载PDF
基于改进YOLOv5s算法的禁捕期长江渔船识别及应用研究
7
作者 崔秀芳 王认认 +2 位作者 林浩涛 夏霖波 韩沛霖 《海洋渔业》 CSCD 北大核心 2024年第3期371-380,共10页
长江实行十年禁渔是长江生态环境修复的关键环节,针对禁渔期间长江非法捕捞渔船目标小、背景复杂、流动大等问题,提出了一种基于改进YOLOv5s的目标检测算法。该算法优化多尺度自适应锚框模块,采用改进的K-means++聚类算法,重新匹配适合... 长江实行十年禁渔是长江生态环境修复的关键环节,针对禁渔期间长江非法捕捞渔船目标小、背景复杂、流动大等问题,提出了一种基于改进YOLOv5s的目标检测算法。该算法优化多尺度自适应锚框模块,采用改进的K-means++聚类算法,重新匹配适合长江船舶尺寸的锚框;使用轻量高效的坐标注意力(coordinate attention,CA)机制,提升模型关注目标通道信息特征的能力;采用SPPCSPPC(spatial pyramid pooling and context-aware spatial pyramid pooling combination)对特征图进行池化,提高小目标检测能力;通过构建长江船舶数据集训练得到最优权值模型。结果显示,改进后的模型在准确率、召回率、mAP0.5、mAP0.5∶0.9和原模型相比分别提高了1.5%、3.0%、2.4%、7.7%,且训练过程损失收敛更快,收敛值更低,能够准确快速识别出长江上的渔船目标。研究结果可为长江十年禁渔提供技术支持。 展开更多
关键词 目标检测 YOLOv5s 聚类算法 注意力机制 空间金字塔池化
下载PDF
基于改进Yolov3-Tiny的加油站目标检测算法研究
8
作者 张利巍 杨万帅 《吉林大学学报(信息科学版)》 CAS 2024年第3期559-566,共8页
针对加油站场景中的目标检测算法存在检测精度低的问题,提出一种基于Yolov3-Tiny的加油站场景目标检测改进算法。该算法以Yolov3-Tiny模型为基础网络,引入Yolov4算法提出的Mosaic图像增强方式进行数据预处理,采用密集连接模块重构特征... 针对加油站场景中的目标检测算法存在检测精度低的问题,提出一种基于Yolov3-Tiny的加油站场景目标检测改进算法。该算法以Yolov3-Tiny模型为基础网络,引入Yolov4算法提出的Mosaic图像增强方式进行数据预处理,采用密集连接模块重构特征提取网络,并将CBAM(Convolutional Block Attention Module)注意力模块与金字塔池化模块(Pyramid Pooling Module)加入到网络中,最终实现了加油站场景下的目标检测。实验结果表明,改进的算法相比于原算法的总体mAP提升了8.2%,能更有效地应用于加油站目标检测中。 展开更多
关键词 目标检测 密集连接模块 注意力机制 金字塔池化模块 图像增强
下载PDF
基于比例池化的RGB图像语义分割网络
9
作者 李顺新 陈飞飞 《计算机技术与发展》 2024年第8期101-107,共7页
针对传统的金字塔多级特征融合算法进行语义分割时存在的特征图有效信息弱和噪声叠加效应等问题,提出一种基于比例池化的混合注意力机制。首先在主干网络特征输出处引入比例池化注意力模块对输入特征图进行不同程度的语义信息抽取和特... 针对传统的金字塔多级特征融合算法进行语义分割时存在的特征图有效信息弱和噪声叠加效应等问题,提出一种基于比例池化的混合注意力机制。首先在主干网络特征输出处引入比例池化注意力模块对输入特征图进行不同程度的语义信息抽取和特征降噪,突出特征图有效特征信息占比,随后将不同内核的池化结果作为级联金字塔结构的输入特征,对降噪后的多尺度特征进行融合,平滑图像噪声实现特征二次降噪和小目标物体语义信息增强。实验在Pascal VOC 2012数据集上验证了该方法在分割领域上的有效性,并采用平均像素准确率(mPA)和平均交并比(mIoU)作为模型的性能评估指标。实验结果表明,基于比例池化的金字塔网络在mPA和mIoU上达到了90.19%和79.92%,优于对比的语义分割方法。 展开更多
关键词 语义分割 比例池化 金字塔结构 多尺度特征融合 特征降噪
下载PDF
引入Transformer的道路小目标检测
10
作者 李丽芬 黄如 《计算机工程与设计》 北大核心 2024年第1期95-101,共7页
针对道路场景中检测小目标时漏检率较高、检测精度低的问题,提出一种引入Transformer的道路小目标检测算法。在原YOLOv4算法基础上,对多尺度检测进行改进,把浅层特征信息充分利用起来;设计ICvT(improved convolutional vision transform... 针对道路场景中检测小目标时漏检率较高、检测精度低的问题,提出一种引入Transformer的道路小目标检测算法。在原YOLOv4算法基础上,对多尺度检测进行改进,把浅层特征信息充分利用起来;设计ICvT(improved convolutional vision transformer)模块捕获特征内部的相关性,获得上下文信息,提取更加全面丰富的特征;在网络特征融合部分嵌入改进后的空间金字塔池化模块,在保持较小计算量的同时增加特征图的感受野。实验结果表明,在KITTI数据集上,算法检测精度达到91.97%,与YOLOv4算法相比,mAP提高了2.53%,降低了小目标的漏检率。 展开更多
关键词 小目标检测 深度学习 YOLOv4算法 多尺度检测 TRANSFORMER 空间金字塔池化 特征融合
下载PDF
基于YOLOv8的气象设备识别监控算法
11
作者 王祝先 叶润泽 +4 位作者 徐翌博 凌霄 白玉 宋邦钰 杨博寓 《应用科技》 CAS 2024年第4期83-90,共8页
在人烟稀少的地区,气象设备的监测与检查面临设备安置位置偏僻、缺乏实时巡检等问题。为解决这一难题,基于在图像识别领域表现卓越的YOLOv8算法,提出了一种新的气象设备识别监控模型,通过将原有的高效的空间金字塔池化(spatial pyramid ... 在人烟稀少的地区,气象设备的监测与检查面临设备安置位置偏僻、缺乏实时巡检等问题。为解决这一难题,基于在图像识别领域表现卓越的YOLOv8算法,提出了一种新的气象设备识别监控模型,通过将原有的高效的空间金字塔池化(spatial pyramid pooling-fast,SPPF)层替换为空间金字塔池化-全连接空间金字塔卷积(spatial pyramid pooling-fully connected spatial pyramid convolution,SPPFCSPC)层,成功降低了计算量,提升了气象设备检测的速度。为了进一步提升模型在复杂环境下的性能,提出了YOLOv8-SA模型,通过在主干网络(backbone)中加入多头自注意力机制,更精准地捕获图像中不同区域之间的关联性,有力地提高了模型的准确性。为了验证模型的有效性,创建了一个专门的气象设备数据集,并进行了对比实验。实验结果表明,本文提出的YOLOv8-SA模型在检测速度和准确性方面均取得了显著的提升,在自制的数据集中检测精度为98.6%,与传统的YOLOv8模型相比,检测精度提升了0.6%。该模型可有效解决人烟稀少地区气象设备的监测问题,为提升监测系统的实用性和效率提供新思路。 展开更多
关键词 气象设备 机器学习 深度学习 图像识别 YOLOv8 YOLOv8-SA 空间金字塔池化-全连接空间金字塔卷积 多头自注意力
下载PDF
基于改进YOLOv5s的跌倒行为检测
12
作者 朱正林 钱予阳 +2 位作者 马辰宇 王悦炜 史腾 《计算机测量与控制》 2024年第10期26-31,38,共7页
为了实现电厂人员跌倒行为的实时检测,防止跌倒昏迷而无法被及时发现并救援的事件发生,针对跌倒行为检测实时性以及特征提取能力不足的问题,提出了一种改进YOLOv5s的跌倒行为检测算法网络:在YOLOv5s模型中引入SKAttention注意力模块,使... 为了实现电厂人员跌倒行为的实时检测,防止跌倒昏迷而无法被及时发现并救援的事件发生,针对跌倒行为检测实时性以及特征提取能力不足的问题,提出了一种改进YOLOv5s的跌倒行为检测算法网络:在YOLOv5s模型中引入SKAttention注意力模块,使得网络可以自动地利用对分类有效的感受野捕捉到的信息,这种新的深层结构允许CNN在卷积核心上执行动态选择机制,从而自适应地调整其感受野的大小;同时结合ASFF自适应空间融合,并在其中充分利用不同特征,又在算法中引入权重参数,以多层次功能为基础,实现了水下目标识别精度提升的目标;加入空间金字塔池化结构SPPFCSPC,大幅缩短了推理时间;实验结果表明,相比于原始YOLOv5s,新网络在mAP平均精度均值方面提升了2.1%,查全率提升了16%;改进后的网络在感知细节和空间建模方面更加强大,能够更准确地捕捉到人员跌倒的异常行为,检测效果有了显著提升。 展开更多
关键词 SKAttention注意力模块 卷积核 ASFF 权重参数 空间金字塔池化
下载PDF
基于YOLOv5的无人机视角小目标检测算法
13
作者 宋旭东 查可豪 《机电工程技术》 2024年第7期46-50,73,共6页
针对无人机视角下的小目标检测精度较差、漏检较为严重的问题,提出一种基于改进YOLOv5的无人机图像检测算法。针对小目标尺度较小问题在骨干网络替换空间金字塔池化(Spatial Pyramid Pooling,SPP)为SPPCSPC-GS,增强密集区域关注能力,提... 针对无人机视角下的小目标检测精度较差、漏检较为严重的问题,提出一种基于改进YOLOv5的无人机图像检测算法。针对小目标尺度较小问题在骨干网络替换空间金字塔池化(Spatial Pyramid Pooling,SPP)为SPPCSPC-GS,增强密集区域关注能力,提取更多小目标有效特征;在颈部网络中引入CBAM注意力机制将头部C3模块替换为C3CBAM增强上下文信息,提高空间与通道特征表达能力;针对遮挡问题引入柔性非极大值抑制(Soft Non Maximum Suppression,Soft NMS)提升模型对遮挡和密集目标的检测能力;替换损失函数为EIOU加快收敛提升定位效果。改进后的模型在VisDrone数据集上平均检测精度为42.2%,相较于原始YOLOv5s算法提升10.7%,遮挡严重的小目标行人与人类别精度分别上升12%与13.3%。相较于其他先进算法,所提算法表现优秀,可以满足无人机视角图像检测任务要求。 展开更多
关键词 小目标检测 空间金字塔池化 注意力机制 柔性非极大值抑制 损失函数
下载PDF
改进YOLOv5s的弱光水下生物目标检测算法 被引量:6
14
作者 陈宇梁 董绍江 +1 位作者 孙世政 闫凯波 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期499-507,共9页
针对水下光学图像目标检测过程中由于水中光线衰弱严重、图像环境复杂和拍摄设备移动等造成的生物识别精度低的问题,提出了基于改进YOLOv5s的弱光水下生物目标实时检测算法YOLOv5s-underwater。针对弱光水下光线衰弱的问题,引入了限制... 针对水下光学图像目标检测过程中由于水中光线衰弱严重、图像环境复杂和拍摄设备移动等造成的生物识别精度低的问题,提出了基于改进YOLOv5s的弱光水下生物目标实时检测算法YOLOv5s-underwater。针对弱光水下光线衰弱的问题,引入了限制对比度自适应直方图均衡(CLAHE)算法对输入图像进行预处理,解决了颜色失真和图像毛糙的问题。针对复杂的弱光水下图像环境,提出了快速空间金字塔池化(SPPF)模块,解决了水下物体区分度低和特征损失严重的问题。针对拍摄设备移动带来的场景和形态变化问题,提出了一种基于旋转窗口的Swin-Transformer模块,提高了模型的泛化能力。针对水下小目标,修改了网络模型结构,提高了小目标的检测能力。仿真和实验结果表明:所提算法相较于YOLOv5s检测精度提高30.7%,证明了算法的有效性。 展开更多
关键词 弱光水下生物目标 YOLOv5s 限制对比度自适应直方图均衡 快速空间金字塔池化 旋转窗口
下载PDF
CIEFRNet:面向高速公路的抛洒物检测算法 被引量:1
15
作者 李旭 宋焕生 +3 位作者 史勤 张朝阳 刘泽东 孙士杰 《计算机工程与应用》 CSCD 北大核心 2024年第5期336-346,共11页
高速公路抛洒物危及行车安全,极易诱发交通事故,及时识别并清理高速公路抛洒物十分重要。由于高速公路抛洒物在图像中面积占比小且图像背景复杂,现有检测方法常出现漏检和误检的情况。针对上述问题,提出了一种基于上下文信息增强和特征... 高速公路抛洒物危及行车安全,极易诱发交通事故,及时识别并清理高速公路抛洒物十分重要。由于高速公路抛洒物在图像中面积占比小且图像背景复杂,现有检测方法常出现漏检和误检的情况。针对上述问题,提出了一种基于上下文信息增强和特征提纯的抛洒物检测算法,记为CIEFRNet。设计了一种融合上下文Transformer的主干特征提取模块(CSP-COT),充分挖掘局部静态上下文信息和全局动态上下文信息,增强小抛洒物的特征表示;主干网络中使用改进的空间金字塔池化(ISPP),通过级联的空洞卷积实现特征的多尺度下采样,减轻目标细节信息的损失;为提高特征融合能力,设计了特征提纯模块(CNAB),其中嵌入了提出的一种混合注意力机制(ECSA),可抑制图像背景噪声,强化微小抛洒物的特征;引入基于动态非单调聚焦机制的WIoU优化损失函数,提高小抛洒物学习能力,加速网络收敛。实验结果表明,所提方法在自制的高速公路抛洒物数据集上的精确率、召回率、AP0.5和AP0.5:0.95分别达到96.5%、81.6%、88.1%和46.5%,优于当前主流的目标检测方法,其算法复杂度也更低,满足实际场景应用需要。 展开更多
关键词 抛洒物检测 上下文信息 空间金字塔池化 注意力机制 损失函数
下载PDF
基于PCSA-YOLOv7 Former的输电线路连接金具及其锈蚀检测方法 被引量:1
16
作者 宋智伟 黄新波 +2 位作者 纪超 张凡 张烨 《中国电力》 CSCD 北大核心 2024年第6期141-152,共12页
输电线路分布情况复杂且故障难以有效检测,其中连接金具长期暴露于复杂环境下易受到恶劣环境的影响出现锈蚀等故障。针对输电线路连接金具部件具有尺度多样性和存在着锈蚀故障检测精度低的问题,提出了一种基于双重注意力嵌入重构和Swin ... 输电线路分布情况复杂且故障难以有效检测,其中连接金具长期暴露于复杂环境下易受到恶劣环境的影响出现锈蚀等故障。针对输电线路连接金具部件具有尺度多样性和存在着锈蚀故障检测精度低的问题,提出了一种基于双重注意力嵌入重构和Swin Transformer的输电线路连接金具组件及其锈蚀故障检测方法:PCSA-YOLOv7 Former。实验结果表明:该方法在构建的TLCF数据集上的综合检测性能领先于12类当前先进的目标检测算法,其中在测试集上的mAP_(0.5)达到94.9%,该方法相比于基线模型YOLOv7,其F1和mAP0.5指标分别提升了2.6个百分点和2.2个百分点,说明该方法能够更全面地理解输电线路连接金具图像中的多尺度语义信息并学习到不易区分的微小细节表征。 展开更多
关键词 输电线路连接金具 PCSA-YOLOv7 Former 双重注意力嵌入 Swin Transformer 空洞空间金字塔池化
下载PDF
结合通道交互空间组注意力与金字塔池化的高分影像语义分割网络 被引量:2
17
作者 汪超宇 杜震洪 汪愿愿 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2024年第2期131-142,152,共13页
高空间分辨率(高分)遥感影像中存在海量信息,因此对高分影像的语义分割研究十分重要。传统机器学习方法的语义分割精度和效率均不高,近年来,深度学习方法迅速发展,逐渐成为影像语义分割领域的常用方法,已有研究将SegNet、Deeplabv3+、U-... 高空间分辨率(高分)遥感影像中存在海量信息,因此对高分影像的语义分割研究十分重要。传统机器学习方法的语义分割精度和效率均不高,近年来,深度学习方法迅速发展,逐渐成为影像语义分割领域的常用方法,已有研究将SegNet、Deeplabv3+、U-Net等神经网络引入遥感影像语义分割,但效果有限。考虑高分影像的特性,对用于遥感影像语义分割的U-Net网络进行了改进。首先,在U-Net网络特征提取过程中使用通道交互空间组注意力模块(channel interaction and spatial group attention module,CISGAM),使得网络能够获取更多有效特征。其次,在编码过程中将普通卷积层变换为残差模块,并在U-Net的编码器和解码器之间用加入了CISGAM的注意力金字塔池化模块(attention pyramid pooling module,APPM)连接,以加强网络对多尺度特征的提取。最后,在0.3 m分辨率的UC Merced数据集和1 m分辨率的GID数据集上进行实验,与U-Net、Deeplabv3+等原始网络相比,在UC Merced数据集上的平均交并比(mean intersection over union,MIoU)分别提升了14.56%和8.72%,平均像素准确率(mean pixel accuracy,MPA)分别提升了12.71%和8.24%。在GID数据集的分割结果中,水体、建筑物等地物的综合分割精度大幅提升,在平均分割精度上,CISGAM和APPM较常用的CBAM和PPM有一定提升。实验结果表明,加入CISGAM和APPM的网络可行性与鲁棒性均较传统网络强,其较强的特征提取能力有利于提升高分辨率遥感影像语义分割的精度,为高分辨率遥感影像智能解译提供新方案。 展开更多
关键词 高分辨率遥感影像 深度学习 语义分割 注意力机制 金字塔池化
下载PDF
健身行为的人体姿态估计及动作识别 被引量:2
18
作者 付惠琛 高军伟 车鲁阳 《液晶与显示》 CAS CSCD 北大核心 2024年第2期217-227,共11页
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法... 人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。 展开更多
关键词 图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化
下载PDF
交叉特征融合和RASPP驱动的场景分割方法 被引量:1
19
作者 朱新杰 熊风光 +2 位作者 谢帅康 宋宁栋 李文清 《计算机系统应用》 2024年第1期76-86,共11页
本文针对场景中目标多样性和尺度不统一等现象造成的边缘分割错误、特征不连续问题,提出了一种交叉特征融合和RASPP驱动的场景分割方法.该方法以交叉特征融合的方式合并编码器输出的多尺度特征,在融合高层语义信息时使用复合卷积注意力... 本文针对场景中目标多样性和尺度不统一等现象造成的边缘分割错误、特征不连续问题,提出了一种交叉特征融合和RASPP驱动的场景分割方法.该方法以交叉特征融合的方式合并编码器输出的多尺度特征,在融合高层语义信息时使用复合卷积注意力模块进行处理,避免上采样操作造成的特征信息丢失以及引入噪声的影响,细化目标边缘分割效果.同时提出了深度可分离残差卷积,在此基础上设计并实现了结合残差的金字塔池化模块——RASPP,对交叉融合后的特征进行处理,获得不同尺度的上下文信息,增强特征语义表达.最后,将RASPP模块处理后的特征进行合并,提升分割效果.在Cityscapes和CamVid数据集上的实验结果表明,本文提出方法相比现有方法具有更好的表现,并且对场景中的目标边缘有更好的分割效果. 展开更多
关键词 语义分割 交叉特征融合 金字塔池化 注意力机制 深度可分离卷积
下载PDF
食道病灶检测的多尺度细节增强金字塔网络
20
作者 李驰 周颖玥 +4 位作者 姚韩敏 李小霞 秦佳敏 庄鸣 文黎明 《计算机工程与应用》 CSCD 北大核心 2024年第4期229-236,共8页
针对食道卢戈染色内窥镜(Lugol’s chromoendoscopy,LCE)检查图像中病变类间相似度高和类内尺度变化大等问题,提出了一种以Sparse R-CNN作为基底网络并搭载多尺度细节增强金字塔网络(multi-scale detail enhancement pyramid network,MD... 针对食道卢戈染色内窥镜(Lugol’s chromoendoscopy,LCE)检查图像中病变类间相似度高和类内尺度变化大等问题,提出了一种以Sparse R-CNN作为基底网络并搭载多尺度细节增强金字塔网络(multi-scale detail enhancement pyramid network,MDEPN)结构的多类食道病灶检测方法。为了改善Sparse R-CNN中的特征金字塔网络(feature pyramid network,FPN)结构在对多尺度特征进行融合时存在的信息丢失和语义差异问题,MDEPN结构首先使用Gabor调制卷积模块对不同尺度特征进行增强,利用Gabor对方向和尺度的强关注度提高了特征图中纹理信息的表达能力;其次使用方向通道池化模块提取不同尺度特征的局部特征方向相似性和局部与全局特征的相关性,减轻了不同尺度特征融合时的语义差异。在自建的多类食道LCE病灶数据集上进行测试,结果表明该方法的mAP0.50检测精度达到了65.0%,相同条件下,比基准模型Sparse R-CNN提升了2.4个百分点,并超过了对比的其余主流检测方法。所设计的MDEPN模块可作为一种独立的结构融入其他检测模型中以提升性能,具有一定的通用性。 展开更多
关键词 食道病变检测 金字塔网络 Gabor调制卷积 方向通道池化
下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部