期刊文献+
共找到483篇文章
< 1 2 25 >
每页显示 20 50 100
A multivariate grey incidence model for different scale data based on spatial pyramid pooling 被引量:4
1
作者 ZHANG Ke CUI Le YIN Yao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第4期770-779,共10页
In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of ... In order to solve the problem that existing multivariate grey incidence models cannot be applied to time series on different scales, a new model is proposed based on spatial pyramid pooling.Firstly, local features of multivariate time series on different scales are pooled and aggregated by spatial pyramid pooling to construct n levels feature pooling matrices on the same scale. Secondly,Deng's multivariate grey incidence model is introduced to measure the degree of incidence between feature pooling matrices at each level. Thirdly, grey incidence degrees at each level are integrated into a global incidence degree. Finally, the performance of the proposed model is verified on two data sets compared with a variety of algorithms. The results illustrate that the proposed model is more effective and efficient than other similarity measure algorithms. 展开更多
关键词 grey system spatial pyramid pooling grey incidence multivariate time series
下载PDF
基于多尺度融合金字塔焦点网络的接触网零部件检测
2
作者 朱新宇 崔浩锐 宋洋 《工程科学学报》 EI 北大核心 2025年第2期315-327,共13页
作为高铁牵引供电系统的重要组成部分,接触网系统承担着向动车组传输电能的重要功能.实际工程运营表明,受弓网交互产生的持续冲击以及外部环境的影响,接触网支撑部件可能会出现“松、脱、断、裂”等缺陷,导致接触网结构可靠性下降,严重... 作为高铁牵引供电系统的重要组成部分,接触网系统承担着向动车组传输电能的重要功能.实际工程运营表明,受弓网交互产生的持续冲击以及外部环境的影响,接触网支撑部件可能会出现“松、脱、断、裂”等缺陷,导致接触网结构可靠性下降,严重影响接触网系统稳定运行.因此,及时精确定位接触网支撑部件(CSCs),对保障高铁安全运行和完善接触网检修维护策略具有重大意义.然而,CSCs的检测通常面临着零部件种类多、尺度差异大、部分零部件微小的问题.针对以上问题,本文提出一种基于多尺度融合金字塔焦点网络的接触网零部件检测算法,将平衡模块和特征金字塔模块相结合,提高对小目标的检测性能.首先,设计了可分离残差金字塔聚合模块(SRPAM),用于优化模型多尺度特征提取能力、扩大感受野,缓解CSCs检测的多尺度问题;其次,设计了一种基于平衡特征金字塔的路径聚合网络(PA-BFPN),用于提升跨层特征融合效率和小目标检测性能.最后,通过对比试验、可视化实验和消融实验证明了所提方法的有效性和优越性.其中,所提的MFPFCOS在CSCs数据集上的检测精度(mAP)能够在达到48.6%的同时,实现30的FLOPs(Floating point operations per second),表明所提方法能够在检测精度和检测速度之间保持良好的平衡. 展开更多
关键词 深度学习 目标检测 接触网支撑组件(CSCs) 路径聚合特征金字塔(PA-FPN) 空洞空间卷积池化金字塔(ASPP)
下载PDF
融合多尺度特征注意力的双目立体匹配算法
3
作者 张嫡 李泽平 +1 位作者 赵勇 杨文帮 《计算机工程与设计》 北大核心 2025年第1期30-36,共7页
针对现有的立体匹配算法在反光、反射、纹理模糊、纹理复杂边缘等区域推理精度不高的问题,提出一种融合多尺度特征注意力的立体匹配网络。采用改进的金字塔池化模块,将金字塔池化结合U型架构,加强边缘区域有效特征信息的提取;在网络中... 针对现有的立体匹配算法在反光、反射、纹理模糊、纹理复杂边缘等区域推理精度不高的问题,提出一种融合多尺度特征注意力的立体匹配网络。采用改进的金字塔池化模块,将金字塔池化结合U型架构,加强边缘区域有效特征信息的提取;在网络中引入多尺度特征融合的注意力模块,融合多尺度代价体和注意力机制增强代价体中不同层次信息量,同时捕获在不同维度间的信息依赖关系,抑制代价体中无关信息;采用多阶段的视差精化得到最终的视差图。实验结果表明,MFANet预测的精度相比基准网络GwcNet在SceneFlow、KITTI 2012和KITTI 2015分别提高了18.8%、11.6%、12%。 展开更多
关键词 深度学习 立体匹配 双目视觉 特征提取 多尺度特征注意力 改进金字塔池化 视差优化
下载PDF
复杂场景下基于深度学习与多传感器融合的无人机配网巡检智能避障技术
4
作者 廖红兵 况松陵 +3 位作者 李扬帆 黄晓露 王刚 魏洪 《测绘通报》 北大核心 2025年第1期22-28,共7页
在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融... 在电力配网的巡检过程中,复杂的环境条件,如树木遮挡和随机性障碍物,常常导致无人机在执行任务时遇到悬停、撞机等问题,严重影响巡检效率和安全性。为应对这一挑战,本文提出了一种针对复杂场景下的无人机自动巡检智能避障技术,开发了融合激光雷达和机器视觉的环境感知系统,通过利用空洞空间金字塔池化结构增大卷积核的感受野,捕获多尺度信息对障碍物进行实时识别,并利用先进的路径规划算法动态调整无人机的飞行路径,以避开障碍物。仿真测试验证表明,该系统在复杂环境中的避障能力得到显著提高,巡检效率提升了20%以上,且有效降低了事故风险。本文所提出的智能避障技术为电力配网的无人机巡检提供了一种高效、安全的解决方案,具备广泛的应用价值和推广前景。 展开更多
关键词 无人机 空洞空间金字塔池化 避障能力 路径规划
下载PDF
Intelligent identification of oceanic eddies in remote sensing data via Dual-Pyramid UNet 被引量:1
5
作者 Nan Zhao Baoxiang Huang +2 位作者 Xinmin Zhang Linyao Ge Ge Chen 《Atmospheric and Oceanic Science Letters》 CSCD 2023年第4期29-36,共8页
海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池... 海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池化金字塔(ASPP)构造了Dual-Pyramid UNet模型,以平面异常和海表面温度数据中进行海洋涡旋的识别.实验在北大西洋和南大西洋两个涡旋活跃区域进行并选用多个评价指标对识别结果进行评价以证明模型的优异性能. 展开更多
关键词 海洋涡旋识别 深度学习 金字塔分割注意 空洞空间卷积池化金字塔 U型网络架构
下载PDF
融合注意力和扩张卷积的遥感影像道路信息提取方法 被引量:1
6
作者 肖振久 郝明 +1 位作者 曲海成 侯佳兴 《遥感信息》 CSCD 北大核心 2024年第1期18-25,共8页
针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标... 针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标注意力(coordinate attention,CA)模块,捕捉道路位置、方向和跨通道信息,精确定位道路信息。其次,针对网络对细节特征丢失的敏感问题,在编码器的末端利用不同扩张率的空洞卷积构建多尺度特征融合的空洞空间金字塔池化模块(multi-scale Atrous spatial pyramid pooling module,MASPPM)来获得更大的感受野,提高网络性能。最后,为了避免U-Net中纯跳跃连接在语义上不相似特征的融合,在编码器和解码器的跳跃连接之间增加了双通道注意力机制来实现门控筛选,抑制非目标区域的特征,提高网络的分割精度。实验在公共道路数据集Massachusetts上对网络模型进行测试,OA(准确率)、交并比(IoU)、平均交并比(mIoU)和F1等评价指标分别达到98.07%、64.39%、81.20%和88.67%。与主流方法U-Net和DDUNet进行比较,mIoU分别提升了3.07%、0.22%,IoU分别提升了1.98%、0.52%。实验结果表明,所提出的方法优于所有的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 语义分割 道路提取 注意力机制 U-Net 空洞空间金字塔池化
下载PDF
引入Transformer的道路小目标检测 被引量:1
7
作者 李丽芬 黄如 《计算机工程与设计》 北大核心 2024年第1期95-101,共7页
针对道路场景中检测小目标时漏检率较高、检测精度低的问题,提出一种引入Transformer的道路小目标检测算法。在原YOLOv4算法基础上,对多尺度检测进行改进,把浅层特征信息充分利用起来;设计ICvT(improved convolutional vision transform... 针对道路场景中检测小目标时漏检率较高、检测精度低的问题,提出一种引入Transformer的道路小目标检测算法。在原YOLOv4算法基础上,对多尺度检测进行改进,把浅层特征信息充分利用起来;设计ICvT(improved convolutional vision transformer)模块捕获特征内部的相关性,获得上下文信息,提取更加全面丰富的特征;在网络特征融合部分嵌入改进后的空间金字塔池化模块,在保持较小计算量的同时增加特征图的感受野。实验结果表明,在KITTI数据集上,算法检测精度达到91.97%,与YOLOv4算法相比,mAP提高了2.53%,降低了小目标的漏检率。 展开更多
关键词 小目标检测 深度学习 YOLOv4算法 多尺度检测 TRANSFORMER 空间金字塔池化 特征融合
下载PDF
基于YOLOv8的气象设备识别监控算法 被引量:1
8
作者 王祝先 叶润泽 +4 位作者 徐翌博 凌霄 白玉 宋邦钰 杨博寓 《应用科技》 CAS 2024年第4期83-90,共8页
在人烟稀少的地区,气象设备的监测与检查面临设备安置位置偏僻、缺乏实时巡检等问题。为解决这一难题,基于在图像识别领域表现卓越的YOLOv8算法,提出了一种新的气象设备识别监控模型,通过将原有的高效的空间金字塔池化(spatial pyramid ... 在人烟稀少的地区,气象设备的监测与检查面临设备安置位置偏僻、缺乏实时巡检等问题。为解决这一难题,基于在图像识别领域表现卓越的YOLOv8算法,提出了一种新的气象设备识别监控模型,通过将原有的高效的空间金字塔池化(spatial pyramid pooling-fast,SPPF)层替换为空间金字塔池化-全连接空间金字塔卷积(spatial pyramid pooling-fully connected spatial pyramid convolution,SPPFCSPC)层,成功降低了计算量,提升了气象设备检测的速度。为了进一步提升模型在复杂环境下的性能,提出了YOLOv8-SA模型,通过在主干网络(backbone)中加入多头自注意力机制,更精准地捕获图像中不同区域之间的关联性,有力地提高了模型的准确性。为了验证模型的有效性,创建了一个专门的气象设备数据集,并进行了对比实验。实验结果表明,本文提出的YOLOv8-SA模型在检测速度和准确性方面均取得了显著的提升,在自制的数据集中检测精度为98.6%,与传统的YOLOv8模型相比,检测精度提升了0.6%。该模型可有效解决人烟稀少地区气象设备的监测问题,为提升监测系统的实用性和效率提供新思路。 展开更多
关键词 气象设备 机器学习 深度学习 图像识别 YOLOv8 YOLOv8-SA 空间金字塔池化-全连接空间金字塔卷积 多头自注意力
下载PDF
结合Segformer与增强特征金字塔的文本检测方法
9
作者 张铭泉 张泽恩 +1 位作者 曹锦纲 邵绪强 《智能系统学报》 CSCD 北大核心 2024年第5期1111-1125,共15页
针对自然场景文本检测算法中的小尺度文本漏检、类文本像素误检以及边缘定位不准确的问题,提出一种基于Segformer和增强特征金字塔的文本检测模型。该模型首先采用基于混合Transformer(mix Trans-former,MiT)的编码器生成多尺度特征图;... 针对自然场景文本检测算法中的小尺度文本漏检、类文本像素误检以及边缘定位不准确的问题,提出一种基于Segformer和增强特征金字塔的文本检测模型。该模型首先采用基于混合Transformer(mix Trans-former,MiT)的编码器生成多尺度特征图;然后,在具有特征金字塔结构解码器的上采样部分,提出级联融合注意力模块,通过全局平均池化、全局最大池化和Ghost模块获取全局通道信息并保留文本特征;接着,在解码器的特征融合部分提出两级正交融合注意力模块,利用非对称卷积分别从水平和垂直方向进行信息增强;最后,利用可微分二值化对结果进行后处理。将本文方法在ICDAR2015、ShopSign1265和MTWI 3个数据集上进行实验,相比于其他8种方法,本文方法的F值均为最优,分别达到了87.8%、59.1%和74.8%。结果表明,本文方法有效提高了文本检测的准确率。 展开更多
关键词 文本检测 特征金字塔 注意力机制 Segformer Ghost模块 多尺度特征融合 平均池化 最大池化
下载PDF
基于DeeplabV3+网络的轻量化语义分割算法
10
作者 张秀再 张昊 杨昌军 《科学技术与工程》 北大核心 2024年第24期10382-10393,共12页
针对传统语义分割模型参数量大、计算速度慢且效率不高等问题,改进一种基于DeeplabV3+网络的轻量化语义分割模型Faster-DeeplabV3+。Faster-DeeplabV3+模型采用轻量级MobilenetV2代替Xception作为主干特征提取网络,大幅减少参数量,提高... 针对传统语义分割模型参数量大、计算速度慢且效率不高等问题,改进一种基于DeeplabV3+网络的轻量化语义分割模型Faster-DeeplabV3+。Faster-DeeplabV3+模型采用轻量级MobilenetV2代替Xception作为主干特征提取网络,大幅减少参数量,提高计算速度;引入深度可分离卷积(deep separable convolution, DSC)与空洞空间金字塔(atrous spatia pyramid pooling, ASPP)中的膨胀卷积设计成新的深度可分离膨胀卷积(depthwise separable dilated convolution, DSD-Conv),即组成深度可分离空洞空间金字塔模块(DP-ASPP),扩大感受野的同时减少原本卷积参数量,提高运算速度;加入改进的双注意力机制模块分别对编码区生成的低级特征图和高级特征图进行处理,增强网络对不同维度特征信息提取的敏感性和准确性;融合使用交叉熵和Dice Loss两种损失函数,为模型提供更全面、更多样的优化。改进模型在PASCAL VOC 2012数据集上进行测试。实验结果表明:平均交并比由76.57%提升至79.07%,分割准确度由91.2%提升至94.3%。改进模型的网络参数量(params)减少了3.86×10~6,浮点计算量(GFLOPs)减少了117.98 G。因此,Faster-DeeplabV3+算法在大幅降低参数量、提高运算速度的同时保持较高语义分割效果。 展开更多
关键词 语义分割 DeeplabV3+ 轻量化 深度可分离卷积(DSC) 空洞空间金字塔池化(ASPP)
下载PDF
深度残差频率自适应的DEM超分辨重建
11
作者 李智杰 米德源 +2 位作者 李昌华 张颉 董玮 《计算机系统应用》 2024年第12期123-130,共8页
目前超分辨率重建技术运用于诸多场景,但对于数字高程模型(digital elevation model,DEM)的重建存在许多挑战,针对无法充分利用DEM复杂地形特征导致的细节缺失和失真问题,提出了深度残差频率自适应的DEM超分辨重建模型,由多个高低频特... 目前超分辨率重建技术运用于诸多场景,但对于数字高程模型(digital elevation model,DEM)的重建存在许多挑战,针对无法充分利用DEM复杂地形特征导致的细节缺失和失真问题,提出了深度残差频率自适应的DEM超分辨重建模型,由多个高低频特征提取模块组成残差网络结构,提升对DEM特征的整体感知能力,并加入频率选择特征提取模块,增强对复杂地形特征的识别和捕捉能力,其次在模型中加入了空洞空间金字塔池化,通过融合多尺度信息,改善重建质量并充分保留地形特征的细节和结构,最终在梯度域和高度域双重约束下完成超分辨率重建.实验结果表明,在以两种精度的陕西秦岭高程图作为实验数据下,深度残差频率自适应DEM超分辨率模型相较于其他先进模型,在各个指标上均取得了提升,重建后的DEM细节更加丰富、纹理更加清晰. 展开更多
关键词 数字高程模型 残差网络 空洞空间金字塔池化 超分辨率重建
下载PDF
融合位置注意力机制与轻量化STDC网络的非结构化场景语义分割
12
作者 陈晔 杨长春 +2 位作者 杨森 王宇鹏 王彭 《计算机系统应用》 2024年第4期254-262,共9页
近年来,非结构化道路分割已成为计算机视觉领域的重要研究方向之一.现有的大多数方法适合结构化道路的分割并无法满足非结构化道路分割的准确性与实时性需求.为了解决上述问题,本文对STDC网络进行改进,引入残差连接来更好地融合多尺度... 近年来,非结构化道路分割已成为计算机视觉领域的重要研究方向之一.现有的大多数方法适合结构化道路的分割并无法满足非结构化道路分割的准确性与实时性需求.为了解决上述问题,本文对STDC网络进行改进,引入残差连接来更好地融合多尺度语义信息,还提出一种嵌入位置注意力模块的空洞空间卷积池化金字塔(PAASPP)来增强网络对道路等特定区域的位置感知能力.本文在RUGD与RELLIS-3D两个数据集上进行实验,所提出方法的MIoU在两个数据集的测试集上分别达到了50.78%和49.96%. 展开更多
关键词 非结构化环境 语义分割 PA-ASPP STDC
下载PDF
基于改进YOLOv5s算法的禁捕期长江渔船识别及应用研究
13
作者 崔秀芳 王认认 +2 位作者 林浩涛 夏霖波 韩沛霖 《海洋渔业》 CSCD 北大核心 2024年第3期371-380,共10页
长江实行十年禁渔是长江生态环境修复的关键环节,针对禁渔期间长江非法捕捞渔船目标小、背景复杂、流动大等问题,提出了一种基于改进YOLOv5s的目标检测算法。该算法优化多尺度自适应锚框模块,采用改进的K-means++聚类算法,重新匹配适合... 长江实行十年禁渔是长江生态环境修复的关键环节,针对禁渔期间长江非法捕捞渔船目标小、背景复杂、流动大等问题,提出了一种基于改进YOLOv5s的目标检测算法。该算法优化多尺度自适应锚框模块,采用改进的K-means++聚类算法,重新匹配适合长江船舶尺寸的锚框;使用轻量高效的坐标注意力(coordinate attention,CA)机制,提升模型关注目标通道信息特征的能力;采用SPPCSPPC(spatial pyramid pooling and context-aware spatial pyramid pooling combination)对特征图进行池化,提高小目标检测能力;通过构建长江船舶数据集训练得到最优权值模型。结果显示,改进后的模型在准确率、召回率、mAP0.5、mAP0.5∶0.9和原模型相比分别提高了1.5%、3.0%、2.4%、7.7%,且训练过程损失收敛更快,收敛值更低,能够准确快速识别出长江上的渔船目标。研究结果可为长江十年禁渔提供技术支持。 展开更多
关键词 目标检测 YOLOv5s 聚类算法 注意力机制 空间金字塔池化
下载PDF
基于改进Yolov3-Tiny的加油站目标检测算法研究
14
作者 张利巍 杨万帅 《吉林大学学报(信息科学版)》 CAS 2024年第3期559-566,共8页
针对加油站场景中的目标检测算法存在检测精度低的问题,提出一种基于Yolov3-Tiny的加油站场景目标检测改进算法。该算法以Yolov3-Tiny模型为基础网络,引入Yolov4算法提出的Mosaic图像增强方式进行数据预处理,采用密集连接模块重构特征... 针对加油站场景中的目标检测算法存在检测精度低的问题,提出一种基于Yolov3-Tiny的加油站场景目标检测改进算法。该算法以Yolov3-Tiny模型为基础网络,引入Yolov4算法提出的Mosaic图像增强方式进行数据预处理,采用密集连接模块重构特征提取网络,并将CBAM(Convolutional Block Attention Module)注意力模块与金字塔池化模块(Pyramid Pooling Module)加入到网络中,最终实现了加油站场景下的目标检测。实验结果表明,改进的算法相比于原算法的总体mAP提升了8.2%,能更有效地应用于加油站目标检测中。 展开更多
关键词 目标检测 密集连接模块 注意力机制 金字塔池化模块 图像增强
下载PDF
基于比例池化的RGB图像语义分割网络
15
作者 李顺新 陈飞飞 《计算机技术与发展》 2024年第8期101-107,共7页
针对传统的金字塔多级特征融合算法进行语义分割时存在的特征图有效信息弱和噪声叠加效应等问题,提出一种基于比例池化的混合注意力机制。首先在主干网络特征输出处引入比例池化注意力模块对输入特征图进行不同程度的语义信息抽取和特... 针对传统的金字塔多级特征融合算法进行语义分割时存在的特征图有效信息弱和噪声叠加效应等问题,提出一种基于比例池化的混合注意力机制。首先在主干网络特征输出处引入比例池化注意力模块对输入特征图进行不同程度的语义信息抽取和特征降噪,突出特征图有效特征信息占比,随后将不同内核的池化结果作为级联金字塔结构的输入特征,对降噪后的多尺度特征进行融合,平滑图像噪声实现特征二次降噪和小目标物体语义信息增强。实验在Pascal VOC 2012数据集上验证了该方法在分割领域上的有效性,并采用平均像素准确率(mPA)和平均交并比(mIoU)作为模型的性能评估指标。实验结果表明,基于比例池化的金字塔网络在mPA和mIoU上达到了90.19%和79.92%,优于对比的语义分割方法。 展开更多
关键词 语义分割 比例池化 金字塔结构 多尺度特征融合 特征降噪
下载PDF
结合残差与双注意力机制的U-Net语音增强方法
16
作者 许春冬 王磊 +2 位作者 胡菁兰 闵源 徐锦武 《计算机工程与设计》 北大核心 2024年第11期3383-3389,共7页
针对U-Net语音增强网络深层特征提取能力不足,以及编解码过程中特征信息丢失问题,提出一种结合残差与双注意力机制的DA-Res-Unet语音增强方法。将U-Net编解码部分设计为残差结构来深化网络,增强深层特征提取能力;在网络结构中构造双注... 针对U-Net语音增强网络深层特征提取能力不足,以及编解码过程中特征信息丢失问题,提出一种结合残差与双注意力机制的DA-Res-Unet语音增强方法。将U-Net编解码部分设计为残差结构来深化网络,增强深层特征提取能力;在网络结构中构造双注意力机制,减少时频特征提取中的细节信息丢失;在网络中融入空洞空间金字塔池化结构,在低参数量情况下融合不同尺度上下文背景信息,提高模型特征捕获能力。实验结果表明,DA-Res-Unet网络模型在可见噪声测试集上的PESQ、STOI和LSD这3种评测指标取得了不同程度的提升,在未知噪声测试集上具备一定优势。 展开更多
关键词 语音增强 深度学习 残差网络 特征提取 编解码结构 注意力机制 空洞空间池化金字塔
下载PDF
基于YOLOv8n的航拍图像小目标检测算法
17
作者 齐向明 严萍萍 姜亮 《计算机工程与应用》 CSCD 北大核心 2024年第24期200-210,共11页
针对航拍图像小目标检测中存在目标密集和相互遮挡问题,提出一种基于YOLOv8n的航拍图像小目标检测算法。在主干网络末段,置换C2f中Bottleneck为改进后的FasterNet,保持通道数并提升收敛速度;替换SPPF中CBS激活函数SiLU为ReLU使输入负值... 针对航拍图像小目标检测中存在目标密集和相互遮挡问题,提出一种基于YOLOv8n的航拍图像小目标检测算法。在主干网络末段,置换C2f中Bottleneck为改进后的FasterNet,保持通道数并提升收敛速度;替换SPPF中CBS激活函数SiLU为ReLU使输入负值置零,在CBS后引入SE注意力机制扩张感受野,保留更多小目标特征。输出端检测头前嵌入高效多尺度注意力机制EMA获取更多细节信息,进一步提高小目标关注度。将基线网络损失函数CIoU替换成Wise IoU,提供增益分配策略,专注普通质量锚框,提高网络泛化能力。在数据集VisDrone2021和RSOD上做消融实验和对比实验,相较于基线算法,mAP@0.5分别提升5.1和7.2个百分点,mAP@0.5:0.95分别提升4.4和2.1个百分点,表明检测精度指标显著提升;在公开数据集VOC2007+2012上做泛化实验,mAP@0.5提升3.8个百分点,表明具有良好的鲁棒性。 展开更多
关键词 航拍图像 小目标检测 YOLOv8n FasterNet SPPF模块 高效多尺度注意力机制(EMA) Wise IoU
下载PDF
基于改进YOLOv5s的跌倒行为检测
18
作者 朱正林 钱予阳 +2 位作者 马辰宇 王悦炜 史腾 《计算机测量与控制》 2024年第10期26-31,38,共7页
为了实现电厂人员跌倒行为的实时检测,防止跌倒昏迷而无法被及时发现并救援的事件发生,针对跌倒行为检测实时性以及特征提取能力不足的问题,提出了一种改进YOLOv5s的跌倒行为检测算法网络:在YOLOv5s模型中引入SKAttention注意力模块,使... 为了实现电厂人员跌倒行为的实时检测,防止跌倒昏迷而无法被及时发现并救援的事件发生,针对跌倒行为检测实时性以及特征提取能力不足的问题,提出了一种改进YOLOv5s的跌倒行为检测算法网络:在YOLOv5s模型中引入SKAttention注意力模块,使得网络可以自动地利用对分类有效的感受野捕捉到的信息,这种新的深层结构允许CNN在卷积核心上执行动态选择机制,从而自适应地调整其感受野的大小;同时结合ASFF自适应空间融合,并在其中充分利用不同特征,又在算法中引入权重参数,以多层次功能为基础,实现了水下目标识别精度提升的目标;加入空间金字塔池化结构SPPFCSPC,大幅缩短了推理时间;实验结果表明,相比于原始YOLOv5s,新网络在mAP平均精度均值方面提升了2.1%,查全率提升了16%;改进后的网络在感知细节和空间建模方面更加强大,能够更准确地捕捉到人员跌倒的异常行为,检测效果有了显著提升。 展开更多
关键词 SKAttention注意力模块 卷积核 ASFF 权重参数 空间金字塔池化
下载PDF
基于YOLOv5的无人机视角小目标检测算法
19
作者 宋旭东 查可豪 《机电工程技术》 2024年第7期46-50,73,共6页
针对无人机视角下的小目标检测精度较差、漏检较为严重的问题,提出一种基于改进YOLOv5的无人机图像检测算法。针对小目标尺度较小问题在骨干网络替换空间金字塔池化(Spatial Pyramid Pooling,SPP)为SPPCSPC-GS,增强密集区域关注能力,提... 针对无人机视角下的小目标检测精度较差、漏检较为严重的问题,提出一种基于改进YOLOv5的无人机图像检测算法。针对小目标尺度较小问题在骨干网络替换空间金字塔池化(Spatial Pyramid Pooling,SPP)为SPPCSPC-GS,增强密集区域关注能力,提取更多小目标有效特征;在颈部网络中引入CBAM注意力机制将头部C3模块替换为C3CBAM增强上下文信息,提高空间与通道特征表达能力;针对遮挡问题引入柔性非极大值抑制(Soft Non Maximum Suppression,Soft NMS)提升模型对遮挡和密集目标的检测能力;替换损失函数为EIOU加快收敛提升定位效果。改进后的模型在VisDrone数据集上平均检测精度为42.2%,相较于原始YOLOv5s算法提升10.7%,遮挡严重的小目标行人与人类别精度分别上升12%与13.3%。相较于其他先进算法,所提算法表现优秀,可以满足无人机视角图像检测任务要求。 展开更多
关键词 小目标检测 空间金字塔池化 注意力机制 柔性非极大值抑制 损失函数
下载PDF
改进YOLOv5s的弱光水下生物目标检测算法 被引量:6
20
作者 陈宇梁 董绍江 +1 位作者 孙世政 闫凯波 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期499-507,共9页
针对水下光学图像目标检测过程中由于水中光线衰弱严重、图像环境复杂和拍摄设备移动等造成的生物识别精度低的问题,提出了基于改进YOLOv5s的弱光水下生物目标实时检测算法YOLOv5s-underwater。针对弱光水下光线衰弱的问题,引入了限制... 针对水下光学图像目标检测过程中由于水中光线衰弱严重、图像环境复杂和拍摄设备移动等造成的生物识别精度低的问题,提出了基于改进YOLOv5s的弱光水下生物目标实时检测算法YOLOv5s-underwater。针对弱光水下光线衰弱的问题,引入了限制对比度自适应直方图均衡(CLAHE)算法对输入图像进行预处理,解决了颜色失真和图像毛糙的问题。针对复杂的弱光水下图像环境,提出了快速空间金字塔池化(SPPF)模块,解决了水下物体区分度低和特征损失严重的问题。针对拍摄设备移动带来的场景和形态变化问题,提出了一种基于旋转窗口的Swin-Transformer模块,提高了模型的泛化能力。针对水下小目标,修改了网络模型结构,提高了小目标的检测能力。仿真和实验结果表明:所提算法相较于YOLOv5s检测精度提高30.7%,证明了算法的有效性。 展开更多
关键词 弱光水下生物目标 YOLOv5s 限制对比度自适应直方图均衡 快速空间金字塔池化 旋转窗口
下载PDF
上一页 1 2 25 下一页 到第
使用帮助 返回顶部