期刊文献+
共找到167篇文章
< 1 2 9 >
每页显示 20 50 100
Intelligent identification of oceanic eddies in remote sensing data via Dual-Pyramid UNet
1
作者 Nan Zhao Baoxiang Huang +2 位作者 Xinmin Zhang Linyao Ge Ge Chen 《Atmospheric and Oceanic Science Letters》 CSCD 2023年第4期29-36,共8页
海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池... 海洋涡旋是大洋中重要的组成部分,对海洋能量和物质的输送至关重要.海洋涡旋的检测和表征无论是对于海洋气象学,海洋声学还是海洋生物学等领域都具有重要的研究价值.本文基于UNet架构,并结合金字塔分割注意力(PSA)模块和空洞空间卷积池化金字塔(ASPP)构造了Dual-Pyramid UNet模型,以平面异常和海表面温度数据中进行海洋涡旋的识别.实验在北大西洋和南大西洋两个涡旋活跃区域进行并选用多个评价指标对识别结果进行评价以证明模型的优异性能. 展开更多
关键词 海洋涡旋识别 深度学习 金字塔分割注意 空洞空间卷积池化金字塔 U型网络架构
下载PDF
基于跨模态注意力融合的煤炭异物检测方法 被引量:1
2
作者 曹现刚 李虎 +3 位作者 王鹏 吴旭东 向敬芳 丁文韬 《工矿自动化》 CSCD 北大核心 2024年第1期57-65,共9页
为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采... 为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题,提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络(DFPN),采用浅层的特征提取策略提取Depth图像的低级特征,用深度边缘与深度纹理等基础特征辅助RGB图像深层特征,以有效获得2种特征的互补信息,从而丰富异物特征的空间与边缘信息,提高检测精度;构建了基于坐标注意力与改进空间注意力的跨模态注意力融合模块(CAFM),以协同优化并融合RGB特征与Depth特征,增强网络对特征图中被遮挡异物可见部分的关注度,提高被遮挡异物检测精度;使用区域卷积神经网络(R-CNN)输出煤炭异物的分类、回归与分割结果。实验结果表明:在检测精度方面,该方法的AP相较两阶段模型中较优的Mask transfiner高3.9%;在检测效率方面,该方法的单帧检测时间为110.5 ms,能够满足异物检测实时性需求。基于跨模态注意力融合的煤炭异物检测方法能够以空间特征辅助色彩、形状与纹理等特征,准确识别煤炭异物之间及煤炭异物与输送带之间的差异,从而有效提高对复杂特征异物的检测精度,减少误检、漏检现象,实现复杂特征下煤炭异物的精确检测与像素级分割。 展开更多
关键词 煤炭异物检测 实例分割 双特征金字塔网络 跨模态注意力融合 Depth图像 坐标注意力 改进空间注意力
下载PDF
融合注意力和扩张卷积的遥感影像道路信息提取方法
3
作者 肖振久 郝明 +1 位作者 曲海成 侯佳兴 《遥感信息》 CSCD 北大核心 2024年第1期18-25,共8页
针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标... 针对高分辨率遥感影像语义分割存在地物边缘分割不连续、道路及背景特征复杂多样导致道路提取分割精度不高的问题,提出了一种融合双通道注意力和扩张卷积的遥感影像道路信息提取语义分割网络(A 2DU-Net)。首先,在特征提取部分引入坐标注意力(coordinate attention,CA)模块,捕捉道路位置、方向和跨通道信息,精确定位道路信息。其次,针对网络对细节特征丢失的敏感问题,在编码器的末端利用不同扩张率的空洞卷积构建多尺度特征融合的空洞空间金字塔池化模块(multi-scale Atrous spatial pyramid pooling module,MASPPM)来获得更大的感受野,提高网络性能。最后,为了避免U-Net中纯跳跃连接在语义上不相似特征的融合,在编码器和解码器的跳跃连接之间增加了双通道注意力机制来实现门控筛选,抑制非目标区域的特征,提高网络的分割精度。实验在公共道路数据集Massachusetts上对网络模型进行测试,OA(准确率)、交并比(IoU)、平均交并比(mIoU)和F1等评价指标分别达到98.07%、64.39%、81.20%和88.67%。与主流方法U-Net和DDUNet进行比较,mIoU分别提升了3.07%、0.22%,IoU分别提升了1.98%、0.52%。实验结果表明,所提出的方法优于所有的比较方法,能够有效提高道路分割的精确度。 展开更多
关键词 语义分割 道路提取 注意力机制 U-Net 空洞空间金字塔池化
下载PDF
融合位置注意力机制与轻量化STDC网络的非结构化场景语义分割
4
作者 陈晔 杨长春 +2 位作者 杨森 王宇鹏 王彭 《计算机系统应用》 2024年第4期254-262,共9页
近年来,非结构化道路分割已成为计算机视觉领域的重要研究方向之一.现有的大多数方法适合结构化道路的分割并无法满足非结构化道路分割的准确性与实时性需求.为了解决上述问题,本文对STDC网络进行改进,引入残差连接来更好地融合多尺度... 近年来,非结构化道路分割已成为计算机视觉领域的重要研究方向之一.现有的大多数方法适合结构化道路的分割并无法满足非结构化道路分割的准确性与实时性需求.为了解决上述问题,本文对STDC网络进行改进,引入残差连接来更好地融合多尺度语义信息,还提出一种嵌入位置注意力模块的空洞空间卷积池化金字塔(PAASPP)来增强网络对道路等特定区域的位置感知能力.本文在RUGD与RELLIS-3D两个数据集上进行实验,所提出方法的MIoU在两个数据集的测试集上分别达到了50.78%和49.96%. 展开更多
关键词 非结构化环境 语义分割 PA-ASPP STDC
下载PDF
基于改进YOLOv5s算法的禁捕期长江渔船识别及应用研究
5
作者 崔秀芳 王认认 +2 位作者 林浩涛 夏霖波 韩沛霖 《海洋渔业》 CSCD 北大核心 2024年第3期371-380,共10页
长江实行十年禁渔是长江生态环境修复的关键环节,针对禁渔期间长江非法捕捞渔船目标小、背景复杂、流动大等问题,提出了一种基于改进YOLOv5s的目标检测算法。该算法优化多尺度自适应锚框模块,采用改进的K-means++聚类算法,重新匹配适合... 长江实行十年禁渔是长江生态环境修复的关键环节,针对禁渔期间长江非法捕捞渔船目标小、背景复杂、流动大等问题,提出了一种基于改进YOLOv5s的目标检测算法。该算法优化多尺度自适应锚框模块,采用改进的K-means++聚类算法,重新匹配适合长江船舶尺寸的锚框;使用轻量高效的坐标注意力(coordinate attention,CA)机制,提升模型关注目标通道信息特征的能力;采用SPPCSPPC(spatial pyramid pooling and context-aware spatial pyramid pooling combination)对特征图进行池化,提高小目标检测能力;通过构建长江船舶数据集训练得到最优权值模型。结果显示,改进后的模型在准确率、召回率、mAP0.5、mAP0.5∶0.9和原模型相比分别提高了1.5%、3.0%、2.4%、7.7%,且训练过程损失收敛更快,收敛值更低,能够准确快速识别出长江上的渔船目标。研究结果可为长江十年禁渔提供技术支持。 展开更多
关键词 目标检测 YOLOv5s 聚类算法 注意力机制 空间金字塔池化
下载PDF
基于YOLOv8的气象设备识别监控算法
6
作者 王祝先 叶润泽 +4 位作者 徐翌博 凌霄 白玉 宋邦钰 杨博寓 《应用科技》 CAS 2024年第4期83-90,共8页
在人烟稀少的地区,气象设备的监测与检查面临设备安置位置偏僻、缺乏实时巡检等问题。为解决这一难题,基于在图像识别领域表现卓越的YOLOv8算法,提出了一种新的气象设备识别监控模型,通过将原有的高效的空间金字塔池化(spatial pyramid ... 在人烟稀少的地区,气象设备的监测与检查面临设备安置位置偏僻、缺乏实时巡检等问题。为解决这一难题,基于在图像识别领域表现卓越的YOLOv8算法,提出了一种新的气象设备识别监控模型,通过将原有的高效的空间金字塔池化(spatial pyramid pooling-fast,SPPF)层替换为空间金字塔池化-全连接空间金字塔卷积(spatial pyramid pooling-fully connected spatial pyramid convolution,SPPFCSPC)层,成功降低了计算量,提升了气象设备检测的速度。为了进一步提升模型在复杂环境下的性能,提出了YOLOv8-SA模型,通过在主干网络(backbone)中加入多头自注意力机制,更精准地捕获图像中不同区域之间的关联性,有力地提高了模型的准确性。为了验证模型的有效性,创建了一个专门的气象设备数据集,并进行了对比实验。实验结果表明,本文提出的YOLOv8-SA模型在检测速度和准确性方面均取得了显著的提升,在自制的数据集中检测精度为98.6%,与传统的YOLOv8模型相比,检测精度提升了0.6%。该模型可有效解决人烟稀少地区气象设备的监测问题,为提升监测系统的实用性和效率提供新思路。 展开更多
关键词 气象设备 机器学习 深度学习 图像识别 YOLOv8 YOLOv8-SA 空间金字塔池化-全连接空间金字塔卷积 多头自注意力
下载PDF
基于YOLOv5的无人机视角小目标检测算法
7
作者 宋旭东 查可豪 《机电工程技术》 2024年第7期46-50,73,共6页
针对无人机视角下的小目标检测精度较差、漏检较为严重的问题,提出一种基于改进YOLOv5的无人机图像检测算法。针对小目标尺度较小问题在骨干网络替换空间金字塔池化(Spatial Pyramid Pooling,SPP)为SPPCSPC-GS,增强密集区域关注能力,提... 针对无人机视角下的小目标检测精度较差、漏检较为严重的问题,提出一种基于改进YOLOv5的无人机图像检测算法。针对小目标尺度较小问题在骨干网络替换空间金字塔池化(Spatial Pyramid Pooling,SPP)为SPPCSPC-GS,增强密集区域关注能力,提取更多小目标有效特征;在颈部网络中引入CBAM注意力机制将头部C3模块替换为C3CBAM增强上下文信息,提高空间与通道特征表达能力;针对遮挡问题引入柔性非极大值抑制(Soft Non Maximum Suppression,Soft NMS)提升模型对遮挡和密集目标的检测能力;替换损失函数为EIOU加快收敛提升定位效果。改进后的模型在VisDrone数据集上平均检测精度为42.2%,相较于原始YOLOv5s算法提升10.7%,遮挡严重的小目标行人与人类别精度分别上升12%与13.3%。相较于其他先进算法,所提算法表现优秀,可以满足无人机视角图像检测任务要求。 展开更多
关键词 小目标检测 空间金字塔池化 注意力机制 柔性非极大值抑制 损失函数
下载PDF
健身行为的人体姿态估计及动作识别 被引量:1
8
作者 付惠琛 高军伟 车鲁阳 《液晶与显示》 CAS CSCD 北大核心 2024年第2期217-227,共11页
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法... 人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。 展开更多
关键词 图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化
下载PDF
基于稠密块改进LinkNet的高分遥感图像道路提取
9
作者 王增优 张鲜化 +2 位作者 刘荣 陈志高 朱旺煌 《航天返回与遥感》 CSCD 北大核心 2024年第3期107-117,共11页
针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Bloc... 针对LinkNet网络模型在进行道路图像分割任务时,特征信息易丢失以及缺乏对目标特征的关注度问题,提出了一种基于改进LinkNet残差网络的高分遥感图像道路提取方法。将原本LinkNet模型中编码区的残差块(Res Block)替换为稠密块(Dense Block),密集连接的方式减少特征信息在传递过程中的损失,并在每个稠密块之后构建卷积注意力单元来提高模型对目标特征的学习能力,最后用空洞空间金字塔池化模块将编码区与解码区进行连接,扩大感受野的同时还能接受多尺度目标特征信息。实验表明,该方法在DeepGlobe数据集上的准确率、平均交并比和F1-score分为82.16%、83.21%和81.65%,均优于同类网络,通过对提取的路网结果对比,该算法对于树木遮蔽处以及建筑物阴影下的路网提取在完整性和准确性上都具有明显提升。 展开更多
关键词 残差网络 道路提取 稠密块 卷积注意力 空洞空间金字塔池化
下载PDF
基于改进DeepLabv3+的遥感影像道路提取算法
10
作者 王谦 何朗 +1 位作者 王展青 黄坤 《计算机科学》 CSCD 北大核心 2024年第8期168-175,共8页
道路提取可以帮助人们更好地理解城市环境,是城市交通和城市规划等方面的重要部分,随着深度学习与计算机视觉的发展,利用基于深度学习的语义分割算法从遥感影像中提取道路的技术趋于成熟。针对现有的深度学习道路提取算法存在的提取速... 道路提取可以帮助人们更好地理解城市环境,是城市交通和城市规划等方面的重要部分,随着深度学习与计算机视觉的发展,利用基于深度学习的语义分割算法从遥感影像中提取道路的技术趋于成熟。针对现有的深度学习道路提取算法存在的提取速度慢和容易受背景环境因素干扰而产生漏分割、不连续等问题,提出了一种基于ECANet注意力机制和级联空洞空间金字塔池化模块的轻量化算法CE-DeepLabv3+。首先,将主干特征提取网络更换为轻量级的MobileNetv2,减少参数量,提高模型的执行速度;其次,通过增加空洞空间金字塔池化模块的卷积层进一步扩大感受野,再级联不同特征层来增强语义信息的复用性,从而加强对细节特征的提取能力;再次,加入ECANet注意力机制,抑制背景环境中的干扰因素,聚焦道路信息;最后,采用改进的损失函数进行训练,消除了道路与背景样本不均衡对模型性能产生的影响。实验结果表明,改进算法的性能优良,与原始DeepLabv3+算法相比,在分割效率、分割精度上有较大的提升。 展开更多
关键词 语义分割 遥感影像 道路提取 注意力机制 DeepLabv3+ 级联空洞空间金字塔池化
下载PDF
CIEFRNet:面向高速公路的抛洒物检测算法
11
作者 李旭 宋焕生 +3 位作者 史勤 张朝阳 刘泽东 孙士杰 《计算机工程与应用》 CSCD 北大核心 2024年第5期336-346,共11页
高速公路抛洒物危及行车安全,极易诱发交通事故,及时识别并清理高速公路抛洒物十分重要。由于高速公路抛洒物在图像中面积占比小且图像背景复杂,现有检测方法常出现漏检和误检的情况。针对上述问题,提出了一种基于上下文信息增强和特征... 高速公路抛洒物危及行车安全,极易诱发交通事故,及时识别并清理高速公路抛洒物十分重要。由于高速公路抛洒物在图像中面积占比小且图像背景复杂,现有检测方法常出现漏检和误检的情况。针对上述问题,提出了一种基于上下文信息增强和特征提纯的抛洒物检测算法,记为CIEFRNet。设计了一种融合上下文Transformer的主干特征提取模块(CSP-COT),充分挖掘局部静态上下文信息和全局动态上下文信息,增强小抛洒物的特征表示;主干网络中使用改进的空间金字塔池化(ISPP),通过级联的空洞卷积实现特征的多尺度下采样,减轻目标细节信息的损失;为提高特征融合能力,设计了特征提纯模块(CNAB),其中嵌入了提出的一种混合注意力机制(ECSA),可抑制图像背景噪声,强化微小抛洒物的特征;引入基于动态非单调聚焦机制的WIoU优化损失函数,提高小抛洒物学习能力,加速网络收敛。实验结果表明,所提方法在自制的高速公路抛洒物数据集上的精确率、召回率、AP0.5和AP0.5:0.95分别达到96.5%、81.6%、88.1%和46.5%,优于当前主流的目标检测方法,其算法复杂度也更低,满足实际场景应用需要。 展开更多
关键词 抛洒物检测 上下文信息 空间金字塔池化 注意力机制 损失函数
下载PDF
基于PCSA-YOLOv7 Former的输电线路连接金具及其锈蚀检测方法
12
作者 宋智伟 黄新波 +2 位作者 纪超 张凡 张烨 《中国电力》 CSCD 北大核心 2024年第6期141-152,共12页
输电线路分布情况复杂且故障难以有效检测,其中连接金具长期暴露于复杂环境下易受到恶劣环境的影响出现锈蚀等故障。针对输电线路连接金具部件具有尺度多样性和存在着锈蚀故障检测精度低的问题,提出了一种基于双重注意力嵌入重构和Swin ... 输电线路分布情况复杂且故障难以有效检测,其中连接金具长期暴露于复杂环境下易受到恶劣环境的影响出现锈蚀等故障。针对输电线路连接金具部件具有尺度多样性和存在着锈蚀故障检测精度低的问题,提出了一种基于双重注意力嵌入重构和Swin Transformer的输电线路连接金具组件及其锈蚀故障检测方法:PCSA-YOLOv7 Former。实验结果表明:该方法在构建的TLCF数据集上的综合检测性能领先于12类当前先进的目标检测算法,其中在测试集上的mAP_(0.5)达到94.9%,该方法相比于基线模型YOLOv7,其F1和mAP0.5指标分别提升了2.6个百分点和2.2个百分点,说明该方法能够更全面地理解输电线路连接金具图像中的多尺度语义信息并学习到不易区分的微小细节表征。 展开更多
关键词 输电线路连接金具 PCSA-YOLOv7 Former 双重注意力嵌入 Swin Transformer 空洞空间金字塔池化
下载PDF
基于改进YOLOv5s的交通标识检测算法 被引量:3
13
作者 李孟浩 袁三男 《南京信息工程大学学报(自然科学版)》 CAS 北大核心 2024年第1期11-19,共9页
针对交通标识在图像中占比小、检测精度低且周围环境复杂等问题,提出一种基于改进YOLOv5s的算法.首先,在主干网络部分添加注意力机制ECA(Efficient Channel Attention,高效通道注意力),增强网络的特征提取能力,有效解决了周围环境复杂... 针对交通标识在图像中占比小、检测精度低且周围环境复杂等问题,提出一种基于改进YOLOv5s的算法.首先,在主干网络部分添加注意力机制ECA(Efficient Channel Attention,高效通道注意力),增强网络的特征提取能力,有效解决了周围环境复杂的问题;其次,提出HASPP(Hybrid Atrous Spatial Pyramid Pooling,混合空洞空间金字塔池化),增强了网络结合上下文的能力;最后,修改网络中的Neck结构,使高层特征与底层特征有效融合,同时避免了跨卷积层造成的信息丢失.实验结果表明,改进后的算法在交通标识数据集上取得了94.4%的平均检测精度、74.1%的召回率以及94.0%的精确率,较原始算法分别提升了3.7、2.8、3.4个百分点. 展开更多
关键词 交通标识检测 小目标检测 YOLOv5s 注意力机制 特征提取 混合空洞空间金字塔池化
下载PDF
基于改进的IIE-SegNet的快速图像语义分割方法
14
作者 李庆 王宏健 +2 位作者 李本银 肖瑶 迟志康 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第2期314-323,共10页
针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计... 针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计算量大的问题;研究Focal损失函数来解决正、负采样不平衡的问题。实验结果表明:与IIE-SegNet相比,本方法在PASCAL VOC 2012数据集上的语义分割速度更快,平均每次迭代快0.6 s左右,测试单张图像的时间平均减少了0.94 s;分割精度更高,MIoU提升了2.1%。在扩展的PASCAL VOC 2012(Exp-PASCAL VOC 2012)数据集上的语义分割速度更快,平均每次迭代快0.4 s左右,测试单张图像的时间平均减少了0.92 s;分割精度更高,MPA和MIoU分别提升了2.6%和2.8%,特别是对于小尺度目标分割边界更清晰,性能得到了很大的提升。 展开更多
关键词 语义分割 深度学习 多尺度空洞卷积空间金字塔池化 图像信息熵 全局加平均 VGG16 IIE-SegNet
下载PDF
面向嵌入式端的轻量级交通信号灯检测算法 被引量:1
15
作者 杨永波 李栋 +2 位作者 房建东 董祥 李毅伟 《计算机工程与应用》 CSCD 北大核心 2024年第13期361-368,共8页
针对现有交通信号灯检测算法计算量和模型大,嵌入式端部署难,且对远距离交通信号灯的检测难度大,漏检率高等问题,设计了一种面向嵌入式端的轻量级交通信号灯检测算法,针对轻量化和实时性要求,采用GhostNet网络Ghost模块和Ghost瓶颈层结... 针对现有交通信号灯检测算法计算量和模型大,嵌入式端部署难,且对远距离交通信号灯的检测难度大,漏检率高等问题,设计了一种面向嵌入式端的轻量级交通信号灯检测算法,针对轻量化和实时性要求,采用GhostNet网络Ghost模块和Ghost瓶颈层结构,减少了模型参数量,提升了检测速度;针对特征相似问题,采用加权双向特征金字塔网络结构,使得算法对目标更敏感;使用密集空洞空间金字塔池化,优化全局上下文信息的提取;针对小目标识别问题,通过多尺度检测的改进,增强对小目标的信息提取;通过知识蒸馏,提升模型学习能力,进而提高检测性能。实验结果表明,该检测算法对交通信号灯的识别精度达到了97.0%,召回率达到了99%,较YOLOv5s算法分别提高了2.7和3个百分点,模型大小减小到8.06 MB,是YOLOv5s的58%,识别速率从51帧每秒提升到56帧每秒,通过在嵌入式端的测试,改进后算法对远距离下的交通信号灯能够实时准确地识别。 展开更多
关键词 目标检测 轻量级 GhostNet 知识蒸馏 密集空洞空间金字塔池化
下载PDF
基于CNN-Transformer结构的遥感影像变化检测
16
作者 潘梦洋 杨航 范祥晖 《液晶与显示》 CAS CSCD 北大核心 2024年第10期1361-1379,共19页
现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但... 现代高分辨率遥感图像变化检测借助卷积神经网络(Convolutional Neural Network,CNN)取得了显著成果。然而,卷积操作的感受野限制导致在学习全局上下文和远程空间关系方面存在不足。虽然视觉Transformer能有效捕获远程特征的依赖性,但其对影像变化细节的处理不足,导致空间定位能力有限且计算效率低下。为解决上述问题,本文提出了一种基于空间空洞金字塔池化的跨层级联线性融合端到端编解码混合CNN-Transformer的变化检测模型,兼具视觉Transformer和CNN的优势。首先,利用孪生CNN网络提取图像特征,并借助空洞金字塔池化模块对特征进行精细处理,从而更精准地捕获图像的细节特征信息。其次,将提取的特征转化为视觉单词,并通过Transformer编码器进行建模,以获取丰富的上下文信息。这些信息随后被反馈至视觉空间,通过Transformer解码器对原始特征进行强化,提升特征的表达效果。接着,采用跨层级联的方式将CNN提取的特征与Transformer编解码的特征进行融合,利用上采样技术联系不同分辨率的特征图,实现位置信息与语义信息的融合。最后,通过差异增强模块生成包含丰富变化信息的差异特征图。在LEVIR、CDD、DSIFN和WHUCD 4个公开遥感数据集上的广泛实验验证了本文方法的有效性。与其他先进方法相比,本文模型的分类性能更出色,有效改善了变化检测中的欠分割、过分割及边缘粗糙等问题。 展开更多
关键词 遥感图像 变化检测 卷积神经网络 TRANSFORMER 空间空洞金字塔池化
下载PDF
基于多尺度注意残差网络的地震波形分类研究
17
作者 王梦琪 黄汉明 +1 位作者 吴业正 王鹏飞 《地震工程学报》 CSCD 北大核心 2024年第3期724-733,共10页
选用2010年2月—2016年12月发生在北京顺义及河北三河等首都圈邻近区域的117个地震事件(包括54个天然地震事件和63个非天然地震事件——爆炸事件)作为研究对象,利用文章所提出的多尺度注意残差网络对其中的天然地震事件和爆炸事件波形... 选用2010年2月—2016年12月发生在北京顺义及河北三河等首都圈邻近区域的117个地震事件(包括54个天然地震事件和63个非天然地震事件——爆炸事件)作为研究对象,利用文章所提出的多尺度注意残差网络对其中的天然地震事件和爆炸事件波形进行二分类。首先,对原始地震波形进行简单预处理并截取成相同长度的地震时序数据,直接将其作为网络模型的输入;其次,选用含有残差模块的深度神经网络作为基础网络,利用深度神经网络对特征的自动提取能力,省略了传统波形分类需要提前提取时域波形的特征作为分类算法输入的步骤;然后,融合通道注意力机制(ECA)并对其进行改进,将空间维度的信息融入通道信息,优化了网络对关键信息的关注,更好地聚焦重要特征;最后,使用空间金字塔池化代替最大池化进行多尺度特征融合,得到更多的特征信息,构成多尺度注意残差网络。实验结果表明,最高分类准确率为97.11%,平均分类准确率为96.53%,证明了多尺度注意残差网络在地震波形分类任务中的有效性,为震源类型识别工作提供了一种新的方法。 展开更多
关键词 天然地震 人工爆炸 残差模块 注意力机制 空间金字塔池化
下载PDF
多尺度特征融合注意力新冠肺炎病灶分割网络
18
作者 林洁沁 黄新 《激光杂志》 CAS 北大核心 2024年第3期168-174,共7页
新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Atte... 新冠病毒传染性极强,尽早的诊断和治疗是减少疫情造成损失的关键因素。为辅助医生诊断新冠病情,高效、准确地从肺部CT切片中分割新冠病灶,提出了一种改进的编码器-解码器深度神经网络———多尺度融合注意力网络MSANet(Multi-scale Attention Network),以图像分割效果较为出色的U-Net网络为基础,通过全局池化层和设置空洞卷积的采样率,增大网络感受野,捕获多尺度信息,实现对大目标的有效分割;使用通道注意力与空间注意力,在空间维度上建模,有效提取图像深层特征。测试结果表明,改进后的算法与U-Net网络相比,分割的平均交并比提升了1.46%,类别平均像素准确率提升了0.8%,准确率提升了1.17%。 展开更多
关键词 图像处理 特征提取 卷积块注意力模块 空洞空间卷积池化金字塔 U-Net结构 多尺度特征融合
下载PDF
基于YOLOx-pro的盖板玻璃复杂缺陷检测方法
19
作者 陈湘尹 尹玲 +3 位作者 张斐 吴鹏 叶正伟 谷叶阳 《组合机床与自动化加工技术》 北大核心 2024年第9期91-97,共7页
为解决手机盖板玻璃表面复杂缺陷检测精度低、速度慢、检测技术难以部署于应用端的问题,提出一种基于YOLOx-pro模型的快速检测方法。根据盖板玻璃的光学性质,设计打光方案并搭建图像采集系统,结合图像增强技术丰富缺陷样本。以YOLOx-tin... 为解决手机盖板玻璃表面复杂缺陷检测精度低、速度慢、检测技术难以部署于应用端的问题,提出一种基于YOLOx-pro模型的快速检测方法。根据盖板玻璃的光学性质,设计打光方案并搭建图像采集系统,结合图像增强技术丰富缺陷样本。以YOLOx-tiny为基础轻量化模型,在主干输出部分添加CA注意力机制,加强对缺陷区域的关注。引入空间池化金字塔SPPF并将激活函数更换为ReLU,构成Sim-SPPF模块,获取更丰富的多尺度信息表达,结合特定的训练策略,进一步提高检测效率。实验结果表明,YOLOx-pro模型的mAP达到85.73%,FPS达到39.17 f/s,而Params仅为10.58 M,性能优于其他主流算法。将模型部署于应用端软件进行实际测试,结果显示YOLOx-pro具备良好的响应速度和准确率,可实现实际工况下盖板玻璃表面缺陷的高效检测。 展开更多
关键词 缺陷检测 YOLOx 注意力机制 空间金字塔池化 模型部署
下载PDF
基于改进YOLOv5算法的纸袋缺陷检测
20
作者 杨萌 张爱军 潘文松 《组合机床与自动化加工技术》 北大核心 2024年第3期105-108,113,共5页
为了提高纸袋生产企业在制造过程中对纸袋手把或底部缺陷的检测精度,提出了一种基于改进YOLOv5算法的纸袋缺陷检测方法。改进算法为了提高网络定位能力,增强网络的特征学习表达能力,引入了坐标注意力机制,接着引入EIoU损失函数对原始损... 为了提高纸袋生产企业在制造过程中对纸袋手把或底部缺陷的检测精度,提出了一种基于改进YOLOv5算法的纸袋缺陷检测方法。改进算法为了提高网络定位能力,增强网络的特征学习表达能力,引入了坐标注意力机制,接着引入EIoU损失函数对原始损失函数进行改进,以此来改善原始网络损失函数纵横比的合理性,提升回归精度,最后引入一种具有类似跨阶段局部结构的简化空间金字塔池化结构,减少冗余信息处理,提升网络检测性能。实验结果表明,改进算法的平均精度平均值mAP@.5为87.3%,mAP@.5∶.95为56.8%,与YOLOv5算法相比mAP@.5提升了1.6%,mAP@.5∶.95提升了0.9%,在纸袋缺陷检测上有更优越的表现。 展开更多
关键词 纸袋缺陷 注意力 损失函数 空间金字塔池化 改进算法
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部