期刊文献+
共找到76篇文章
< 1 2 4 >
每页显示 20 50 100
基于注意力机制残差神经网络的近红外芒果种类定性建模方法
1
作者 王书涛 万金丛 +2 位作者 刘诗瑜 张金清 王玉田 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第8期2262-2267,共6页
现代光谱检测技术的飞速发展与深度学习紧密相关,作为一种端到端的模型,深度神经网络可以从光谱中得到更多信息,从而提升模型鲁棒性。为探究近红外光谱结合深度学习对芒果种类定性预测的可行性,提出一种基于卷积注意力机制(CBAM)的一维... 现代光谱检测技术的飞速发展与深度学习紧密相关,作为一种端到端的模型,深度神经网络可以从光谱中得到更多信息,从而提升模型鲁棒性。为探究近红外光谱结合深度学习对芒果种类定性预测的可行性,提出一种基于卷积注意力机制(CBAM)的一维残差神经网络(1D-AD-ResNet-18)模型。为降低光谱中冗余信息的干扰,在传统一维残差神经网络(1D-ResNet-18)中嵌入CBAM卷积注意力模块,该模块可重点关注光谱局部有用信息;为避免梯度消失、过拟合情况发生,使用解决网络“退化”问题的ResNet-18。对于186个芒果样本,采用70%的样本进行训练,30%的样本进行测试,采用准确度(Accuracy)、精确率(Precision)、召回率(Recall)、F1值(F1-score)、宏观平均值(Macro-average)以及加权平均值(Weighted-average)作为模型评价指标。建立传统1D-ResNet-18、SNV-SVM和PCA-KNN三种对比模型,与上述三种方法作对比,所建立的1D-AD-ResNet-18模型取得最优预测结果,四种定性分析模型的准确率分别为96.42%,80.35%,76.78%和67.85%。结果表明,1D-AD-ResNet-18模型实现了对芒果种类的准确识别与分类,为近红外光谱定性分析芒果种类提供了新思路。 展开更多
关键词 芒果种类识别 cbam注意力机制 近红外光谱 残差网络
下载PDF
基于注意力机制和Mogrifier LSTNet的道路交通占有率预测
2
作者 秦喜文 潘星宇 +2 位作者 张斯琪 石红玉 董小刚 《长春工业大学学报》 CAS 2024年第3期199-207,共9页
提出一种改进的LSTNet深度学习框架用于交通占有率数据预测。采用不同大小的卷积核来捕捉时间序列数据中不同时间范围内的模式和趋势,并融合CBAM注意力机制可以在通道维度和空间维度上自适应地调整特征的权重。通过引入Mogrifier机制多... 提出一种改进的LSTNet深度学习框架用于交通占有率数据预测。采用不同大小的卷积核来捕捉时间序列数据中不同时间范围内的模式和趋势,并融合CBAM注意力机制可以在通道维度和空间维度上自适应地调整特征的权重。通过引入Mogrifier机制多次迭代交替更新LSTM的输入门和遗忘门的权重,以更好地捕捉序列数据中的长期依赖关系。而AR模型充分考虑了数据集的自相关性帮助模型更好地理解历史信息。实验结果表明,提出的模型相对绝对值误差为0.3497,明显优于其他模型,能够有效提高交通占有率的准确预测。 展开更多
关键词 LSTNet模型 卷积神经网络 cbam注意力机制 Mogrifier LSTM 交通占有率预测
下载PDF
基于注意力机制和迁移学习的服装分类方法
3
作者 陈金广 黄晓菊 马丽丽 《西安工程大学学报》 CAS 2024年第3期109-116,共8页
针对服装图像分类效率低、准确率不高等问题,提出了一种基于注意力机制和迁移学习的服装图像分类方法。主要采用预训练的ResNet50网络模型在服装数据集上进行迁移学习,以降低对数据集的依赖,并减少网络训练时间;通过几何变换和颜色抖动... 针对服装图像分类效率低、准确率不高等问题,提出了一种基于注意力机制和迁移学习的服装图像分类方法。主要采用预训练的ResNet50网络模型在服装数据集上进行迁移学习,以降低对数据集的依赖,并减少网络训练时间;通过几何变换和颜色抖动2种数据增强手段处理数据集,提高模型的泛化能力;以ResNet50为基础网络,加入卷积注意力机制模块(convolutional block attention module, CBAM),依次从通道和空间2个维度提高对服装不同区域的关注度,增强了特征表达能力。在CD和IDFashion两类背景干扰信息不同的数据集上进行验证,实验结果表明:所提出的模型能够提取更多服装特征信息,在IDFashion数据集的平均分类准确率为95.60%,分别高于ResNet50、ResNet50+STN和ResNet50+ECA模型6.65%、6.69%、6.62%,一定程度上提高了服装图像分类的准确率和效率。 展开更多
关键词 服装图像分类 ResNet50 卷积注意力机制模块(cbam) 注意力机制 迁移学习
下载PDF
多尺度残差注意力网络及其表情识别算法
4
作者 袁德荣 张勇 +2 位作者 唐颖军 李波燕 谢宝来 《小型微型计算机系统》 CSCD 北大核心 2024年第1期30-36,共7页
面部表情识别已经广泛运用于人机交互、教育、自动驾驶等各种领域,针对现有表情识别方法网络结构复杂、参数多、泛化能力不足、识别率低等问题,且人脸表情在自然环境下易受到光照、姿态和局部遮挡等环境因素的影响,提出了一种多尺度残... 面部表情识别已经广泛运用于人机交互、教育、自动驾驶等各种领域,针对现有表情识别方法网络结构复杂、参数多、泛化能力不足、识别率低等问题,且人脸表情在自然环境下易受到光照、姿态和局部遮挡等环境因素的影响,提出了一种多尺度残差注意力网络.以ResNet-18网络为基础,提出了一种新的多尺度残差注意力模块,通过提取不同尺度特征,增加特征多样性.引入CBAM注意力机制获取表情图像重点特征信息,有利于提升遮挡表情的识别.构建特征残差融合块,将浅层特征与深层特征进行残差融合,有利于获取丰富的人脸表情图像整体特征.实验结果表明,本文方法在CK+、JAFFE和Oulu-CASIA 3个公开表情数据集上分别达到了99.49%、98.53%和97.08%的准确率,与一些现有方法相比,本文方法表情识别率更高,证明了该方法可用于人脸表情识别. 展开更多
关键词 人脸表情识别 多尺度特征 cbam注意力机制 遮挡人脸识别
下载PDF
基于注意力机制和级联金字塔网络的姿态估计
5
作者 牛悦 王安南 吴胜昔 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第5期724-734,共11页
人体姿态估计是计算机视觉领域的热门研究课题。随着深度学习的发展,人体姿态估计模型已经能够精准预测人体关键点。针对关键点被遮挡、关键点重合以及复杂背景等问题,提出了一种结合注意力机制的级联金字塔模型,它将注意力机制加入特... 人体姿态估计是计算机视觉领域的热门研究课题。随着深度学习的发展,人体姿态估计模型已经能够精准预测人体关键点。针对关键点被遮挡、关键点重合以及复杂背景等问题,提出了一种结合注意力机制的级联金字塔模型,它将注意力机制加入特征提取网络中,使模型可以获得更丰富的特征信息,并且借助GlobalNet和RefineNet达到精准定位被遮挡关键点的目的。在公开数据集MPII、MS COCO2017和3DOH50K上的验证结果表明,相较于以往模型,该模型在标准情况和被遮挡情况下人体姿态估计的准确度有所提升,且具有鲁棒性。 展开更多
关键词 姿态估计 级联金字塔模型 残差网络 cbam注意力机制 OHKM算法
下载PDF
基于注意力机制的遥感船舶图像分类
6
作者 喻恩泽 左欣 《软件导刊》 2023年第7期138-143,共6页
遥感船舶图像细粒度分类的难点在于类间差异小和类内差异大,并且该领域公开可用的数据集太少,常规的数据增强方法效率低且效果不够好。为了解决上述问题,提出一种基于注意力机制的遥感船舶图像分类网络。首先,利用CBAM注意力机制生成每... 遥感船舶图像细粒度分类的难点在于类间差异小和类内差异大,并且该领域公开可用的数据集太少,常规的数据增强方法效率低且效果不够好。为了解决上述问题,提出一种基于注意力机制的遥感船舶图像分类网络。首先,利用CBAM注意力机制生成每张训练图的注意力图以突出目标的显著特征部分;其次,通过注意力引导的区域剪裁和区域删除两种方式进行数据增强;最后,将原图和增强后的图片输入进行训练。在数据集FGSCR-42上对该方法进行验证,实验结果表明,该方法超越了其他现有模型,有效提升了遥感船舶图像细粒度分类精度。 展开更多
关键词 遥感图像 船舶细粒度分类 数据增强 cbam注意力机制
下载PDF
基于CBAM-InceptionV2-双流CNN的风电机组轴承故障诊断 被引量:3
7
作者 李俊卿 马亚鹏 +4 位作者 胡晓东 马志鹏 王罗 何玉灵 张承志 《智慧电力》 北大核心 2023年第6期28-33,共6页
针对风电机组轴承故障诊断中经典一维卷积神经网络和二维卷积神经网络准确率低的问题,将一维原始振动信号和二维时频图相融合,构建基于CBAM-InceptionV2-双流CNN的滚动轴承故障诊断方法。首先,通过快速傅里叶变换和小波变换,将原始振动... 针对风电机组轴承故障诊断中经典一维卷积神经网络和二维卷积神经网络准确率低的问题,将一维原始振动信号和二维时频图相融合,构建基于CBAM-InceptionV2-双流CNN的滚动轴承故障诊断方法。首先,通过快速傅里叶变换和小波变换,将原始振动信号转化为一维数据和二维时频图;其次,构建基于CBAMInceptionV2-双流CNN模型;最后,将提取到的双层特征信息进行融合,并输入到Softmax完成故障分类。实验结果表明,所提模型能够显著地提升轴承故障诊断的准确性。 展开更多
关键词 cbam注意力机制 InceptionV2 双流CNN 故障诊断 快速傅里叶变换 小波变换
下载PDF
基于CBAM-ResNet网络的视线估计方法 被引量:1
8
作者 胡长春 刘笑楠 《信息技术与信息化》 2023年第8期152-155,共4页
针对当前视线估计方法准确率不高的问题,提出了一种基于残差网络与注意力机制相结合的视线估计模型。首先,预处理阶段对人脸图像进行关键点定位、剪裁及归一化;然后,将归一化后的图像连续通过残差网络与CBAM(convolutional block attent... 针对当前视线估计方法准确率不高的问题,提出了一种基于残差网络与注意力机制相结合的视线估计模型。首先,预处理阶段对人脸图像进行关键点定位、剪裁及归一化;然后,将归一化后的图像连续通过残差网络与CBAM(convolutional block attention module)注意力模块,进行人脸特征提取;最后,将神经网络输出的二维视线方向向量转换为三维视线方向向量,得到最终结果。实验结果表明,本模型在公共数据集MPIIFaceGaze上的视线误差角度为4.48o,与其他视线估计系统模型进行对比,本文所提出的模型可以更准确地估计视线方向。 展开更多
关键词 视线估计 残差网络 cbam注意力机制
下载PDF
基于改进EfficientNet的红外图像光伏组件故障识别研究
9
作者 吕游 郑茜 +2 位作者 齐欣宇 房方 刘吉臻 《仪器仪表学报》 EI CAS CSCD 北大核心 2024年第4期175-184,共10页
光伏组件的故障会影响光伏阵列的输出性能,从而降低电站的发电效率,严重时甚至会危害电站的安全运行。传统的方法无法满足目前光伏组件故障检测快速性和正确率需求。因此,本文提出了一种基于改进EfficientNet的光伏组件故障识别方法。首... 光伏组件的故障会影响光伏阵列的输出性能,从而降低电站的发电效率,严重时甚至会危害电站的安全运行。传统的方法无法满足目前光伏组件故障检测快速性和正确率需求。因此,本文提出了一种基于改进EfficientNet的光伏组件故障识别方法。首先,利用采集到的光伏组件红外图像建立故障数据集,并利用图像分割和数据增强对数据集进行预处理;其次,基于EfficientNet网络构建故障识别模型,同时在模型中引入双通道注意力模块(CBAM),该模块能够抑制不必要特征的识别,增强模型对空间特征信息的提取能力,进而提高模型的识别准确率;最后,通过对比仿真实验证明模型的有效性和先进性。实验结果表明,该模型的故障识别准确率达到了90.83%,相较于原始的EfficientNet模型提高了2.83%,且模型大小仅为20.3 M,具有良好的实用性,能够满足光伏电站实际应用的需求。 展开更多
关键词 光伏组件 红外图像 故障识别 cbam注意力机制
下载PDF
基于改进YOLOv8s算法的胸环靶弹孔检测技术
10
作者 苏宇锋 边锋 张玉堂 《郑州大学学报(工学版)》 CAS 北大核心 2024年第5期16-22,共7页
为了解决传统胸环靶弹孔检测技术在自然条件下易受光照强度、复杂背景影响的问题,设计了一种基于YOLOv8s的改进算法。首先,在数据集的制作过程中引入图形分割将背景与胸环靶分离,避免了复杂环境对弹孔识别精度的影响。其次,为提升模型... 为了解决传统胸环靶弹孔检测技术在自然条件下易受光照强度、复杂背景影响的问题,设计了一种基于YOLOv8s的改进算法。首先,在数据集的制作过程中引入图形分割将背景与胸环靶分离,避免了复杂环境对弹孔识别精度的影响。其次,为提升模型对弹孔的检测能力,在C2f中引入CBAM注意力机制,通过对空间和通道特征赋予不同的权值提高网络对弹孔目标的识别能力;增加检测尺度为160×160的小目标输出层,减少了弹孔特征在下采样过程中的信息损失并降低弹孔漏检的概率;考虑到原有卷积层对小目标不敏感,采用SPD-Conv模块替换原有卷积层,提取更多的特征信息提升检测精度。最后,将边界框损失函数更改为WIoU以减弱正负样本数量不均衡的影响,提高了预测框的回归精度。在自制胸环靶数据集的实验结果表明:改进算法的准确率P为96.9%、召回率R为96.4%、平均精度mAP50为98.0%,相较于原算法,分别提升8.8百分点、25.4百分点、15.3百分点。实验结果证明改进的YOLOv8s模型在复杂环境和密集弹孔的检测方面具有更好的性能。 展开更多
关键词 YOLOv8s 弹孔检测 cbam注意力机制 损失函数 SPD-Conv
下载PDF
地磁时变观测数据中高压直流输电干扰事件多尺度表示及识别方法
11
作者 李良超 刘海军 +5 位作者 单维锋 雷东兴 袁静 陈俊 王浩然 袁国铭 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2024年第3期969-981,共13页
高效准确地识别地磁时变观测数据中受高压直流输电干扰的波形对于提高地磁时变观测数据质量具有重要意义.然而,由于高压直流输电干扰事件持续时间长短不一、干扰程度变化多样,给识别任务带来巨大困难.为了能自动识别长短不同的高压直流... 高效准确地识别地磁时变观测数据中受高压直流输电干扰的波形对于提高地磁时变观测数据质量具有重要意义.然而,由于高压直流输电干扰事件持续时间长短不一、干扰程度变化多样,给识别任务带来巨大困难.为了能自动识别长短不同的高压直流输电干扰事件,本文提出一种高压输电干扰事件的多尺度表示及识别方法:利用小波技术具有多尺度的特性,卷积神经网络具有自动特征提取的特性,将二者结合,设计了一个多输入卷积神经网络模型来识别地磁中的高压直流输电干扰事件.首先使用离散小波技术将地磁时变观测样本进行多尺度分解,得到原始样本的多尺度表示,再将分解后的多尺度地磁时变观测样本分别输入到含有多个输入分支的卷积神经网络中,每个分支分别自动提取不同尺度的特征,然后将多个尺度的特征融合,并加入注意力机制来自适应计算每个尺度特征的权重,对多尺度特征进行加权处理,再采用全连接层和SoftMax层进行分类,本文将该模型命名为CBAM-MCNN.在中国地震前兆台网中心提供的高压直流输电干扰样本上进行试验,并将本文所提出模型的识别效果与现有的全卷积网络、残差神经网络、多输入卷积神经网络、IICM-HVDCT-CNN-LSTM进行了对比,在5271条测试样本集上,本文所提出的CBAM-MCNN模型识别准确率达到了97.14%,F_1值达到了97.12%,远远高于其他4种对比模型. 展开更多
关键词 地磁时变观测数据 高压直流输电干扰 小波分解 卷积神经网络 cbam注意力机制
下载PDF
低照度下改进YOLOX的煤矿无人电机车轨道障碍物检测方法
12
作者 章赛 纪凡 +5 位作者 卢才武 江松 李萌 刘力 刘迪 朱兴攀 《安全与环境学报》 CAS CSCD 北大核心 2024年第3期952-961,共10页
为解决地下煤矿光照不足进而导致无人电机车脱轨、撞车或侧翻等问题,提出了一种低照度多特征融合的YOLOX-CBAM目标检测算法,对矿井无人电机车轨道障碍物进行有效识别与分类。首先,通过实际场景采集及标注构建地下煤矿障碍物数据集,并将... 为解决地下煤矿光照不足进而导致无人电机车脱轨、撞车或侧翻等问题,提出了一种低照度多特征融合的YOLOX-CBAM目标检测算法,对矿井无人电机车轨道障碍物进行有效识别与分类。首先,通过实际场景采集及标注构建地下煤矿障碍物数据集,并将其输入微光数据处理Zero_DCE模型中;其次,对YOLOX目标检测网络进行改进,分别在骨干网络CSPDarknet和特征金字塔(Feature Pyramid Networks,FPN)部分增加双通道CBAM注意力模块,解决了特征提取环节通道单一的问题;最后,将预测头部分的损失函数替换成SIoU,加快了模型迭代的速度。结果表明,与传统两阶段Faster-RCNN网络、YOLOv4网络、YOLOv5网络和原YOLOX网络相比,本模型精确率分别提高了4.65百分点、2.65百分点、2.19百分点、1.35百分点,召回率分别提高了9.39百分点、4.36百分点、0.82百分点、0.76百分点,速度分别提高了28.6帧/s、16帧/s、13.6帧/s、2.9帧/s,同时本模型与分别添加CBAM、SA、SA+SIoU、SE、SE+SIoU,YOLOX-CBAM模块的YOLOX模型相比,其精度分别提高了0.64百分点、0.84百分点、1百分点、1.29百分点和0.76百分点,速度分别提高了0.5帧/s、0.4帧/s、0.3帧/s、0.2帧/s和0.4帧/s。所提出的方法能实现地下煤矿井下无人电机车轨道障碍物的快速准确检测,并为地下矿运输设备的智能化升级及安全运行提供理论支撑。 展开更多
关键词 安全工程 井下无人电机车 目标检测 cbam注意力机制 SIoU损失函数
下载PDF
一种结合改进Inception V2模块和CBAM的轴承故障诊断方法 被引量:16
13
作者 姚齐水 别帅帅 +1 位作者 余江鸿 陈前旭 《振动工程学报》 EI CSCD 北大核心 2022年第4期949-957,共9页
传统深度学习的轴承故障诊断方法网络复杂,训练参数多,模型泛化性弱。针对上述问题,在工业大数据背景下,提出一种结合改进Inception V2模块和CBAM注意力机制的轴承故障诊断方法,改进后的Inception V2模块通过增加平均池化层,进一步拓宽... 传统深度学习的轴承故障诊断方法网络复杂,训练参数多,模型泛化性弱。针对上述问题,在工业大数据背景下,提出一种结合改进Inception V2模块和CBAM注意力机制的轴承故障诊断方法,改进后的Inception V2模块通过增加平均池化层,进一步拓宽分支网络结构,从而提高网络表达能力。将轴承振动信号通过小波变换转换为时频图,作为卷积神经网络的输入,通过改进Inception V2模块对输入特征进行自适应特征提取,跨通道对提取的特征进行信息组织;通过CBAM注意力机制生成通道和空间的双重注意力权重,增强相关度高的特征并抑制相关度不高的特征;将生成的特征数据输入到全局平均池化层,并输出故障诊断结果。实验结果表明:该方法可以建立“浅层”卷积神经网络模型,减少模型参数,加快模型收敛速度,实现99.75%的准确率;同时在不同负载以及高噪声条件下,模型有较好的泛化性,更适合应用在工业大数据中。 展开更多
关键词 故障诊断 滚动轴承 卷积神经网络 cbam注意力机制 故障特征
下载PDF
基于YOLO-Pose的城市街景小目标行人姿态估计算法
14
作者 马明旭 马宏 宋华伟 《计算机工程》 CAS CSCD 北大核心 2024年第4期177-186,共10页
现有的姿态估计算法在城市街景中对小目标行人的检测效果不佳。针对该问题,提出一种基于YOLO-Pose的小目标行人姿态估计算法YOLO-Pose-CBAM。通过引入CBAM注意力机制模块,在不增加过多计算量的前提下,增强网络聚焦小目标行人区域的能力... 现有的姿态估计算法在城市街景中对小目标行人的检测效果不佳。针对该问题,提出一种基于YOLO-Pose的小目标行人姿态估计算法YOLO-Pose-CBAM。通过引入CBAM注意力机制模块,在不增加过多计算量的前提下,增强网络聚焦小目标行人区域的能力,提升算法对小目标行人的敏感度,同时在主干网络中使用4个不同尺寸的检测头,丰富算法对图片中不同大小行人的检测手段;在骨干网络和颈部之间架设2条跨层级联通道,提升浅层网络与深层网络之间的特征融合能力,进一步增强信息交流,降低小目标行人漏检率;引入SIoU重新定义边界框回归的定位损失函数,加快训练的收敛速度,提高检测精度;采用k-means++算法代替k-means算法对数据集中标注的锚框进行聚类,避免聚类中心初始化时导致的局部最优解问题,从而选择出更适合检测小目标行人的锚框。对比实验结果表明,在小目标行人Wider Keypoints数据集上,所提算法相较于YOLO-Pose和YOLOv7-Pose在平均精度上分别提升了4.6和6.5个百分比。 展开更多
关键词 YOLO-Pose算法 姿态估计 跨层级联 cbam注意力机制 SIo U损失函数 k-means++算法
下载PDF
基于改进YOLOv5s的田间移动障碍物检测
15
作者 侯艳林 艾尔肯·亥木都拉 李贺南 《现代电子技术》 北大核心 2024年第6期171-178,共8页
为实现无人农机在行驶过程中对田间移动型障碍物的实时检测,提出一种基于YOLOv5s的目标检测模型,用于检测田间行人和其他协同作业的农机设备。该目标检测模型以YOLOv5s模型为基础框架,进行了以下三点改进:第一,为了减少模型的参数量和... 为实现无人农机在行驶过程中对田间移动型障碍物的实时检测,提出一种基于YOLOv5s的目标检测模型,用于检测田间行人和其他协同作业的农机设备。该目标检测模型以YOLOv5s模型为基础框架,进行了以下三点改进:第一,为了减少模型的参数量和计算复杂度,提高推理速度,将YOLOv5s网络模型中的卷积模块和C3模块替换为Ghost卷积和C3Ghost模块;第二,为了弥补模型参数量减少所造成的精度下降的损失,提升对目标的检测能力,在主干网络输出的特征层中引入CBAM注意力机制;第三,采用BiFPN特征金字塔结构,实现多尺度特征加权融合。实验结果表明,YOLOv5s模型的参数量为7.02×106,计算复杂度为15.8GB,平均检测精度为94%,生成权重文件大小为13.7MB,单幅图像的检测速度为71.43 f/s;改进后的模型参数量为4.04×106,下降了42.45%,计算复杂度缩减为8.5 GB,平均检测精度达到了93.2%,仅仅下降了0.8%,权重文件大小为8.1 MB,单幅图像的检测速度为77.52 f/s。以上数据证明,改进后的模型能够满足对田间移动型障碍物的实时检测,且更加易于部署到移动端设备。 展开更多
关键词 移动型障碍物 YOLOv5s 无人农机 目标检测 cbam注意力机制 双向特征金字塔网络(BiFPN)
下载PDF
基于改进YOLOv8的森林火灾检测算法研究
16
作者 陈义啸 沈景凤 仲梁维 《软件工程》 2024年第2期49-54,共6页
随着全球天气持续变暖,高温、干旱、大风等极端天气呈现多发并发态势,导致全球范围内森林火灾频繁爆发。为了提升森林火灾检测精确率和实时性,提出了一种基于改进YOLOv8的森林火灾检测算法模型。该模型在Neck端上采样阶段中的Upsample... 随着全球天气持续变暖,高温、干旱、大风等极端天气呈现多发并发态势,导致全球范围内森林火灾频繁爆发。为了提升森林火灾检测精确率和实时性,提出了一种基于改进YOLOv8的森林火灾检测算法模型。该模型在Neck端上采样阶段中的Upsample结构后面以及每个C2F模块后面添加CBAM(Convolutional Block Attention Module)注意力机制,通过对特征通道和空间的学习,提高模型的特征提取能力,解决火焰和烟雾图像分辨率低和受不同场景因素影响导致的识别率低的问题。将该算法模型应用于火灾数据集进行训练、验证、测试发现,与原算法模型相比,经改进的算法模型的准确率和召回率分别提高了6.5%和6.8%,其中mAP@0.5提高了4.8%。实验结果表明,改进后的算法模型能够实现对森林火灾的实时监测与精确识别。 展开更多
关键词 YOLOv8 cbam注意力机制 森林火灾检测
下载PDF
基于Swin Transformer和YOLOv5的无纺布瑕疵检测
17
作者 刘佳玮 曹江涛 姬晓飞 《辽宁石油化工大学学报》 CAS 2024年第3期80-88,共9页
对无纺布进行瑕疵检测,可以帮助企业提升生产效率,节约成本,但是基于CNN的目标检测算法受限于卷积核的局部特性,缺乏对图像的全局建模,对尺度变化范围大的瑕疵检出效果不理想。因此,提出了基于Swin Transformer和YOLOv5的无纺布瑕疵检... 对无纺布进行瑕疵检测,可以帮助企业提升生产效率,节约成本,但是基于CNN的目标检测算法受限于卷积核的局部特性,缺乏对图像的全局建模,对尺度变化范围大的瑕疵检出效果不理想。因此,提出了基于Swin Transformer和YOLOv5的无纺布瑕疵检测方法,并引入了CBAM注意力机制,同时微调了预测目标框的anchor尺寸;在自制数据集上对所提方法的有效性进行了验证。结果表明,通过其强大的自我注意力对特征进行编码、解码,网络可以获得更大的感受野,充分联系上下文关系;Swin的基于特征金字塔的分层构建结构与YOLOv5的neck设计十分相似,可以帮助网络在多尺度特征图上对目标进行预测;网络对重要信息的关注度得到了提高;通过Mosaic和MixUp数据增强丰富了数据分布;模型的鲁棒性和对无纺布的检测性能得到提高,回归预测结果更精准。 展开更多
关键词 Swin Transformer模型 自我注意力 cbam注意力机制 数据增强 anchor尺寸
下载PDF
基于注意力机制轻量化模型的植物病害识别方法
18
作者 苏航 陈旭昊 +3 位作者 寿德荣 张朝阳 许彪 孙丙宇 《江苏农业学报》 2024年第8期1389-1399,共11页
针对现有植物病害识别模型存在响应速度慢、参数量多、计算机内存资源消耗大等问题,本研究提出了一种轻量化神经网络模型,该模型由特征提取层、特征增强层和分类器组成。为了减小模型大小并提高网络响应速度,在特征提取层中使用深度可... 针对现有植物病害识别模型存在响应速度慢、参数量多、计算机内存资源消耗大等问题,本研究提出了一种轻量化神经网络模型,该模型由特征提取层、特征增强层和分类器组成。为了减小模型大小并提高网络响应速度,在特征提取层中使用深度可分离卷积进行特征提取。为了防止网络传播过程中的梯度消失并增强病害像素特征融合,在特征提取层中引入了大卷积核倒置残差结构(IRBCKS)模块。此外,在特征增强层集成了轻量级卷积块注意力模块(CBAM)注意力机制,以捕捉植物病害相关图像中像素之间的关系,增强关键信息的提取。最后,采用剪枝技术剔除模型中冗余特征信息,从而再次减少模型参数量,形成最终的轻量级网络模型Cut-MobileNet。为验证该模型的先进性,将其与轻量化模型(MobileNet V2、SqueezeNet、GoogLeNet)和非轻量化模型(Vision Transformer、AlexNet)进行性能对比,研究结果表明,Cut-MobileNet在浮点运算量、准确率、单张图片推理时间、参数量、F1值和模型大小等性能指标上都取得了较优的效果。 展开更多
关键词 模型剪枝 卷积块注意力模块(cbam)注意力机制 大卷积核倒置残差结构(IRBCKS)模块 植物病害 轻量化网络
下载PDF
基于改进YOLOv7的口罩佩戴检测算法 被引量:1
19
作者 张文铠 刘佳 《北京信息科技大学学报(自然科学版)》 2024年第1期55-60,共6页
针对YOLOv7模型在口罩佩戴检测任务中特征提取能力不足、模型感受野相对较小等问题,提出一种改进YOLOv7的口罩佩戴检测算法。首先,在YOLOv7模型的主干网络引入感受野模块(receptive field block,RFB),增大模型的感受野;其次,在YOLOv7模... 针对YOLOv7模型在口罩佩戴检测任务中特征提取能力不足、模型感受野相对较小等问题,提出一种改进YOLOv7的口罩佩戴检测算法。首先,在YOLOv7模型的主干网络引入感受野模块(receptive field block,RFB),增大模型的感受野;其次,在YOLOv7模型的头部网络引入卷积块注意力模块(convolutional block attention module,CBAM),提取关键信息,忽略无关信息,增强特征图的信息表达能力,提高模型的检测能力。实验结果表明:改进后的YOLOv7口罩佩戴检测算法精确率达到95.7%,较原YOLOv7算法提高了5.6百分点;平均精度均值达到96.6%,提高了2.6百分点。相比于目前主流的口罩佩戴检测算法,改进后的YOLOv7口罩佩戴检测算法可以更加准确地检测出口罩佩戴情况。 展开更多
关键词 YOLOv7 口罩佩戴检测 cbam注意力机制 感受野模块 平均精度
下载PDF
基于CartoonGan的改进卡通化图片生成方法
20
作者 张文天 于瓅 《新疆师范大学学报(自然科学版)》 2024年第2期32-42,共11页
文章提出了一种改进的卡通图像生成网络模型,旨在增强卡通效果的同时保留语义信息。首先,设计一个显著性网络,为了防止过拟合问题以及进一步提取特征,在显著性网络上添加残差结构构成残差显著性网络,并将其拼接到CartoonGan上用来保留... 文章提出了一种改进的卡通图像生成网络模型,旨在增强卡通效果的同时保留语义信息。首先,设计一个显著性网络,为了防止过拟合问题以及进一步提取特征,在显著性网络上添加残差结构构成残差显著性网络,并将其拼接到CartoonGan上用来保留语义信息;其次,在前者基础上添加cbam注意力机制进一步提高卡通化效果;最后,在训练过程中为了防止训练不稳定和梯度消失使用最小二乘损失来替换交叉熵损失,并且引入显著性损失来约束显著性网路的训练。实验表明,通过在宫崎骏和新海诚两个画风的卡通数据集上进行测试,使用FID测试指标显示在两个数据集上都有一定的优化。 展开更多
关键词 cbam注意力机制 显著性网络 残差结构 CartoonGan
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部