期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于注意力机制和迁移学习的服装分类方法
1
作者 陈金广 黄晓菊 马丽丽 《西安工程大学学报》 CAS 2024年第3期109-116,共8页
针对服装图像分类效率低、准确率不高等问题,提出了一种基于注意力机制和迁移学习的服装图像分类方法。主要采用预训练的ResNet50网络模型在服装数据集上进行迁移学习,以降低对数据集的依赖,并减少网络训练时间;通过几何变换和颜色抖动... 针对服装图像分类效率低、准确率不高等问题,提出了一种基于注意力机制和迁移学习的服装图像分类方法。主要采用预训练的ResNet50网络模型在服装数据集上进行迁移学习,以降低对数据集的依赖,并减少网络训练时间;通过几何变换和颜色抖动2种数据增强手段处理数据集,提高模型的泛化能力;以ResNet50为基础网络,加入卷积注意力机制模块(convolutional block attention module, CBAM),依次从通道和空间2个维度提高对服装不同区域的关注度,增强了特征表达能力。在CD和IDFashion两类背景干扰信息不同的数据集上进行验证,实验结果表明:所提出的模型能够提取更多服装特征信息,在IDFashion数据集的平均分类准确率为95.60%,分别高于ResNet50、ResNet50+STN和ResNet50+ECA模型6.65%、6.69%、6.62%,一定程度上提高了服装图像分类的准确率和效率。 展开更多
关键词 服装图像分类 ResNet50 卷积注意力机制模块(CBAM) 注意力机制 迁移学习
下载PDF
基于注意力机制轻量化模型的植物病害识别方法
2
作者 苏航 陈旭昊 +3 位作者 寿德荣 张朝阳 许彪 孙丙宇 《江苏农业学报》 CSCD 北大核心 2024年第8期1389-1399,共11页
针对现有植物病害识别模型存在响应速度慢、参数量多、计算机内存资源消耗大等问题,本研究提出了一种轻量化神经网络模型,该模型由特征提取层、特征增强层和分类器组成。为了减小模型大小并提高网络响应速度,在特征提取层中使用深度可... 针对现有植物病害识别模型存在响应速度慢、参数量多、计算机内存资源消耗大等问题,本研究提出了一种轻量化神经网络模型,该模型由特征提取层、特征增强层和分类器组成。为了减小模型大小并提高网络响应速度,在特征提取层中使用深度可分离卷积进行特征提取。为了防止网络传播过程中的梯度消失并增强病害像素特征融合,在特征提取层中引入了大卷积核倒置残差结构(IRBCKS)模块。此外,在特征增强层集成了轻量级卷积块注意力模块(CBAM)注意力机制,以捕捉植物病害相关图像中像素之间的关系,增强关键信息的提取。最后,采用剪枝技术剔除模型中冗余特征信息,从而再次减少模型参数量,形成最终的轻量级网络模型Cut-MobileNet。为验证该模型的先进性,将其与轻量化模型(MobileNet V2、SqueezeNet、GoogLeNet)和非轻量化模型(Vision Transformer、AlexNet)进行性能对比,研究结果表明,Cut-MobileNet在浮点运算量、准确率、单张图片推理时间、参数量、F1值和模型大小等性能指标上都取得了较优的效果。 展开更多
关键词 模型剪枝 卷积注意力模块(CBAM)注意力机制 卷积核倒置残差结构(IRBCKS)模块 植物病害 轻量化网络
下载PDF
嵌入注意力机制残差网络的人脸表情识别方法 被引量:1
3
作者 钟瑞 蒋斌 +1 位作者 李南星 崔晓梅 《计算机工程与应用》 CSCD 北大核心 2023年第11期88-97,共10页
针对非可控环境下人脸图像易受光照、姿态变化等复杂因素的影响,进而造成人脸表情识别中人脸检测率低、表情识别精度差的问题,提出了一种嵌入注意力机制残差网络的表情识别方法。在人脸检测阶段,采用改进的RetinaFace算法完成多视角人... 针对非可控环境下人脸图像易受光照、姿态变化等复杂因素的影响,进而造成人脸表情识别中人脸检测率低、表情识别精度差的问题,提出了一种嵌入注意力机制残差网络的表情识别方法。在人脸检测阶段,采用改进的RetinaFace算法完成多视角人脸检测,获取人脸区域。在特征提取阶段,使用ResNet-50作为特征提取的主干网络。将预处理后的人脸图片,依次通过该网络的通道注意力网络和空间注意力网络,显式地建模全局图像的相互依赖性。在虚线残差单元的快捷连接中,加入平均池化层进行下采样操作,通过微调残差模块的操作,加强输入特征之间的映射,使提取的表情特征能够较完整地在网络之间传递,以减小特征信息的损失;在网络中再次传入卷积注意力机制模块,增强局部表情特征的通道维度信息和空间维度信息,加强特征图中与表情相关性高的特征区域的重点信息,同时抑制特征图中无关区域的干扰,进而加快网络的收敛速度,提高表情识别率。与基线算法相比,该方法在RAF-DB和FER2013表情数据集上分别取得了87.65%和73.57%的准确率。 展开更多
关键词 注意力机制 残差网络 表情识别 卷积注意力机制模块 RetinaFace
下载PDF
深度迁移学习与注意力机制的垃圾图像分类方法
4
作者 王策仁 彭亚雄 陆安江 《计算机与数字工程》 2023年第12期2959-2965,共7页
垃圾分类对节约资源和改善环境有着重大的意义。针对日益增长的消费能力带来的垃圾种类的增长,提出基于深度学习神经网络和迁移学习并引入注意力机制的垃圾分类图像识别方法。首先,建立以可回收垃圾、厨余垃圾、有害垃圾和其他垃圾四大... 垃圾分类对节约资源和改善环境有着重大的意义。针对日益增长的消费能力带来的垃圾种类的增长,提出基于深度学习神经网络和迁移学习并引入注意力机制的垃圾分类图像识别方法。首先,建立以可回收垃圾、厨余垃圾、有害垃圾和其他垃圾四大分类为基础,其中包括210种子分类的二级分类数据集;其次,采用自训练加迁移学习融合的方式,先搭建自训练卷积神经网络,后建立VGG16、ResNet50和ResNeSt50卷积神经网络,迁移同构模型下的预训练特征模型,把两个网络提取的特征融合,再添加基于CBAM注意力机制的改进模型,最后再接入微调网络再训练。分析得出最好的垃圾分类模型。实验数据表明,论文方法对比非迁移学习网络,时间消耗平均节约了29.4%,模型准确度平均提升8.06%,准确度最高达到92.2%。该方式可以显著地提升垃圾分类自动化的效率。 展开更多
关键词 深度学习 垃圾分类 卷积注意力机制模块 迁移学习 微调网络
下载PDF
基于注意力残差U-Net的皮肤镜图像分割方法 被引量:1
5
作者 沈鑫 魏利胜 《智能系统学报》 CSCD 北大核心 2023年第4期699-707,共9页
针对皮肤镜图像类内差异性、类间相似性、数据集不平衡等问题,本文提出了一种基于注意力残差U-Net(attention residual block-UNet,ARB-UNet)的皮肤镜图像分割方法。将卷积块注意力机制模块(convolutional block attention module,CBAM... 针对皮肤镜图像类内差异性、类间相似性、数据集不平衡等问题,本文提出了一种基于注意力残差U-Net(attention residual block-UNet,ARB-UNet)的皮肤镜图像分割方法。将卷积块注意力机制模块(convolutional block attention module,CBAM)引入到U-Net模型的“跳过连接”中;同时将CBAM模块集成到残差模块DRB(dilated residual networks)中得到注意力残差结构(attention residual block,ARB);且选取Focal Tversky Loss作为该模型的损失函数;在ISIC2016数据集上对所提ARB-UNet模型进行训练和测试,并与传统方法和UNet等经典方法进行了对比实验,实验结果中灵敏度(sensitivity,SE)达到了92.9%,特异性(specificity,SP)达到了94.1%,Dice相似指数(dice similarity cofficient,DSC)达到了92.1%,整体上均优于其他对比方法,从而验证了本文方法是有效的和可行的。 展开更多
关键词 图像分割 皮肤镜 卷积神经网络 注意力残差U-Net 注意力机制 卷积注意力机制模块 深度学习 残差网络
下载PDF
基于多监督注意力机制神经网络的脑胶质瘤循环肿瘤细胞分割算法
6
作者 袁红杰 杨艳 +1 位作者 张东 杨双 《中国医学物理学杂志》 CSCD 2022年第7期828-833,共6页
为了提升脑胶质瘤循环肿瘤细胞的分割准确率,解决人工分割中肉眼分辨边界困难、目标占比小和操作流程繁琐等问题,提出一种端到端的像素级分割算法。针对数据特征,提出一种基于多监督机制的混合损失函数用以提升预测区域与目标区域的交并... 为了提升脑胶质瘤循环肿瘤细胞的分割准确率,解决人工分割中肉眼分辨边界困难、目标占比小和操作流程繁琐等问题,提出一种端到端的像素级分割算法。针对数据特征,提出一种基于多监督机制的混合损失函数用以提升预测区域与目标区域的交并比,同时训练网络向预测正确目标个数的方向收敛;其次,在网络中逐层加入卷积块注意力机制模块,使得网络能在空间、通道层面重点学习数据特征,进一步提升预测准确率;最后,通过采用混合训练的方式,只需一个网络模型就能直接分割出细胞核、细胞质区域,缩减训练流程。实验结果表明,此分割算法对比U-Net网络在召回率、精确率以及Dice系数方面均有显著提升,在细胞核分割方面,分别达到92.20%、86.56%、88.27%;在细胞质分割方面,分别达到89.33%、85.31%、86.33%。 展开更多
关键词 脑胶质瘤 循环肿瘤细胞 多监督 卷积注意力机制模块 小目标分割
下载PDF
基于卷积神经网络的遮挡目标图像检测识别技术研究 被引量:1
7
作者 秦晨曦 于洋 《电脑编程技巧与维护》 2023年第2期153-155,共3页
为了尽可能降低图像目标的重复识别概率、错误率,提出了利用卷积神经网络算法对图像识别信息的重复识别进行分析的实验研究。遮挡目标的数据集经过图像增强后输入给卷积层卷积,初始化得到的图像数据经过卷积层卷积后,提交至池化层进行... 为了尽可能降低图像目标的重复识别概率、错误率,提出了利用卷积神经网络算法对图像识别信息的重复识别进行分析的实验研究。遮挡目标的数据集经过图像增强后输入给卷积层卷积,初始化得到的图像数据经过卷积层卷积后,提交至池化层进行进一步处理,提取图像特征数据,将提取的图像特征数据经过池化层处理后进行压缩,提取遮挡目标的关键特征信息。最后经过TensorFlow深度机器学习框架的实验测试,进一步证明使用注意模块后可以通过引导网络去关注被遮挡目标图像上的可视细节部分,并完善对遮挡目标图像检测进行验证研究。 展开更多
关键词 卷积神经网络 卷积注意力机制模块 遮挡目标识别
下载PDF
融合Inception V1-CBAM-CNN的轴承剩余寿命预测模型 被引量:2
8
作者 余江鸿 彭雄露 +2 位作者 刘涛 杨文 叶帅 《机电工程》 北大核心 2024年第1期107-114,共8页
针对现有的滚动轴承剩余寿命(RUL)预测方法精度低、轴承健康指标(HI)构建困难等问题,提出了一种基于卷积神经网络(CNN)并融合Inception V1模块和卷积注意力机制模块(CBAM)的滚动轴承RUL预测模型。首先,在CNN中添加了CBAM机制,并进行了... 针对现有的滚动轴承剩余寿命(RUL)预测方法精度低、轴承健康指标(HI)构建困难等问题,提出了一种基于卷积神经网络(CNN)并融合Inception V1模块和卷积注意力机制模块(CBAM)的滚动轴承RUL预测模型。首先,在CNN中添加了CBAM机制,并进行了加权处理,在通道和空间维度对重要特征进行了强化,对次要特征进行了抑制,通过添加改进的InceptionV1模块,提高了CNN通道间信息交互水平,全面提取了退化特征;然后,进行了网络优化,采用全局最大池化(GMP)方法对模型进行了简化,采用Dropout和批量归一化(BN)方法,避免了过拟合,提高了精度,且克服了训练时出现的梯度消失问题;最后,对数据进行了处理,将降噪后的信号重组为三维张量,将其作为HI,构建了退化标签,引入了评价指标,采用PHM2012轴承数据集进行了实验验证,在3种工况下将其与深度神经网络(DNN)、CNN方法、结合注意力机制的残差网络方法(ResNet)进行了对比。研究结果表明:该方法在变负载条件下的平均RMSE为0.033,较其他方法的RMSE值分别降低了86%、78%和69%,在预测精度和泛化能力方面具有明显优势。 展开更多
关键词 滚动轴承 剩余使用寿命 Inception V1模块 卷积注意力机制模块 卷积神经网络 全局最大池化 批量归一化
下载PDF
基于卷积模块注意力机制深度学习模型的激光熔覆裂纹识别 被引量:6
9
作者 崔陆军 李海洋 +4 位作者 郭士锐 李晓磊 崔英浩 郑博 孙满盈 《激光与光电子学进展》 CSCD 北大核心 2021年第20期329-335,共7页
为改进传统人工方法对熔覆区域裂纹检测耗时、准确率低的现状,提出了一种融合注意力模型的熔覆区裂纹自动识别方法,以便对裂纹进行标识和检测。基于U-net网络构造的熔覆裂纹语义分割网络存在对局部小特征提取能力不足的问题,而通过增加... 为改进传统人工方法对熔覆区域裂纹检测耗时、准确率低的现状,提出了一种融合注意力模型的熔覆区裂纹自动识别方法,以便对裂纹进行标识和检测。基于U-net网络构造的熔覆裂纹语义分割网络存在对局部小特征提取能力不足的问题,而通过增加注意力模型(CBAM)层,提取特征空间和特征通道的权重信息,就可以对激光熔覆区微观裂纹进行实时的像素级标注和检测。实验结果表明:引入注意力模型的深度学习模型可使熔覆裂纹的识别和检测准确率提升2.7个百分点;融合注意力模型的网络在熔覆区域裂纹测试集上的准确率为79.8%。深度学习模型标注的准确度和速度均已超过人工标注,为激光熔覆裂纹的识别提供了有效方法。 展开更多
关键词 图像处理 熔覆区裂纹 卷积模块注意力机制 语义分割 U-net网络
原文传递
基于时序特征灰度图与多任务学习的综合能源负荷短期预测 被引量:1
10
作者 倪建辉 张菁 +2 位作者 张昊立 陈龙 高典 《电气工程学报》 CSCD 北大核心 2024年第2期186-199,共14页
准确预测综合能源系统(Integrated energy system,IES)中的电、冷、热多元负荷是提高各类能源综合效率、获得更大经济效益的关键。因此,提出一种基于时序特征灰度图与多任务学习的综合能源负荷短期预测方法。首先将初始特征集通过最大... 准确预测综合能源系统(Integrated energy system,IES)中的电、冷、热多元负荷是提高各类能源综合效率、获得更大经济效益的关键。因此,提出一种基于时序特征灰度图与多任务学习的综合能源负荷短期预测方法。首先将初始特征集通过最大互信息系数(Maximum information coefficient,MIC)改进的快速相关滤波算法(Fast correlation-based filter,FCBF)对IES时序特征数据集进行相关性分析和冗余性分析;然后将特征选择结果利用因数重构法与MIC-gamma图像增强的方法重构为时序特征灰度图,能够直观有效地反映实际数据的特征相关性;其次采用基于多任务学习框架的(Convolutional block attention module-convolutional neural network-deep bidirectional gated recurrent unit,CBAM-CNN-DBiGRU)网络进行训练,嵌入的卷积注意力机制模块(Convolutional block attention module,CBAM)与(Deep bidirectional gated recurrent unit,DBiGRU)结构能有效加强共享层的关键信息提取和时序信息处理能力;最后以美国亚利桑那州立大学的IES数据为例对提出的方法进行测试。选取典型工作日和典型休息日并对比多种深度网络模型,测试结果表明,该模型在典型工作日的加权平均绝对百分比误差与加权均方根误差分别最大降低了0.8813%与229.2593 kW,在典型休息日则分别最大降低了0.9942%与360.8007 kW,能够有效提升IES多元负荷预测精度。 展开更多
关键词 多元负荷预测 最大互信息系数 快速相关滤波算法 特征冗余性 MIC-gamma图像增强 卷积注意力机制模块 深度双向门控循环单元
下载PDF
基于双目视觉的吊卡识别及其方位检测方法
11
作者 李进付 《石油机械》 北大核心 2024年第4期11-17,共7页
针对钻井自动化中的吊卡方位需要人工参与,存在识别定位缓慢和准确性差等问题,建立了基于双目视觉的吊卡自动识别和方位检测系统。通过搭建双目相机视觉检测系统,对获取的吊卡图像进行标定、立体校正和立体匹配,进而获取吊卡图像的深度... 针对钻井自动化中的吊卡方位需要人工参与,存在识别定位缓慢和准确性差等问题,建立了基于双目视觉的吊卡自动识别和方位检测系统。通过搭建双目相机视觉检测系统,对获取的吊卡图像进行标定、立体校正和立体匹配,进而获取吊卡图像的深度图。在原YOLOv5s目标检测算法的主干网络中引入卷积注意力机制模块,将要识别的目标即吊卡图像进行增强,进一步提高吊卡的识别准确率,结合深度图计算出吊卡中心位置相对机械手的距离和偏转角度,从而实现自动送管。通过在钻井平台的试验,验证了吊卡识别和检测方法的有效性。所得结论可为钻井平台自动化程度的进一步提高提供技术借鉴。 展开更多
关键词 吊卡识别 方位检测 双目相机 YOLOv5s算法 卷积注意力机制模块 试验验证
下载PDF
一种基于YOLOv4的密集人群小目标检测方法
12
作者 王翀 王同军 周正一 《应用科技》 CAS 2024年第2期82-89,共8页
针对密集人群中由于视觉受阻和目标被遮挡导致小目标检测精度不佳的问题,本文基于YOLOv4模型将卷积块–像素块注意力机制模块(convolutional-pixel block attention module,CBAM-PIX)融入主干网络CSPDarknet53,并利用级联思想改进特征... 针对密集人群中由于视觉受阻和目标被遮挡导致小目标检测精度不佳的问题,本文基于YOLOv4模型将卷积块–像素块注意力机制模块(convolutional-pixel block attention module,CBAM-PIX)融入主干网络CSPDarknet53,并利用级联思想改进特征融合网络。注意力机制方法和特征融合方法不仅提升了数据的丰富性,而且提高了空间通道像素提取信息的能力和目标检测的准确性。此外,通过减少网络层数降低计算量和减少参数,提高了网络模型在有限计算资源和设备需求下的适应能力。实验结果表明,改进的模型算法在用于密集人群小目标检测时精确度提升了1.96%,且鲁棒性强。该算法为解决复杂背景下密集人群小目标检测提供了有效的解决方案,具有应用价值。 展开更多
关键词 小目标检测 YOLOv4 特征提取 卷积块–像素块注意力机制模块 密集人群 多尺度特征网络 WiderPerson数据集 特征融合
下载PDF
面向密集场景结合TC-YOLOX的小目标检测方法
13
作者 李翔宇 王伟 +1 位作者 王峰萍 韩岩江 《电子测量技术》 北大核心 2023年第15期133-142,共10页
密集场景下小目标的高效精确检测是目标检测领域的关键问题。为了解决环境的多样性和小目标自身复杂性存在着特征难以提取、检测精度低等问题,提出一种面向密集场景结合TC-YOLOX的小目标检测方法。首先,通过在CSPNet中引入Transformer E... 密集场景下小目标的高效精确检测是目标检测领域的关键问题。为了解决环境的多样性和小目标自身复杂性存在着特征难以提取、检测精度低等问题,提出一种面向密集场景结合TC-YOLOX的小目标检测方法。首先,通过在CSPNet中引入Transformer Encode模块,不断更新目标权重实现增强目标特征信息,提高网络的特征提取能力;其次,在特征金字塔网络中增加卷积注意力机制模块,关注重要特征并抑制不必要特征,提高不同尺度目标的检测准确度;然后,采用CIoU代替IoU作为回归损失函数,使得模型训练过程中网络收敛更快,性能更好;最后在PASCAL VOC 2007数据集上验证。实验结果表明,所设计的TC-YOLOX模型能够有效的检测出多样化场景中正常、密集、稀疏、黑暗条件下的小目标物体,mAP和检测速度可以达到94.6%和38 fps,与原始模型相比提升了10.9%和1 fps,对多种密集场景下的小目标检测任务均具有较好的适用性。 展开更多
关键词 小目标检测 YOLOX 卷积注意力机制模块 Transformer Encode CIoU回归损失函数
下载PDF
基于改进YOLOv5算法的密集遮挡零件检测
14
作者 张新伟 陈东 +1 位作者 闫昊 马兆昆 《工具技术》 北大核心 2023年第10期150-155,共6页
针对零件在密集遮挡等复杂场景下存在视觉识别难度大、检测精度低和实时性差的问题,提出YOLOv5零件目标检测的改进算法。在YOLOv5的主干网络中添加卷积注意力机制模块,进而增强算法对零件的特征提取能力;将抑制准则改为考虑真实框与预... 针对零件在密集遮挡等复杂场景下存在视觉识别难度大、检测精度低和实时性差的问题,提出YOLOv5零件目标检测的改进算法。在YOLOv5的主干网络中添加卷积注意力机制模块,进而增强算法对零件的特征提取能力;将抑制准则改为考虑真实框与预测框重叠区域且同时计算两个框之间中心点距离的DIoU-NMS,并以此作为后处理方法,进而提高零件检测精度。试验结果表明,相比原始YOLOv5算法,本改进算法将mAP@0.5提升1.6%,识别速度达58.8帧/s,可以更好地完成检测密集遮挡零件的任务,同时保证了实时性。 展开更多
关键词 目标检测 YOLOv5 卷积注意力机制模块 DIoU-NMS
下载PDF
基于改进YOLOv5s的小麦赤霉病检测方法
15
作者 高君 张正华 +2 位作者 邵明 廖瑾薇 蔡涵杰 《信息与电脑》 2023年第12期61-65,共5页
针对目前小麦赤霉病检测依赖人工和实时性较低等缺点,提出一种基于改进YOLOv5s的小麦赤霉病检测算法。首先使用数据增强方式扩充样本集合,增强模型的训练效果,其次引入GhostConv卷积来代替原有Conv卷积,提升计算速度,再次引入卷积注意... 针对目前小麦赤霉病检测依赖人工和实时性较低等缺点,提出一种基于改进YOLOv5s的小麦赤霉病检测算法。首先使用数据增强方式扩充样本集合,增强模型的训练效果,其次引入GhostConv卷积来代替原有Conv卷积,提升计算速度,再次引入卷积注意力机制模块(Convolutional Block Attention Module,CBAM)提升检测精度,最后引入TensorRT网络进行模型检测加速。实验结果表明:改进后的YOLOv5s模型经TensorRT加速后平均精度均值达到0.938,提升了2.6个百分点;单幅图像处理时间为77.8 ms,检测速度提升1.45倍。综上,本次提出的检测方法可以基本满足小麦赤霉病检测对精度和实时性的要求。 展开更多
关键词 小麦赤霉病 YOLOv5s 卷积注意力机制模块(CBAM) TensorRT
下载PDF
基于改进YOLOv7的安全帽佩戴检测算法
16
作者 张晨 陈云鹏 +1 位作者 王青林 邱生顺 《信息与电脑》 2023年第14期115-119,共5页
佩戴安全帽对确保高危作业人员的生命安全至关重要。然而,由于施工现场活动范围广泛,从摄像头收集的安全帽图像具有相对较小、检测难度大的特点,容易出现漏检或错检的问题。因此,提出了一种基于改进YOLOv7的安全帽检测算法。使用Kmeans+... 佩戴安全帽对确保高危作业人员的生命安全至关重要。然而,由于施工现场活动范围广泛,从摄像头收集的安全帽图像具有相对较小、检测难度大的特点,容易出现漏检或错检的问题。因此,提出了一种基于改进YOLOv7的安全帽检测算法。使用Kmeans++算法聚类得到更优的先验边界框,在原YOLOv7中添加一个小目标检测层,同时加入卷积注意力机制模块(Convolutional Block Attention Module,CBAM),使网络更加关注输入图像的有效信息。为优化损失函数,使用Focal-EIoU替换了原YOLOv7网络模型中的完整的交并比(Complete Intersectionover Union,CIoU),从而减少损失函数自由度,提高模型性能。实验采用了百度飞桨公开的安全帽数据集进行训练。结果表明,改进算法的准确率达到92.2%,召回率达到91.6%,全类别平均正确率(mean Average Precision,mAP)提升1.4个百分点。提出的改进算法有效降低了漏检率及错检率,在安全帽佩戴检测中表现出良好的性能。 展开更多
关键词 安全帽佩戴检测 YOLOv7 卷积注意力机制模块(CBAM) Kmeans++ 损失函数
下载PDF
基于CRNN改进的中文手写体文本行识别
17
作者 舒珊珊 郑晓旭 文成玉 《成都信息工程大学学报》 2023年第4期422-428,共7页
中文手写体文本行识别可以将纸质书写内容转换为可编辑的电子内容。对于手写体书写随意性大、中文字符种类多,且基于字符分割的方法识别准确率不高这些问题,提出基于卷积循环神经网络改进的端到端的中文手写体识别方法。首先将图片传入... 中文手写体文本行识别可以将纸质书写内容转换为可编辑的电子内容。对于手写体书写随意性大、中文字符种类多,且基于字符分割的方法识别准确率不高这些问题,提出基于卷积循环神经网络改进的端到端的中文手写体识别方法。首先将图片传入基于改进的Inception结构的特征提取网络,该网络首先改进GoogLeNet模型,然后在此基础上又改进添加卷积模块的注意力机制模块和Inception组合结构,改进后的模型能更好地提取图片的有效特征;之后将提取到的图片特征传入循环层,即两层双向长短时记忆网络进行预测;最后将预测序列传入转录层,经过连接时序分类进行转录输出。在CASIA-HWDB2数据集的实验结果表明,该方法能获得95.12%的识别准确率,证明方法的可行性。 展开更多
关键词 手写体识别 卷积循环神经网络 卷积模块注意力机制模块 双向长短时记忆网络 连接时序分类
下载PDF
基于CBAM Faster R-CNN的食道癌检测 被引量:7
18
作者 佘逸飞 高军峰 +3 位作者 闵祥德 徐胜舟 盘安思 蓝文威 《中南民族大学学报(自然科学版)》 CAS 北大核心 2021年第6期631-638,共8页
为解决钡餐造影图像经Faster R-CNN的骨干网络得出的特征图中的食管区域不明显以及背景区域占比较大等问题,提出了CBAM Faster R-CNN,它是在原Faster R-CNN模型的基础上添加卷积注意力模块CBAM,以提升特征图中食管区域的特征的显著性.采... 为解决钡餐造影图像经Faster R-CNN的骨干网络得出的特征图中的食管区域不明显以及背景区域占比较大等问题,提出了CBAM Faster R-CNN,它是在原Faster R-CNN模型的基础上添加卷积注意力模块CBAM,以提升特征图中食管区域的特征的显著性.采用CBAM Faster R-CNN模型对数据增强后的训练集进行了训练,并采用Recall值、Precision值、AP值进行了评价分析.实验结果表明:在不同的IOU阈值下,CBAM Faster R-CNN模型的检测效果明显优于Faster R-CNN,且对实际的临床研究具有一定的意义. 展开更多
关键词 食道癌 目标检测 更快速的R-CNN 卷积注意力机制模块 计算机视觉
下载PDF
芒果图像的改进EfficientNet模型分级
19
作者 巩晴 尚庆生 +1 位作者 郭泓 韩运龙 《宜宾学院学报》 2022年第12期1-5,共5页
针对传统芒果分级方法存在繁琐、劳动密集、缓慢、容易出错等问题,提出基于CBAM注意机制的EfficientNet模型,并添加一种多尺度融合方法,将模型应用于芒果图像数据集,高精度完成了芒果等级分类任务,准确率达95.23%.
关键词 EfficientNet 深度学习 卷积注意力机制模块 水果分类 芒果分级
下载PDF
基于改进YOLOv4的行人检测算法 被引量:10
20
作者 李挺 伊力哈木·亚尔买买提 《科学技术与工程》 北大核心 2022年第8期3221-3227,共7页
针对YOLOv4算法在行人检测中精度低,实时性差的问题,提出一种基于YOLOv4的改进算法。首先将MobileNetv2作为主干网络,在减少参数量的同时保证其特征提取能力,同时在MobileNetv2中加入Bottom-up连接,减少浅层信息的丢失;然后在特征融合... 针对YOLOv4算法在行人检测中精度低,实时性差的问题,提出一种基于YOLOv4的改进算法。首先将MobileNetv2作为主干网络,在减少参数量的同时保证其特征提取能力,同时在MobileNetv2中加入Bottom-up连接,减少浅层信息的丢失;然后在特征融合网络嵌入卷积模块的注意力机制模块(convolutional block attention module,CBAM)注意力机制,增强特征的表现力;最后在分类与回归网络中加入Inception结构,进一步提高检测速度和增加网络复杂度。结果表明:在VOC数据集上,改进算法比原算法检测效果更佳,实时性更好,其精度提高了2.87%,处理速度提升了29.52 FPS;同时在真实场景下构建的数据集上,改进后的算法比YOLOv4精度提高了2.13%,具有较好的鲁棒性。 展开更多
关键词 行人检测 实时 多尺度融合 卷积模块注意力机制模块(CBAM) BOTTOM-UP MobilenNetv2
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部