期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
基于SPD-Conv结构和NAM注意力机制的鱼群小目标检测
1
作者 谌雨章 王诗琦 +1 位作者 周雯 周婉婷 《计算机科学》 CSCD 北大核心 2024年第S01期426-432,共7页
为解决因水下成像环境退化导致图像分辨率较低,以及因鱼群目标较小等因素导致的检测精度不高的问题,提出了一种结合SPD-Conv结构和NAM注意力机制的改进YOLOv7检测算法。首先,采用Space-to-Depth(SPD)结构改进头部网络,取代了网络中原有... 为解决因水下成像环境退化导致图像分辨率较低,以及因鱼群目标较小等因素导致的检测精度不高的问题,提出了一种结合SPD-Conv结构和NAM注意力机制的改进YOLOv7检测算法。首先,采用Space-to-Depth(SPD)结构改进头部网络,取代了网络中原有的跨步卷积结构,保留了更多的细粒度信息,提升了特征学习的效率,提高了网络对低分辨率图像的检测效果。然后在网络中引入Normalization-based Attention Module(NAM)注意力机制,采用CBAM的模块集成方式,使用BN缩放因子来计算注意力权重,抑制了不显著的特征,提升了小目标检测的准确率。最后针对水下成像退化,对检测图片做反卷积预处理,减小了水下成像退化因素对检测造成的影响。实验结果显示,在WildFish数据集上模型的整体精度达到97.2%,与YOLOv7算法相比提升了7.6%,准确率提升了8.5%,召回率提升了9.8%,与Efficientdet,SSD,YOLOv5及YOLOv8算法相比,所提模型精度分别提升了12.6%,17.8%,4%及2.9%,在Aquarium数据集上模型的整体精度达到80.5%,相比Efficientdet,SSD,YOLOv5,YOLOv7及YOLOv8分别提升了18.4%,11.6%,6.9%,2.0%及2.7%,可以满足水下鱼群识别的需求。 展开更多
关键词 SPD-Conv结构 nam注意力机制 YOLOv7算法 鱼群检测 目标检测
下载PDF
基于NAM-YOLOv7的航拍船体小目标检测算法研究
2
作者 冯灵清 杜凯杰 刘宇晶 《无线互联科技》 2023年第20期136-140,144,共6页
针对目标检测中遥感或航拍图像中的小目标检测容易出现漏检和误检等问题,文章提出一种在YOLOv7目标检测模型上引入注意力机制NAMAttention的优化改进模型。该注意力机制采用新的注意力计算方式,无需额外的参数,通过抑制不太显著的特征... 针对目标检测中遥感或航拍图像中的小目标检测容易出现漏检和误检等问题,文章提出一种在YOLOv7目标检测模型上引入注意力机制NAMAttention的优化改进模型。该注意力机制采用新的注意力计算方式,无需额外的参数,通过抑制不太显著的特征来提高效率,是一种轻量级的高效的注意力机制。实验证明,基于NAM-YOLOv7的航拍船体小目标检测能够达到更高的准确率,误检率和漏检率也有一定程度上的降低。该模型可用于捕捉检测航拍画面中的船体数量,对于海域的活动船只监控具有参考意义。 展开更多
关键词 nam-YOLOv7 注意力机制 小目标检测 轻量级
下载PDF
基于NAM-YOLO网络的苹果缺陷检测算法 被引量:2
3
作者 张嘉琪 徐啟蕾 《计算机与现代化》 2023年第10期53-58,64,共7页
针对苹果缺陷检测经常误检漏检、缺陷易混淆等问题,提出一种基于改进YOLOv5的苹果缺陷检测算法。苹果缺陷检测对苹果分拣至关重要,现有检测苹果缺陷的方法主要是通过机器学习或卷积神经网络提取颜色和纹理特征,存在错误检测、漏检和特... 针对苹果缺陷检测经常误检漏检、缺陷易混淆等问题,提出一种基于改进YOLOv5的苹果缺陷检测算法。苹果缺陷检测对苹果分拣至关重要,现有检测苹果缺陷的方法主要是通过机器学习或卷积神经网络提取颜色和纹理特征,存在错误检测、漏检和特征提取能力不足等问题,不能满足缺陷检测精度与实时性的需求。NAM-YOLO算法主要有3个核心思想:1)通过将TRANS模块添加到骨干网络,更好地融合特征与全局信息;2)通过加权双向特征金字塔网络融合不同尺度的特征;3)将基于归一化的注意力机制NAM注意机制引入颈部网络,强化目标区域的关键特征,提高网络的检测精度。实验结果表明,改进算法的mAP达到98.90%,准确度为98.73%。与其他模型相比,该模型具有较好的特征融合能力,可较好地满足苹果分拣的实际需要。 展开更多
关键词 nam-YOLO YOLOv5 TRANS 注意力机制 缺陷检测
下载PDF
Enhanced Attention-Based Encoder-Decoder Framework for Text Recognition 被引量:2
4
作者 S.Prabu K.Joseph Abraham Sundar 《Intelligent Automation & Soft Computing》 SCIE 2023年第2期2071-2086,共16页
Recognizing irregular text in natural images is a challenging task in computer vision.The existing approaches still face difficulties in recognizing irre-gular text because of its diverse shapes.In this paper,we propos... Recognizing irregular text in natural images is a challenging task in computer vision.The existing approaches still face difficulties in recognizing irre-gular text because of its diverse shapes.In this paper,we propose a simple yet powerful irregular text recognition framework based on an encoder-decoder archi-tecture.The proposed framework is divided into four main modules.Firstly,in the image transformation module,a Thin Plate Spline(TPS)transformation is employed to transform the irregular text image into a readable text image.Sec-ondly,we propose a novel Spatial Attention Module(SAM)to compel the model to concentrate on text regions and obtain enriched feature maps.Thirdly,a deep bi-directional long short-term memory(Bi-LSTM)network is used to make a con-textual feature map out of a visual feature map generated from a Convolutional Neural Network(CNN).Finally,we propose a Dual Step Attention Mechanism(DSAM)integrated with the Connectionist Temporal Classification(CTC)-Attention decoder to re-weights visual features and focus on the intra-sequence relationships to generate a more accurate character sequence.The effectiveness of our proposed framework is verified through extensive experiments on various benchmarks datasets,such as SVT,ICDAR,CUTE80,and IIIT5k.The perfor-mance of the proposed text recognition framework is analyzed with the accuracy metric.Demonstrate that our proposed method outperforms the existing approaches on both regular and irregular text.Additionally,the robustness of our approach is evaluated using the grocery datasets,such as GroZi-120,Web-Market,SKU-110K,and Freiburg Groceries datasets that contain complex text images.Still,our framework produces superior performance on grocery datasets. 展开更多
关键词 Deep learning text recognition text normalization attention mechanism convolutional neural network(CNN)
下载PDF
跨域人脸活体检测的单边对抗网络算法
5
作者 曾凡智 吴楚涛 周燕 《计算机工程与应用》 CSCD 北大核心 2024年第5期103-111,共9页
现有跨域人脸活体检测算法,其特征提取过程容易发生过拟合和缺乏特征聚合所导致的泛化性不足问题。针对该问题,提出了跨域人脸活体检测的单边对抗网络算法,将分组卷积与改进的倒残差结构融合替换普通卷积,降低网络参数同时加强人脸细粒... 现有跨域人脸活体检测算法,其特征提取过程容易发生过拟合和缺乏特征聚合所导致的泛化性不足问题。针对该问题,提出了跨域人脸活体检测的单边对抗网络算法,将分组卷积与改进的倒残差结构融合替换普通卷积,降低网络参数同时加强人脸细粒度特征的表达能力,并引入自适应特征归一化模块,强调图像中人脸活体信息区域淡化无关背景区域,有效避免人脸活体信息的过拟合并加强来自不同源域的人脸活体检测能力。基于NetVLAD引入通道注意力机制模块,通道注意力机制模块作为特征聚合网络的分支,学习不同源域中人脸局部特征的语义信息,有效增强对不同源域的人脸活体信息分类的泛化能力。设计两模块融合网络以提高未知场景下跨域人脸活体检测精度。在OULU-NPU、CASIA-FASD、MSU-MFSD和Idiap Replay-Attack数据集上的实验结果表明,该算法在跨数据集测试O&C&M to I、O&C&I to M、I&C&M to O、O&M&I to C均有不错的表现,其中,在O&C&I to M及O&M&I to C性能评估指标分别提升了0.99个百分点和0.5个百分点的精度。 展开更多
关键词 域泛化 生成对抗网络 人脸活体检测 自适应归一化 注意力机制
下载PDF
基于BN-YOLOv5的轻量级齿轮表面缺陷检测方法
6
作者 赵小惠 张智杰 +3 位作者 胡胜 郇凯旋 刘磊 蒲军平 《机械传动》 北大核心 2024年第5期145-151,共7页
齿轮表面的缺陷检测是齿轮生产制造过程中相当重要的工序。为了提高齿轮表面缺陷检测的精度,提出了一种基于改进YOLOv5的算法检测模型BN-YOLOv5。首先,将加权双向特征金字塔网络结构嵌入到颈部网络结构中,强化了网络对不同特征的提取能... 齿轮表面的缺陷检测是齿轮生产制造过程中相当重要的工序。为了提高齿轮表面缺陷检测的精度,提出了一种基于改进YOLOv5的算法检测模型BN-YOLOv5。首先,将加权双向特征金字塔网络结构嵌入到颈部网络结构中,强化了网络对不同特征的提取能力;其次,引入轻量级的基于标准化的注意力模块(Normalization-based Attention Module,NAM),将其与加权双向特征金字塔网络结构相结合,以更加有效地融合高层与低层的特征信息;最后,采用深度可分离卷积模块替换网络结构中所有的卷积层,使网络模型更加轻量化。实验结果显示,改进后的算法模型平均精度均值可达到98.5%,检测速度达到66 FPS/s,模型大小为9.69 MB,有效降低了模型的占用内存,可满足在小型移动设备上实时检测齿轮表面缺陷的任务要求。 展开更多
关键词 齿轮表面 缺陷检测 YOLOv5 轻量级 nam注意力机制
下载PDF
基于轻量化NDFEDet-SOLOv2的遥感图像建筑物提取方法
7
作者 汪强 郭来功 程伟涛 《重庆工商大学学报(自然科学版)》 2024年第6期20-29,共10页
目的在地籍测绘和灾害管理等领域中,建筑物轮廓和位置的自动提取是至关重要的一环。为了解决高分辨率遥感图像建筑物因环境因素导致分割精度不准确等问题,提出了一种改进的轻量化SOLOv2实例分割模型——NDFEDet-SOLOv2。方法该模型选用... 目的在地籍测绘和灾害管理等领域中,建筑物轮廓和位置的自动提取是至关重要的一环。为了解决高分辨率遥感图像建筑物因环境因素导致分割精度不准确等问题,提出了一种改进的轻量化SOLOv2实例分割模型——NDFEDet-SOLOv2。方法该模型选用双向特征金字塔网络(BiFPN)特征融合方式的轻量级EfficientDet网络,其中将骨干网络部分的EfficientNet升级为EfficientNetv2,EfficientNetv2中的三层MBConv模块SE注意力更换为含有DropBlock正则化的轻量级标准化注意力机制(NAM),构成NAD-MBConv模块。BiFPN特征融合部分,向其尾端各特征层并入双水平路由注意视觉变压器(BiFormer),形成双向水平路由注意特征金字塔网络结构(Bi-FPN-Former),从而聚焦微小建筑物轮廓信息,以实现更高层次的特征融合。结果NDFEDet-SOLOv2模型相较于传统轻量级SOLOv2实例分割算法,平均精度mAP、mAP 50和mAP 75分别提高了3.9%、3.7%和2.5%,检测帧率(FPS)提高了2.7帧/s。结论轻量化NDFEDet-SOLOv2实例分割算模型消除了建筑物边角的图像畸变,在地理环境空间不均等复杂情况下也能准确提取出遥感图像建筑物的基本轮廓,从而为城市布局更新和建筑变化检测提供理论参考。 展开更多
关键词 高分辨率遥感图像 实例分割 EfficientDet 标准化注意力机制(nam) 双水平路由注意视觉变压器(BiFormer)
下载PDF
联合归一化模块和多分支特征的行人重识别
8
作者 任丹萍 董会升 +1 位作者 何婷婷 张春华 《计算机工程与设计》 北大核心 2024年第4期1233-1239,共7页
针对行人重识别技术中存在特征挖掘不充分的问题,提出一种联合归一化模块和多分支特征的行人重识别模型。在主干网络中嵌入注意力机制引导的实例归一化模块,减轻背景等杂波信息的影响。在双级特征融合模块对局部特征进行加权后再聚合形... 针对行人重识别技术中存在特征挖掘不充分的问题,提出一种联合归一化模块和多分支特征的行人重识别模型。在主干网络中嵌入注意力机制引导的实例归一化模块,减轻背景等杂波信息的影响。在双级特征融合模块对局部特征进行加权后再聚合形成对行人特征的更细节表达。联合平滑交叉熵损失、三元组损失以及跨分支特征蒸馏损失对网络进行优化。所提模型在Market-1501和DukeMTMC-ReID数据集上首位准确率分别达到了95.7%和89.2%。实验结果表明,该模型增强了对图像特征的提取。 展开更多
关键词 归一化 行人重识别 注意力机制 多分支特征 特征提取 特征蒸馏损失 三元组损失
下载PDF
基于自注意力和门控循环神经网络的雷达回波外推算法研究
9
作者 薛丰昌 章超钦 +1 位作者 王文硕 陈笑娟 《气象学报》 CAS CSCD 北大核心 2024年第1期127-135,共9页
为提升现有神经网络对雷达回波序列的时、空特征提取能力,建立外推性能更优的时、空序列预测模型,开展雷达回波外推算法改进研究。基于深圳市气象局与中国香港天文台共同建立的雷达回波数据集,在数据处理层面,通过改进对雷达回波图像序... 为提升现有神经网络对雷达回波序列的时、空特征提取能力,建立外推性能更优的时、空序列预测模型,开展雷达回波外推算法改进研究。基于深圳市气象局与中国香港天文台共同建立的雷达回波数据集,在数据处理层面,通过改进对雷达回波图像序列归一化的方法,提升了常用的5种时、空序列预测模型对强回波的预测水平;在模型算法层面,将两个联立的自注意力结构引入ST-LSTM结构,组成新的循环门控单元,并将这些循环门控单元进行堆叠,建立ST-SARNN模型。选用CSI和POD作为精度评价指标,进行模型对比分析得到:(1)改进的归一化方法提升了近几年内常用的5种时、空序列预测模型对强回波的预测水平。(2)加入自注意力的ST-SARNN模型对雷达回波的预测性能显著优于ConvLSTM、PredRNN和MIM等模型。改进的归一化方法能改变样本数据分布,并在一定程度上提升模型外推性能;自注意力结构能够有效挖掘雷达回波序列的时、空特征,进而改进神经网络的外推表现。 展开更多
关键词 雷达回波外推 自注意力机制 循环神经网络 数据归一化方法
下载PDF
基于关系挖掘和对抗训练的多标签文本分类
10
作者 杨冬菊 程伟飞 《计算机与数字工程》 2024年第1期18-22,42,共6页
传统的多标签文本分类方法存在忽略标签语义、没有充分利用文本与标签以及标签与标签之间的关系等问题。为了解决以上问题,论文提出了一种基于关系挖掘和对抗训练的多标签文本分类模型。该模型利用了BERT模型和图注意力网络(GAT)分别提... 传统的多标签文本分类方法存在忽略标签语义、没有充分利用文本与标签以及标签与标签之间的关系等问题。为了解决以上问题,论文提出了一种基于关系挖掘和对抗训练的多标签文本分类模型。该模型利用了BERT模型和图注意力网络(GAT)分别提取文本的语义信息和挖掘标签之间的关系。首先,通过BERT模型对文本进行编码,以获取文本的语义信息。然后,使用图注意力网络(GAT)来挖掘标签之间的关系,以更好地理解标签之间的依赖关系。为了进一步挖掘文本与可学习的标签嵌入之间的关系,该模型采用了多头自注意力机制。此外,为了提高模型的鲁棒性,论文采用了R-drop策略进行模型训练。实验结果表明,在AAPD和RCV1数据集上,所提出的模型相比当前一些主流的多标签文本分类模型,不仅能够关注文本信息,还能够有效捕捉文本与标签之间的依赖关系以及标签与标签之间的关系,从而取得更好的性能。 展开更多
关键词 BERT 注意力机制 R-drop 图注意网络 归一化
下载PDF
MNTH-YOLOv8:一种用于食品包装中蚊虫高效检测的深度学习方法
11
作者 王晓红 张微 《包装学报》 2024年第3期91-98,共8页
食品安全一直是社会关注的焦点,而在食品包装印刷生产过程中,蚊虫的夹杂会对食品安全构成威胁。针对食品包装质检过程中蚊虫检测仍是人工筛查的现状,以及蚊虫目标尺寸小、所处背景复杂的特点,提出了一种基于深度学习的全自动MNTH-YOLOv... 食品安全一直是社会关注的焦点,而在食品包装印刷生产过程中,蚊虫的夹杂会对食品安全构成威胁。针对食品包装质检过程中蚊虫检测仍是人工筛查的现状,以及蚊虫目标尺寸小、所处背景复杂的特点,提出了一种基于深度学习的全自动MNTH-YOLOv8检测方法。该方法是在YOLOv8强大的目标检测功能基础上,结合通道特征部分卷积模块、SimAM注意力机制和改进的特征融合模块,并以CIoU与归一化Wasserstein距离作为定位回归损失函数的优化模型。对真实数据集的检测结果表明,MNTH-YOLOv8表现出显著优势,不仅有效提高了小目标蚊虫的检测精度,还在保持检测速度的前提下减少了参数量。MNTH-YOLOv8在食品包装中蚊虫的实时检测应用上拥有广阔前景。 展开更多
关键词 食品包装安全 蚊虫检测 YOLOv8 小目标检测 SimAM注意力机制 特征融合 归一化Wasserstein距离
下载PDF
一种基于多跳注意残差网络的调制识别算法
12
作者 侯艳丽 刘春晓 《电子信息对抗技术》 2024年第3期27-34,共8页
为了进一步提升通信信号调制识别的准确率,在ResNet网络的基础上提出一种基于多跳注意残差网络(Multi-skip Attention Residual Network,MARN)的调制识别方法。该方法利用提取不同特征的卷积核进行多跳连接构建3种残差块,进而构建多跳... 为了进一步提升通信信号调制识别的准确率,在ResNet网络的基础上提出一种基于多跳注意残差网络(Multi-skip Attention Residual Network,MARN)的调制识别方法。该方法利用提取不同特征的卷积核进行多跳连接构建3种残差块,进而构建多跳残差网络,提取信号的时域特征;加入CBAM(Convolutional Block Attention Module)注意力机制自适应地调整通道权重,加强信号特征的表征能力;采用自适配归一化(Switchable Normalization,SN)加速网络收敛;加入丢弃率为0.3的AlphaDropout层,提高算法的拟合能力,最终实现对通信信号端到端的分类识别。在RadioML2018.01a数据集上仿真实验,结果表明在信噪比为-10~15 dB下,MARN网络平均识别率达到63.3%,较ResNet网络的平均识别率提升3.7%。 展开更多
关键词 调制识别 多跳连接 残差网络 注意力机制 自适配归一化
下载PDF
基于卷积神经网络的轻量级水稻叶片病害识别模型 被引量:1
13
作者 陆煜 俞经虎 +1 位作者 朱行飞 张不凡 《江苏农业学报》 CSCD 北大核心 2024年第2期312-319,共8页
水稻病害一直是影响水稻产量的重要因素之一,为了快速、准确地检测水稻病害,本研究提出了一种基于卷积神经网络的轻量级水稻叶片病害识别模型。首先,从参数量的角度对注意力机制进行改进,得到轻量级注意力机制模块,对水稻叶片病害特征... 水稻病害一直是影响水稻产量的重要因素之一,为了快速、准确地检测水稻病害,本研究提出了一种基于卷积神经网络的轻量级水稻叶片病害识别模型。首先,从参数量的角度对注意力机制进行改进,得到轻量级注意力机制模块,对水稻叶片病害特征图中的潜在注意力信息进行深度挖掘;其次,使用深度可分离卷积代替部分标准卷积,进一步降低模型的参数量;最后,为了提高模型的泛化能力,让模型学习过程更快、更稳定,采用了自带内部归一化属性的扩展型指数线性单元函数(SELU)与外部组归一化模块相结合的方法。通过在公共数据集中进行验证,本研究构建模型的平均精度最高(0.990 0),模型在参数量和平均单次迭代时间方面也有一定优势,与其他模型相比,具有相对较好的性能。 展开更多
关键词 水稻病害 组归一化 激活函数 深度可分离卷积 注意力机制
下载PDF
基于改进生成对抗网络的半监督语义分割
14
作者 王小成 胡亚琦 王一中 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期99-107,共9页
为了解决对抗式半监督语义分割网络在训练过程中稳定性较差,传统语义分割网络难以对像素之间远距离依赖关系建模等问题,提出了一种结合谱归一化生成对抗网络和坐标注意力机制的半监督语义分割网络.利用谱归一化使对抗网络判别器满足利... 为了解决对抗式半监督语义分割网络在训练过程中稳定性较差,传统语义分割网络难以对像素之间远距离依赖关系建模等问题,提出了一种结合谱归一化生成对抗网络和坐标注意力机制的半监督语义分割网络.利用谱归一化使对抗网络判别器满足利普西茨连续性,从而提高了网络训练过程的稳定性且避免了梯度消失的问题;在分割网络中融入坐标注意力机制,使网络能够获取远距离像素之间的依赖关系,并扩大感受野.与基准模型相比,在PASCAL VOC 2012增强数据集中采用1/50、1/20和1/8标记数据集时,MIoU分别提升了2.2%、1.4%和1.8%;在Cityscapes城市街景数据集中采用1/8、1/4和1/2标记数据集时,MIoU分别提升了1.9%、2.1%和1.3%.实验结果证明,与其他基于对抗学习的半监督语义分割网络相比,该算法在半监督语义分割任务中具有较好的稳定性和准确性. 展开更多
关键词 语义分割 半监督学习 生成对抗网络 谱归一化 注意力机制
下载PDF
基于深度学习的结直肠腺体自动分割算法研究
15
作者 杨佐鹏 丁秋阳 +1 位作者 丁偕 王瑜 《计算机应用与软件》 北大核心 2024年第9期201-206,264,共7页
为实现腺体自动化分割,减轻病理学医生的工作量,帮助医生做出更加准确的临床决策,提出一种基于注意力机制和可变形卷积的适合腺体分割的深度神经网络模型(Adaptive-Gland-Segmentation-Net,AGS-Net)。该模型使用分组卷积和注意力机制使... 为实现腺体自动化分割,减轻病理学医生的工作量,帮助医生做出更加准确的临床决策,提出一种基于注意力机制和可变形卷积的适合腺体分割的深度神经网络模型(Adaptive-Gland-Segmentation-Net,AGS-Net)。该模型使用分组卷积和注意力机制使模型具有更强的表征能力,增加可变形卷积层以适应不同分化程度的腺体形状。在GlaS数据集上,加入染色标准化预处理的AGS-Net在检测结果、分割性能和形状相似性等三方面与竞争方法相比,具有很大的优势。 展开更多
关键词 结直肠癌腺体 语义分割 染色标准化 注意力机制 可变形卷积
下载PDF
基于联合注意力机制的多阶段去雨网络
16
作者 陈浩翰 王瑛 王勇 《信息技术》 2024年第5期60-65,共6页
为了提高雨天环境下拍摄的图像质量,提出了一个多阶段联合注意网络(MUANet)。该网络有三个阶段,在每个阶段的初始输入采用基于通道注意力和空间注意力的联合注意模块(UAB)进行处理,该模块可以检测通道内特征分布同时获取雨纹的空间信息... 为了提高雨天环境下拍摄的图像质量,提出了一个多阶段联合注意网络(MUANet)。该网络有三个阶段,在每个阶段的初始输入采用基于通道注意力和空间注意力的联合注意模块(UAB)进行处理,该模块可以检测通道内特征分布同时获取雨纹的空间信息。前两个阶段使用引入半实例归一化模块(HINB)的编码解码网络挖掘深层的上下文信息,精准定位雨纹在图像中的位置。最后阶段在前两个阶段生成的注意图引导下,对图像进行雨线纹理去除和背景细节的恢复。实验表明,MUANet在去雨效果和对图像背景细节的恢复上相较于现有方法有明显提高。 展开更多
关键词 多阶段网络 注意力机制 图像去雨 半实例归一化 编码解码网络
下载PDF
基于多尺度融合和高阶交互的单目3D检测算法
17
作者 孙延康 王璇之 +2 位作者 封澳 谢玉阳 肖建 《计算机技术与发展》 2024年第10期38-45,共8页
三维目标检测是三维场景理解的一项基础性和挑战性的任务,基于单目视觉的方法可以作为基于立体或基于雷达方法的经济替代。该文提出了一种基于MonoDLE改进的单目3D检测算法,用于优化由尺寸形状与3D位置偏差产生的精度损失。首先,提出了... 三维目标检测是三维场景理解的一项基础性和挑战性的任务,基于单目视觉的方法可以作为基于立体或基于雷达方法的经济替代。该文提出了一种基于MonoDLE改进的单目3D检测算法,用于优化由尺寸形状与3D位置偏差产生的精度损失。首先,提出了一个通用的多尺度池化注意力模块用于聚合更精细的多尺度特征并且高效地联系上下文信息。其次,为了增强模型的高阶空间交互能力,还提出了由递归门控卷积和分组归一化构成的递归门控卷积块,用于替代基线架构上采样模块的卷积层,有效提升上采样模块的表征能力。在单目3D检测通用数据集KITTI上的实验表明:经过多尺度池化注意力模块提高网络聚合特征的能力后,在3D视角且交并比大于0.7的标准情况下,该算法的平均检测率指标AP 40从13.66提升到15.10;经过递归门控卷积块增强模型的高阶空间交互能力后,在3D视角且交并比大于0.7的标准情况下,该算法的平均检测率指标AP 40再次从15.10提升到15.53;在两个模块协同作用下,在鸟瞰图视角且交并比大于0.7的标准情况下,该算法的平均检测率指标AP 40同样从19.33提升到21.95。 展开更多
关键词 单目3D检测 特征金字塔池化 注意力机制 递归门控卷积 分组归一化
下载PDF
基于批归一化与注意力机制的图像纹理识别算法
18
作者 贺泽华 乔延松 +1 位作者 赵绪营 赵耿 《计算机与数字工程》 2024年第3期646-652,共7页
针对传统图像纹理识别方法特征提取繁琐和纹理类间模糊性高、类内区分度低的问题,提出基于批归一化与注意力机制的卷积网络图像纹理识别算法。通过逐层批归一化将分散的数据统一,优化算法损失震荡和梯度消失问题;通过通道域和空间域的... 针对传统图像纹理识别方法特征提取繁琐和纹理类间模糊性高、类内区分度低的问题,提出基于批归一化与注意力机制的卷积网络图像纹理识别算法。通过逐层批归一化将分散的数据统一,优化算法损失震荡和梯度消失问题;通过通道域和空间域的注意力机制对图像的关键区域和纹理的关键特征进行突出化表达。实验结果表明,所提算法不仅参数量低、计算速度快,而且在纹理数据集上的识别率达99.84%,超越基准模型和其他网络模型,证明该算法的对图像纹理具有良好的识别效果。 展开更多
关键词 图像纹理 特征提取 卷积神经网络 批归一化 注意力机制
下载PDF
基于Faster-RCNN的绝缘子缺陷检测
19
作者 王子旭 张红旗 包曼 《山西电力》 2024年第4期17-21,共5页
针对传统人工检测绝缘子缺陷效率低的问题,提出一种基于Faster-RCNN的绝缘子缺陷检测方法。首先对航拍的绝缘子缺陷图片进行数据增强,其次算法中使用残差网络结构并引入注意力机制,提升检测效果的同时降低了模型复杂性,使用组归一化方... 针对传统人工检测绝缘子缺陷效率低的问题,提出一种基于Faster-RCNN的绝缘子缺陷检测方法。首先对航拍的绝缘子缺陷图片进行数据增强,其次算法中使用残差网络结构并引入注意力机制,提升检测效果的同时降低了模型复杂性,使用组归一化方式代替批归一化方式,最后用Soft-NMS代替NMS进行结果优化。试验结果表明,改进后算法的精确率达到90.3%,与改进前相对比精确率提升了14.7%,使绝缘子缺陷检测的有效性与可靠性得到了提升。 展开更多
关键词 绝缘子 Faster-RCNN 残差网络 注意力机制 组归一化
下载PDF
基于改进SqueezeNet的火焰识别算法
20
作者 王文标 时启衡 郝友维 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第8期19-26,共8页
针对现有火焰识别算法在效率上的不足,设计1种轻量高效的深度学习模型。模型基于SqueezeNet进行优化,引入双分支注意力机制以强化对火焰特征的识别能力,提升模型分类性能;同时,加入残差连接,提高网络的训练稳定性和特征表达能力;通过使... 针对现有火焰识别算法在效率上的不足,设计1种轻量高效的深度学习模型。模型基于SqueezeNet进行优化,引入双分支注意力机制以强化对火焰特征的识别能力,提升模型分类性能;同时,加入残差连接,提高网络的训练稳定性和特征表达能力;通过使用批通道归一化技术提高网络的泛化性能;此外,通过将Fire模块中的3×3标准卷积核替换为深度可分离卷积,进一步降低参数数量和计算复杂度,并通过多个公开的火焰图像数据集来评估所提算法的性能。研究结果表明:相较于原始的SqueezeNet算法,改进后的SqueezeNet模型不仅提升检测速度,同时也获得更高的识别准确率和更好的泛化能力。研究结果可为实时火灾监测系统和智能消防设备的开发提供理论基础和技术支持。 展开更多
关键词 火焰识别 SqueezeNet 批通道归一化 注意力机制 卷积神经网络
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部