期刊文献+
共找到795篇文章
< 1 2 40 >
每页显示 20 50 100
基于切分通道注意力网络的图像分类算法
1
作者 储岳中 石玉金 +1 位作者 张学锋 刘恒 《工程科学学报》 EI CSCD 北大核心 2024年第10期1856-1863,共8页
通道注意力机制可以有效利用不同的特征通道,通过对特征图的通道进行加权和调整,使得卷积神经网络可以更加关注重要的特征通道,以提高卷积神经网络的分类能力.然而,对于使用全局平均池化来获取通道全局特征的方法,特征图中不同的通道有... 通道注意力机制可以有效利用不同的特征通道,通过对特征图的通道进行加权和调整,使得卷积神经网络可以更加关注重要的特征通道,以提高卷积神经网络的分类能力.然而,对于使用全局平均池化来获取通道全局特征的方法,特征图中不同的通道有极大概率出现相同的均值,使得全局平均池化后的特征缺乏多样性,进一步影响网络分类性能.针对此问题,提出一种切分通道注意力机制来构建模块,该模块对全局平均池化的输出维度进行了扩展,减轻全局平均池化造成的信息丢失,增强了通道注意力中全局平均池化层的特征多样性,然后使用多个一维卷积分别计算通道维度上每个区域的注意力权重.将切分通道注意力机制与多种图像分类网络相结合,在CIFAR-100和ImageNet数据集上进行了图像分类实验.实验结果表明,切分通道注意力机制在保持轻量化的基础上仍然能有效提高模型的精度,并且与其他注意力机制相比也表现出较好的优势. 展开更多
关键词 图像分类 通道注意 全局平均池化 高效通道注意 模型解释
下载PDF
基于高效通道注意力的多阶段图像去雨网络
2
作者 李国金 张书铭 +1 位作者 林森 陶志勇 《电光与控制》 CSCD 北大核心 2024年第4期109-114,120,共7页
针对现有图像去雨算法不能更好地保留图像背景细节的问题,提出一种基于高效通道注意力的多阶段图像去雨网络。首先,网络使用3×3卷积提取雨图的浅层特征并传递给高效通道注意力模块,为不同的特征通道分配不同的权重;然后,传递给3个... 针对现有图像去雨算法不能更好地保留图像背景细节的问题,提出一种基于高效通道注意力的多阶段图像去雨网络。首先,网络使用3×3卷积提取雨图的浅层特征并传递给高效通道注意力模块,为不同的特征通道分配不同的权重;然后,传递给3个并行阶段,在前2个阶段中,使用编码-解码器进行多尺度特征提取,减少雨纹信息丢失,其中使用Transformer模块抑制无用信息传递;最后,在第3个阶段使用初始分辨率模块代替编码-解码器,从而保留输出图像的精细特征。实验结果表明,所提算法在Rain800、Rain12、Rain100L和Rain100H公开测试集上的结构相似性分别为0.830、0.968、0.960和0.944,峰值信噪比分别为27.33 dB、35.27 dB、36.79 dB和28.94 dB。所提算法相比于经典和新颖的图像去雨算法,在去除雨纹和恢复背景细节上具有更好的效果。 展开更多
关键词 深度学习 图像去雨 多阶段网络 Transformer模块 通道注意力机制
下载PDF
基于双向LSTM的双任务学习残差通道注意力机制手写签名认证
3
作者 栾方军 陈昱岑 袁帅 《计算机科学与应用》 2024年第3期159-168,共10页
随着人工智能深度学习的发展,网络模型对于在线签名认证系统(Online Signature Verification, OSV)的性能有了显著的提升。然而,如何进一步提高在线手写签名认证的准确性仍然是一个需要解决的问题。为此,本文提出了一种基于双向LSTM的... 随着人工智能深度学习的发展,网络模型对于在线签名认证系统(Online Signature Verification, OSV)的性能有了显著的提升。然而,如何进一步提高在线手写签名认证的准确性仍然是一个需要解决的问题。为此,本文提出了一种基于双向LSTM的双任务学习残差通道注意力机制网络模型,用于改进手写签名认证。该模型使用残差通道注意力机制来学习序列特征的权重以便解决不同通道的权重分配问题,双向长短期记忆网络来缓解在深度神经网络中增加深度时可能带来的梯度消失和梯度爆炸问题。此外,引入多任务学习,包括有监督学习和深度度量学习,以更好地进行特征学习。最终,本文提出了一种基于多任务学习的训练方法,使得OSV系统的准确性进一步提高。所提出的方法在SVC-2004数据集中取得了2.33%的等错误率和97.03%的准确率。实验结果表明,所提出的方法能够有效地提高OSV系统的身份验证准确性。 展开更多
关键词 签名认证 多任务学习 残差通道注意力机制 双向长短期记忆 度量学习
下载PDF
基于通道注意特征融合的轴承故障诊断方法
4
作者 齐爱玲 马森哲 《航天器环境工程》 CSCD 2024年第1期115-122,共8页
针对传统故障诊断方法通常依赖单域信息输入,导致信号中的部分信息丢失或信息不完整使用的问题,提出了一种基于通道注意特征融合的轴承故障诊断方法。首先,将原始信号通过快速傅里叶变换(FFT)和连续小波变换(CWT)处理得到频域和时频图... 针对传统故障诊断方法通常依赖单域信息输入,导致信号中的部分信息丢失或信息不完整使用的问题,提出了一种基于通道注意特征融合的轴承故障诊断方法。首先,将原始信号通过快速傅里叶变换(FFT)和连续小波变换(CWT)处理得到频域和时频图。然后,将来自不同域的2个样本输入双流Ghost Module(GM)神经网络故障诊断模型中提取频域和时频域特征,并结合通道注意力机制有效融合频域和时频域的重要特征,从而获得更丰富的故障诊断信息,实现对故障信号的准确分类。最后,利用美国凯斯西储大学、中国江南大学和加拿大渥太华大学的轴承故障数据集进行实验验证。结果表明,与现行主流模型相比,基于通道注意特征融合的轴承故障诊断方法在3个数据集上的分类故障诊断准确率分别达到99.78%、98.50%和97.65%,证明该方法具有良好的诊断效果。 展开更多
关键词 轴承故障诊断 特征融合 双流GM神经网络 通道注意
下载PDF
基于多组多分辨率特征和小波通道注意力的环境声音分类
5
作者 李军 王子壬 +1 位作者 向彦伯 钮焱 《无线电工程》 2024年第8期1862-1870,共9页
针对目前环境声音分类(Environmental Sound Classification, ESC)方法对音频特征提取中反映的时频维度信息不足的问题,提出基于多组多分辨率特征和小波通道注意力的分类方法。采用多组多分辨率特征组成的多特征作为网络输入,通过多组... 针对目前环境声音分类(Environmental Sound Classification, ESC)方法对音频特征提取中反映的时频维度信息不足的问题,提出基于多组多分辨率特征和小波通道注意力的分类方法。采用多组多分辨率特征组成的多特征作为网络输入,通过多组滤波器,多个频率分辨率,在时间和频率维度上实现数据增强,同时实现信息互补。为了更好地衡量各个通道的重要性,针对一维音频图像特征设计了小波通道注意力模块,采用离散小波变换(Discrete Wavelet Transform, DWT)将信号的低频子带和高频子带有效结合,得到通道标量,利用Gram-Schmidt正交化方法使网络在信道注意压缩阶段提取的信息多样化,利用长短期记忆(Long Short Term Memory, LSTM)网络长时间保存信息,提高学习的长期可靠性。实验结果表明,在ESC-10和ESC-50数据集上的分类准确度分别达到了98.7%和93.6%,取得了较好的效果,为音频特征处理提供了一种新的研究思路。 展开更多
关键词 环境声音分类 多组多分辨率特征 小波通道注意 长短期记忆网络
下载PDF
引入级联通道注意力的轻量化人体姿态估计
6
作者 林远强 郜辉 +3 位作者 王鹏 吕志刚 李晓艳 王储 《计算机工程与应用》 CSCD 北大核心 2024年第13期219-227,共9页
针对当前人体姿态估计模型在轻量化过程中精度损失严重的问题,以高分辨率网络(HRNet)为基线提出一种引入级联通道注意力的轻量化人体姿态估计模型。构建一种保持内部高分辨率特征的级联通道注意力,学习输入特征各通道的重要性来提高模... 针对当前人体姿态估计模型在轻量化过程中精度损失严重的问题,以高分辨率网络(HRNet)为基线提出一种引入级联通道注意力的轻量化人体姿态估计模型。构建一种保持内部高分辨率特征的级联通道注意力,学习输入特征各通道的重要性来提高模型表征能力;通过设计一种基于MetaFormer结构的轻量级深度卷积变换模块来替换HRNet阶段2、3、4中运算复杂度较高的残差模块;设计一种多尺度特征融合方法减少HRNet原融合方法中的多维特征语义信息损失;采用无偏数据处理来消除关键点热力图编码过程中导致的偏移误差。COCO2017验证集的实验结果表明,所提出的模型同基准模型相比,在AP降低2个百分点的情况下,模型参数量和浮点运算量分别减少了90.2%和83.1%,并且以AP为71.4%的表现在轻量化模型中达到精度最优。 展开更多
关键词 人体姿态估计 轻量化 通道注意 MetaFormer结构 多尺度特征融合
下载PDF
应用小波通道注意力网络的地震数据重建方法
7
作者 刘沛 王长鹏 +2 位作者 董安国 张春霞 张讲社 《石油地球物理勘探》 EI CSCD 北大核心 2024年第1期31-37,共7页
重建缺失的地震道是地震数据处理的关键环节之一。近年来提出了多种基于深度学习理论的地震数据重建方法。然而,这些方法中常用的卷积运算只能捕捉到地震数据的局部特征,没有充分利用全局信息。另外,池化操作也会造成特征图信息的丢失,... 重建缺失的地震道是地震数据处理的关键环节之一。近年来提出了多种基于深度学习理论的地震数据重建方法。然而,这些方法中常用的卷积运算只能捕捉到地震数据的局部特征,没有充分利用全局信息。另外,池化操作也会造成特征图信息的丢失,从而破坏地震反射的细节特征。为此,提出了基于小波通道注意力网络的地震数据重建方法。哈尔(Haar)小波变换能够有效提取信号的多尺度特征,并在上采样过程中避免信息的丢失;高效通道注意力模块通过对不同通道特征图之间的相关性进行建模,能实现全局信息的充分利用。合成和实际地震数据的实验结果表明,与具有代表性的深度学习方法相比,文中所提出的网络模型可以产生更准确的重建结果。 展开更多
关键词 地震数据重建 随机缺失 深度学习 哈尔小波变换 高效通道注意
下载PDF
结合MGCC特征与多尺度通道注意力的环境声深度学习分类方法
8
作者 杨俊杰 丁家辉 +2 位作者 杨柳 冯丽 杨超 《应用声学》 CSCD 北大核心 2024年第3期513-524,共12页
环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模... 环境声分类技术在家居安全监测、人机语声交互等领域具有关键作用。然而,声源的多样性与混合性给环境声分类方法设计带来了重大挑战。为提高分类准确率与节约计算资源,该文提出一种基于多尺度通道注意力机制的深度学习分类模型。所提模型由特征提取模块、多尺度卷积模块、高效通道注意力模块、输出层四部分组成。首先,通过引入加权型梅尔Gammatone频率倒谱系数(MGCC)挖掘环境声频谱幅值与相位结构信息;其次,融合多尺度卷积核与高效通道注意力机制优选出声频关键局部细节和通道特征;最后,在全连接层采用softmax函数映射特征并输出环境声类型的概率值。所提模型在6种环境声的iFLYTEK、10种环境声的Urbansound8k数据集上开展测试验证,分别取得了94%、76.52%、79.24%(iFLYTEK+Urbansound8k)的分类准确率。消融实验结果进一步表明:引入的多尺度卷积模块、通道注意力机制模块对分类准确率的提升贡献率分别接近于3.77%和1.89%。实验还详细对比了7种现有的深度学习分类方法,所提算法在分类准确率上排名第二;另外,在同级别算法中如ResNet18、GoogLeNet,所提算法在模型参数量和计算复杂度方面上实现了进一步的约减。 展开更多
关键词 环境声分类 梅尔Gammatone频率倒谱 多尺度核卷积 高效通道注意 卷积神经网络
下载PDF
基于高效通道注意力机制和特征融合网络的冠心病诊断算法研究
9
作者 郭卫涛 帕孜来·马合木提 张洪春 《计算机应用与软件》 北大核心 2024年第1期190-197,共8页
针对冠心病重要特征不确定、诊断模型预测性能低等因素而导致冠心病早期诊断精度低的问题,提出一种基于高效通道注意力机制和特征融合的网络。通过XGBoost(eXtreme Gradient Boosting)来确定冠心病重要特征,设计数据生成图片的特征组合... 针对冠心病重要特征不确定、诊断模型预测性能低等因素而导致冠心病早期诊断精度低的问题,提出一种基于高效通道注意力机制和特征融合的网络。通过XGBoost(eXtreme Gradient Boosting)来确定冠心病重要特征,设计数据生成图片的特征组合算法以适用该模型;为提高诊断模型预测性能,采用可以提升模型学习能力和特征利用率的高效通道注意力机制模块和特征融合模块。实验结果表明,在UCI克利夫兰心脏病数据集上,与其他诊断算法相比,该算法优于传统机器学习方法,预测精度可达100%且稳定性好。 展开更多
关键词 冠心病 早期诊断 特征组合算法 特征融合 高效通道注意
下载PDF
全局通道注意力增强的毫米波图像目标检测
10
作者 蒋甜甜 叶学义 +2 位作者 李刚 杨梦豪 陈华华 《电子技术应用》 2024年第3期19-25,共7页
针对主动毫米波图像中目标与背景纹理区分度较低导致隐匿目标漏检问题,并根据安检实时性要求,提出一种基于全局通道注意力增强的主动毫米波图像目标检测方法。该方法以YOLOv5s为载体,在坐标注意力位置方向上引入全局通道注意模块,增强... 针对主动毫米波图像中目标与背景纹理区分度较低导致隐匿目标漏检问题,并根据安检实时性要求,提出一种基于全局通道注意力增强的主动毫米波图像目标检测方法。该方法以YOLOv5s为载体,在坐标注意力位置方向上引入全局通道注意模块,增强对隐匿目标全局通道信息的关注,从而提升在隐匿目标与背景纹理区分度较低时的检测能力;再利用K-means++聚类算法重新生成适合毫米波图像目标检测的锚框。实验结果表明,无论是阵列图像数据集还是线扫图像数据集,该方法增强了对隐匿目标的特征注意,提高了召回率,在满足安检实时性的前提下,提升了检测性能。通过增加少量参数,在阵列图像数据集上,精度、召回率和mAP@.5达到了92.0%、90.93%和95.32%;在线扫图像数据集上,精度、召回率和mAP@.5达到了94.65%、92.67%和97.73%。平均单张图像推理时间在两个数据集上均达到1 ms,满足实时性要求。 展开更多
关键词 主动毫米波图像目标检测 全局通道注意力增强 K-means++ 注意力机制
下载PDF
基于梯度可感知通道注意力模块的红外小目标检测前去噪网络
11
作者 林再平 罗伊杭 +5 位作者 李博扬 凌强 郑晴 杨晶贻 刘丽 吴京 《红外与毫米波学报》 SCIE EI CAS CSCD 北大核心 2024年第2期254-260,共7页
红外图像去噪在军事及民用领域应用广泛。现有基于深度学习的图像去噪方法主要为可见光图像设计,此类方法容易过度平滑图像细节,从而导致弱小目标丢失,为后续的检测任务带来困难。为了在去除噪声的同时保留好红外图像中的目标信息,本文... 红外图像去噪在军事及民用领域应用广泛。现有基于深度学习的图像去噪方法主要为可见光图像设计,此类方法容易过度平滑图像细节,从而导致弱小目标丢失,为后续的检测任务带来困难。为了在去除噪声的同时保留好红外图像中的目标信息,本文提出了一种基于梯度可感知通道注意力模块的红外弱小目标检测前去噪网络。该网络首先采用编码器-解码器结构来去除图像中的加性噪声,然后通过梯度可感知通道注意力模块对图像高频区域进行自适应增强,有效保持红外弱小目标的响应强度。此外,本文提出了领域第一个包含3981张含噪声的红外图像数据集。实验结果表明,该网络能够在有效去除加性噪声的同时避免过度平滑,很好地保留了红外图像中的目标信息,最终实现了在含噪声环境下的高鲁棒性红外弱小目标检测。 展开更多
关键词 红外小目标 检测前去噪 梯度可感知通道注意力模块
下载PDF
高效通道注意力结合卷积神经网络的近红外光谱分析模型研究
12
作者 王妞 宦克为 +2 位作者 傅钲淇 刘赋伟 王迪 《长春理工大学学报(自然科学版)》 2024年第1期16-22,共7页
近红外光谱分析技术有无损、高效的特点,在各领域都有广泛应用。但传统分析模型在面对近红外光谱数据量激增时往往出现预测精度不高、泛化能力差等问题。为此,提出一种基于卷积神经网络(CNN)与高效通道注意力(ECA)模块相结合的近红外光... 近红外光谱分析技术有无损、高效的特点,在各领域都有广泛应用。但传统分析模型在面对近红外光谱数据量激增时往往出现预测精度不高、泛化能力差等问题。为此,提出一种基于卷积神经网络(CNN)与高效通道注意力(ECA)模块相结合的近红外光谱分析模型(CNNECANet),该模型由8个一维卷积层、1个ECA模块、4个最大池化层、1个展平层、2个全连接层和1个参数优化器组成。ECA模块由1个全局平均池化、1个一维卷积层和1个Sigmoid激活函数组成。以啤酒、牛奶、柴油、谷物的近红外光谱公共数据为例,将CNNECANet与常用建模方法进行比较,CNNECANet比PLS的预测精度分别提高了30.3%、14.1%、29.5%、48.4%;CNNECANet比SVR的预测精度分别提高了33.5%、17.6%、39.0%、50.0%;CNNECANet比BP神经网络模型的预测精度分别提高了80.0%、29.0%、7.2%、42.7%。该模型具有更好的预测精度和鲁棒性,解决了传统近红外光谱建模算法容易出现过拟合、模型泛化性差等问题。 展开更多
关键词 近红外光谱 卷积神经网络 高效通道注意 预测模型
下载PDF
基于通道注意力与光照权重的无监督低照度图像增强
13
作者 杨猛 杜晓刚 +1 位作者 张学军 孙浩轩 《软件导刊》 2024年第7期167-173,共7页
现有部分无监督低照度图像增强方法在增强图像曝光不足的区域时会降低其高光区域亮度,导致增强后的图像出现伪影;单一的TV损失既无法区别照明特征图的细节,还会忽略照明特征图边缘明暗度差异突出的地区,导致光晕现象的产生。为此,提出... 现有部分无监督低照度图像增强方法在增强图像曝光不足的区域时会降低其高光区域亮度,导致增强后的图像出现伪影;单一的TV损失既无法区别照明特征图的细节,还会忽略照明特征图边缘明暗度差异突出的地区,导致光晕现象的产生。为此,提出一种基于通道注意力与光照权重的无监督低照度图像增强方法 VARRNet。首先,VARRNet将图像转化为HSV空间,将V空间与Retinex理论结合以避免损失信息;其次,为了防止在亮度增强过程中生成伪影,设计了一个亮度估计网络引入通道注意力ECA分配输入特征图的权重,以恢复曝光不足区域的亮度,并有效保持高光区域的亮度;最后,在亮度估计网络中结合TV损失与光照分量权重来保留增强后特征图的丰富细节信息,消除强边缘处的光晕。在与当前流行的5个低照度图像增强方法进行比较实验发现,VARRNet在亮度增强、细节保留、色彩恢复、伪影抑制和光晕去除等方面均取得了更好的可视化效果。 展开更多
关键词 无监督学习 RETINEX 低照度图像增强 通道注意 照明平滑度
下载PDF
基于双通道注意力机制的AE-BIGRU交通流预测模型
14
作者 黄艳国 何烜 杨仁峥 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第5期1774-1782,共9页
交通流预测是智能交通系统的关键。针对目前交通流数据复杂的时空关联性以及自身的不确定性,为准确预测高速公路交通流并缓解交通拥堵问题,提出以自编码器网络(AE)和双向门控循环单元(BIGRU)相结合的深度学习组合预测模型(AE-BIGRU),并... 交通流预测是智能交通系统的关键。针对目前交通流数据复杂的时空关联性以及自身的不确定性,为准确预测高速公路交通流并缓解交通拥堵问题,提出以自编码器网络(AE)和双向门控循环单元(BIGRU)相结合的深度学习组合预测模型(AE-BIGRU),并在此基础上引入双通道注意力机制进行模型训练。将预处理后的数据采用滑动窗口的方式作为参数输入模型,通过AE提取交通流的空间特征,得到输入信息特征的最优抽象表示;利用BIGRU从前向和后向传播中获取信息,充分提取交通流的时间相关特征,更全面地捕捉时间演变规律;最后结合双通道注意力机制,增强预测模型的特征提取能力,最大限度地保留特征信息,提升模型的预测精度,从而得到最终短时流量的预测目标值。为验证模型的适用性,采用多组短时交通流数据进行仿真实验,与其他基准模型对比发现:该交通流预测模型能够有效捕获交通流的动态时空特征,加强关键信息的提取,所预测的流量更加接近真实值,具有良好的泛化能力。其中测试集的均方根误差值下降了约0.061~0.604,平均绝对误差值下降了约0.025~0.512,相关系数值R2提高了约0.007~0.062。研究结果表明,随着预测步长的增加,该实验模型在交通流数据的时间特性上仍能表现出稳定的预测性能,所建的组合预测模型在预测精度和鲁棒性方面表现出更高水平。 展开更多
关键词 智能交通 交通流预测 AE-BIGRU模型 深度学习 通道注意力机制
下载PDF
融合卷积通道注意力的遥感图像目标检测方法
15
作者 王怀济 李广明 +2 位作者 张红良 申京傲 吴京 《计算机工程与应用》 CSCD 北大核心 2024年第2期200-210,共11页
针对遥感目标检测中,目标分布不均匀、排列杂乱、大长宽比和尺寸变化剧烈等导致目标定位困难的问题,提出了一种融合卷积通道注意力的旋转目标检测方法。基于k-means进行改进,设计了在最优解下增加聚类簇之间距离的锚框设计方法;基于YOL... 针对遥感目标检测中,目标分布不均匀、排列杂乱、大长宽比和尺寸变化剧烈等导致目标定位困难的问题,提出了一种融合卷积通道注意力的旋转目标检测方法。基于k-means进行改进,设计了在最优解下增加聚类簇之间距离的锚框设计方法;基于YOLOv5进行改进,设计融合卷积通道注意力的网络模型,增强主干网络传达给特征金字塔顶层和底层的语义和定位特征;设计包含覆盖面积、中心点距离、宽高比和角度损失四种要素的目标框损失函数;优化YOLOv5的目标框宽高回归函数,自适应生成回归预测范围。实验在两个遥感公共数据集UCAS-AOD和HRSC2016上分别与5种具有代表性的方法进行比较,在UCAS-AOD数据集上,平均精度mAP达到了95.9%,相比于CSL方法,mAP提升了0.8个百分点;在HRSC2016数据集上,平均精度mAP达到了96.3%,速度FPS达到了77.5,相比于R3Det方法,mAP提升了0.3个百分点,FPS提升了5.46倍。实验结果表明,方法的整体性能超过了近年来一些代表性的方法,在两个遥感数据集中验证了方法的有效性。 展开更多
关键词 旋转目标检测 YOLO 锚框 卷积通道注意 回归函数优化 损失函数重构
下载PDF
结合通道注意力的无人机遥感影像行人检测方法
16
作者 杨贤辉 周永林 杨善斌 《测绘与空间地理信息》 2024年第2期137-140,共4页
在无人机遥感影像行人检测任务中,针对无人机影像背景复杂、行人目标尺度多样化且样本个数稀少等问题,提出一种结合通道注意力的单阶段卷积网络模型。模型以并联卷积核构成特征提取层,同时引入通道注意力机制来强化模型对行人特征的学... 在无人机遥感影像行人检测任务中,针对无人机影像背景复杂、行人目标尺度多样化且样本个数稀少等问题,提出一种结合通道注意力的单阶段卷积网络模型。模型以并联卷积核构成特征提取层,同时引入通道注意力机制来强化模型对行人特征的学习能力;在特征强化网络中进一步通过融合跨尺度特征,构建了4个输出层的特征强化网络,最后使用增广后的训练集完成模型的训练。实验结果表明,本文所提出的行人检测模型能够对曝光、阴影等复杂效果下以及不同角度、不同距离下的行人目标实施稳定检出,在测试环境下的检测速度也达到实时检测水平。 展开更多
关键词 无人机遥感 行人检测 通道注意 数据集增广
下载PDF
融合多尺度通道注意力的开放词汇语义分割模型SAN
17
作者 武玲 张虹 《现代信息科技》 2024年第3期164-168,175,共6页
随着视觉语言模型的发展,开放词汇方法在识别带注释的标签空间之外的类别方面具有广泛应用。相比于弱监督和零样本方法,开放词汇方法被证明更加通用和有效。文章研究的目标是改进面向开放词汇分割的轻量化模型SAN,即引入基于多尺度通道... 随着视觉语言模型的发展,开放词汇方法在识别带注释的标签空间之外的类别方面具有广泛应用。相比于弱监督和零样本方法,开放词汇方法被证明更加通用和有效。文章研究的目标是改进面向开放词汇分割的轻量化模型SAN,即引入基于多尺度通道注意力的特征融合机制AFF来改进该模型,并改进原始SAN结构中的双分支特征融合方法。然后在多个语义分割基准上评估了该改进算法,结果显示在几乎不改变参数量的情况下,模型表现有所提升。这一改进方案有助于简化未来开放词汇语义分割的研究。 展开更多
关键词 开放词汇 语义分割 SAN CLIP 多尺度通道注意
下载PDF
基于高效通道注意力机制的Fair MOT多目标跟踪
18
作者 张慧旺 《信息技术与信息化》 2024年第1期90-93,共4页
多目标跟踪是计算机视觉领域中的一个重要且热门的任务。针对在真实复杂场景中目标的漏检以及ID匹配不准确的问题,提出一种基于FairMOT算法的改进算法。通过引入双分支高效注意力机制模块即DMECA,分别加强检测与重识别分支的特征,以解... 多目标跟踪是计算机视觉领域中的一个重要且热门的任务。针对在真实复杂场景中目标的漏检以及ID匹配不准确的问题,提出一种基于FairMOT算法的改进算法。通过引入双分支高效注意力机制模块即DMECA,分别加强检测与重识别分支的特征,以解决多任务训练平衡问题。优化分支头的结构,将传统卷积方式修改为深度可分离卷积,并采用LeakyRelu激活函数。在数据关联模块的第二阶段匹配中,使用距离交并比(DIOU)替代交并比(IOU)计算代价矩阵进行匹配。实验结果表明,在MOT17数据集上IDS下降了625,此外HOTA、IDF1分别提高了0.3%、0.4%。 展开更多
关键词 多目标跟踪 通道注意力机制 深度可分离卷积 DIOU
下载PDF
一种基于通道注意力机制的交通监控视频超分辨率算法
19
作者 林哲显 《上海船舶运输科学研究所学报》 2024年第1期66-72,共7页
为提升交通监控视频的显示质量,进而提高监控视频车牌识别成功率,提出一种基于通道注意力机制(Channel-wise Attention,CA)和BasicVSR模型的监控视频超分辨率模型。在BasicVSR模型中引入CA,使模型能学习不同通道之间的非线性依赖关系,... 为提升交通监控视频的显示质量,进而提高监控视频车牌识别成功率,提出一种基于通道注意力机制(Channel-wise Attention,CA)和BasicVSR模型的监控视频超分辨率模型。在BasicVSR模型中引入CA,使模型能学习不同通道之间的非线性依赖关系,从而有效提升监控视频超分辨率图像的质量。在某交通监控场景下开展车牌识别试验,对该CA-BasicVSR模型的有效性进行验证,结果表明:在交通监控画面还原任务中,该模型对画面还原的峰值信噪比相比EDVR-L模型和BasicVSR模型能分别提高约1.3 dB和0.3 dB;在车牌识别任务中,使用该模型处理的交通监控视频画面作为输入,相比原始低分辨率的视频画面,能提高车牌识别的成功率。 展开更多
关键词 视频超分辨率 BasicVSR模型 通道注意力机制(CA) 车牌识别
下载PDF
结合高效通道注意力机制的语音增强算法仿真 被引量:1
20
作者 杨立东 曾江蛟 董桂官 《计算机仿真》 北大核心 2023年第3期258-262,535,共6页
语音增强能有效解决人机交互和语音识别等技术中的噪声干扰问题。为了提高语音增强的效果,提出了一种结合高效通道注意力机制的生成对抗网络,并在两种不同的数据集下进行实验。该方法通过在生成对抗网络的生成器中加入高效的通道注意力... 语音增强能有效解决人机交互和语音识别等技术中的噪声干扰问题。为了提高语音增强的效果,提出了一种结合高效通道注意力机制的生成对抗网络,并在两种不同的数据集下进行实验。该方法通过在生成对抗网络的生成器中加入高效的通道注意力机制来提高抑制无关于语音增强的信息来提高模型的灵活度与准确率。该模型在Nonspeech-100数据集相较于基线模型下语音感知质量评估(PESQ)平均提升了2.79%,语音短时客观可懂度(STOI)平均提升了0.95%;在NoiseX-92数据集下,ESQ平均提升了3.8%,STOI平均提升了2.03%。实验结果表明,该方法在没有增加很大的计算量的情况下提高了模型的性能。 展开更多
关键词 语音增强 生成对抗网络 通道注意 神经网络
下载PDF
上一页 1 2 40 下一页 到第
使用帮助 返回顶部