期刊文献+
共找到74篇文章
< 1 2 4 >
每页显示 20 50 100
基于Res2Net的人脸表情识别方法
1
作者 唐宏伟 丁祥 +3 位作者 邓嘉鑫 高方坤 罗佳强 王军权 《邵阳学院学报(自然科学版)》 2024年第2期28-35,共8页
为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据... 为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。 展开更多
关键词 表情识别 Focal Loss函数 广义平均池化模块 res2net50
下载PDF
基于Ghost-SE-Res2Net的多模型融合语音唤醒词检测方法
2
作者 虞秋辰 周若华 袁庆升 《计算机工程》 CAS CSCD 北大核心 2024年第3期52-59,共8页
语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测... 语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测窗,均基于轻量化的挤压与激励残差网络(SE-Res2Net)模块,即GhostSE-Res2Net,SE-Res2Net结构的多尺度机制可显著提升WWD的能力。在Ghost-SE-Res2Net中,首先使用Ghost卷积替换SE-Res2Net中的普通卷积以降低模型参数量,然后使用注意力池化层替换SE-Res2Net中的全局平均池化层进一步提升WWD能力。在实际检测时融合连续3个小检测窗模型的检测结果的最大值和1个大检测窗模型的检测结果,来判断唤醒词是否被触发。在训练时引入困难样本挖掘算法,选择性地学习较难检测的唤醒词信息以提高分类模型的检测性能。在包含2个唤醒词的Mobvoi数据集上评估系统性能,实验结果表明,在每小时0.5次错误唤醒的情况下,该系统在2个唤醒词上的错误拒绝率分别为0.46%和0.43%,实现了与先进基线相似的性能,并且系统参数量比基线少31%。 展开更多
关键词 唤醒词检测 Ghost模块 res2net结构 错误拒绝 多模型融合
下载PDF
基于Res2Net-IDCN-SCF算法的多模态医学图像融合
3
作者 程颖 方贤进 《湖北民族大学学报(自然科学版)》 CAS 2023年第4期499-505,共7页
利用多尺度特征策略进行特征提取的有效性不足是多模态医学图像融合领域存在的问题。为了增加融合结果的多尺结构信息,提出了一种基于残差多尺度网络(residual multi-scale network,Res2Net)、交错稠密网络和空间通道融合算法的多模态... 利用多尺度特征策略进行特征提取的有效性不足是多模态医学图像融合领域存在的问题。为了增加融合结果的多尺结构信息,提出了一种基于残差多尺度网络(residual multi-scale network,Res2Net)、交错稠密网络和空间通道融合算法的多模态医学图像融合算法。Res2Net的编码器在提取多尺度特征时能保留更多语义信息;交错稠密网络减少了解码器和编码器之间的语义差异,丰富了融合图像的结构和细节信息;掩码鉴别器约束了脑瘤病灶区域,进一步提高了融合图像的质量;特征图通过空间通道融合算法融合减少了多模态图像之间的信息冗余。该算法在信息熵(entropy of information,EN)、互信息(mutual information,MI)、结构相似性(structure similarity index measure,SSIM)、多尺度结构相似性(multi scale structural similarity index measure,MI_SSIM)指标上拥有较高水平的性能表现,EN提高了6%,MI提高了3%。结果显示,所提出的算法在视觉感知和指标评估上达到了较高的融合质量。 展开更多
关键词 多模态医学图像融合 res2net 交错稠密网络 空间融合 通道融合
下载PDF
基于Res2net和金字塔池化的图像去雾算法 被引量:1
4
作者 王贺 韩磊 《测试技术学报》 2023年第5期455-460,共6页
在计算机视觉的高级任务中,对图像的清晰度有很高的要求,目前基于深度学习的图像去雾算法仍存在一些问题,如细节丢失、色彩失真、去雾不完全等。为解决这些问题,设计了一种基于Res2net和金字塔池化的端到端图像去雾算法。该网络中,通过... 在计算机视觉的高级任务中,对图像的清晰度有很高的要求,目前基于深度学习的图像去雾算法仍存在一些问题,如细节丢失、色彩失真、去雾不完全等。为解决这些问题,设计了一种基于Res2net和金字塔池化的端到端图像去雾算法。该网络中,通过使用Res2net模块提取上下文特征,并利用金字塔池化模块融合不同尺度的特征信息。为了得到更好的网络模型,采用RESIDE数据集对提出的模型分别进行训练和测试。结果表明:该模型在主客观评价中都取得了不错的效果,极大地改善了去雾后图片色彩失真和去雾不够彻底的问题。 展开更多
关键词 深度学习 图像去雾 res2net 金字塔池化
下载PDF
FIR-YOLACT:Fusion of ICIoU and Res2Net for YOLACT on Real-Time Vehicle Instance Segmentation
5
作者 Wen Dong Ziyan Liu +1 位作者 Mo Yang Ying Wu 《Computers, Materials & Continua》 SCIE EI 2023年第12期3551-3572,共22页
Autonomous driving technology has made a lot of outstanding achievements with deep learning,and the vehicle detection and classification algorithm has become one of the critical technologies of autonomous driving syst... Autonomous driving technology has made a lot of outstanding achievements with deep learning,and the vehicle detection and classification algorithm has become one of the critical technologies of autonomous driving systems.The vehicle instance segmentation can perform instance-level semantic parsing of vehicle information,which is more accurate and reliable than object detection.However,the existing instance segmentation algorithms still have the problems of poor mask prediction accuracy and low detection speed.Therefore,this paper proposes an advanced real-time instance segmentation model named FIR-YOLACT,which fuses the ICIoU(Improved Complete Intersection over Union)and Res2Net for the YOLACT algorithm.Specifically,the ICIoU function can effectively solve the degradation problem of the original CIoU loss function,and improve the training convergence speed and detection accuracy.The Res2Net module fused with the ECA(Efficient Channel Attention)Net is added to the model’s backbone network,which improves the multi-scale detection capability and mask prediction accuracy.Furthermore,the Cluster NMS(Non-Maximum Suppression)algorithm is introduced in the model’s bounding box regression to enhance the performance of detecting similarly occluded objects.The experimental results demonstrate the superiority of FIR-YOLACT to the based methods and the effectiveness of all components.The processing speed reaches 28 FPS,which meets the demands of real-time vehicle instance segmentation. 展开更多
关键词 Instance segmentation real-time vehicle detection YOLACT res2net ICIoU
下载PDF
Res2Net融合注意力机制的YOLOv4目标检测算法 被引量:2
6
作者 张翔 刘振凯 +1 位作者 叶娜 赵妍祯 《计算机测量与控制》 2022年第9期213-220,227,共9页
针对传统目标检测算法容易出现漏检、误检或者有遮挡物时检测困难等问题,提出一种Res2Net融合注意力机制的YOLOv4(Res2Net fusion with attention learning YOLOv4,RFAL YOLOv4)目标检测模型;首先为了获取更多特征图语义信息,通过在一... 针对传统目标检测算法容易出现漏检、误检或者有遮挡物时检测困难等问题,提出一种Res2Net融合注意力机制的YOLOv4(Res2Net fusion with attention learning YOLOv4,RFAL YOLOv4)目标检测模型;首先为了获取更多特征图语义信息,通过在一个残差块内构造层次化的类残差连接,引入Res2Net替换原YOLOv4主干网络中的ResNet残差网络结构,可以获取到更细小的特征,同时也增加了模型感受野;其次将Res2Net与注意力机制相融合,获取关键特征信息,减轻因优化主干网络带来计算量增加的负担;最后通过改进CIOU损失,降低预测框与真实框之间的误差值,有效的解决因目标过小或者有遮挡时模型出现漏检误检等问题;在公开的PASCAL VOC数据集上进行验证,结果表明:RFAL YOLOv4模型的mAP达到了79.5%,比原模型提升了5.5%,改进后的模型具有较高的鲁棒性。 展开更多
关键词 目标检测 YOLOv4 res2net 注意力机制 CIOU
下载PDF
一种利用SE-Res2Net的合成语音检测系统 被引量:3
7
作者 梁超 高勇 《无线电工程》 北大核心 2022年第9期1560-1565,共6页
传统的说话人识别(Automatic Speaker Verfication, ASV)系统难以分辨合成语音,构建一个说话人保护系统刻不容缓。针对合成语音侵扰说话人识别系统问题,从特征层面提出了一种基于经验模式分解(Empirical Mode Decomposition, EMD)的梅... 传统的说话人识别(Automatic Speaker Verfication, ASV)系统难以分辨合成语音,构建一个说话人保护系统刻不容缓。针对合成语音侵扰说话人识别系统问题,从特征层面提出了一种基于经验模式分解(Empirical Mode Decomposition, EMD)的梅尔倒谱系数(Mel Frequency Cepstral Coefficients, MFCC)+逆梅尔倒谱系数(Inverse Mel Frequency Cepstral Coefficients, IMFCC)的双通道语音特征作为合成语音检测的前端特征,在后端分类器上串联Res2Net网络和SENet网络组合成SE-Res2Net网络来提升模型的泛化能力。将不同特征与模型的打分结果融合,进一步提高实验性能。在ASVspoof2019数据集上的实验结果表明,该设计的合成语音检测系统能有效检测合成语音,与ASVspoof2019比赛的基线系统相比,融合模型的等错误概率(Equal Error Rate, EER)与串联成本检测函数(tandem Detection Cost Function, t-DCF)分别降低了49%和64%。 展开更多
关键词 合成语音检测 res2net 经验模式分解 SENet 等错误概率 串联成本检测函数
下载PDF
基于CA-Res2Net和可变形卷积的图像去模糊方法
8
作者 李武斌 李春国 杨绿溪 《无线电通信技术》 2022年第5期945-950,共6页
针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时... 针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时CADNet嵌入了细粒度多尺度的残差模块,可以在更细粒度的层次上表示图片的多尺度特征信息,从而可以获得更强的特征表示能力。实验结果表明,CADNet是一种高效的去模糊算法,在获得更高去模糊性能的同时,压制住了计算开销。 展开更多
关键词 图像去模糊 非均匀模糊 可变形卷积 通道注意力 res2net
下载PDF
基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术
9
作者 张海艳 李洁 +2 位作者 张博学 刘静 唐雪蕊 《信息技术》 2022年第5期177-182,共6页
为了有效提高宫颈癌的诊断准确率,提出一种基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术。在YOLOv3算法模型的基础上,将SE模块嵌入Res2Net网络中,创建一种能够替换原特征提取网络的SE-Res2Net网络,使模型的特征提取能力得到提升。... 为了有效提高宫颈癌的诊断准确率,提出一种基于SE-Res2Net网络的宫颈癌超声肿瘤特征提取技术。在YOLOv3算法模型的基础上,将SE模块嵌入Res2Net网络中,创建一种能够替换原特征提取网络的SE-Res2Net网络,使模型的特征提取能力得到提升。利用重新构建的下采样模块,保证了下采样操作后信息的完整性。将密集连接网络与残差连接网络相结合,组建Res-DenseNet网络以改进YOLOv3模型的原有残差连接方式。实验结果表明,该方法的性能明显优于传统YOLOv3算法,适于在临床诊断中普及应用。 展开更多
关键词 SE-res2net网络 宫颈癌超声图像 采样 特征提取 识别性能
下载PDF
基于CBAM-Res2Net的人群计数算法
10
作者 陈江川 吴云韬 孔权 《武汉工程大学学报》 CAS 2022年第6期664-669,共6页
针对静态人群图像中背景干扰和尺度变化等问题,采用多尺度特征提取模块(Res2Net)以更细的粒度提取多尺度特征,提高对不同尺寸人头的计数性能;引入卷积注意力模块(CBAM),分别在通道域和空间域上提高人群区域的权重,有效改善了高密度和复... 针对静态人群图像中背景干扰和尺度变化等问题,采用多尺度特征提取模块(Res2Net)以更细的粒度提取多尺度特征,提高对不同尺寸人头的计数性能;引入卷积注意力模块(CBAM),分别在通道域和空间域上提高人群区域的权重,有效改善了高密度和复杂的人群场景下背景干扰等问题。在此基础上,将CBAM模块集成到Res2Net模块中,形成了新的多尺度特征提取模块CBAM-Res2Net。在后端网络中设计了一个扩张模块以提取更深层的特征并进行特征融合回归,从而生成高质量的密度图。并且分别在ShanghaiTech Part A、ShanghaiTech Part B和UCF_CC_50数据集上进行了算法对比实验,本文模型在上述数据集的平均绝对误差和均方根误差分别为61.4、7.3、255.6和98.5、10.8、310.2,综合性能均优于其他算法,验证了模型的准确性和鲁棒性。 展开更多
关键词 人群计数 多尺度特征提取模块 卷积注意力模块 CBAM-res2net 密度图
下载PDF
融合注意力机制的Res2Net-LSTM声纹识别方法
11
作者 李坤明 《网络安全技术与应用》 2024年第5期58-61,共4页
针对现有的声纹识别技术模型具有提取特征单一、泛化能力不强等局限性,提出了一种融合注意力机制的Res2Net-LSTM声纹识别方法。通过采用Res2Net和LSTM分别提取空间特征和时序特征,增强模型收敛速度与精度,并融合注意力机制,对特征权重... 针对现有的声纹识别技术模型具有提取特征单一、泛化能力不强等局限性,提出了一种融合注意力机制的Res2Net-LSTM声纹识别方法。通过采用Res2Net和LSTM分别提取空间特征和时序特征,增强模型收敛速度与精度,并融合注意力机制,对特征权重进行调整,通过关注重点区域,提高分类性能。在公开的Voxceleb1数据集上进行验证,实验结果表明,相较于ResNetLSTM、Res2Net-LSTM准确率分别提升了10.4%,10.5%,验证了该方法具有更好的性能。 展开更多
关键词 声纹识别 注意力机制 res2net LSTM
原文传递
Infrared and Visible Image Fusion Based on Res2Net-Transformer Automatic Encoding and Decoding
12
作者 Chunming Wu Wukai Liu Xin Ma 《Computers, Materials & Continua》 SCIE EI 2024年第4期1441-1461,共21页
A novel image fusion network framework with an autonomous encoder and decoder is suggested to increase thevisual impression of fused images by improving the quality of infrared and visible light picture fusion. The ne... A novel image fusion network framework with an autonomous encoder and decoder is suggested to increase thevisual impression of fused images by improving the quality of infrared and visible light picture fusion. The networkcomprises an encoder module, fusion layer, decoder module, and edge improvementmodule. The encoder moduleutilizes an enhanced Inception module for shallow feature extraction, then combines Res2Net and Transformerto achieve deep-level co-extraction of local and global features from the original picture. An edge enhancementmodule (EEM) is created to extract significant edge features. A modal maximum difference fusion strategy isintroduced to enhance the adaptive representation of information in various regions of the source image, therebyenhancing the contrast of the fused image. The encoder and the EEM module extract features, which are thencombined in the fusion layer to create a fused picture using the decoder. Three datasets were chosen to test thealgorithmproposed in this paper. The results of the experiments demonstrate that the network effectively preservesbackground and detail information in both infrared and visible images, yielding superior outcomes in subjectiveand objective evaluations. 展开更多
关键词 Image fusion res2net-Transformer infrared image visible image
下载PDF
基于YOLOv7的木材缺陷检测模型Wood-Net的研究
13
作者 王正 江莺 +3 位作者 严飞 孙佑鹏 张园 张柳磊 《林业工程学报》 CSCD 北大核心 2024年第1期132-140,共9页
为改善利用人工方式识别木材缺陷存在的效率低、人工成本高的问题,同时实现在木材加工过程中使用新兴方式对不同的缺陷进行快速准确检测以提高木材利用率,针对现有的目标检测网络在木材缺陷检测方面存在诸如检测精度低、报错率高以及识... 为改善利用人工方式识别木材缺陷存在的效率低、人工成本高的问题,同时实现在木材加工过程中使用新兴方式对不同的缺陷进行快速准确检测以提高木材利用率,针对现有的目标检测网络在木材缺陷检测方面存在诸如检测精度低、报错率高以及识别种类少等局限,设计了用于木材缺陷检测的深度学习网络Wood-Net。Wood-Net将注意力机制ECA(efficient channel attention module)引入YOLOv7的主干网络,以便更好地区分木材缺陷之间的细微差别;将ECA与Res2Net结合后形成ECA-Res2Net模块,ECA-Res2Net模块克服了单纯的Res2Net跨通道交流能力不足的问题,增强了网络对更细粒度特征的提取能力;将ECA-Res2Net模块与SPPCSPC(spatial pyramid pooling and channel spatial pyramid convolution)并联形成ResSPPCSPC模块,增加了描述图像本身特征数量的能力,由此构成新方法Wood-Net。本研究将准确度、召回值、mAP@0.5以及mAP@0.5∶mAP@0.95 4个数值作为系统性能的评价指标。利用自建数据集训练Wood-Net,得到试验数据。试验结果表明:Wood-Net模型比基准模型YOLOv7在木材优选上精确率提高了4.52%,mAP@0.5∶mAP@0.95提高了6.62%;比基准模型YOLOv5s在木材优选上精确率提高了6.79%,mAP@0.5∶mAP@0.95提高了5.67%。ECA注意力机制能够有效提升E-ELAN的通道间信息交互能力;Res2Net模块具有很强的细粒度特征提取能力,在网络中引入Res2Net模块后,网络各项性能指标收敛速度快,在Res2Net中加入ECA后能够使单纯的Res2Net考虑多通道特征之间的关系,完成信息融合,提高检测性能。 展开更多
关键词 Wood-Net 木材优选 ECA-res2net ECA res2net
下载PDF
基于上下文特征提取的边缘生成三阶段图像修复算法
14
作者 芮志超 郭艳艳 《测试技术学报》 2024年第1期34-40,共7页
对于具有较大不规则缺失区域的图像修复问题,现有的基于深度学习的图像修复方法通常会生成具有模糊纹理和扭曲结构的内容。针对这个问题,将修复问题分解为基于上下文特征的结构预测和图像补全三阶段模型。第一阶段,通过空洞卷积编-解码... 对于具有较大不规则缺失区域的图像修复问题,现有的基于深度学习的图像修复方法通常会生成具有模糊纹理和扭曲结构的内容。针对这个问题,将修复问题分解为基于上下文特征的结构预测和图像补全三阶段模型。第一阶段,通过空洞卷积编-解码网络,利用周围图像特征来对缺失部分进行初步修复;第二阶段,将第一阶段粗修复结果进行边缘提取后,输入到一个自注意力机制编-解码网络来预测缺失区域的纹理结构;第三阶段,将前两个阶段的输出一起输入到一个改进的U-net精修复网络中,得到结构清晰、纹理细节丰富的图像。在公开数据集上将所提算法与现有经典算法进行对比,实验表明,所提方法在主观视觉和客观评价方面优于现有方法。 展开更多
关键词 深度学习 图像修复 自注意力机制 res2net 生成式对抗网络
下载PDF
基于改进YOLOv5的太阳能电池板缺陷检测算法
15
作者 朱栋 贺森 《国外电子测量技术》 2024年第3期76-82,共7页
为提高太阳能电池板缺陷的检测精确,提出了一种改进的YOLOv5网络,对太阳能电池板常见的划痕、叉隐、黑斑、黑边以及无电等5类主要缺陷进行检测和分类。首先,使用改进后的ODConv模块对主干提取网络中的普通卷积模块进行替换,减少网络模... 为提高太阳能电池板缺陷的检测精确,提出了一种改进的YOLOv5网络,对太阳能电池板常见的划痕、叉隐、黑斑、黑边以及无电等5类主要缺陷进行检测和分类。首先,使用改进后的ODConv模块对主干提取网络中的普通卷积模块进行替换,减少网络模型的参数量;其次,将C3模块中的Bottleneck结构替换成包含ParNet模块的Res2Net以增加感受野,从而提升了探测物体缺陷的能力和检测精确;最后,在预测网络前引入自适应特征融合结构,以融合不同特征图的位置与类别信息,增强特征表达并提高模型的鲁棒性。对自建的数据集进行训练、验证以及测试,实验结果表明,改进后的模型能够成功识别和定位5类常见缺陷。与原YOLOv5算法相比,在保持原网络高效性的同时,平均检测精确提升了6.2%。 展开更多
关键词 缺陷检测 ODConv ParNet模块 res2net 特征融合
下载PDF
基于改进YOLOv5s的森林烟火检测算法
16
作者 冯艳玲 韩毓莹 +3 位作者 余智美 朱珉慧 朱雨荷 孙庆华 《计算机科学与应用》 2024年第4期290-297,共8页
为了解决传统火焰烟雾检测算法在光照条件恶劣和山林云雾影响的条件下存在漏检误检、准确性下降的缺陷,提出了一种基于YOLOv5s目标检测框架的森林烟火检测算法。首先,针对火焰烟雾目标特征复杂的问题,在C3模块中融合Res2Net,增强了网络... 为了解决传统火焰烟雾检测算法在光照条件恶劣和山林云雾影响的条件下存在漏检误检、准确性下降的缺陷,提出了一种基于YOLOv5s目标检测框架的森林烟火检测算法。首先,针对火焰烟雾目标特征复杂的问题,在C3模块中融合Res2Net,增强了网络在不同尺度下的特征表示能力。然后,在主干检测网络加入SE注意力模块,达到抑制干扰信息,提升模型表征能力的效果。最后,通过集成GIOU优化损失函数,进一步提高了检测精度。改进后的的算法相比于传统算法,mAP50值提高了1.8%,P值提高了0.9%,R值提高了0.6%。 展开更多
关键词 目标检测 火焰烟雾检测 res2net SE注意力机制
下载PDF
一种适应不同距离的低清人脸深度识别算法 被引量:1
17
作者 邵文泽 胡洪明 +1 位作者 李金叶 邓海松 《南京邮电大学学报(自然科学版)》 北大核心 2023年第1期1-10,共10页
针对多数人脸识别算法对于实际低清影像鲁棒性弱的问题,构建了一种融合知识蒸馏和域自适应的低清人脸识别新模型,包含教师网和学生网。首先,两分支骨干网均引入Res2Net模块,以助于提取细粒度强的人脸身份特征;其次,骨干网的不同阶段均... 针对多数人脸识别算法对于实际低清影像鲁棒性弱的问题,构建了一种融合知识蒸馏和域自适应的低清人脸识别新模型,包含教师网和学生网。首先,两分支骨干网均引入Res2Net模块,以助于提取细粒度强的人脸身份特征;其次,骨干网的不同阶段均引入知识蒸馏,以助于提升学生网的低清人脸特征提取能力;最后,在学生网引入域自适应学习机制,以助于实现域不变的特征提取能力。公开数据集上的实验结果验证了新模型对于不同距离低清人脸的有效性。 展开更多
关键词 人脸识别 知识蒸馏 域自适应 res2net 视频监控
下载PDF
基于虚拟对抗训练的合成话音检测方法
18
作者 杨玲 高勇 《通信技术》 2023年第4期425-433,共9页
自动说话人确认(Automatic Speaker Verification,ASV)技术在日常生活中起着重要作用,同时它也面临着语音合成等欺骗攻击的威胁,因此为ASV系统提供一个有效的合成话音检测方法刻不容缓。近年来,检测任务更加侧重于在真实物理环境下对合... 自动说话人确认(Automatic Speaker Verification,ASV)技术在日常生活中起着重要作用,同时它也面临着语音合成等欺骗攻击的威胁,因此为ASV系统提供一个有效的合成话音检测方法刻不容缓。近年来,检测任务更加侧重于在真实物理环境下对合成话音展开研究。为了提高模型的鲁棒性,引入虚拟对抗训练对检测任务进行数据增强。实验中在前端提取了多个特征,并在后端采用了SE-Res2net50和ECAPA2D-BL/BG模型。最后还将多个特征,多个模型的打分结果进行融合,提高了总体的检测性能。在逻辑访问场景中,ASVspoof2019挑战赛评估集的串联成本检测代价(tandem Detection Cost Function,t-DCF)和等错率(Equal Error Rate,EER)分别达到0.0187和0.56%,ASVspoof2021挑战赛评估集的t-DCF和EER分别达到0.3073和6.05%。 展开更多
关键词 合成话音检测 虚拟对抗训练 SE-res2net Bi-LSTM Bi-GRU 模型融合
下载PDF
改进YOLOv5s算法的安全帽佩戴检测 被引量:13
19
作者 宋晓凤 吴云军 +1 位作者 刘冰冰 张青林 《计算机工程与应用》 CSCD 北大核心 2023年第2期194-201,共8页
佩戴安全帽是施工过程中人员安全的重要保障之一,但现有的人工检测不仅耗时耗力而且无法做到实时监测,针对这一现象,提出了一种基于深度学习的安全帽佩戴检测算法。该算法以YOLOv5s网络为基础。在网络的主干网中引入CoordAtt坐标注意力... 佩戴安全帽是施工过程中人员安全的重要保障之一,但现有的人工检测不仅耗时耗力而且无法做到实时监测,针对这一现象,提出了一种基于深度学习的安全帽佩戴检测算法。该算法以YOLOv5s网络为基础。在网络的主干网中引入CoordAtt坐标注意力机制模块,考虑全局信息,使得网络分配给安全帽更多的注意力,以此提升对小目标的检测能力;针对原主干网对特征融合不充分的问题,将主干网中的残差块替换成Res2NetBlock结构中的残差块,以此提升YOLOv5s在细粒度上的融合能力。实验结果表明:在自制的安全帽数据集中验证可知,与原有的YOLOv5算法相比,平均精度提升了2.3个百分点,速度提升了18 FPS,与YOLOv3算法相比,平均精度提升了13.8个百分点,速度提升了95 FPS,实现了更准确的轻量高效实时的安全帽佩戴检测。 展开更多
关键词 安全帽佩戴检测 YOLOv5s CoordAtt res2netBlock
下载PDF
基于多尺度特征提取深度残差网络的水稻害虫识别 被引量:1
20
作者 郑显润 郑鹏 +2 位作者 王文秀 程亚红 苏宇锋 《华南农业大学学报》 CAS CSCD 北大核心 2023年第3期438-446,共9页
[目的]在水稻生产过程中,针对不同虫害需要采用不同的防治方案,水稻害虫的准确识别分类是制定针对性防治方案的前提。[方法]采用深度学习结合机器视觉的方法,基于Res2Net结构提出了一种多尺度特征提取的深度残差网络,通过准确地提取害... [目的]在水稻生产过程中,针对不同虫害需要采用不同的防治方案,水稻害虫的准确识别分类是制定针对性防治方案的前提。[方法]采用深度学习结合机器视觉的方法,基于Res2Net结构提出了一种多尺度特征提取的深度残差网络,通过准确地提取害虫特征实现复杂自然背景下的水稻害虫识别;采用改进的残差结构,使用等级制的类残差连接取代了原本的3×3卷积核,增加了每个网络层的感受野,可以更细粒度地提取多尺度特征。[结果]本网络训练的模型能够有效地识别自然背景下的水稻害虫,在自建的包含22类常见水稻害虫的图像数据集上,平均识别准确率达到了92.023%,优于传统的ResNet、VGG等网络。[结论]本文提出的模型可应用于水稻虫情自动监测系统,为实现水稻害虫虫情的机器视觉监测提供参考。 展开更多
关键词 水稻害虫 res2net 残差网络 深度学习 图像识别 图像分类 多尺度特征
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部