期刊文献+
共找到72篇文章
< 1 2 4 >
每页显示 20 50 100
基于Res2Net的人脸表情识别方法
1
作者 唐宏伟 丁祥 +3 位作者 邓嘉鑫 高方坤 罗佳强 王军权 《邵阳学院学报(自然科学版)》 2024年第2期28-35,共8页
为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据... 为解决自然条件下人脸表情识别易受角度、光线、遮挡物的影响以及人脸表情数据集各类表情数量不均衡等问题,提出基于Res2Net的人脸表情识别方法。使用Res2Net50作为特征提取的主干网络,在预处理阶段对图像随机翻转、缩放、裁剪进行数据增强,提升模型的泛化性。引入广义平均池化(generalized mean pooling, GeM)方式,关注图像中比较显著的区域,增强模型的鲁棒性;选用Focal Loss损失函数,针对表情类别不平衡和错误分类问题,提高较难识别表情的识别率。该方法在FER2013数据集上准确率达到了70.41%,相较于原Res2Net50网络提高了1.53%。结果表明,在自然条件下对人脸表情识别具有更好的准确性。 展开更多
关键词 表情识别 Focal Loss函数 广义平均池化模块 res2net50
下载PDF
基于Ghost-SE-Res2Net的多模型融合语音唤醒词检测方法 被引量:1
2
作者 虞秋辰 周若华 袁庆升 《计算机工程》 CAS CSCD 北大核心 2024年第3期52-59,共8页
语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测... 语音唤醒词检测(WWD)是语音交互中的关键技术,选择合适大小的检测窗对WWD性能的影响很大。提出一种新的多模型融合方法,通过融合小检测窗和大检测窗的检测结果来提高WWD性能。多模型融合方法包含两个分类模型,分别使用小检测窗和大检测窗,均基于轻量化的挤压与激励残差网络(SE-Res2Net)模块,即GhostSE-Res2Net,SE-Res2Net结构的多尺度机制可显著提升WWD的能力。在Ghost-SE-Res2Net中,首先使用Ghost卷积替换SE-Res2Net中的普通卷积以降低模型参数量,然后使用注意力池化层替换SE-Res2Net中的全局平均池化层进一步提升WWD能力。在实际检测时融合连续3个小检测窗模型的检测结果的最大值和1个大检测窗模型的检测结果,来判断唤醒词是否被触发。在训练时引入困难样本挖掘算法,选择性地学习较难检测的唤醒词信息以提高分类模型的检测性能。在包含2个唤醒词的Mobvoi数据集上评估系统性能,实验结果表明,在每小时0.5次错误唤醒的情况下,该系统在2个唤醒词上的错误拒绝率分别为0.46%和0.43%,实现了与先进基线相似的性能,并且系统参数量比基线少31%。 展开更多
关键词 唤醒词检测 Ghost模块 res2net结构 错误拒绝 多模型融合
下载PDF
Infrared and Visible Image Fusion Based on Res2Net-Transformer Automatic Encoding and Decoding
3
作者 Chunming Wu Wukai Liu Xin Ma 《Computers, Materials & Continua》 SCIE EI 2024年第4期1441-1461,共21页
A novel image fusion network framework with an autonomous encoder and decoder is suggested to increase thevisual impression of fused images by improving the quality of infrared and visible light picture fusion. The ne... A novel image fusion network framework with an autonomous encoder and decoder is suggested to increase thevisual impression of fused images by improving the quality of infrared and visible light picture fusion. The networkcomprises an encoder module, fusion layer, decoder module, and edge improvementmodule. The encoder moduleutilizes an enhanced Inception module for shallow feature extraction, then combines Res2Net and Transformerto achieve deep-level co-extraction of local and global features from the original picture. An edge enhancementmodule (EEM) is created to extract significant edge features. A modal maximum difference fusion strategy isintroduced to enhance the adaptive representation of information in various regions of the source image, therebyenhancing the contrast of the fused image. The encoder and the EEM module extract features, which are thencombined in the fusion layer to create a fused picture using the decoder. Three datasets were chosen to test thealgorithmproposed in this paper. The results of the experiments demonstrate that the network effectively preservesbackground and detail information in both infrared and visible images, yielding superior outcomes in subjectiveand objective evaluations. 展开更多
关键词 Image fusion res2net-Transformer infrared image visible image
下载PDF
基于YOLOv7的木材缺陷检测模型Wood-Net的研究
4
作者 王正 江莺 +3 位作者 严飞 孙佑鹏 张园 张柳磊 《林业工程学报》 CSCD 北大核心 2024年第1期132-140,共9页
为改善利用人工方式识别木材缺陷存在的效率低、人工成本高的问题,同时实现在木材加工过程中使用新兴方式对不同的缺陷进行快速准确检测以提高木材利用率,针对现有的目标检测网络在木材缺陷检测方面存在诸如检测精度低、报错率高以及识... 为改善利用人工方式识别木材缺陷存在的效率低、人工成本高的问题,同时实现在木材加工过程中使用新兴方式对不同的缺陷进行快速准确检测以提高木材利用率,针对现有的目标检测网络在木材缺陷检测方面存在诸如检测精度低、报错率高以及识别种类少等局限,设计了用于木材缺陷检测的深度学习网络Wood-Net。Wood-Net将注意力机制ECA(efficient channel attention module)引入YOLOv7的主干网络,以便更好地区分木材缺陷之间的细微差别;将ECA与Res2Net结合后形成ECA-Res2Net模块,ECA-Res2Net模块克服了单纯的Res2Net跨通道交流能力不足的问题,增强了网络对更细粒度特征的提取能力;将ECA-Res2Net模块与SPPCSPC(spatial pyramid pooling and channel spatial pyramid convolution)并联形成ResSPPCSPC模块,增加了描述图像本身特征数量的能力,由此构成新方法Wood-Net。本研究将准确度、召回值、mAP@0.5以及mAP@0.5∶mAP@0.95 4个数值作为系统性能的评价指标。利用自建数据集训练Wood-Net,得到试验数据。试验结果表明:Wood-Net模型比基准模型YOLOv7在木材优选上精确率提高了4.52%,mAP@0.5∶mAP@0.95提高了6.62%;比基准模型YOLOv5s在木材优选上精确率提高了6.79%,mAP@0.5∶mAP@0.95提高了5.67%。ECA注意力机制能够有效提升E-ELAN的通道间信息交互能力;Res2Net模块具有很强的细粒度特征提取能力,在网络中引入Res2Net模块后,网络各项性能指标收敛速度快,在Res2Net中加入ECA后能够使单纯的Res2Net考虑多通道特征之间的关系,完成信息融合,提高检测性能。 展开更多
关键词 Wood-net 木材优选 ECA-res2net ECA res2net
下载PDF
基于Res2Net-IDCN-SCF算法的多模态医学图像融合
5
作者 程颖 方贤进 《湖北民族大学学报(自然科学版)》 CAS 2023年第4期499-505,共7页
利用多尺度特征策略进行特征提取的有效性不足是多模态医学图像融合领域存在的问题。为了增加融合结果的多尺结构信息,提出了一种基于残差多尺度网络(residual multi-scale network,Res2Net)、交错稠密网络和空间通道融合算法的多模态... 利用多尺度特征策略进行特征提取的有效性不足是多模态医学图像融合领域存在的问题。为了增加融合结果的多尺结构信息,提出了一种基于残差多尺度网络(residual multi-scale network,Res2Net)、交错稠密网络和空间通道融合算法的多模态医学图像融合算法。Res2Net的编码器在提取多尺度特征时能保留更多语义信息;交错稠密网络减少了解码器和编码器之间的语义差异,丰富了融合图像的结构和细节信息;掩码鉴别器约束了脑瘤病灶区域,进一步提高了融合图像的质量;特征图通过空间通道融合算法融合减少了多模态图像之间的信息冗余。该算法在信息熵(entropy of information,EN)、互信息(mutual information,MI)、结构相似性(structure similarity index measure,SSIM)、多尺度结构相似性(multi scale structural similarity index measure,MI_SSIM)指标上拥有较高水平的性能表现,EN提高了6%,MI提高了3%。结果显示,所提出的算法在视觉感知和指标评估上达到了较高的融合质量。 展开更多
关键词 多模态医学图像融合 res2net 交错稠密网络 空间融合 通道融合
下载PDF
基于Res2net和金字塔池化的图像去雾算法 被引量:1
6
作者 王贺 韩磊 《测试技术学报》 2023年第5期455-460,共6页
在计算机视觉的高级任务中,对图像的清晰度有很高的要求,目前基于深度学习的图像去雾算法仍存在一些问题,如细节丢失、色彩失真、去雾不完全等。为解决这些问题,设计了一种基于Res2net和金字塔池化的端到端图像去雾算法。该网络中,通过... 在计算机视觉的高级任务中,对图像的清晰度有很高的要求,目前基于深度学习的图像去雾算法仍存在一些问题,如细节丢失、色彩失真、去雾不完全等。为解决这些问题,设计了一种基于Res2net和金字塔池化的端到端图像去雾算法。该网络中,通过使用Res2net模块提取上下文特征,并利用金字塔池化模块融合不同尺度的特征信息。为了得到更好的网络模型,采用RESIDE数据集对提出的模型分别进行训练和测试。结果表明:该模型在主客观评价中都取得了不错的效果,极大地改善了去雾后图片色彩失真和去雾不够彻底的问题。 展开更多
关键词 深度学习 图像去雾 res2net 金字塔池化
下载PDF
基于Res2-UNet模型的皮带煤量检测
7
作者 成彦颖 白尚旺 《计算机与数字工程》 2023年第7期1635-1639,共5页
为了能够检测煤矿井下的煤量,预测和提高煤的利用率,同时节省电能,减少人力的监管和资源成本。利用煤矿安装的视频监控系统,采用非接触的方式通过Camshift算法对快速运动皮带上的煤量捕捉和跟踪,然后建立Res2-UNet模型来获得显著性信息... 为了能够检测煤矿井下的煤量,预测和提高煤的利用率,同时节省电能,减少人力的监管和资源成本。利用煤矿安装的视频监控系统,采用非接触的方式通过Camshift算法对快速运动皮带上的煤量捕捉和跟踪,然后建立Res2-UNet模型来获得显著性信息,融合灰度、纹理、边缘等特征到单一的网络中,实现了皮带煤量的检测。模型利用U-Net网络的思想以编码器-解码器为架构,编码器以Res2Net网络为骨干网络提取煤流不同层次特征的信息,解码器通过反卷积上采样操作恢复图像尺寸。经过构建皮带数据集训练和测试模型,实验结果表明,提出的方法能够快速准确地检测出皮带上的煤料,精确率达到95.5%,每张图像从输入网络到输出的运行时间为4.8s。表明该方法具有一定的实用性和有效性。 展开更多
关键词 煤量检测 CAMSHIFT算法 编码器-解码器 res2-Unet模型 U-net网络 res2net网络
下载PDF
FIR-YOLACT:Fusion of ICIoU and Res2Net for YOLACT on Real-Time Vehicle Instance Segmentation
8
作者 Wen Dong Ziyan Liu +1 位作者 Mo Yang Ying Wu 《Computers, Materials & Continua》 SCIE EI 2023年第12期3551-3572,共22页
Autonomous driving technology has made a lot of outstanding achievements with deep learning,and the vehicle detection and classification algorithm has become one of the critical technologies of autonomous driving syst... Autonomous driving technology has made a lot of outstanding achievements with deep learning,and the vehicle detection and classification algorithm has become one of the critical technologies of autonomous driving systems.The vehicle instance segmentation can perform instance-level semantic parsing of vehicle information,which is more accurate and reliable than object detection.However,the existing instance segmentation algorithms still have the problems of poor mask prediction accuracy and low detection speed.Therefore,this paper proposes an advanced real-time instance segmentation model named FIR-YOLACT,which fuses the ICIoU(Improved Complete Intersection over Union)and Res2Net for the YOLACT algorithm.Specifically,the ICIoU function can effectively solve the degradation problem of the original CIoU loss function,and improve the training convergence speed and detection accuracy.The Res2Net module fused with the ECA(Efficient Channel Attention)Net is added to the model’s backbone network,which improves the multi-scale detection capability and mask prediction accuracy.Furthermore,the Cluster NMS(Non-Maximum Suppression)algorithm is introduced in the model’s bounding box regression to enhance the performance of detecting similarly occluded objects.The experimental results demonstrate the superiority of FIR-YOLACT to the based methods and the effectiveness of all components.The processing speed reaches 28 FPS,which meets the demands of real-time vehicle instance segmentation. 展开更多
关键词 Instance segmentation real-time vehicle detection YOLACT res2net ICIoU
下载PDF
Res2-Unet深度学习网络的RGB-高光谱图像重建 被引量:7
9
作者 宋蓓蓓 马穗娜 +1 位作者 何帆 孙文方 《光学精密工程》 EI CAS CSCD 北大核心 2022年第13期1606-1619,共14页
针对高光谱成像设备价格昂贵而难以推广应用的问题,利用深度学习网络从易获得的RGB图像重建高质量的高光谱图像。提出的Res2-Unet深度学习网络以Unet框架为基础,以Res2Net为主要模块构建其骨干网络,可以在更加细粒度级别提取局部和全局... 针对高光谱成像设备价格昂贵而难以推广应用的问题,利用深度学习网络从易获得的RGB图像重建高质量的高光谱图像。提出的Res2-Unet深度学习网络以Unet框架为基础,以Res2Net为主要模块构建其骨干网络,可以在更加细粒度级别提取局部和全局的图像特征。引入通道注意力机制自适应调节通道特征响应,并在编解码间通过跳跃连接以充分融合不同尺度和不同深度的信息。最后在图像恢复与增强新趋势2020年国际挑战赛提供的数据集上进行训练和测试。实验结果表明,与自适应加权注意力机制网络、分层回归网络相比,提出的方法在平均相对绝对误差、均方根误差、峰值信噪比和平均光谱角制图等4种客观评价指标上均获得了最好的结果;在Clean赛道中平均峰值信噪比分别高出0.08 dB和1.73 dB,在Real World赛道中平均峰值信噪比分别高出0.72 dB和0.97 dB。对比高光谱参考图像与重建图像,无论是在图像的低频平坦区还是在图像的高频纹理区,提出方法均获得了更好的主观视觉效果。 展开更多
关键词 深度学习 高光谱图像 图像重建 res2net 通道注意力机制
下载PDF
Res2Net融合注意力机制的YOLOv4目标检测算法 被引量:2
10
作者 张翔 刘振凯 +1 位作者 叶娜 赵妍祯 《计算机测量与控制》 2022年第9期213-220,227,共9页
针对传统目标检测算法容易出现漏检、误检或者有遮挡物时检测困难等问题,提出一种Res2Net融合注意力机制的YOLOv4(Res2Net fusion with attention learning YOLOv4,RFAL YOLOv4)目标检测模型;首先为了获取更多特征图语义信息,通过在一... 针对传统目标检测算法容易出现漏检、误检或者有遮挡物时检测困难等问题,提出一种Res2Net融合注意力机制的YOLOv4(Res2Net fusion with attention learning YOLOv4,RFAL YOLOv4)目标检测模型;首先为了获取更多特征图语义信息,通过在一个残差块内构造层次化的类残差连接,引入Res2Net替换原YOLOv4主干网络中的ResNet残差网络结构,可以获取到更细小的特征,同时也增加了模型感受野;其次将Res2Net与注意力机制相融合,获取关键特征信息,减轻因优化主干网络带来计算量增加的负担;最后通过改进CIOU损失,降低预测框与真实框之间的误差值,有效的解决因目标过小或者有遮挡时模型出现漏检误检等问题;在公开的PASCAL VOC数据集上进行验证,结果表明:RFAL YOLOv4模型的mAP达到了79.5%,比原模型提升了5.5%,改进后的模型具有较高的鲁棒性。 展开更多
关键词 目标检测 YOLOv4 res2net 注意力机制 CIOU
下载PDF
一种利用SE-Res2Net的合成语音检测系统 被引量:3
11
作者 梁超 高勇 《无线电工程》 北大核心 2022年第9期1560-1565,共6页
传统的说话人识别(Automatic Speaker Verfication, ASV)系统难以分辨合成语音,构建一个说话人保护系统刻不容缓。针对合成语音侵扰说话人识别系统问题,从特征层面提出了一种基于经验模式分解(Empirical Mode Decomposition, EMD)的梅... 传统的说话人识别(Automatic Speaker Verfication, ASV)系统难以分辨合成语音,构建一个说话人保护系统刻不容缓。针对合成语音侵扰说话人识别系统问题,从特征层面提出了一种基于经验模式分解(Empirical Mode Decomposition, EMD)的梅尔倒谱系数(Mel Frequency Cepstral Coefficients, MFCC)+逆梅尔倒谱系数(Inverse Mel Frequency Cepstral Coefficients, IMFCC)的双通道语音特征作为合成语音检测的前端特征,在后端分类器上串联Res2Net网络和SENet网络组合成SE-Res2Net网络来提升模型的泛化能力。将不同特征与模型的打分结果融合,进一步提高实验性能。在ASVspoof2019数据集上的实验结果表明,该设计的合成语音检测系统能有效检测合成语音,与ASVspoof2019比赛的基线系统相比,融合模型的等错误概率(Equal Error Rate, EER)与串联成本检测函数(tandem Detection Cost Function, t-DCF)分别降低了49%和64%。 展开更多
关键词 合成语音检测 res2net 经验模式分解 SEnet 等错误概率 串联成本检测函数
下载PDF
基于CA-Res2Net和可变形卷积的图像去模糊方法
12
作者 李武斌 李春国 杨绿溪 《无线电通信技术》 2022年第5期945-950,共6页
针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时... 针对动态场景下的非均匀运动模糊问题,提出了一种基于细粒度多尺度注意力残差模块(CA-Res2Net)和可变形卷积(Deformable Convolution)的图像去模糊方法CADNet。CADNet以可变形卷积自编码结构为基础架构,进而可以更好地对抗模糊形变;同时CADNet嵌入了细粒度多尺度的残差模块,可以在更细粒度的层次上表示图片的多尺度特征信息,从而可以获得更强的特征表示能力。实验结果表明,CADNet是一种高效的去模糊算法,在获得更高去模糊性能的同时,压制住了计算开销。 展开更多
关键词 图像去模糊 非均匀模糊 可变形卷积 通道注意力 res2net
下载PDF
基于CenterNet的草原牛羊计数研究
13
作者 孙强 郝敏 《现代计算机》 2023年第11期1-8,共8页
对草原放牧牛羊数量快速准确的统计是进行科学放牧管理和草原草畜平衡分析的重要前提。随着市场对畜牧产品需求的增加,内蒙古地区作为国内畜牧产品主要产地,其草原放牧牛羊的数量逐年上升,而目前以人工进行放牧牛羊数量统计工作存在难... 对草原放牧牛羊数量快速准确的统计是进行科学放牧管理和草原草畜平衡分析的重要前提。随着市场对畜牧产品需求的增加,内蒙古地区作为国内畜牧产品主要产地,其草原放牧牛羊的数量逐年上升,而目前以人工进行放牧牛羊数量统计工作存在难度大、效率低、统计准确度不稳定等问题。为实现牛羊数量的快速统计,使用无人机进行航拍采集的草原放牧牛羊图像并建立数据集,使用多尺度特征提取网络Res2Net提升anchor-free的CenterNet模型对航拍情景下放牧牛羊图像粘连小目标的检测效果,加入ECANet注意力机制进一步提升模型性能,并调节相关参数进行算法优化。研究结果表明,该模型在无人机航拍获取的数据集中的类平均精度达到88.22%,体现密集目标检测效果的牛羊对数平均漏检率分别下降了10%和11%。这一结果说明引入无接触式的计算机视觉技术在草原牛羊计数方面具有一定的价值。 展开更多
关键词 Centernet 目标检测 计数 res2net 注意力机制
下载PDF
Unveiling localized electronic properties of ReS2 thin layers at nanoscale using Kelvin force probe microscopy combined with tip-enhanced Raman spectroscopy
14
作者 罗宇 苏伟涛 +4 位作者 张娟娟 陈飞 武可 曾宜杰 卢红伟 《Chinese Physics B》 SCIE EI CAS CSCD 2023年第11期598-603,共6页
Electronic properties of two-dimensional(2D) materials can be strongly modulated by localized strain. The typical spatial resolution of conventional Kelvin probe force microscopy(KPFM) is usually limited in a few hund... Electronic properties of two-dimensional(2D) materials can be strongly modulated by localized strain. The typical spatial resolution of conventional Kelvin probe force microscopy(KPFM) is usually limited in a few hundreds of nanometers, and it is difficult to characterize localized electronic properties of 2D materials at nanoscales. Herein, tip-enhanced Raman spectroscopy(TERS) is proposed to combine with KPFM to break this restriction. TERS scan is conducted on ReS2bubbles deposited on a rough Au thin film to obtain strain distribution by using the Raman peak shift. The localized contact potential difference(CPD) is inversely calculated with a higher spatial resolution by using strain measured by TERS and CPD-strain working curve obtained using conventional KPFM and atomic force microscopy. This method enhances the spatial resolution of CPD measurements and can be potentially used to characterize localized electronic properties of 2D materials. 展开更多
关键词 few layer res2 tip enhanced Raman spectroscopy local strain Kelvin probe force microscopy
下载PDF
基于改进YOLOv5的行人检测方法研究
15
作者 薛继伟 薛鹏杰 胡馨元 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第7期101-109,共9页
针对行人检测中出现的目标遮挡和小尺度目标漏检等现象,提出一种基于YOLOv5改进的行人检测模型DROE-YOLO。在YOLOv5的C3模块中引入了Res2Net的残差结构以增强网络对行人目标的表征能力。采用Dynamic Head作为YOLOv5的检测头,提高检测的... 针对行人检测中出现的目标遮挡和小尺度目标漏检等现象,提出一种基于YOLOv5改进的行人检测模型DROE-YOLO。在YOLOv5的C3模块中引入了Res2Net的残差结构以增强网络对行人目标的表征能力。采用Dynamic Head作为YOLOv5的检测头,提高检测的准确性和鲁棒性。在标签分配策略方面采用了Simplified OTA方法,可以更准确地匹配真实框与预测框。最后,使用soft-NMS+EIOU的方法,进一步提高行人目标的检测准确率。在CrowdHuman数据集上的实验结果表明,DROE-YOLO在行人检测任务上取得了较好的效果。与基准模型相比,在增加少量参数的情况下,DROE-YOLO模型的检测精度提升了3.3%,召回率提升了6.5%,相比原模型更适用于实际的行人检测任务。 展开更多
关键词 行人检测 res2net Dynamic-Head Simplified-OTA Soft-NMS
下载PDF
国标麻将的多尺度骨干神经网络模型
16
作者 代君学 李霞丽 +1 位作者 刘博 王昭琦 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期137-144,共8页
在有多轮次、状态空间巨大、81种不同类别的番种、胡牌方式复杂的国标麻将中,普通的神经网络难以对复杂的数据进行表达和拟合。首次将多尺度骨干的深度神经网络用于实现麻将AI,以更好地捕获国标麻将的局部以及全局特征,适用于处理复杂数... 在有多轮次、状态空间巨大、81种不同类别的番种、胡牌方式复杂的国标麻将中,普通的神经网络难以对复杂的数据进行表达和拟合。首次将多尺度骨干的深度神经网络用于实现麻将AI,以更好地捕获国标麻将的局部以及全局特征,适用于处理复杂数据,做出更准确的游戏策略。基于IJCAI 2020 Champion的对局数据,对训练数据进行数据增强。采用增强后的数据,在NVIDAI GeForce RTX3090 LapTop GPU上进行了5天的监督学习训练,训练出的模型有52 M参数,动作准确率达到93.47%,弃牌准确率达到83.93%,鸣牌准确率达到97.56%。将提出的模型部署到北京大学开发的Botzone平台上,进入天梯榜前1%。 展开更多
关键词 深度学习 麻将 卷积神经网络 res2net50 多尺度骨干架构
下载PDF
采用轻量级网络MobileNetV2的酿酒葡萄检测模型 被引量:5
17
作者 李国进 黄晓洁 +1 位作者 李修华 艾矫燕 《农业工程学报》 EI CAS CSCD 北大核心 2021年第17期168-176,F0003,共10页
为提高田间葡萄图像中小目标葡萄检测的速度和精度,该研究提出了一种基于轻量级网络的酿酒葡萄检测模型(Wine Grape Detection Model,WGDM)。首先,采用轻量级网络MobileNetV2取代YOLOv3算法的骨干网络DarkNet53完成特征提取,加快目标检... 为提高田间葡萄图像中小目标葡萄检测的速度和精度,该研究提出了一种基于轻量级网络的酿酒葡萄检测模型(Wine Grape Detection Model,WGDM)。首先,采用轻量级网络MobileNetV2取代YOLOv3算法的骨干网络DarkNet53完成特征提取,加快目标检测的速度;其次,在多尺度检测模块中引入M-Res2Net模块,提高检测精度;最后,采用平衡损失函数和交并比损失函数作为改进的定位损失函数,增大目标定位的准确性。试验结果表明,提出的WGDM模型在公开的酿酒葡萄图像数据集的测试集上平均精度为81.20%,网络结构大小为44 MB,平均每幅图像的检测时间为6.29 ms;与单发检测器(Single Shot Detector,SSD)、YOLOv3、YOLOv4和快速区域卷积神经网络(Faster Regions with Convolutional Neural Network,Faster R-CNN)4种主流检测模型相比,平均检测时间分别减少了4.91、7.75、14.84和158.20 ms。因此,该研究提出的WGDM模型对田间葡萄果实具有更快速、更准确的识别与定位,为实现葡萄采摘机器人的高效视觉检测提供了可行方法。 展开更多
关键词 机器视觉 图像处理 模型 葡萄 检测 YOLO res2net
下载PDF
基于上下文特征提取的边缘生成三阶段图像修复算法
18
作者 芮志超 郭艳艳 《测试技术学报》 2024年第1期34-40,共7页
对于具有较大不规则缺失区域的图像修复问题,现有的基于深度学习的图像修复方法通常会生成具有模糊纹理和扭曲结构的内容。针对这个问题,将修复问题分解为基于上下文特征的结构预测和图像补全三阶段模型。第一阶段,通过空洞卷积编-解码... 对于具有较大不规则缺失区域的图像修复问题,现有的基于深度学习的图像修复方法通常会生成具有模糊纹理和扭曲结构的内容。针对这个问题,将修复问题分解为基于上下文特征的结构预测和图像补全三阶段模型。第一阶段,通过空洞卷积编-解码网络,利用周围图像特征来对缺失部分进行初步修复;第二阶段,将第一阶段粗修复结果进行边缘提取后,输入到一个自注意力机制编-解码网络来预测缺失区域的纹理结构;第三阶段,将前两个阶段的输出一起输入到一个改进的U-net精修复网络中,得到结构清晰、纹理细节丰富的图像。在公开数据集上将所提算法与现有经典算法进行对比,实验表明,所提方法在主观视觉和客观评价方面优于现有方法。 展开更多
关键词 深度学习 图像修复 自注意力机制 res2net 生成式对抗网络
下载PDF
基于RES2DMOD高密度电阻率法在采空区勘查中的应用 被引量:1
19
作者 王小玉 王璐 崔明飞 《华北地震科学》 2020年第S01期19-23,共5页
采用RES2DMOD高密度电阻率正演软件和RES2DINV高密度电阻率反演软件,选取有限差分法正演和最小二乘法反演的处理方法,对建立的三个不同采空区模型进行正、反演计算,研究地质体(采空区)的电阻率响应,并以在焦家金矿望儿山尾矿库区的具体... 采用RES2DMOD高密度电阻率正演软件和RES2DINV高密度电阻率反演软件,选取有限差分法正演和最小二乘法反演的处理方法,对建立的三个不同采空区模型进行正、反演计算,研究地质体(采空区)的电阻率响应,并以在焦家金矿望儿山尾矿库区的具体应用为例,验证了高密度电阻率法在采空区勘查中的有效性和可靠性,同时对反演结果做出解释和分析,结果表明高密度电阻率法在采空区勘查中具有一定的效果,最小二乘反演效果较好,可以进一步推广和使用。 展开更多
关键词 高密度电阻率法 采空区勘查 res2DMOD res2DINV
下载PDF
基于改进YOLOv5的太阳能电池板缺陷检测算法
20
作者 朱栋 贺森 《国外电子测量技术》 2024年第3期76-82,共7页
为提高太阳能电池板缺陷的检测精确,提出了一种改进的YOLOv5网络,对太阳能电池板常见的划痕、叉隐、黑斑、黑边以及无电等5类主要缺陷进行检测和分类。首先,使用改进后的ODConv模块对主干提取网络中的普通卷积模块进行替换,减少网络模... 为提高太阳能电池板缺陷的检测精确,提出了一种改进的YOLOv5网络,对太阳能电池板常见的划痕、叉隐、黑斑、黑边以及无电等5类主要缺陷进行检测和分类。首先,使用改进后的ODConv模块对主干提取网络中的普通卷积模块进行替换,减少网络模型的参数量;其次,将C3模块中的Bottleneck结构替换成包含ParNet模块的Res2Net以增加感受野,从而提升了探测物体缺陷的能力和检测精确;最后,在预测网络前引入自适应特征融合结构,以融合不同特征图的位置与类别信息,增强特征表达并提高模型的鲁棒性。对自建的数据集进行训练、验证以及测试,实验结果表明,改进后的模型能够成功识别和定位5类常见缺陷。与原YOLOv5算法相比,在保持原网络高效性的同时,平均检测精确提升了6.2%。 展开更多
关键词 缺陷检测 ODConv Parnet模块 res2net 特征融合
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部