期刊文献+
共找到518篇文章
< 1 2 26 >
每页显示 20 50 100
基于SMR-RCNN网络的隧道衬砌缺陷智能识别研究
1
作者 徐秋朗 罗伟斌 +2 位作者 刘斌 李涛 朱培民 《工程地球物理学报》 2024年第4期541-554,共14页
脱空和不密实是隧道衬砌最常见的两种病害。在这两种病害长期作用下会导致隧道出现破裂、渗漏水、钢筋锈蚀,最终造成隧道塌方等问题,严重威胁行车安全。采用探地雷达对隧道进行无损探测是发现这些病害或缺陷的常见方式,但大量雷达数据... 脱空和不密实是隧道衬砌最常见的两种病害。在这两种病害长期作用下会导致隧道出现破裂、渗漏水、钢筋锈蚀,最终造成隧道塌方等问题,严重威胁行车安全。采用探地雷达对隧道进行无损探测是发现这些病害或缺陷的常见方式,但大量雷达数据的人工识别存在着工作量大、效率低、强烈依赖人员的专业素养等问题。本文提出一种基于深度学习的隧道衬砌缺陷的自动检测方法——自监督多尺度池化区域卷积神经网络方法(Self-monitoring Multi-scale ROI Align Region Convolutional Neural Network,SMR-RCNN),以提高缺陷识别的效率,并减少主观因素的影响。在雷达探测隧道衬砌的实践中,数据量巨大,但缺陷样本却很少,这对训练神经网络是一个相当大的挑战。为此,设计了一种数据增强的方法来增加缺陷的样本数量,且使用一种自监督对比学习的网络模型来提取雷达数据的特征,然后将其迁移到改进后的Faster-RCNN网络模型中;最后,使用有标签的样本对改进的Faster-RCNN网络进行细调训练。实验结果表明,相较于传统的Faster-RCNN方法,本文提出的算法增强了神经网络对脱空和不密实两类缺陷的自动识别能力,在检测精度上得到了显著提高,mAP值提升了12%。 展开更多
关键词 隧道衬砌 缺陷特征 SMR-rcnn 对比学习 Faster-rcnn
下载PDF
改进Mask RCNN的盾构隧道渗漏水检测方法
2
作者 王健 郑理科 +1 位作者 吴斌杰 齐智宇 《测绘通报》 CSCD 北大核心 2024年第2期170-177,共8页
渗漏水是盾构隧道结构存在潜在损伤或缺陷的重要表征,快速、准确检测出渗漏水位置,对隧道安全运营和维护具有重要意义。现有的方法大多采用光学影像对隧道渗漏水进行检测,受隧道内空间和光线条件限制,难以获得高质量病害图片。因此,本... 渗漏水是盾构隧道结构存在潜在损伤或缺陷的重要表征,快速、准确检测出渗漏水位置,对隧道安全运营和维护具有重要意义。现有的方法大多采用光学影像对隧道渗漏水进行检测,受隧道内空间和光线条件限制,难以获得高质量病害图片。因此,本文提出了一种基于激光点云数据与改进Mask RCNN相结合的渗漏水检测方法。首先对激光点云反射强度进行修正;然后生成灰度图像并建立渗漏水病害数据集;最后在Mask RCNN算法中引入空洞卷积和变形卷积,实现了隧道渗漏水病害的快速检测。利用某地铁采集的数据进行验证,结果表明,本文提出的改进Mask RCNN算法相较于原始算法和FCN算法检测精度均有明显提升,在盾构隧道渗漏水识别方面性能表现较好。 展开更多
关键词 盾构隧道 点云 反射强度修正 Mask rcnn 渗漏水检测
下载PDF
多尺度特征和极化自注意力的Faster-RCNN水漂垃圾识别
3
作者 蒋占军 吴佰靖 +1 位作者 马龙 廉敬 《计算机应用》 CSCD 北大核心 2024年第3期938-944,共7页
针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature an... 针对小目标水漂垃圾形态多变、分辨率低且信息有限,导致检测效果不理想的问题,提出一种改进的Faster-RCNN(Faster Regions with Convolutional Neural Network)水漂垃圾检测算法MP-Faster-RCNN(Faster-RCNN with Multi-scale feature and Polarized self-attention)。首先,建立黄河兰州段小目标水漂垃圾数据集,将空洞卷积结合ResNet-50代替原来的VGG-16(Visual Geometry Group 16)作为主干特征提取网络,扩大感受野以提取更多小目标特征;其次,在区域生成网络(RPN)利用多尺度特征,设置3×3和1×1的两层卷积,补偿单一滑动窗口造成的特征丢失;最后,在RPN前加入极化自注意力,进一步利用多尺度和通道特征提取更细粒度的多尺度空间信息和通道间依赖关系,生成具有全局特征的特征图,实现更精确的目标框定位。实验结果表明,MP-Faster-RCNN能有效提高水漂垃圾检测精度,与原始Faster-RCNN相比,平均精度均值(mAP)提高了6.37个百分点,模型大小从521 MB降到了108 MB,且在同一训练批次下收敛更快。 展开更多
关键词 目标检测 水漂垃圾 Faster-rcnn 空洞卷积 多尺度特征融合 极化自注意力
下载PDF
基于Faster-RCNN网络的接箍自动识别方法
4
作者 严正国 陈瑛 +1 位作者 邹世娇 李锦江 《工业控制计算机》 2024年第3期57-58,61,共3页
在可视化测井中,深度对于判断油管缺陷位置、射孔位置至关重要,而现有的测深系统具有一定的深度误差。在观测井下视频人工查找接箍,存在耗时、检测速度慢等问题。先对VideoLog油气井可视化测井技术采集到的井下视频进行图像增强,引入Fas... 在可视化测井中,深度对于判断油管缺陷位置、射孔位置至关重要,而现有的测深系统具有一定的深度误差。在观测井下视频人工查找接箍,存在耗时、检测速度慢等问题。先对VideoLog油气井可视化测井技术采集到的井下视频进行图像增强,引入Faster-RCNN模型,采用ResNet50网络作为特征提取网络提取接箍特征,最终通过兴趣区域池化网络和全连接层完成接箍的识别定位。该模型有着0.99的平均精度,在实验中,视频中的接箍均可被准确识别,具有识别速度快和准确率高等优点。 展开更多
关键词 接箍识别 可视化测井 Faster-rcnn 深度学习
下载PDF
基于改进Mask-RCNN算法的作物害虫分类识别
5
作者 张佳敏 闫科 +4 位作者 王一非 刘杰 曾娟 吴鹏飞 黄求应 《农业工程学报》 EI CAS CSCD 北大核心 2024年第7期202-209,共8页
智能虫情测报灯对农业生产中及时察觉虫害、虫灾问题有重大作用,准确的害虫分类识别为虫情测报提供可靠数据支撑的关键。该研究对智能虫情测报灯所需核心识别算法进行改进,针对分类目标多尺度、存在多种相似非目标害虫干扰、易产生目标... 智能虫情测报灯对农业生产中及时察觉虫害、虫灾问题有重大作用,准确的害虫分类识别为虫情测报提供可靠数据支撑的关键。该研究对智能虫情测报灯所需核心识别算法进行改进,针对分类目标多尺度、存在多种相似非目标害虫干扰、易产生目标粘连等问题,提出一种基于改进Mask-RCNN(mask region-based convolutional neural network)模型的害虫图像智能识别模型。该模型使用DeAnchor算法改进Mask-RCNN的锚框引导机制,使用NDCC(novelty detection consistent classifiers)训练分类器进行联合分类和检测,改善非目标杂虫的误识别问题。改进后模型对无杂虫、不同虫体密度图像的识别准确率最高达到96.1%,最密集时可达90.6%,在仅有非目标的图片识别中,误检率降至9%,非目标与目标共存且密度为40虫/图的误检率降至15%。试验表明,该文所提模型在现有分类模型的基础上,增强了对密集区域的检测能力,改善了非目标误识别问题,在实际检测环境下的害虫分类识别精度更高,可为虫害防治工作提供数据参考。 展开更多
关键词 目标检测 虫害防治 分类识别 Mask rcnn 粘连目标
下载PDF
基于改进版Faster-RCNN的复杂背景下桃树黄叶病识别研究
6
作者 张平川 胡彦军 +3 位作者 张烨 张彩虹 陈昭 陈旭 《中国农机化学报》 北大核心 2024年第3期219-225,251,共8页
由于桃树黄叶病(以下简称PTYLD)初期症状不明显,现有的基于深度学习的桃树病害识别技术,存在识别准确率不高、识别品种单一的问题,提出一种基于Faster-RCNN的PTYLD识别模型。为提高模型对PTYLD识别准确率和识别多样性,提出使用RS-Loss... 由于桃树黄叶病(以下简称PTYLD)初期症状不明显,现有的基于深度学习的桃树病害识别技术,存在识别准确率不高、识别品种单一的问题,提出一种基于Faster-RCNN的PTYLD识别模型。为提高模型对PTYLD识别准确率和识别多样性,提出使用RS-Loss函数代替RPN中的交叉熵函数、使用Soft-NMS算法代替原来的NMS算法,来改进Faster-RCNN。通过试验对比初始版和改进版Faster-RCNN对PTYLD的识别效果。试验结果显示,改进后的Faster-RCNN对黄叶病识别的各类别平均准确率mAP达90.56%、召回率达94.16%、准确率达92.53%,能识别常见的五种PTYLD。 展开更多
关键词 桃树黄叶病 Faster-rcnn 复杂背景 软性非极大值抑制算法
下载PDF
基于改进Double-Head RCNN的无人机航拍图像小目标检测算法
7
作者 王殿伟 胡里晨 +1 位作者 房杰 许志杰 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第7期2141-2149,共9页
为解决无人机航拍图像中小目标特征信息少且容易被噪声干扰导致现有算法漏检率和误检率高的问题,提出一种改进Double-Head Region-卷积神经网络(RCNN)的无人机航拍图像小目标检测算法。在骨干网络ResNet-50上引入Transformer和可变形卷... 为解决无人机航拍图像中小目标特征信息少且容易被噪声干扰导致现有算法漏检率和误检率高的问题,提出一种改进Double-Head Region-卷积神经网络(RCNN)的无人机航拍图像小目标检测算法。在骨干网络ResNet-50上引入Transformer和可变形卷积(DCN)模块,更有效提取小目标特征信息和语义信息;提出一种基于内容感知特征重组(CARAFE)的特征金字塔网络(FPN)结构模块,解决特征融合过程中小目标被背景噪声干扰而丢失特征信息的问题;在区域建议网络中针对小目标尺度分布特点重新设置Anchor生成尺度,进一步提升小目标检测性能。在VisDrone-DET2021数据集上的实验结果表明:所提算法能提取更具有表征能力的小目标特征信息和语义信息,对比Double-Head RCNN算法,所提算法的参数量增加了9.73×10^(6),FPS损失了0.6,但是AP、AP50和AP75分别提升了2.6%、6.2%和2.1%,APs提升了3.1%。 展开更多
关键词 小目标检测 无人机航拍图像 Double-Head rcnn TRANSFORMER 内容感知特征重组
下载PDF
基于改进Faster RCNN的钢板表面缺陷检测研究
8
作者 卢勇拾 张滢雪 +2 位作者 司占军 于彦辉 王庆 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第3期244-251,共8页
钢铁是我国工业生产的重要原材料之一,其表面质量问题会直接影响产品的使用,从而带来无法预知的风险,故对钢铁表面进行缺陷检测具有重要意义。而在缺陷检测过程中,存在因裂痕缺陷特征不明显,导致缺陷定位不准确以及检测难度高等问题。... 钢铁是我国工业生产的重要原材料之一,其表面质量问题会直接影响产品的使用,从而带来无法预知的风险,故对钢铁表面进行缺陷检测具有重要意义。而在缺陷检测过程中,存在因裂痕缺陷特征不明显,导致缺陷定位不准确以及检测难度高等问题。针对以上问题,本研究提出一种改进的Faster RCNN算法,在主干特征提取网络上引入自适应模块,增强网络提取有效特征的能力,同时使用DBSCAN聚类算法取得合适的先验框,大大提高了算法的检测效率。实验结果表明,改进的Faster RCNN算法模型对不明显的缺陷特征检测能力大幅度的提升,相比其他检测算法,在钢板表面缺陷检测中能达到高质量、缺陷定位准确、分类成功率高的效果。 展开更多
关键词 Faster rcnn DBSACN聚类 目标检测 锚框
下载PDF
基于改进Faster RCNN的金属丝网缺陷检测方法
9
作者 姜菲菲 李宁 +1 位作者 邱翠翠 刘大猛 《中国科技论文》 CAS 2024年第2期153-159,共7页
作为一种传统的纺织产品,金属丝网在工业生产、日常生活、科研等领域起着举足轻重的作用,而金属丝网在编制过程中,表面会产生斑点、断线等缺陷,严重影响金属丝网的质量。为保障产品质量,研究了一种基于改进Faster RCNN算法的金属丝网表... 作为一种传统的纺织产品,金属丝网在工业生产、日常生活、科研等领域起着举足轻重的作用,而金属丝网在编制过程中,表面会产生斑点、断线等缺陷,严重影响金属丝网的质量。为保障产品质量,研究了一种基于改进Faster RCNN算法的金属丝网表面缺陷检测方法。首先,为提高模型缺陷特征提取能力,特征提取网络选用深度残差网络(ResNet50)代替原视觉几何群网络(VGG16),并引入注意力模块;随后,训练过程中利用有预热的余弦退火学习率衰减机制,以提高网络检测精度;同时引入k-means算法和遗传算法,设计了更适合金属丝网数据集的锚框尺寸,以提高候选框的精度,解决缺陷定位不准的问题。经实验验证,利用改进Faster RCNN算法检测的平均精度均值(mean average precision,mAP)达86.95%,较原Faster RCNN算法提高18.81%,为金属丝网缺陷的检测提供了一个有效可行的方案。 展开更多
关键词 金属丝网 Faster rcnn 缺陷检测 深度学习
下载PDF
嵌入CBAM的改进Faster RCNN眼底微动脉瘤检测方法
10
作者 杨丽 邵虹 崔文成 《长江信息通信》 2024年第5期40-43,共4页
眼底微动脉瘤检测可以有效地预防和控制糖尿病性视网膜病变,在临床应用中具有重要的意义,但该病灶的目标区域较小且存在眼底出血和其他结构的干扰,同时眼底图像存在亮度、对比度不均的问题,给检测任务带来了巨大挑战。针对此问题提出一... 眼底微动脉瘤检测可以有效地预防和控制糖尿病性视网膜病变,在临床应用中具有重要的意义,但该病灶的目标区域较小且存在眼底出血和其他结构的干扰,同时眼底图像存在亮度、对比度不均的问题,给检测任务带来了巨大挑战。针对此问题提出一种基于Faster RCNN网络的微动脉瘤小目标检测方法,先对数据集进行以病灶为中心的分块处理,提升目标区域的占比;再将主干网络替换为特征表达能力强的ResNet网络,并引入注意力机制,结合加入融合因子的特征金字塔模块进行多尺度特征融合,改善主干网络提取小目标特征信息的能力,增加其对目标区域的关注程度。实验结果表明,算法在E-Ophtha MA数据集上取得了良好的检测效果,精确率为91.3%,召回率为80.2%,较原模型精确率提高了13.1%,召回率提高了8%,且与其他方法相比检测效果更好。 展开更多
关键词 小目标检测 Faster rcnn 微动脉瘤 注意力机制 多尺度特征融合
下载PDF
基于Transformer改进的Faster RCNN在复杂环境下的车辆检测
11
作者 王鑫泽 何超 《机电工程技术》 2024年第4期106-110,共5页
在监控视角中目标车辆较小、遮挡较为严重,导致检测精度低。通过探讨卷积神经网络和Transformer模型的互相借鉴和联系,并结合损失函数等常规改进,提出了新的Faster RCNN模型。通过借鉴Transformer模型的思想,对原有的特征提取网络进行... 在监控视角中目标车辆较小、遮挡较为严重,导致检测精度低。通过探讨卷积神经网络和Transformer模型的互相借鉴和联系,并结合损失函数等常规改进,提出了新的Faster RCNN模型。通过借鉴Transformer模型的思想,对原有的特征提取网络进行了改进,将原block比例3∶4∶6∶3改为3∶3∶27∶3、卷积核由3×3改为7×7,增大其感受野,能够更好捕捉图像中的全局特征,使用DW卷积来减少参数量并略微提高性能,使用Channel shuffle解决通道间信息不交流的问题。将原先交并比IoU改为CIoU,与改进后的特征提取网络结合,进一步提高小目标和遮挡目标的检测效果。在UA-DETRAC数据集上,改进后的模型在mAP@0.5:0.95方面比原算法提高了20.20%,并在大、中、小目标下分别提高了15.8%、23%和45.8%,相较于其他模型,如YO⁃LOv7、YOLOv5和Cascade RCNN,mAP@0.5:0.95分别提高了3.3%、5%和6.69%。 展开更多
关键词 TRANSFORMER CIoU损失函数 卷积神经网络改进 改进的Faster rcnn
下载PDF
基于SE-Mask-RCNN建筑遗产识别与空间可视化分析
12
作者 朱小凡 胡璐锦 +1 位作者 王恺 王坚 《时空信息学报》 2024年第1期50-56,共7页
传统建筑是中国宝贵的建筑遗产,承载着优秀的民族建筑文化,是反映城市特色风貌的重要指标。现阶段深度学习识别建筑物的技术相对成熟,但使用街景图片识别建筑遗产并进行地图可视化展示的研究较少,因此,本研究基于Mask-RCNN(mask region-... 传统建筑是中国宝贵的建筑遗产,承载着优秀的民族建筑文化,是反映城市特色风貌的重要指标。现阶段深度学习识别建筑物的技术相对成熟,但使用街景图片识别建筑遗产并进行地图可视化展示的研究较少,因此,本研究基于Mask-RCNN(mask region-based convolutional neural network)模型,融合SE(squeeze and excitation)注意力机制,提出一种基于SE-Mask-RCNN识别街景图片中建筑遗产的方法。首先,通过路网数据获取百度街景图片,制作数据集。其次,在模型的残差网络(residual network,ResNet)中引入SE注意力机制;并与已有相关方法 U-net(u-shaped network)、全卷积网络(fully convolutional network,FCN)、Mask-RCNN三种模型进行实验对比评价。最后,使用本方法识别研究区域内的街景图片,形成可视化地图,分析建筑遗产在空间上的分布情况。结果表明,本方法可以有效识别城市中的建筑遗产,识别结果较Mask-RCNN、U-Net、FCN模型分别提高了2%、3.1%、4.7%,证明了本方法对城市中建筑遗产的识别具有可靠性和有效性。研究成果可为建筑遗产保护及现状调查提供依据。 展开更多
关键词 传统建筑 建筑遗产 深度学习 Mask-rcnn 街景数据
下载PDF
多尺度特征融合改进Faster RCNN的铝材表面缺陷辨识
13
作者 陈法法 刘咏 +1 位作者 潘瑞雪 陈保家 《组合机床与自动化加工技术》 北大核心 2024年第5期166-170,共5页
针对铝型材表面缺陷类型多样、缺陷特征复杂,难以自动检测的问题,设计了一种基于改进Faster RCNN的铝材表面缺陷检测模型。以感兴趣区域校准代替感兴趣区域池化,减少Faster RCNN模型自身量化产生的缺陷定位误差;以Darknet-53结合特征金... 针对铝型材表面缺陷类型多样、缺陷特征复杂,难以自动检测的问题,设计了一种基于改进Faster RCNN的铝材表面缺陷检测模型。以感兴趣区域校准代替感兴趣区域池化,减少Faster RCNN模型自身量化产生的缺陷定位误差;以Darknet-53结合特征金字塔为主干网络提高对微小缺陷的提取能力;利用热重启的余弦退火策略更新模型的学习率,进一步加速模型收敛,提高模型检测精度。通过实际的铝型材表观缺陷数据进行测试,该方法对铝型材表面缺陷识别的平均准确率达到96.5%,单张图片检测时间为0.373 s。综合分析表明,所构建的多尺度特征融合改进Faster RCNN的铝材表面缺陷辨识模型,能够达到工程界对铝型材表观缺陷进行缺陷辨识的实际应用需求。 展开更多
关键词 缺陷检测 Faster rcnn 特征提取 余弦退火
下载PDF
MCIF-Transformer Mask RCNN:Multi-Branch Cross-Scale Interactive Feature Fusion Transformer Model for PET/CT Lung Tumor Instance Segmentation
14
作者 Huiling Lu Tao Zhou 《Computers, Materials & Continua》 SCIE EI 2024年第6期4371-4393,共23页
The precise detection and segmentation of tumor lesions are very important for lung cancer computer-aided diagnosis.However,in PET/CT(Positron Emission Tomography/Computed Tomography)lung images,the lesion shapes are ... The precise detection and segmentation of tumor lesions are very important for lung cancer computer-aided diagnosis.However,in PET/CT(Positron Emission Tomography/Computed Tomography)lung images,the lesion shapes are complex,the edges are blurred,and the sample numbers are unbalanced.To solve these problems,this paper proposes a Multi-branch Cross-scale Interactive Feature fusion Transformer model(MCIF-Transformer Mask RCNN)for PET/CT lung tumor instance segmentation,The main innovative works of this paper are as follows:Firstly,the ResNet-Transformer backbone network is used to extract global feature and local feature in lung images.The pixel dependence relationship is established in local and non-local fields to improve the model perception ability.Secondly,the Cross-scale Interactive Feature Enhancement auxiliary network is designed to provide the shallow features to the deep features,and the cross-scale interactive feature enhancement module(CIFEM)is used to enhance the attention ability of the fine-grained features.Thirdly,the Cross-scale Interactive Feature fusion FPN network(CIF-FPN)is constructed to realize bidirectional interactive fusion between deep features and shallow features,and the low-level features are enhanced in deep semantic features.Finally,4 ablation experiments,3 comparison experiments of detection,3 comparison experiments of segmentation and 6 comparison experiments with two-stage and single-stage instance segmentation networks are done on PET/CT lung medical image datasets.The results showed that APdet,APseg,ARdet and ARseg indexes are improved by 5.5%,5.15%,3.11%and 6.79%compared with Mask RCNN(resnet50).Based on the above research,the precise detection and segmentation of the lesion region are realized in this paper.This method has positive significance for the detection of lung tumors. 展开更多
关键词 PET/CT images instance segmentation mask rcnn interactive fusion TRANSFORMER
下载PDF
基于优化Mask-RCNN算法的遥感飞机目标检测
15
作者 葛海婷 杨铁梅 《太原科技大学学报》 2024年第1期1-6,共6页
针对传统的图像检测算法在遥感领域中存在的问题,将改进的Mask-RCNN检测算法应用于遥感领域。通过优化Resnet特征提取网络,提高算法的特征提取能力;通过改进NMS非极大值抑制网络,优化区域推荐网络。并在自建的遥感飞机数据集上验证算法... 针对传统的图像检测算法在遥感领域中存在的问题,将改进的Mask-RCNN检测算法应用于遥感领域。通过优化Resnet特征提取网络,提高算法的特征提取能力;通过改进NMS非极大值抑制网络,优化区域推荐网络。并在自建的遥感飞机数据集上验证算法的稳定性以及有效性。经检测,改进的算法能够提升遥感图像中飞机的检测精度,并且有效降低了飞机目标的误检和漏检问题。 展开更多
关键词 Mask-rcnn 深度学习 遥感图像 目标检测
下载PDF
基于Faster-RCNN和先验知识的车架VIN码识别方法
16
作者 赵珣 张新峰 边浩南 《计算机应用与软件》 北大核心 2024年第1期177-182,共6页
为了提高车检所工作效率,同时克服对VIN(Vehicle Identification Number)这类长字符串识别准确率低的难题,基于现有深度卷积神经网络的模型,提出以Faster R-CNN为主干网络,并结合先验知识的车架VIN识别模型。根据车架号图像特点,选择Fas... 为了提高车检所工作效率,同时克服对VIN(Vehicle Identification Number)这类长字符串识别准确率低的难题,基于现有深度卷积神经网络的模型,提出以Faster R-CNN为主干网络,并结合先验知识的车架VIN识别模型。根据车架号图像特点,选择Faster R-CNN进行字符级定位和识别的方案。针对长字符识别容易漏字符的现象,使用被遗漏位置的前后字符坐标来定位缺失字符。使用inception网络对补漏得出的字符区域进行识别。灵活使用先验知识使得该方法比只使用Faster R-CNN识别车架号的准确率提高了31.7百分点,识别率达到了64.77%,这也高于当前主流OCR模型在长度超过15位的文本上的准确率。 展开更多
关键词 OCR Faster rcnn 先验知识 长字符串
下载PDF
基于Faster-RCNN与自注意力机制的矿山图像异常检测算法
17
作者 张玉茜 刘文荣 +4 位作者 孙勇 刘丰武 殷齐月 马文宁 赵建伟 《金属矿山》 CAS 北大核心 2024年第7期196-201,共6页
矿山异常行为检测是一项重要工作,有助于提高采场安全生产监管效率。提出了一种基于自注意力机制的Faster-RCNN算法,用于矿山图像异常行为检测。该算法通过自注意力机制对特征图进行加权,有效提取关键特征,并减少冗余信息干扰。首先,从... 矿山异常行为检测是一项重要工作,有助于提高采场安全生产监管效率。提出了一种基于自注意力机制的Faster-RCNN算法,用于矿山图像异常行为检测。该算法通过自注意力机制对特征图进行加权,有效提取关键特征,并减少冗余信息干扰。首先,从图像中提取RoI区域,并通过自注意力机制对RoI区域内的特征图进行加权,使得关键特征得到更准确的提取。同时,对RoI区域内的特征图进行细粒度融合,以捕捉更多的图像细节信息。最后,使用分类器对每个RoI区域进行分类,以检测图像中的异常行为。在自建数据集上对算法进行了训练与评估,试验结果表明:所提算法在矿工图像异常行为检测工作上表现出更高的准确性和鲁棒性,与传统的Faster-RCNN算法相比,该算法检测精度提高了4.8%。此外,该算法对于光照和角度等变化具有更好的鲁棒性,可以有效应对实际场景中的复杂环境。 展开更多
关键词 目标检测 自注意力 Faster-rcnn 矿山图像 异常行为检测
下载PDF
基于改进Mask RCNN的遥感图像小目标检测算法研究
18
作者 张艺博 赵加坤 +2 位作者 陈攀 支杨丹 夏星浩 《计算机与数字工程》 2024年第3期880-885,共6页
随着航空遥感领域的不断发展,针对该场景下小型目标的检测已经成为目前研究领域中的一项重要工作。论文基于航空遥感图像场景,提出了一种针对航空遥感领域中小目标检测的优化方法。为了提高算法在小目标检测方面的实用性和准确性,论文在... 随着航空遥感领域的不断发展,针对该场景下小型目标的检测已经成为目前研究领域中的一项重要工作。论文基于航空遥感图像场景,提出了一种针对航空遥感领域中小目标检测的优化方法。为了提高算法在小目标检测方面的实用性和准确性,论文在Mask RCNN算法的基础上添加了空间注意力机制模块来对图像的背景做降噪处理,使用CIOU作为边界框回归损失函数进行优化,然后使用Kmeans聚类算法代替原始算法生成更加匹配小型目标的检测锚框。改进的Mask RCNN在航空遥感图像数据集下的检测精度达到61.89mAP,检测精度相对于目前主流的遥感图像检测算法R-FCN提升了17%,相对于Mask RCNN提高了2.4%,达到了当前条件下最好的检测效果。 展开更多
关键词 改进Mask rcnn 航空遥感图像 注意力机制 CIOU
下载PDF
基于迁移学习和改进Faster-RCNN遥感影像飞机目标检测
19
作者 周绍鸿 方新建 +2 位作者 刘鑫怡 张潆丹 严盛 《机电工程技术》 2024年第5期172-177,共6页
为了提高遥感影像飞机目标检测的准确性和泛化能力,需要解决背景复杂、尺度多变、目标密集、飞机朝向不确定和特征不明显等问题。但现阶段训练数据量有限,初始训练需要消耗大量算力和时间,容易出现过拟合现象。因此,需要优化模型结构和... 为了提高遥感影像飞机目标检测的准确性和泛化能力,需要解决背景复杂、尺度多变、目标密集、飞机朝向不确定和特征不明显等问题。但现阶段训练数据量有限,初始训练需要消耗大量算力和时间,容易出现过拟合现象。因此,需要优化模型结构和训练过程。针对上述问题,首先引入一种迁移学习的策略,在Faster-RCNN模型训练之前,加载MS COCO数据集预先训练好的权重,使模型快速收敛,节约了大量的训练时间。然后以ResNet50替代原Faster-RCNN的VGG16特征提取网络,更好地利用深层次的语义信息,在此基础上结合FPN网络,并对原Faster-RCNN的9种锚框增加为15种锚框,通过融合多尺度特征图以获得更丰富的特征表示,从而提高网络检测和定位目标的能力。以RSOD-Dataset数据集为例进行飞机目标检测实验,同时比较不同检测算法的性能;再以NWPU VHR-10数据集验证模型的泛化性和稳定性,实验结果表明:改进的Faster-RCNN在RSOD-Dataset数据集上的精确率为97.54%;在NWPU VHR-10数据集上的精确率为98.27%。通过迁移学习和改进Faster-RCNN的网络结构,可以实现在数据量较少的情况下高精度目标检测,且泛化能力较强,所提方法可以利用于其他目标检测和识别,具有较好的推广意义。 展开更多
关键词 遥感影像 迁移学习 目标检测 Faster-rcnn 深度学习
下载PDF
基于Mask RCNN和YOLOv5的水库水位监测方法
20
作者 方涛 《水利科技与经济》 2024年第8期86-88,105,共4页
随着深度学习的发展,通过视频实现水位监测成为近年来研究热点。为了提高水位监测的准确性,研究开发一种结合Mask RCNN和YOLOv5的新型水位监测方法。首先利用Mask RCNN模型,识别视频画面中的水尺区域并进行精确分割;然后通过YOLOv5模型... 随着深度学习的发展,通过视频实现水位监测成为近年来研究热点。为了提高水位监测的准确性,研究开发一种结合Mask RCNN和YOLOv5的新型水位监测方法。首先利用Mask RCNN模型,识别视频画面中的水尺区域并进行精确分割;然后通过YOLOv5模型,对分割后的水尺区域进行字符识别,准确捕捉水尺上的“m”字符、“E”字符以及数字字符,并记录这些字符在视频画面中的坐标位置;再通过分析字符的代表高度及其坐标位置,计算出水位数据。研究显示,该方法通过精确的区域分割和高效的字符识别,可显著提高水位监测的准确率和可靠性,表明其在水位监测中的应用潜力。 展开更多
关键词 水位监测 深度学习 Mask rcnn YOLOv5
下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部