期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
应用于扩容小样本量YOLO人脸数据集的imgaug图像增广方法
1
作者 尤鑫 蔡艺军 +3 位作者 林云 唐凯 卓建明 邹建航 《厦门理工学院学报》 2023年第5期32-39,共8页
采用人脸照片作为训练数据集,利用imgaug图像增广库对基本的数据进行随机裁剪、随机90°旋转等变换来增加样本容量,以提高所训练网络模型的泛化能力,解决深度模型训练过程中数据集样本不足的问题。在图库扩容小样本数据集的过程中,... 采用人脸照片作为训练数据集,利用imgaug图像增广库对基本的数据进行随机裁剪、随机90°旋转等变换来增加样本容量,以提高所训练网络模型的泛化能力,解决深度模型训练过程中数据集样本不足的问题。在图库扩容小样本数据集的过程中,以YOLO网络结构为主对人脸身份进行检测和分类,并对比YOLOv3和YOLOv5增广前后的结果。实验结果显示,增广后的YOLOv3模型对测试集进行检测的平均精度为88.85%,比原始的YOLOv3模型提高了38.59%,识别效果优于原始的YOLOv3模型;YOLOv5组合增广扩充样本后训练图像识别模型的人脸识别准确率比原始的YOLOv5模型提升了约0.5%。 展开更多
关键词 人脸识别 图像增广 imgaug算法数据库 YOLO网络结构 小样本数据集
下载PDF
基于卷积评价及对抗网络的花粉、孢子图像增广算法 被引量:1
2
作者 王万亮 江高飞 +1 位作者 严江伟 薛卫 《江苏农业学报》 CSCD 北大核心 2021年第5期1190-1198,共9页
针对花粉、孢子图像特征复杂,样本稀缺及种类繁多制约图像检测识别效果的问题,建立基于自适应阈值分割的pix2pix图像增广模型。首先基于卷积评价改进自适应阈值分割算法,择优选取语义分割图像;其次构建pix2pix图像增广模型,将语义分割... 针对花粉、孢子图像特征复杂,样本稀缺及种类繁多制约图像检测识别效果的问题,建立基于自适应阈值分割的pix2pix图像增广模型。首先基于卷积评价改进自适应阈值分割算法,择优选取语义分割图像;其次构建pix2pix图像增广模型,将语义分割图像和原始图像建立标签映射用于模型训练,根据语义分割图像生成仿真图像,扩充样本数据集。结果表明,以149种花粉、孢子图像为样本,通过图像增广模型生成的花粉、孢子图像整体相似度达到85.40%;图像增广前Faster RCNN、YOLOv3检测模型的检测精准率分别为86.18%、85.64%,使用增广后的样本训练模型,检测精准率分别达到92.16%、90.57%,提升5.98个百分点和4.93个百分点。 展开更多
关键词 花粉检测 图像增广 图像分割 pix2pix网络
下载PDF
基于多层感知分类器的皮革图像缺陷识别研究
3
作者 马静 《中国皮革》 CAS 2024年第8期40-46,共7页
针对传统皮革图像缺陷识别准确率和识别效率不高的问题,提出一种改进多层感知分类器的皮革图像缺陷识别方法。首先,以多层感知分类器作为基础网络模型,对其结构进行优化,并选择适宜的激活函数、分类器和权值与偏置更新方法;然后,搭建一... 针对传统皮革图像缺陷识别准确率和识别效率不高的问题,提出一种改进多层感知分类器的皮革图像缺陷识别方法。首先,以多层感知分类器作为基础网络模型,对其结构进行优化,并选择适宜的激活函数、分类器和权值与偏置更新方法;然后,搭建一个基于改进多层感知分类器的皮革图像缺陷识别模型;最后,提出一套皮革缺陷图像数据集构建方案,通过滑窗裁剪、样本标注、图像增广等获得4类皮革缺陷图像样本,并将该数据集输入至搭建缺陷识别模型中进行缺陷识别。试验结果表明,本模型对孔洞缺陷、划痕缺陷、针眼缺陷和无缺陷4种故障样本的平均精确率、召回率、准确率和F1值分别为96.97%、96.52%、94.99%和96.14,且本模型进行缺陷识别所用时长仅为3.56 s。相较于经典卷积神经网络VGG16、残差网络ResNet10和支持向量机SVM,本模型对皮革图像不同样本的故障识别准确率更高,识别时间更短。由此说明,本模型能够提升皮革图像缺陷识别准确率和效率,模型性能具备优越性和有效性。 展开更多
关键词 多层感知分类器 皮革图像 图像增广 权值与偏置更新 缺陷识别
下载PDF
机器视觉应用中的图像数据增广综述 被引量:27
4
作者 林成创 单纯 +11 位作者 赵淦森 杨志荣 彭璟 陈少洁 黄润桦 李壮伟 易序晟 杜嘉华 李双印 罗浩宇 樊小毛 陈冰川 《计算机科学与探索》 CSCD 北大核心 2021年第4期583-611,共29页
深度学习是目前机器视觉的前沿解决方案,而海量高质量的训练数据集是深度学习解决机器视觉问题的基本保障。收集和准确标注图像数据集是一个极其费时且代价昂贵的过程。随着机器视觉的广泛应用,这个问题将会越来越突出。图像增广技术是... 深度学习是目前机器视觉的前沿解决方案,而海量高质量的训练数据集是深度学习解决机器视觉问题的基本保障。收集和准确标注图像数据集是一个极其费时且代价昂贵的过程。随着机器视觉的广泛应用,这个问题将会越来越突出。图像增广技术是一种有效解决深度学习在少量或者低质量训练数据中进行训练的一种技术手段,该技术不断地伴随着深度学习与机器视觉的发展。系统性梳理当前图像增广技术研究,从增广对象、增广空间、标签处理和增广策略生成的角度,分析现有图像增广技术的研究范式。依据研究范式提出现有图像增广技术的分类系统,重点介绍每类图像增广研究的代表性研究成果。最后,对现有图像增广研究进行总结,指出当前图像增广研究中存在的问题及未来的发展趋势。 展开更多
关键词 深度学习 计算机视觉 图像增广 数据广 图像
下载PDF
基于图像和特征联合优化的跨模态行人重识别研究
5
作者 张辉 刘世洪 钟武 《荆楚理工学院学报》 2023年第2期9-17,共9页
跨模态行人重识别(VI-ReID)旨在匹配可见光和红外摄像头下捕获的行人图像,十分具有挑战性。为减小可见光图像和红外图像之间的模态差异,本文提出了异质图像增广方法和跨模态特征对齐方法来优化跨模态行人重识别网络,利用轻量级异质图像... 跨模态行人重识别(VI-ReID)旨在匹配可见光和红外摄像头下捕获的行人图像,十分具有挑战性。为减小可见光图像和红外图像之间的模态差异,本文提出了异质图像增广方法和跨模态特征对齐方法来优化跨模态行人重识别网络,利用轻量级异质图像卷积生成器对可见光图像进行增广,采用色彩抖动方式对红外图像进行增广,并使用正样本优化轻量级异构图像卷积生成器来约束损失。在此基础上,使用两个模态分类器和跨模态特征对齐损失作为指导,不断学习获得模态共享的特征。在两个数据集上的大量实验表明,我们的方法具有优异的性能,在SYSU-MM01和RegDB数据集上分别达到了rank1/mAP 57.82%/54.35%和80.39%/75.05%的精度。 展开更多
关键词 跨模态行人重识别 模态差异 异质图像增广 跨模态特征对齐
下载PDF
基于双注意力机制和级联检测框架的金具螺栓缺陷检测研究
6
作者 陆晓 高超 +1 位作者 蒋承伶 王茂飞 《机械与电子》 2024年第1期63-70,共8页
针对传统输电线路金具上的螺栓缺陷检测存在精度低和效率低的问题,提出一种基于双注意力机制和级联检测框架的螺栓缺陷检测模型。首先,构建了螺栓缺陷检测的级联框架并通过基于GridMask图像增广方法实现数据集的扩充;其次,为了提高螺栓... 针对传统输电线路金具上的螺栓缺陷检测存在精度低和效率低的问题,提出一种基于双注意力机制和级联检测框架的螺栓缺陷检测模型。首先,构建了螺栓缺陷检测的级联框架并通过基于GridMask图像增广方法实现数据集的扩充;其次,为了提高螺栓缺陷检测精度,提出了基于知识引导的输电线金具检测模型,通过隐式和显示模块的构建,实现第1级金具的检测;然后,将金具检测结果输入到第2级螺栓的缺陷检测网络中,同时提出一种基于双注意力机制的螺栓缺陷检测模型来进行螺栓缺陷检测,通过多尺度注意力模块的设计,融合空间注意力图,实现螺栓全局视野上的特征增强,提高检测的精度;最后,通过实验进行验证,实验结果表明,所提模型的螺栓缺陷检测平均准确度高、检测速度快,具有良好的实用性和鲁棒性,有一定的应用前景。 展开更多
关键词 金具螺栓 缺陷检测 多尺度注意力 级联 知识引导 图像增广
下载PDF
基于深度学习的施工现场安全帽佩戴检测的研究
7
作者 张贝贝 程科 +1 位作者 钱倩倩 张亚芹 《计算机与数字工程》 2023年第7期1657-1662,共6页
安全帽在保护施工人员免受事故中起着至关重要的作用。为了加强建筑工地的安全。论文提出了一种基于卷积神经网络的一级系统,用于自动监测施工人员是否戴安全帽并识别相应的颜色。为了便于研究,论文建了一个新安全帽佩戴检测基准数据集... 安全帽在保护施工人员免受事故中起着至关重要的作用。为了加强建筑工地的安全。论文提出了一种基于卷积神经网络的一级系统,用于自动监测施工人员是否戴安全帽并识别相应的颜色。为了便于研究,论文建了一个新安全帽佩戴检测基准数据集,该数据集由2116幅图像组成,涵盖了不同的现场条件。然后,利用所提出的反向渐进注意对不同尺度的不同层次的特征进行区分融合,生成新的特征金字塔,并将其送入单次激发多盒检测器(SSD)中预测最终的检测结果。该系统采用端到端方案进行训练。实验结果表明,该系统在各种现场条件下都是有效的,在输入尺寸为512×512的情况下,平均mAP精度可达82.21%。 展开更多
关键词 深度学习 卷积神经网络 目标检测 K-MEANS聚类算法 图像增广
下载PDF
基于Faster R-CNN算法的列车轴承表面缺陷检测研究 被引量:10
8
作者 石炜 李嘉楠 +1 位作者 张惠丽 黄迎久 《机床与液压》 北大核心 2021年第11期103-108,共6页
将深度学习Faster R-CNN应用于列车轴承图像的表面缺陷检测。建立人工数据库BSD,通过对图像增广弥补数据不足的缺陷;采用Faster R-CNN算法进行目标检测和识别,卷积神经网络采用ZF Net模型,对BSD数据集训练,得到检测结果;并与传统检测方... 将深度学习Faster R-CNN应用于列车轴承图像的表面缺陷检测。建立人工数据库BSD,通过对图像增广弥补数据不足的缺陷;采用Faster R-CNN算法进行目标检测和识别,卷积神经网络采用ZF Net模型,对BSD数据集训练,得到检测结果;并与传统检测方法Canny算法的检测结果进行比较。试验结果表明:和传统Canny算法比较,基于Faster R-CNN算法的轴承缺陷的检测精度为93.03%、检测时间为0.29 s,相比传统Canny算法检测精度提升21.73%、检测时间减少2.21 s,同时准确率大幅度提高,能够实现轴承表面缺陷的精确检测和识别,满足铁路部门对轴承检修的需求。 展开更多
关键词 深度学习 缺陷检测 图像增广 卷积神经网络
下载PDF
一种基于深度学习网络的输电杆塔智能检测算法 被引量:10
9
作者 韦汶妍 刘晓立 +3 位作者 杨传凯 菅永峰 沙洁韵 杜建超 《广东电力》 2020年第9期166-173,共8页
为了满足电力设备智能巡检的要求,提出一种基于深度学习网络的输电杆塔智能检测算法。该算法采用Faster区域卷积神经网络(regional convolutional neural networks,R-CNN)架构,利用VGG16作为特征提取器,通过在ImageNet图像库上进行前期... 为了满足电力设备智能巡检的要求,提出一种基于深度学习网络的输电杆塔智能检测算法。该算法采用Faster区域卷积神经网络(regional convolutional neural networks,R-CNN)架构,利用VGG16作为特征提取器,通过在ImageNet图像库上进行前期训练和本地迁移学习进行参数调整,减少深层网络参数的训练难度,有效提取杆塔的浅层基础特征以及深层抽象特征;为了扩大训练样本数量,提高模型检测准确度,对杆塔图像进行了镜像、旋转、锐化处理。实验结果表明,所提算法的检测准确度达到90.5%,能有效检测到监控图像中的杆塔,满足应用要求。 展开更多
关键词 深度学习 杆塔检测 智能巡检 VGG16 图像增广
下载PDF
基于深度学习的面部疼痛智能评估方法研究 被引量:2
10
作者 刘定玺 蒋国璋 +4 位作者 章花 胜照友 刘康 鲁辉 刘融 《生物医学工程研究》 2022年第3期268-274,284,共8页
为了提高疼痛评估的快捷性、直观性、连续性、准确性,本研究建立了一种基于深度学习和面部表情图像的疼痛强度智能评估模型,为准确评估疼痛病情、适时调整治疗方案、实施有效镇痛措施提供补充依据。该方法采集7位志愿者在6种不同疼痛强... 为了提高疼痛评估的快捷性、直观性、连续性、准确性,本研究建立了一种基于深度学习和面部表情图像的疼痛强度智能评估模型,为准确评估疼痛病情、适时调整治疗方案、实施有效镇痛措施提供补充依据。该方法采集7位志愿者在6种不同疼痛强度状态下的表情图片,通过预处理和数据增广形成数据库,设计深度卷积神经网络并进行训练,使用特征级差异进行面部疼痛表情分类。在JAFFE、CK+数据库上进行模型性能验证和评价。模型在训练集、测试集分类准确率分别达到98.15%、90.91%,训练速度19 ms/step。模型在JAFFE、CK+数据库上的验证效果良好。结果表明,该方法在疼痛表情识别中准确有效,评分结果具有显著性。 展开更多
关键词 疼痛强度评估 卷积神经网络 面部图像 图像预处理 图像增广 表情数据库 分类器设计
下载PDF
基于迁移学习和Xception网络的混凝土裂纹识别研究 被引量:2
11
作者 徐峥匀 钱松荣 《软件工程》 2022年第7期15-18,共4页
针对深层卷积神经网络检测表面结构裂纹耗费时间长、精度不够高的问题,基于Xception网络进行自适应调整重构其分类器,利用图像增广技术扩充数据集后,引入迁移学习的方法对Xception网络进行训练。同时,与构建的ResNet50、InceptionV3和VG... 针对深层卷积神经网络检测表面结构裂纹耗费时间长、精度不够高的问题,基于Xception网络进行自适应调整重构其分类器,利用图像增广技术扩充数据集后,引入迁移学习的方法对Xception网络进行训练。同时,与构建的ResNet50、InceptionV3和VGG19三个深层卷积神经网络模型进行对比实验,重新验证其性能。实验证明,引入迁移学习不仅可以提升模型的整体性能,还能缩减训练深层卷积神经网络的时间,训练的模型在数据集上的识别精确率达到96.24%,在对比实验中达到96.50%。 展开更多
关键词 迁移学习 卷积神经网络 图像识别 图像增广
下载PDF
基于卷积神经网络的电话行为识别方法研究 被引量:1
12
作者 张亚芹 刘畅 +1 位作者 覃源 程科 《计算机与数字工程》 2020年第7期1737-1742,共6页
为了解决人防的保安方式难以适应人们的需求,论文研究基于卷积神经网络的电话行为识别方法,用于特定场合下智能监控接打电话行为。采用基于VGG16并重构网络结构,减少一个全连接层,增加6个卷积层和1个池化层。为了使目标定位更加精准,用K... 为了解决人防的保安方式难以适应人们的需求,论文研究基于卷积神经网络的电话行为识别方法,用于特定场合下智能监控接打电话行为。采用基于VGG16并重构网络结构,减少一个全连接层,增加6个卷积层和1个池化层。为了使目标定位更加精准,用K-means聚类算法进行统计prior box。在ssd上优化模型时,在数据层增加数据增广功能。同时为了提高对光照不均匀图像识别准确率,进行光照预处理。实验用2800张图片对训练得到的模型进行测试,结果表明正检率可达0.965。此外,实验进行了多次不同模型对比发现:此模型的内存占用率和处理单张图片的时间也有优势。该模型已成功应用于特定场合的接打电话行为智能监控。 展开更多
关键词 深度学习 卷积神经网络 目标检测 K-MEANS聚类算法 图像增广
下载PDF
基于YOLO v3的火源预警监控系统研究 被引量:1
13
作者 许文倩 《河南科学》 2021年第9期1383-1387,共5页
在火灾发生初期,若对火源进行探测、预警以及定位就可以有效地保障人员的安全,避免财产损失.然而,由于火源现场环境复杂且存在诸多潜在风险,传统监控系统易出现漏判、误判等问题.随着图像识别技术的不断发展,利用图像增强以及深度学习... 在火灾发生初期,若对火源进行探测、预警以及定位就可以有效地保障人员的安全,避免财产损失.然而,由于火源现场环境复杂且存在诸多潜在风险,传统监控系统易出现漏判、误判等问题.随着图像识别技术的不断发展,利用图像增强以及深度学习的方法,基于YOLO v3搭建火源预警监控系统,可有效提高传统监控方法的检测准确率.同时,采用虚拟现实仿真以及图像滤波等方法进行增广,既保障高质量的训练数据集收集和准确标注,又可以实现识别多样性.在416×416的输入尺寸下,该系统满足火源检测需求,且在光线不佳、小目标等复杂环境下,该系统具有良好的火源识别与预警能力. 展开更多
关键词 图像增广 深度学习 YOLO v3 目标检测 火源预警
下载PDF
基于深度学习的红外烟幕区域分割技术 被引量:5
14
作者 齐航 袁健全 +2 位作者 李磊 任君 梁杰 《控制与信息技术》 2019年第4期18-22,57,共6页
红外成像制导系统容易受到烟幕干扰,分割烟幕区域是提高红外成像自动目标识别性能的有效技术途径。文章提出一种基于深度学习的红外烟幕干扰分割技术,针对实拍红外烟幕图像样本获取成本高而难以满足算法训练需求的问题,提出基于粒子系... 红外成像制导系统容易受到烟幕干扰,分割烟幕区域是提高红外成像自动目标识别性能的有效技术途径。文章提出一种基于深度学习的红外烟幕干扰分割技术,针对实拍红外烟幕图像样本获取成本高而难以满足算法训练需求的问题,提出基于粒子系统的红外烟幕仿真技术,并针对性地借助图像增广技术模拟不同成像条件,借助Deeplab v3+算法实现烟幕区域分割。文章在零实拍红外图像条件下训练网络,在实拍图像集上测试结果与真实烟幕区域的平均交并比达到79%,实现了红外图像烟幕区域分割。 展开更多
关键词 深度学习 图像语义分割 红外图像 粒子系统 图像增广
下载PDF
基于LeNet 深度学习模型的雏鸡性别智能识别
15
作者 杨陆野 《现代信息科技》 2020年第23期64-66,共3页
不同性别雏鸡在生产生活中的价值及培育方向均有较大差别,尽早无损伤高效地分辨出雏鸡性别从而进行定向培育,实现产业利益最大化。传统的肛门鉴别法、伴性性状鉴别法、蛋内尿囊液检测法和核磁共振测定法均有其不足之处。受肛门鉴别法中... 不同性别雏鸡在生产生活中的价值及培育方向均有较大差别,尽早无损伤高效地分辨出雏鸡性别从而进行定向培育,实现产业利益最大化。传统的肛门鉴别法、伴性性状鉴别法、蛋内尿囊液检测法和核磁共振测定法均有其不足之处。受肛门鉴别法中对肛部图片两大特性传统人眼检测方案的启发,在对原始图像数据进行关键区域特征增强和图像增广后,依托于LeNet深度学习模型的强大图像处理能力实现极高效率的雏鸡性别识别。 展开更多
关键词 雏鸡性别鉴定 深度学习 图像识别 图像增广 LeNet
下载PDF
智能图像导引头目标数据集制备技术研究
16
作者 黄攀 范继伟 +1 位作者 杨小冈 卢瑞涛 《战术导弹技术》 北大核心 2022年第2期105-112,共8页
针对目前可用的智能图像导引头目标数据集稀少、时敏图像难以获取等问题,结合智能化精确制导技术发展需求,提出了智能图像导引头目标数据集的制备流程与主要方法。通过仿真技术生成时敏目标图像;采用了生成对抗网络对时敏目标图像进行增... 针对目前可用的智能图像导引头目标数据集稀少、时敏图像难以获取等问题,结合智能化精确制导技术发展需求,提出了智能图像导引头目标数据集的制备流程与主要方法。通过仿真技术生成时敏目标图像;采用了生成对抗网络对时敏目标图像进行增广;在人工标注的基础上,提出了针对特定序列视频的自动标注算法;并构建了名为Seekeri的智能图像导引头目标认知数据集。将Seekeri数据集在几种主流目标检测算法上进行测试,其mAP值均在85%~90%之间,说明数据集适用于主流目标检测算法。结果表明:该方法既解决了时敏目标难以获取的问题,又可快速准确地构建更适用于智能导引头的目标数据集,为精确制导武器智能导引头目标检测算法训练与升级提供了有力保障。 展开更多
关键词 智能图像导引头 目标获取 时敏目标 数据集制备 图像增广 自动标注 目标检测算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部