-
题名改进的YOLOv5图书梯标检测算法
- 1
-
-
作者
杨祥
王华彬
董明刚
-
机构
桂林理工大学计算机科学与工程学院
桂林理工大学物理与电子信息工程学院
-
出处
《桂林理工大学学报》
CAS
北大核心
2024年第2期330-338,共9页
-
基金
国家自然科学基金地区项目(61563012)。
-
文摘
对于印刷行业而言,确保每本书的页码、页面正确排序是提高印刷厂生产率的重点。为了解决目前印刷厂对于图书梯标的检测存在漏检、误检的问题,提出了一种改进YOLOv5的梯标检测算法。该算法增加一个检测尺度以解决漏检问题和提高梯标的识别精度,将主干网络中的C3数量减少,使用深度可分离卷积替代颈部网络中的部分卷积,在能够保证精度稳定的同时降低模型的参数量和计算量;使用SPConv替换Resunit结构里的Conv,形成SPConv-C3结构,SPConv-C3结构不仅能够降低模型的参数量,还能提升网络对图书梯标的检测精度;根据深度可分离卷积和SPConv-C3结构设计特征融合网络结构,能够大幅度提升网络模型的特征融合能力。将所改进的检测算法在自建数据集上进行验证,结果表明,改进后的算法Pm,A@0.5∶0.95达到了64.7%,比原YOLOv5s提高7.5百分点,参数量下降了3.16%,能够满足实际需求。
-
关键词
YOLOv5
梯标检测
目标检测
基于拆分的卷积
-
Keywords
YOLOv5
ladder label detection
object detection
split-based convolution
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于CIFAR-10的图像分类模型优化
被引量:13
- 2
-
-
作者
张占军
彭艳兵
程光
-
机构
武汉邮电科学研究院
烽火通信科技股份有限公司南京研发
-
出处
《计算机应用与软件》
北大核心
2018年第3期177-181,共5页
-
基金
国家自然科学基金项目(61602114)
国家高技术研究发展计划(2015AA015603)
-
文摘
随着卷积神经网络在图像处理的研究与应用,图像的分类准确度得到了大幅提升,但是过拟合的问题却一直存在并成为影响分类准确率的重要因素。从过拟合的产生源头出发,增加数据量并减少参数数量以达到降低过拟合的目的。基于经典模型Le Net-5,对输入数据进行数据增强,并对卷积层进行拆分以减少参数,同时采用L1、L2混合约束的方法,并灵活调整两者的占比以达到最佳效果。实验结果表明,在CIFAR-10数据集上,优化后的网络达到了91.2%的准确率,相比最初的Le Net-5模型提高了23%,极大地降低了过拟合,提高了模型的分类准确率。
-
关键词
过拟合
数据增强
正则约束
卷积拆分
准确率
-
Keywords
Over-fitting
Data enhancement
Regular constraints
Convolutional split
Accuracy
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名降低参数规模的卷积神经网络模型压缩方法
被引量:6
- 3
-
-
作者
朱雪晨
陈三林
蔡刚
黄志洪
-
机构
中国科学院空天信息创新研究院
中国科学院大学
-
出处
《计算机与现代化》
2021年第9期83-89,共7页
-
基金
国家自然科学基金资助项目(61704173)。
-
文摘
针对卷积神经网络模型参数规模越来越大导致难以在计算与存储资源有限的嵌入式设备上大规模部署的问题,提出一种降低参数规模的卷积神经网络模型压缩方法。通过分析发现,卷积层参数量与输入输出特征图数量以及卷积核大小有关,而全连接层参数数量众多且难以大幅减少。通过分组卷积减少输入输出特征图数量,通过卷积拆分减小卷积核大小,同时采用全局平均池化层代替全连接层的方法来解决全连接层参数数量众多的问题。将上述方法应用于LeNet5和AlexNet进行实验,实验结果表明通过使用组合压缩方法对LeNet5模型进行最大压缩后,参数规模可减少97%,识别准确率降低了不到2个百分点,而压缩后的AlexNet模型参数规模可减少95%,识别准确率提高了6.72个百分点,在保证卷积神经网络精度的前提下,可大幅减少模型的参数量。
-
关键词
卷积神经网络
参数规模
分组卷积
卷积拆分
全局平均池化
-
Keywords
convolutional neural networks
parameter scale
grouping convolution
convolution resolution
global average pooling
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于3D卷积神经网络的动态手势识别模型
被引量:8
- 4
-
-
作者
徐访
黄俊
陈权
-
机构
重庆邮电大学通信与信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第11期283-291,共9页
-
基金
国家自然科学基金(61671095)。
-
文摘
在不带有标志帧的手势视频上进行动态手势识别,容易导致识别准确率下降。提出一种具有分级网络结构的动态手势识别模型。以手势检测模型为第1级网络,手势分类模型为第2级网络,分步完成识别任务。同时,将三维卷积核拆分为时间域和空间域卷积分阶段完成任务,解决三维卷积神经网络中因参数过多造成模型训练或运行时间过长的问题。实验结果表明,在保证实时性的前提下,该模型在EgoGesture数据集上的识别准确率高达93.35%,优于C3D、ResNeXt101、MTUT等模型。
-
关键词
动态手势识别
分级结构
卷积核拆分
3D卷积神经网络
手势检测器
-
Keywords
dynamic gesture recognition
hierarchical structure
convolution kernel split
3D Convolutional Neural Network(CNN)
gesture detector
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进SSD的输电线路销钉缺陷检测
被引量:30
- 5
-
-
作者
李瑞生
张彦龙
翟登辉
许丹
-
机构
许继集团有限公司
-
出处
《高电压技术》
EI
CAS
CSCD
北大核心
2021年第11期3795-3802,共8页
-
基金
国家电网公司科技项目(面向智能电网运维场景的视听觉主动感知与协同认知技术研究及应用)(5600-202046347A-0-0-00)。
-
文摘
销钉在输电线路中起着连接关键部件的重要作用,其缺陷直接引起部件变形、不稳定甚至造成电力停电事故。针对已有单发多盒探测器(single shot multibox detector,SSD)模型对输电线路复杂背景下销钉缺陷检测能力不足的问题,提出基于残差网络和多层级特征融合策略的改进SSD模型。首先,改进SSD网络结构,引入残差网络,增加浅层特征层,并将深层特征进行融合,替换SSD原特征层,以提升网络的鲁棒性,增强特征层的信息提取能力。其次,采用卷积拆分压缩网络参数量,采用权值量化减小模型部署占用空间。最后,通过实验对所提方法的有效性进行了验证。实验结果表明,该方法在输电线路销钉缺陷检测上召回率达到80%以上,较原SSD模型及其他目标检测算法具有明显提升。同时,该方法在其他输电线路小目标缺陷测试中,也取得了较好的效果。
-
关键词
改进SSD
残差网络
多层级特征融合
卷积拆分
权值量化
-
Keywords
improved SSD
residual network
multi-level feature fusion
convolution resolution
weight quantization
-
分类号
TM75
[电气工程—电力系统及自动化]
-
-
题名基于多任务CNN的监控视频中异常行人快速检测
被引量:6
- 6
-
-
作者
李俊杰
刘成林
朱明
-
机构
中国科学技术大学信息科学技术学院
-
出处
《计算机系统应用》
2018年第11期78-83,共6页
-
基金
国家重大科技专项(2017ZX03001019)~~
-
文摘
在近年来社会公共安全受到广泛关注的情况下,如何利用监控视频对异常行人进行监督,预防危险事件的发生成为了一个热门课题.异常行人是指与普通行人在外观上有明显异常性区别的人,例如用头盔大面积遮挡面部或低头躲避摄像头,考虑到异常行人的特征主要集中在头面部,本文提出一种基于多任务卷积神经网络和单类支持向量机的针对头面部特征的异常行人快速检测方法.首先进行头面部区域的检测,然后使用多任务卷积神经网络提取头面部区域的特征,之后使用单类支持向量机判断是正常行人还是异常行人.此外,本文还针对卷积神经网络设计了一种卷积核拆分方法,加快了特征提取的速度,最终实验表明,本文提出的算法能够快速有效的检测出监控视频中的异常行人.
-
关键词
监控视频
异常行人
多任务卷积神经网络
卷积核拆分
单类支持向量机
-
Keywords
surveillance video
abnormal pedestrians
multi-task CNN(Convolutional Neural Network)
convolution kernel splitting method
one-class SVM(Support Vector Machine)
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-