期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于改进的IIE-SegNet的快速图像语义分割方法
1
作者 李庆 王宏健 +2 位作者 李本银 肖瑶 迟志康 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第2期314-323,共10页
针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计... 针对IIE-SegNet计算复杂度高、计算量大等问题,本文提出一种基于IIE-SegNet的改进方法。编码结构中引入经ImageNet训练过的VGG16和多尺度空洞卷积空间金字塔池化来获得丰富的编码信息;解码结构中,设计全局加平均模块来解决IIE-SegNet计算量大的问题;研究Focal损失函数来解决正、负采样不平衡的问题。实验结果表明:与IIE-SegNet相比,本方法在PASCAL VOC 2012数据集上的语义分割速度更快,平均每次迭代快0.6 s左右,测试单张图像的时间平均减少了0.94 s;分割精度更高,MIoU提升了2.1%。在扩展的PASCAL VOC 2012(Exp-PASCAL VOC 2012)数据集上的语义分割速度更快,平均每次迭代快0.4 s左右,测试单张图像的时间平均减少了0.92 s;分割精度更高,MPA和MIoU分别提升了2.6%和2.8%,特别是对于小尺度目标分割边界更清晰,性能得到了很大的提升。 展开更多
关键词 语义分割 深度学习 多尺度空洞卷积空间金字塔池化 图像信息熵 全局平均 VGG16 IIE-SegNet
下载PDF
基于改进的AlexNet的无人驾驶研究
2
作者 张锐戈 张瑞 张安陈 《消费电子》 2024年第5期18-21,共4页
本研究利用空间金字塔池化(Spatial Pyramid Pooling,SPP)和全局平均池化(Global Average Pooling,GAP)优化传统的AlexNet架构,并将其应用于无人驾驶汽车的视觉识别系统中。这项研究旨在提高无人驾驶车辆通过摄像头感知环境的准确性和... 本研究利用空间金字塔池化(Spatial Pyramid Pooling,SPP)和全局平均池化(Global Average Pooling,GAP)优化传统的AlexNet架构,并将其应用于无人驾驶汽车的视觉识别系统中。这项研究旨在提高无人驾驶车辆通过摄像头感知环境的准确性和效率。首先,笔者对AlexNet算法进行了改进,集成了SPP和GAP。SPP的引入使网络能够更有效地处理不同尺寸的图像,得到改进的AlexNet-SG网络,从而捕捉更多的空间信息。GAP的应用减少了模型的参数数量,从而降低了过拟合的风险并加快了训练速度。这些改进不仅增强了模型的泛化能力,还提高了网络对复杂场景的识别能力。本研究使用真实世界的交通环境数据对改进后的模型进行了测试,实验涵盖了多种交通场景,包括直车道、弯车道、人行道等。研究结果表明,AlexNet-SG在处理复杂交通场景时的表现明显优于原始模型,特别是在识别距离和准确率方面取得了显著提升。 展开更多
关键词 无人驾驶 AlexNet算法 空间金字塔池化(SPP) 全局平均池化(GAP) 图像识别
下载PDF
高分辨率皮肤黑色素瘤图像的两阶段式分割算法 被引量:1
3
作者 贵向泉 张馨月 李立 《计算机工程》 CAS CSCD 北大核心 2023年第11期267-274,共8页
皮肤黑色素瘤切片图像分辨率过大且病理特征表现形式多样,现有很多分割算法结果不精准同时消耗巨大显卡内存。针对该问题,提出一种低显存消耗的两阶段式精细分割算法。该算法第一阶段采用全局分割网络对以ResNet50为骨干的特征金字塔结... 皮肤黑色素瘤切片图像分辨率过大且病理特征表现形式多样,现有很多分割算法结果不精准同时消耗巨大显卡内存。针对该问题,提出一种低显存消耗的两阶段式精细分割算法。该算法第一阶段采用全局分割网络对以ResNet50为骨干的特征金字塔结构进行改进,图像特征提取过程中使用全局金字塔平均池化模块增强图像全局语义信息的提取,并采用多尺度特征融合分支将高层特征图的语义信息融入到低层特征图中,增强低层特征图语义信息的表征能力。第二阶段采用一种全局到局部的精细分割策略,以全局分割结果为基准对图像进行剪裁,得到一个较小的候选区域,将其输入到局部分割网络中,局部分割网络仅处理候选区域内的像素并与全局网络对应层共享图像特征,精细分割结果的同时减少显存的消耗。在经典数据集ISIC2018上的实验结果显示,该算法的准确度和IOU分别达到93.5%和82.1%,相较于对比的经典分割算法精度最高且占用的显卡内存减少了22.8%~36.9%,能有效适用于高分辨率皮肤病灶图像的分割任务。 展开更多
关键词 两阶段式分割 ResNet50 特征金字塔结构 全局金字塔平均池化模块 多尺度特征融合分支
下载PDF
结合Inception模块的卷积神经网络图像分类方法 被引量:3
4
作者 齐广华 何明祥 《软件导刊》 2020年第3期79-82,共4页
针对现有卷积神经网络模型参数量大、训练时间长的问题,提出了一种结合VGG模型和Inception模块特点的网络模型。该模型通过结合两种经典模型的特点,增加网络模型的宽度和深度,使用较小的卷积核和较多的非线性激活,在减少参数量的同时增... 针对现有卷积神经网络模型参数量大、训练时间长的问题,提出了一种结合VGG模型和Inception模块特点的网络模型。该模型通过结合两种经典模型的特点,增加网络模型的宽度和深度,使用较小的卷积核和较多的非线性激活,在减少参数量的同时增加了网络特征提取能力,同时利用全局平均池化层替代全连接层,避免全连接层参数过多容易导致的过拟合问题。在MNIST和CIFAR-10数据集上的实验结果表明,该方法在MNIST数据集上的准确率达到了99.76%,在CIFAR-10数据集上的准确率相比传统卷积神经网络模型提高了6%左右。 展开更多
关键词 卷积神经网络 Inception模块 全局平均池化 卷积核 图像分类
下载PDF
改进SSD算法的道路小目标检测研究 被引量:15
5
作者 邹慧海 侯进 《计算机工程》 CAS CSCD 北大核心 2022年第5期281-288,共8页
在道路场景中,因小目标分辨率低且特征不明显,传统的目标检测算法难以确认其所属类别和位置信息,导致检测精度低、检测速度慢、漏检率高。提出一种改进SSD的道路小目标检测算法RFG_SSD。在SSD网络结构的主干部分和检测部分之间,通过引... 在道路场景中,因小目标分辨率低且特征不明显,传统的目标检测算法难以确认其所属类别和位置信息,导致检测精度低、检测速度慢、漏检率高。提出一种改进SSD的道路小目标检测算法RFG_SSD。在SSD网络结构的主干部分和检测部分之间,通过引入改进的特征金字塔网络结构,融合浅层和深层感受野的特征信息,以获得小目标语义信息丰富的特征图。将深层特征提取网络ResNet 50作为改进网络的主干特征提取网络,提高整体网络的检测精度。为加快网络运算速度,基于检测层结构,利用全局平均池化层代替全连接层,减少网络参数量。实验结果表明,与SSD、VGG16+SFPN等算法相比,该算法能够有效提高小目标检测性能,且加快检测速度,其在BDD100K数据集上的平均精度和检测速度分别为98.05%和85.56 frame/s,小目标检测个数相较于SSD算法提高3倍多。 展开更多
关键词 小目标检测 SSD算法 ResNet50网络 特征金字塔网络 全局平均池化
下载PDF
基于多尺度特征融合的柑橘病虫害图像识别方法 被引量:11
6
作者 黄平 闭吕庆 +3 位作者 莫燕斌 覃斌毅 林林 万海斌 《无线电工程》 北大核心 2022年第3期407-416,共10页
针对基于传统机器学习与简单神经网络的病虫害识别方法对于具有小样本、数据不均衡、特征演变(黄龙病不同病害阶段的特征差异较大)、特征不明显和多类别等特点的柑橘病虫害识别效果不理想的问题,设计了一种基于VGG19改进的VGG19-INC模... 针对基于传统机器学习与简单神经网络的病虫害识别方法对于具有小样本、数据不均衡、特征演变(黄龙病不同病害阶段的特征差异较大)、特征不明显和多类别等特点的柑橘病虫害识别效果不理想的问题,设计了一种基于VGG19改进的VGG19-INC模型。该模型以VGG19网络模型为骨干网络并利用迁移学习实现预训练权重参数的共享;模型结构使用1个批标准化卷积层和2个Inception模块替换VGG19的第5卷积层;使用1个全局池化层替换VGG19模型的全连接层,使用一个1×4的Softmax层作为分类输出层。所提模型不仅保留了VGG19对图像特征的有效提取,还利用Inception模块增加了网络的深度与宽度,使模型获得了不同大小的感受野,实现了多尺度特征的融合;全局池化层对全连接层的替换,使参数减少率达到了70.56%,有效地提高了模型的训练速度与平均测试速度,降低参数负载。试验结果表明,VGG19-INC对柑橘(沙田柚)黄龙病、潜叶蛾和线虫病等病虫害识别准确率为98.47%,比VGG19,Resnet50,Inceptionv3,Densenet201模型分别高22.26%,14.47%,5.18%和0.24%;损失值为0.0415,比其他模型分别低1.1085,0.2172,0.3987,0.0654,并具有良好的泛化能力。 展开更多
关键词 柑橘病虫害 迁移学习 图像识别 Inception模块 全局平均池化
下载PDF
结合混合池化的双流人脸活体检测网络 被引量:8
7
作者 汪亚航 宋晓宁 吴小俊 《中国图象图形学报》 CSCD 北大核心 2020年第7期1408-1420,共13页
目的人脸识别技术在很多领域起着重要作用,但大量的欺诈攻击对人脸识别产生了威胁,比如打印攻击和重放攻击。传统的活体检测方法是以手工方式提取特征且缺乏对时间维度的考虑,导致检测效果不佳。针对以上问题,提出一种结合混合池化的双... 目的人脸识别技术在很多领域起着重要作用,但大量的欺诈攻击对人脸识别产生了威胁,比如打印攻击和重放攻击。传统的活体检测方法是以手工方式提取特征且缺乏对时间维度的考虑,导致检测效果不佳。针对以上问题,提出一种结合混合池化的双流活体检测网络。方法对数据集提取光流图像并进行面部检测,得到双流网络的两个输入;在双流网络末端加入空间金字塔和全局平均混合池化,利用全连接层对池化后的特征进行分类并进行分数层面的融合;对空间流网络和时间流网络进行融合得到一个最优结果,同时考虑了不同颜色空间对检测性能的影响。结果在CASIA-FASD(CASIA face anti-spoofing database)和replay-attack两个数据集上做了多组对比实验,在CASIA-FASD数据集上,等错误率(equal error rate,EER)为1.701%;在replay-attack数据集上,等错误率和半错误率(half total error rate,HTER)分别为0.091%和0.082%。结论结合混合池化的双流活体检测网络充分考虑时间维度,提出的空间金字塔和全局平均混合池化策略能有效地利用特征。针对包含多种攻击类型、图像质量差异较大的数据集,本文提出的网络模型均能取得较低的错误率。 展开更多
关键词 活体检测 卷积神经网络 双流网络 光流法 空间金字塔池化 全局平均池化
原文传递
结合改进卷积神经网络与通道加权的轻量级表情识别 被引量:3
8
作者 梁华刚 薄颖 +2 位作者 雷毅雄 喻子鑫 刘丽华 《中国图象图形学报》 CSCD 北大核心 2022年第12期3491-3502,共12页
目的表情是人机交互过程中重要的信息传递方式,因此表情识别具有重要的研究意义。针对目前表情识别方法存在背景干扰大、网络模型参数复杂、泛化性差等问题,本文提出了一种结合改进卷积神经网络(convolutional neural network,CNN)与通... 目的表情是人机交互过程中重要的信息传递方式,因此表情识别具有重要的研究意义。针对目前表情识别方法存在背景干扰大、网络模型参数复杂、泛化性差等问题,本文提出了一种结合改进卷积神经网络(convolutional neural network,CNN)与通道加权的轻量级表情识别方法。方法首先,采用标准卷积和深度可分离卷积组合神经网络结构,再利用全局平均池化层作为输出层,简化网络的复杂程度,有效降低网络参数;其次,网络引入SE(squeeze-and-excitation)模块进行通道加权,通过在不同卷积层后设置不同的压缩率增强表情特征提取能力,提升网络模型精度;最后,用softmax分类函数实现各类表情的准确分类。结果本文网络参数量为6108519,相较于识别性能较好的Xception神经网络参数减少了63%,并且通过对网络模型的实时性测试,平均识别速度可达128帧/s。在5个公开的表情数据集上验证网络模型对7种表情的识别效果,与7种卷积神经网络方法相比,在FER2013(Facial Expression Recognition 2013)、CK+(the extended Cohn-Kanade)和JAFFE(Japanses Female Facial Expression)3个表情数据集的识别精确度提高了5.72%、0.51%和0.28%,在RAF-DB(Real-world Affective Faces Database)、AffectNet这两个in-the-wild表情数据库的识别精确度分别提高了2.04%和0.68%。结论本文提出的轻量级表情识别方法在不同通道具有不同的加权能力,获取更多表情关键特征信息,提高了模型的泛化性。实验结果表明,本文方法在简化网络的复杂程度、减少计算量的同时能够准确识别人脸表情,能够有效提升网络的识别能力。 展开更多
关键词 表情识别 图像处理 卷积神经网络(CNN) 深度可分离卷积 全局平均池化 SE模块
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部