基于非特定类别图像前景主体分割的深度学习算法研究

Study on Deep Learning Algorithm for Foreground Subject Segmentation of Non-specific Category Images

下载PDF

导出

摘要通过在Mobile-Unet网络的基础上加入SENet通道注意力机制来改进图像前景主体分割算法。改进后的算法引入深度可分离卷积来减小模型参数量,同时利用跳跃连接和多尺度特征融合来提高模型的分割精度。在训练过程中,采用了带空洞卷积的空间金字塔池化模块来增加感受野,提高模型对于大尺度物体的识别能力。实验结果表明,改进后的算法在PASCAL VOC2012数据集上达到了96%的MIOU(Modular Input/Output Unit)分割精度,准确率达到了0.971,优于现有的多种图像分割算法,例如FCN全卷积神经网络算法。在速度方面,模型对于每张图片的处理时间为1.7~2.5 s,改进后的算法相对于传统的全卷积神经网络具有更快的推理速度,适合于在移动设备上实现实时图像分割。通过对比实验,比较了改进前和改进后的Mobile-Unet模型以及FCN模型对于明亮条件下和昏暗条件下图像前景主体分割的效果,并得出了改进后的Mobile-Unet模型具有最好效果的结论。最终进行算法的部署,设计了GUI可视化操作界面,并生成.exe可执行文件。 By incorporating SENet channel attention mechanism on the basis of Mobile Unet network,the image foreground subject se-gmentation algorithm is improved.The algorithm introduces deep separable convolution to reduce the number of model parameters,while utilizing skip connections and multi-scale feature fusion to improve the segmentation accuracy of the model.Du-ring the training process,a spatial pyramid pooling module with hollow convolution is used to increase the receptive field and improve the model’s recognition ability for large-scale objects.Experimental results show that the improved algorithm achieves 96%MIOU(Modular Input/Output Un-it)segmentation accuracy on the PASCAL VOC2012 dataset,with an accuracy rate of 0.971,which is superior to various existing image segmentation algorithms,such as the FCN fully convolutional neural network algorithm.In terms of speed,the processing time of the model for each image is between 1.7 s and 2.5 s.The improved algorithm has a faster inference speed compared to traditional fully convolutional neural networks,making it suitable for real-time image segmentation on mobile devices.Through comparative experiments,the effectiveness of the Mobile Unet models before and after the improvement,as well as the FCN model,in foreground subject segmentation of images under bright and dim conditions is compared,and the conclusion is drawn that the improved Mobile Unet model has the best performance.Finally,the algorithm is deployed,a GUI visualization operation interface is designed,and an.exe executable file is generated.

作者陈祥龙李海军 CHEN Xianglong;LI Haijun(School of Information and Intelligent Engineering,University of Sanya,Sanya,Hainan 572022,China;Academician Guoliang Chen Team Innovation Center,University of Sanya,Sanya,Hainan 572022,China)

机构地区三亚学院信息与智能工程学院三亚学院陈国良院士团队创新中心

出处《计算机科学》 CSCD 北大核心 2024年第S02期379-387,共9页 Computer Science

关键词主体分割神经网络感受野参数量分割精度 Subject segmentation Neural network Receptive field Parameter quantity Segmentation accuracy

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献10

1刘莹,杨硕.基于改进UNet网络的室内运动目标阴影分割[J].计算机系统应用,2022,31(12):412-419. 被引量：4
2孟名柱,李丽,何光远,张铭,沈栋,潘昌杰,杨洁岩.MobileNetV2对乳腺X线BI-RADS 4类病变的降级作用初步研究[J].临床放射学杂志,2022,41(10):1868-1873. 被引量：3
3张鑫,姚庆安,赵健,金镇君,冯云丛.全卷积神经网络图像语义分割方法综述[J].计算机工程与应用,2022,58(8):45-57. 被引量：47
4黄鹏,郑淇,梁超.图像分割方法综述[J].武汉大学学报（理学版）,2020,66(6):519-531. 被引量：161
5黄生鹏,柳海南,周克帅,刘建宇.基于改进Unet的斑马线分割[J].智能计算机与应用,2020,10(11):61-64. 被引量：6
6孙立新.基于卷积神经网络的煤矸石图像识别[J].电脑知识与技术,2020,16(21):16-18. 被引量：6
7王平,高琛,朱莉,赵俊,张晶,孔维铭.基于3D深度残差网络与级联U-Net的缺血性脑卒中病灶分割算法[J].计算机应用,2019,39(11):3274-3279. 被引量：10
8丁瑞金,高飞飞,邢玲.基于深度强化学习的物联网智能路由策略[J].物联网学报,2019,3(2):56-63. 被引量：6
9田萱,王亮,丁琪.基于深度学习的图像语义分割方法综述[J].软件学报,2019,30(2):440-468. 被引量：230
10刘松涛,殷福亮.基于图割的图像分割方法及其新进展[J].自动化学报,2012,38(6):911-922. 被引量：143

二级参考文献116

1朱旭娜,刘丽东,苏丹柯,李红学,左阳,谢东,黄雷,刘宇.乳腺磁共振BI-RADS 4类病变恶性征象分析及Nomogram预测模型的构建[J].临床放射学杂志,2020,39(12):2406-2410. 被引量：6
2唐鹏,高琳,盛鹏.基于动态形状的红外目标提取算法[J].光电子．激光,2009,20(8):1049-1052. 被引量：3
3闫成新,桑农,张天序.基于图论的图像分割研究进展[J].计算机工程与应用,2006,42(5):11-14. 被引量：33
4陶文兵,金海.一种新的基于图谱理论的图像阈值分割方法[J].计算机学报,2007,30(1):110-119. 被引量：58
5Pal N R, Pal S K. A review on image segmentation tech- niques. Pattern Recognition, 1993, 26(9): 1277-1294.
6Veksler O. Efficient Graph-based Energy Minimization Methods in Computer Vision [Ph.D. dissertation], Cornell University, USA, 1999.
7Bhandarkar S M, Zhang H. A comparison of stochastic op- timization techniques for image segmentation. International Journal o? Intelligent Systems, 2000, 15(5): 441-476.
8Wang J S, Swendsen R H. Cluster Monte Carlo algorithms. Physica A: Statistical Mechanics and Its Applications, 1990, 167(3): 565--578.
9Tu Z W, Zhu S C. Image segmentation by data-driven Markov chain Conte Carlo. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(5): 657-673.
10Barbu A, Zhu S C. Generalizing Swendsen-Wang to sam- pling arbitrary posterior probabilities. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(8): 1239-1253.

共引文献587

1苏奎,董默.Matlab在医学图像分割中的应用[J].中华消化病与影像杂志（电子版）,2022,12(2):108-112.
2刘禹杉,孙淼军,吴帅峰,张丽雅,孙黎明.土石料粒径与级配的图像智能识别研究[J].岩土工程学报,2023,45(S01):59-62. 被引量：1
3赵恩玄,何云勇,沈宽,刘杰,段黎明.基于深度学习的铸件CT图像分割算法[J].仪器仪表学报,2023,44(11):176-184. 被引量：2
4曹建荣,韩发通,汪明,庄园,朱亚琴,张玉婷.基于YOLOv5和FCN-DenseNet水下图像多目标语义分割算法[J].计算机系统应用,2022,31(12):309-315. 被引量：1
5张婉莹,佟喜峰.高分辨率遥感影像的斑马线检测与识别算法[J].绥化学院学报,2022,42(9):152-155. 被引量：1
6李振波,赵远洋,杨普,吴宇峰,李一鸣,郭若皓.基于机器视觉的鱼体长度测量研究综述[J].农业机械学报,2021,52(S01):207-218. 被引量：4
7杨耿,张业明,侯金利,刘咏炫,鲁骏,周靖.高速公路图像识别技术应用探析[J].中国交通信息化,2022(S01):294-298. 被引量：1
8潘泽民,覃亚丽,郑欢,王荣芳,任宏亮.基于深度神经网络的块压缩感知图像重构[J].计算机科学,2022,49(S02):510-518. 被引量：5
9卢瑞怀.捡矸机器人在大柳塔选煤厂的应用[J].洁净煤技术,2023,29(S01):146-149.
10金玉,袁和金.基于改进FCN双路径特征融合的局部放电图谱识别[J].电子测量技术,2022,45(24):132-136.

1林在宁.面向轻量化网络的安全帽佩戴检测方法研究[J].福建建筑,2024(9):82-85.
2付晓鸽,左治江,李涵.基于改进Mask R-CNN的堆积式袋装炸药识别方法研究[J].中国测试,2024,50(10):81-86.
3王月,刘永旭,王鹏,银兴行,杨欢.YOLO-ML:基于多尺度特征层注意力机制的滑轨缺陷检测方法[J].重庆邮电大学学报（自然科学版）,2024,36(5):992-1003.
4柳煦,李昕.一种基于Unet网络的肝脏图像分割模型[J].辽宁工业大学学报（自然科学版）,2024,44(5):292-297.
5任会梅.小学数学计算教学小组合作学习策略[J].新智慧,2024(19):88-89.
6陈冬,周浩,袁国武,杨凌宇,成秋艳,任莹,马仪.融合多尺度特征与位置信息的输电线路山火检测算法[J].计算机科学,2024,51(S02):248-254.
7王君妆,谭冬平.融合路径优化的异构图神经网络算法[J].软件,2024,45(8):42-44.
8王利彬,王树梅.基于注意力机制的眼底血管图像分割算法[J].计算机科学,2024,51(S02):349-354.
9魏宁宁,陈荟婷,董晓军,李幼清,张英俊.MATLAB_GUI仿真平台CT图像肺结节分割和标记研究[J].黑龙江科学,2024,15(20):136-139.
10刘云清,吴越,张琼,颜飞,陈姗姗.基于可分离卷积与小波变换融合的道路裂缝检测[J].计算机科学,2024,51(S02):304-312.

计算机科学

2024年第S02期

浏览历史

内容加载中请稍等...

基于非特定类别图像前景主体分割的深度学习算法研究

参考文献10

二级参考文献116

共引文献587

相关作者

相关机构

相关主题

浏览历史