DL-GAN生成对抗网络的半监督语义分割模型

DL-GAN Semi Supervised Semantic Segmentation Model for Generative Adversarial Network

下载PDF

导出

摘要语义分割目前主流的全监督学习方式、数据质量和数量决定了网络的训练效果。只有花费大量的标注成本,才能得到质量高且数据量大的训练数据。根据上述情况,出现了基于半监督学习方式的语义分割。半监督学习可以节省数据的标注成本,很好地解决需要大量标注成本的问题,越来越多人开始关注半监督学习的图像语义分割。根据图像语义分割方法目前的发展现状,提出了一种结合DeepLabv2的生成对抗网络(DL-GAN)的半监督语义分割的模型。将DeepLabv2作为生成对抗网络的生成网络,完全卷积的网络作为判别器网络;对生成网络进行改进,首次将CBAM注意力机制和深度可分离卷积结合应用于DeepLabv2,将其作为生成网络,具体一是在DeepLabv2最后的卷积层前添加CBAM注意力机制,二是将DeepLabv2网络中Resnet残差块的标准卷积替换为深度可分离卷积,使整个模型将权重参数更为合理地分配,提高模型的表征能力且计算更为高效,加快训练效率;用空洞卷积替换判别器的标准卷积,提升整个判别器的感受野,提高训练效果,提升语义分割精度。该方法在PASCAL VOC 2012数据集上的实验结果相对于Affinitynet网络平均交并比提高6.3个百分点,证明了提出方法是有效的。 Semantic segmentation is currently the mainstream fully supervised learning method,and the quality and quantity of data determine the training effect of the network.High-quality and large-scale training data can be obtained only by spending a lot of annotation costs.Based on the above situation,semantic segmentation based on semi-supervised learning emerged.Semi-supervised learning can save the cost of labeling data and solve the problem of requiring a large amount of labeling costs.More and more people are beginning to pay attention to semi-supervised learning for image semantic segmentation.Based on the current development status of image semantic segmentation methods,a semi-supervised semantic segmentation model combining DeepLabv2’s generative adversarial network(DL-GAN)is proposed.First,it uses DeepLabv2 as the generator network of the generative adversarial network,and a fully convolutional network as the discriminator network of the generator network.Secondly,it improves the generation network by applying the CBAM attention mechanism and deep separable convolution for the first time to DeepLabv2 as a generation network.Specifically,it adds the CBAM attention mechanism before the final convolutional layer of DeepLabv2,and replaces the standard convolution of Resnet residual blocks in the DeepLabv2 network with deep separable convolution,which makes the weight parameters of the entire model more reasonably distributed,improves the model’s representation ability and computational efficiency,and accelerates the training efficiency.Finally,replacing the standard convolution of the discriminator with a hole convolution improves the receptive field of the entire discriminator,enhances training effectiveness,and improves semantic segmentation accuracy.The experimental results of the proposed method on the PASCAL VOC 2012 dataset show an average improvement of 6.3 percentage points compared to the Affinitynet network,proving the effectiveness of the proposed method.

作者刘凡段先华胡维康 LIU Fan;DUAN Xianhua;HU Weikang(School of Computer Science,Jiangsu University of Science and Technology,Zhenjiang,Jiangsu 212100,China)

机构地区江苏科技大学计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2024年第19期221-229,共9页 Computer Engineering and Applications

基金国家自然科学基金(61806087) 江苏省研究生科研与实践创新计划项目(KYCX21_3489)。

关键词生成对抗网络注意力机制语义分割深度可分离卷积 generative adversarial network attention mechanism semantic segmentation deep separable convolution

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1何雨岩.基于深度学习的图像语义分割综述[J].长江信息通信,2023,36(1):77-79. 被引量：9
2张晴晴,史健芳.基于语义分割网络的小样本表面缺陷检测[J].电子设计工程,2021,29(5):180-184. 被引量：7
3段续庭,周宇康,田大新,郑坤贤,周建山,孙亚夫.深度学习在自动驾驶领域应用综述[J].无人系统技术,2021,4(6):1-27. 被引量：30
4周涛,董雅丽,霍兵强,刘珊,马宗军.U-Net网络医学图像分割应用综述[J].中国图象图形学报,2021,26(9):2058-2077. 被引量：37
5苏晨,任志俊,范彪,董俊杰.基于注意力机制与ResNet的残余奥氏体评级研究[J].轻工机械,2023,41(2):78-84. 被引量：1
6王士斌,高梓雕,刘栋.一种基于有限数据的改进DCGAN图像生成方法[J].河南师范大学学报（自然科学版）,2023,51(6):39-46. 被引量：1
7王可,沈川贵,罗孟华.基于深度学习的图像语义分割方法综述[J].信息技术与信息化,2022(4):23-30. 被引量：15

二级参考文献45

1于宁波,刘嘉男,高丽,孙泽文,韩建达.基于深度学习的膝关节MR图像自动分割方法[J].仪器仪表学报,2020(6):140-149. 被引量：30
2Lisha CUI,Rui MA,Pei LV,Xiaoheng JIANG,Zhimin GAO,Bing ZHOU,Mingliang XU.MDSSD:multi-scale deconvolutional single shot detector for small objects[J].Science China(Information Sciences),2020,63(2):98-100. 被引量：18
3徐祖耀.低碳钢中的残余奥氏体[J].上海金属,1995,17(1):1-6. 被引量：19
4高德芝,段建民,郑榜贵,田炳香.智能车辆环境感知传感器的应用现状[J].现代电子技术,2008,31(19):151-156. 被引量：9
5张广林,胡小梅,柴剑飞,赵磊,俞涛.路径规划算法及其应用综述[J].现代机械,2011(5):85-90. 被引量：125
6郭锁利,辛栋,刘延飞.近代图像分割方法综述[J].四川兵工学报,2012,33(7):93-96. 被引量：17
7刘学宽,陈李丽.浅淡产品责任的因果关系认定[J].山东法官培训学院学报,2013,29(3):93-95. 被引量：4
8史晓楠,欧阳震.图像分割常用方法综述[J].科技视界,2014(33):33-33. 被引量：7
9刘超,蔡文华,陆玲.图像阈值法分割综述[J].电脑知识与技术,2015,0(1):140-142. 被引量：25
10赵冬斌,邵坤,朱圆恒,李栋,陈亚冉,王海涛,刘德荣,周彤,王成红.深度强化学习综述:兼论计算机围棋的发展[J].控制理论与应用,2016,33(6):701-717. 被引量：131

共引文献92

1常晗,郭树欣,张海洋,张瑶.基于改进CBAM-DeepLab V3+的苹果种植面积提取[J].农业机械学报,2023,54(S02):206-213. 被引量：3
2陈凡,宋文革,范誉瀚,陈塞.基于CNN-Transformer融合模型的选煤厂振动筛上杂物语义分割研究[J].煤炭工程,2023,55(S01):193-199. 被引量：1
3亢克松,张建舒,巩鹏辉.基于Deeplabv3+的转炉炉口溢渣检测系统开发[J].河北冶金,2023(S01):24-28. 被引量：2
4韩谷静,何敏,雷宇航,张敏,赵柳,秦亮.基于改进U-Net的输电线路绝缘子图像分割方法研究[J].智慧电力,2022,50(3):93-99. 被引量：15
5王钟鸣,姚文臣,马兆伟,林博森,牛轶峰.面向侦察任务的无人机机载感知传感器配置与融合综述[J].无人系统技术,2022,5(2):1-8. 被引量：4
6周涛,董雅丽,刘珊,陆惠玲,马宗军,侯森宝,邱实.用于肺部肿瘤图像分割的跨模态多编码混合注意力U-Net[J].光子学报,2022,51(4):368-384. 被引量：7
7许正玺,张少敏,支力佳,周涛.三维多尺度嵌套U结构CT影像肺结节检测[J].中国图象图形学报,2022,27(3):797-811. 被引量：5
8张婷,张善文,徐聪.基于超像素与多尺度残差U⁃Net相结合的遥感图像飞机检测方法[J].宇航计测技术,2022,42(3):86-92. 被引量：2
9周涛,侯森宝,陆惠玲,赵雅楠,党培(综述),董雅丽(审校).探析U-Net的改进机制及其在医学图像分割的应用[J].生物医学工程学杂志,2022,39(4):806-825. 被引量：5
10袁小平,何祥,王小倩,胡杨明.基于多层级特征自适应融合的图像分割算法[J].浙江大学学报（工学版）,2022,56(10):1958-1966. 被引量：1

1桑林.改进FCOS的SAR图像舰船检测算法[J].黑龙江科技大学学报,2024,34(4):637-641.
2程知,邓灶辉,高丽萍,陶寅,沐超,杜丽丽.基于网格网络的大气湍流退化图像复原[J].激光与光电子学进展,2024,61(14):69-80.
3王文涛,刘彦飞,毛博文,余成波.面向多维属性融合的加权网络结构洞节点发现算法[J].信息网络安全,2024(8):1265-1276.

计算机工程与应用

2024年第19期

浏览历史

内容加载中请稍等...

DL-GAN生成对抗网络的半监督语义分割模型

参考文献7

二级参考文献45

共引文献92

相关作者

相关机构

相关主题

浏览历史