基于深度特征融合的图像语义分割被引量：3

Image Semantic Segmentation Based on Deep Feature Fusion

下载PDF

导出

摘要在图像语义分割中使用卷积网络进行特征提取时,由于最大池化和下采样操作的重复组合引起了特征分辨率降低,从而导致上下文信息丢失,使得分割结果失去对目标位置的敏感性。虽然基于编码器-解码器架构的网络通过跳跃连接在恢复分辨率的过程中逐渐细化了输出精度,但其将相邻特征简单求和的操作忽略了特征之间的差异性,容易导致目标局部误识别等问题。为此,文中提出了基于深度特征融合的图像语义分割方法。该方法采用多组全卷积VGG16模型并联组合的网络结构,结合空洞卷积并行高效地处理金字塔中的多尺度图像,提取了多个层级的上下文特征,并通过自顶向下的方法逐层融合,最大限度地捕获上下文信息;同时,以改进损失函数而得到的逐层标签监督策略为辅助支撑,联合后端像素建模的全连接条件随机场,无论是在模型训练的难易程度还是预测输出的精度方面都有一定的优化。实验数据表明,通过对表征不同尺度上下文信息的各层深度特征进行逐层融合,图像语义分割算法在目标对象的分类和空间细节的定位方面都有所提升。在PASCAL VOC 2012和PASCAL CONTEXT两个数据集上获得的实验结果显示,所提方法分别取得了80.5%和45.93%的mIoU准确率。实验数据充分说明,并联框架中的深度特征提取、特征逐层融合和逐层标签监督策略能够联合优化算法架构。特征对比表明,该模型能够捕获丰富的上下文信息,得到更加精细的图像语义特征,较同类方法具有明显的优势。 When feature extraction is performed by using convolutional networks in image semantic segmentation,the context information is lost due to the reduced resolution of features by the repeated combination of maximum pooling and downsampling operations,so that the segmentation result loses the sensitivity to the object location.Although the network based on the encoder-decoder architecture gradually refines the output precision through the jump connection in the process of restoring the resolution,the operation of simply summing the adjacent features ignores the difference between the features and easily leads to local mis-identification of objects and other issues.To this end,an image semantic segmentation method based on deep feature fusion was proposed.It adopts a network structure in which multiple sets of fully convolutional VGG16 models are combined in parallel,processes multi-scale images in the pyramid in parallel efficiently with atrous convolutions,extracts multi-level context feature,and fuses layer by layer through a top-down method to capture the context information as far as possible.At the same time,the layer-by-layer label supervision strategy based on the improved loss function is an auxiliary support with a dense conditional random field of pixels modeling in the backend,which has certain optimization in terms of the difficulty of model training and the accuracy of predictive output.Experimental data show that the image semantic segmentation algorithm improves the classification of target objects and the location of spatial details by layer-by-layer fusion of deep features that characterize different scale context information.The experimental results obtained on PASCAL VOC 2012 and PASCAL CONTEXT datasets show that the proposed method achieves mIoU accuracy of 80.5%and 45.93%,respectively.The experimental data fully demonstrate that deep feature extraction,feature layer-by-layer fusion and layer-by-layer label supervision strategy in the parallel framework can jointly optimize the algorithm architecture.The feature comparison shows that the model can capture rich context information and obtain more detailed image semantic features.Compared with similar methods,it has obvious advantages.

作者周鹏程龚声蓉钟珊包宗铭戴兴华 ZHOU Peng-cheng;GONG Sheng-rong;ZHONG Shan;BAO Zong-ming;DAI Xing-hua(School of Computer Science and Technology,Soochow University,Suzhou,Jiangsu 215006,China;School of Computer Science and Engineering,Changshu Institute of Technology,Suzhou,Jiangsu 215500,China)

机构地区苏州大学计算机科学与技术学院常熟理工学院计算机科学与工程学院

出处《计算机科学》 CSCD 北大核心 2020年第2期126-134,共9页 Computer Science

基金国家自然科学基金项目(61272005 61702055) 江苏省自然科学基金项目(BK20151254,BK20151260) 江苏省六大高峰人才项目(DZXX-027) 教育部科技发展中心“云数融合科教创新”基金(2017B03112)~~

关键词图像语义分割深度特征空洞卷积特征融合上下文信息条件随机场 Image semantic segmentation Deep feature Atrous convolution Feature fusion Context information Conditional random field

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献17

1王凯,岳泊暄,傅骏伟,梁军.基于生成对抗网络的图像恢复与SLAM容错研究[J].浙江大学学报（工学版）,2019,53(1):115-125. 被引量：6
2王中任,郭晓康,赵刚.两组双目立体深度图像信息融合与三维重建方法[J].激光与红外,2019,49(2):246-250. 被引量：24
3陈超,齐峰.卷积神经网络的发展及其在计算机视觉领域中的应用综述[J].计算机科学,2019,46(3):63-73. 被引量：142
4王子愉,袁春,黎健成.利用可分离卷积和多级特征的实例分割[J].软件学报,2019,30(4):954-961. 被引量：14
5刘月峰,杨涵晰,蔡爽,张晨荣.基于改进卷积神经网络的单幅图像超分辨率重建方法[J].计算机应用,2019,39(5):1440-1447. 被引量：26
6杨海清,徐勇军,王明雪.基于深度强化学习和循环卷积神经网络的图像恢复算法[J].高技术通讯,2019,29(5):432-437. 被引量：8
7肖进胜,周景龙,雷俊锋,刘恩雨,舒成.基于霾层学习的单幅图像去雾算法[J].电子学报,2019,47(10):2142-2148. 被引量：11
8王爽.基于自适应总变分法的AO图像复原算法研究[J].红外技术,2019,41(12):1106-1110. 被引量：3
9陈文,王强.基于卷积神经网络的LDR图像重建HDR图像的方法研究[J].包装工程,2020,41(5):228-234. 被引量：3
10郭业才,周腾威.基于深度强化对抗学习的图像增强方法[J].扬州大学学报（自然科学版）,2020,23(2):42-46. 被引量：5

引证文献3

1胡伏原,万新军,沈鸣飞,徐江浪,姚睿,陶重犇.深度卷积神经网络图像实例分割方法研究进展[J].计算机科学,2022,49(5):10-24. 被引量：11
2王春洁,王建.基于边缘细化的散焦失真图像恢复方法[J].计算机仿真,2022,39(3):220-223.
3单昕昕,李凯,文颖.集成全尺度融合和循环注意力的医学图像分割网络[J].计算机科学,2024,51(5):100-107.

二级引证文献11

1屈露,苍岩.基于卷积神经网络的群猪图像实例分割方法[J].应用科技,2023,50(3):78-84. 被引量：1
2尤永鹏,董峦,尹书林,李佳航,艾里亚尔·阿不都克里木.图书馆在架图书书脊与标签实例分割方法研究[J].新疆农业大学学报,2023,46(2):139-145.
3狄泽波,马丽,张继凯,白红英.基于改进SOLO神经网络钢包起重挂钩的识别测定[J].冶金能源,2023,42(4):47-50.
4庞世源.深度学习驱动街道更新的研究进展[J].南宁师范大学学报（自然科学版）,2023,40(2):61-66.
5薛娟.利用图像处理的流场测速技术研究[J].电脑与信息技术,2023,31(6):10-14.
6张峰,黄仕鑫,花强,董春茹.基于Depth-wise卷积和视觉Transformer的图像分类模型[J].计算机科学,2024,51(2):196-204. 被引量：2
7柴玉,曹伟.人工智能在街道空间研究中的应用综述——基于CiteSpace的可视化分析[J].中外建筑,2024(1):21-26. 被引量：1
8周涛,石道宗,赵雅楠,张祥祥,杜玉虎,陆惠玲.单阶段实例分割——从局部到整体的网络结构研究综述[J].中国科技论文,2024,19(2):131-142.
9唐若仪,陈成军,王金磊,代成刚.基于TD-Mask R-CNN的机械装配体图像实例分割[J].组合机床与自动化加工技术,2024(4):135-140. 被引量：1
10陈攀,王绍东.基于轻量级卷积神经网络的多视觉特征图像分割研究[J].现代电子技术,2024,47(15):60-64. 被引量：1

1刘小安,彭涛.基于卷积神经网络的中文景点识别研究[J].计算机工程与应用,2020,56(4):140-145. 被引量：16
2张立功.塔式太阳能热发电站中定日镜的电源方案研究[J].太阳能,2019,0(11):48-52. 被引量：1
3杨恒杰,闫铮,邬宗玲,方定邦,段放.基于循环神经网络的图像特定文本抽取方法[J].激光与光电子学进展,2019,56(24):180-187. 被引量：4
4王宝珠,史龙云,郭志涛,雷瑶.改进的Faster R-CNN在车辆识别中的应用[J].现代电子技术,2019,42(23):48-52. 被引量：3
5张陈欢,史燕中.基于Chinese Whispers的人脸动态聚类[J].计算机技术与发展,2019,29(11):92-96. 被引量：4
6王中宇,倪显扬,尚振东.利用卷积神经网络的自动驾驶场景语义分割[J].光学精密工程,2019,27(11):2429-2438. 被引量：33
7申彦斌.基于卷积自编码器的旋转机械故障特征提取方法研究[J].南方农机,2020,51(3):44-45.
8李川,马文胜,王瑞东,张少茹.基于多级规约CRF模型景点评论观点分析方法[J].兵工自动化,2020,39(1):86-91.
9罗会兰,张云.结合上下文特征与CNN多层特征融合的语义分割[J].中国图象图形学报,2019,24(12):2200-2209. 被引量：4
10蒋玉婷.云计算数据库中集成化数据智能挖掘算法研究[J].信息与电脑,2019,31(23):22-23.

计算机科学

2020年第2期

浏览历史

内容加载中请稍等...

基于深度特征融合的图像语义分割被引量：3

同被引文献17

引证文献3

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于深度特征融合的图像语义分割 被引量：3

同被引文献17

引证文献3

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于深度特征融合的图像语义分割被引量：3