期刊文献+

基于金字塔场景分析网络改进的语义分割算法 被引量:2

Improved Semantic Segmentation Algorithm Based on Pyramid Scene Parsing Network
下载PDF
导出
摘要 图像语义分割是图像识别中的一个经典难题,是机器视觉研究的一个热点。但在实际应用中,会出现语义标签预测不准确、所分割对象与背景之间边缘信息损失问题,这已逐渐成为了图像理解的瓶颈。据此,提出了一种基于金字塔场景分析网络(PSPNet)的网络改进结构,在特征学习模块中将输入图在原残差网络(ResNet)的基础上通过在网络内部增加卷积、池化操作,进一步学习各个层次特征,将所学习到的多个低层次特征图与高层次特征图相加,得到新的具有更多空间位置信息的特征图;为得到丰富的上下文信息,利用PSPNet的金字塔池化结构,将特征图中全局上下文信息与不同尺度局部上下文信息相结合,进行卷积和上采样,得到最终预测图。仿真实验结果表明,所改进的方法在PASCAL VOC 2012测试集中平均交并比(Mean Intersectionover Union,MIoU)达到78.5%,较基准算法提升了1.7%。 Image semantic segmentation is a classic problem in image recognition and a hot spot in machine vision research.However,in practical applications,there will be inaccurate semantic label prediction and edge information loss between the segmented object and the background,which has gradually become a bottleneck in image understanding.Accordingly,this paper proposes a network improvement structure based on the Pyramid Scene Parsing Network(PSPNet).Firstly,in the feature learning module,the input image is added to the original Residual Network(ResNet)by adding convolution and pooling operations within the network to further learn the features of each level,and add the multiple low-level feature maps learned to the high-level feature map to obtain a new feature map with more spatial location information.To obtain rich context information,it uses PSPNet’s pyramid pool structure,combining global context information in the feature map with local context information at different scales,convolution and upsampling to obtain the final prediction map.The simulation experimental results show that the improved method in the paper has a Mean Intersection over Union(MIoU)of 78.5%in the PASCAL VOC 2012 test set,which is 1.7%higher than the benchmark algorithm.
作者 王嘉 张楠 孟凡云 王金鹤 WANG Jia;ZHANG Nan;MENG Fanyun;WANG Jinhe(School of Information and Control Engineering,Qingdao University of Technology,Qingdao,Shandong 266000,China)
出处 《计算机工程与应用》 CSCD 北大核心 2021年第19期220-227,共8页 Computer Engineering and Applications
基金 国家自然科学基金(31271077) 山东省重点研发项目(2019CCX104089) 山东省高等学校科技计划项目(J17KA061)。
关键词 语义分割 深度学习 金字塔场景分析网络(PSPNet) 残差网络(ResNet) 平均交并比 semantic segmentation deep learning Pyramid Scene Parsing Network(PSPNet) Residual Network(ResNet) Mean Intersection over Union(MIoU)
  • 相关文献

参考文献2

二级参考文献12

共引文献30

同被引文献26

引证文献2

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部