多尺度特征融合的道路场景语义分割被引量：5

Semantic Segmentation for Road Scene Based on Multiscale Feature Fusion

导出

摘要针对现有语义分割网络模型难以在参数量、推理速度和精确度中取得平衡的问题,设计了一种多尺度特征信息融合的轻量级网络模型(MIFNet)。MIFNet采用编码-解码结构,在编码部分利用分离策略和非对称卷积设计了轻量型特征提取瓶颈结构,且引入空间注意力机制与Laplace边缘检测算子组成边缘-空间融合模块,将空间信息和边缘信息进行融合得到丰富的特征信息。在解码部分引入通道注意力机制恢复特征图尺寸和细节信息完成语义分割。在Cityscapes和CamVid测试集上,MIFNet仅以0.82 M的参数量分别取得了73.1%和67.7%的分割精度,同时在单个GTX 1080Ti GPU下分别获得73.68 frame/s和85.16 frame/s的推理速度,表明该方法在参数量、推理速度和精确度3个指标上得到较好平衡,实现了轻量、快速、精准的语义分割。 A lightweight network model based on multiscale feature information fusion(MIFNet)is developed in this study owing to the imbalance among the parameter amount,inference speed,and accuracy in many existing semantic segmentation network models.The MIFNet is constructed on the encoding-decoding architecture.In the encoding part,the split strategy and asymmetric convolution are flexibly applied to design lightweight bottleneck structure for feature extraction.The spatial attention mechanism and Laplace edge detection operator are introduced to fuse spatial and edge information to obtain rich feature information.In the decoding part,a new decoder is designed by introducing a channel attention mechanism to recover the size and detail information of the feature map for a complete semantic segmentation task.The MIFNet achieves accuracies of 73.1%and 67.7%on the Cityscapes and CamVid test sets,respectively,with only approximately 0.82 M parameters.Correspondingly,it reaches up to 73.68 frame/s and 85.16 frame/s inference speed,respectively using a single GTX 1080Ti GPU.The results show that the method achieves a good balance in terms of the parameter amount,inference speed,and accuracy,yielding a lightweight,fast,and accurate semantic segmentation.

作者易清明张文婷石敏沈佳林骆爱文 Yi Qingming;Zhang Wenting;Shi Min;Shen Jialin;Luo Aiwen(College of Information Science and Technology,Jinan University,Guangzhou 510632,Guangdong,China)

机构地区暨南大学信息科学技术学院

出处《激光与光电子学进展》 CSCD 北大核心 2023年第12期82-90,共9页 Laser & Optoelectronics Progress

基金国家自然科学基金(62002134) 广东省基础与应用基础研究基金(2020A1515110645) 广东省重点实验室项目(2021KSY001) 羊城创新创业领军人才支持计划(2019019) 暨南大学中央高校基本科研业务费项目(21620353)。

关键词图像处理实时语义分割 Laplace边缘检测注意力机制多尺度特征信息融合 image processing real-time semantic segmentation Laplace edge detection attention mechanism multiscale feature information fusion

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1陈浩,杨恺伦,胡伟健,白剑,汪凯巍.基于全景环带成像的语义视觉里程计[J].光学学报,2021,41(22):142-152. 被引量：4
2赵亮,胡杰,刘汉,安永鹏,熊宗权,王宇.基于语义分割的深度学习激光点云三维目标检测[J].中国激光,2021,48(17):171-183. 被引量：36

二级参考文献11

1黄治,白剑,侯西云.单传感器全景与长焦组合光学系统设计[J].光学学报,2013,33(4):207-211. 被引量：2
2卢晓艺,云挺,薛联凤,徐强法,曹林.基于树木激光点云的有效特征抽取与识别方法[J].中国激光,2019,46(5):403-414. 被引量：15
3马娟娟,潘泉,梁彦,胡劲文,赵春晖,郭亚宁.基于改进Grassberger熵随机森林分类器的目标检测[J].中国激光,2019,46(7):230-238. 被引量：21
4张祥甫,刘健,石章松,吴中红,王智.基于深度学习的语义分割问题研究综述[J].激光与光电子学进展,2019,56(15):12-26. 被引量：26
5黄刚,刘先林.基于深度学习的道路标线自动提取与分类方法[J].中国激光,2019,46(8):138-145. 被引量：28
6季顺平,秦梓杰.多镜头组合式相机的全景SLAM[J].测绘学报,2019,48(10):1254-1265. 被引量：6
7张爱武,刘路路,张希珍.道路三维点云多特征卷积神经网络语义分割方法[J].中国激光,2020,47(4):261-269. 被引量：18
8顾尚泰,王玲,马燕新,马超.基于分层墨卡托投影的激光雷达点云数据局部特征描述[J].光学学报,2020,40(20):120-126. 被引量：9
9邹斌,林思阳,尹智帅.基于YOLOv3和视觉SLAM的语义地图构建[J].激光与光电子学进展,2020,57(20):116-122. 被引量：18
10刘训华,孙韶媛,顾立鹏,李想.基于改进Frustum PointNet的3D目标检测[J].激光与光电子学进展,2020,57(20):320-326. 被引量：5

共引文献38

1张业,徐婧.基于语义点云的巡航系统移动目标轨迹识别[J].北京测绘,2023,37(8):1115-1120.
2李维刚,梅洋,樊响,赵云涛.基于车载激光点云的铁路轨道检测[J].中国激光,2022,49(4):162-173. 被引量：17
3闫杰琼,周来水,胡少乾,文思扬.航空发动机外形点云的特征分割方法[J].光学学报,2022,42(7):220-235. 被引量：4
4张佳泽,张胜茂,王书献,杨昱皞,戴阳,熊瑛.基于3-2D融和模型的毛虾捕捞渔船行为识别[J].南方水产科学,2022,18(4):126-135. 被引量：5
5李翔,何淼,罗海波.一种面向遮挡行人检测的改进YOLOv3算法[J].光学学报,2022,42(14):152-161. 被引量：20
6孟俊熙,张莉,曹洋,张乐天,宋倩.基于Deeplab v3+的图像语义分割算法优化研究[J].激光与光电子学进展,2022,59(16):151-160. 被引量：14
7尚鹏飞,陈义,吕伟嘉,郑芳,王杰龙.一种考虑法矢量的点云语义分割网络[J].激光与光电子学进展,2022,59(16):168-175. 被引量：2
8刘友群,敖建锋,潘仲泰.DGPoint:用于三维点云语义分割的动态图卷积网络[J].激光与光电子学进展,2022,59(16):199-206. 被引量：7
9夏利玲,顾建华.基于生成对抗网络和DenseNet的数据信息安全识别方法[J].计算机测量与控制,2022,30(10):240-245. 被引量：2
10张海明,史涛.基于改进Faster R-CNN的目标检测算法研究[J].重庆理工大学学报（自然科学）,2022,36(9):179-186. 被引量：13

同被引文献43

1刘强,施富强,汪旭光,赵明生,廖学燕.基于三维激光点云的爆破块度统计预测方法[J].煤炭学报,2020,45(S02):781-790. 被引量：7
2Jinpu Lin,Florian Haberstroh,Stefan Karsch,Andreas Döpp.Applications of object detection networks in high-power laser systems and experiments[J].High Power Laser Science and Engineering,2023,11(1):52-60. 被引量：19
3雷振,杨仁树,陶铁军.基于未确知测度理论的台阶爆破效果综合评价[J].煤炭学报,2015,40(2):353-359. 被引量：29
4陈然,杨仕教,朱忠华,郑建礼,张紫晗,胡光球.基于双门限阈值的爆破块度图像识别研究[J].工程爆破,2020,26(2):57-64. 被引量：6
5司晨冉,王仁超,邸阔,朱品光.一种基于Mask R-CNN和分水岭算法的岩石颗粒图像分割方法[J].水电能源科学,2020,38(11):129-132. 被引量：13
6张绪义,曹家乐.基于轮廓点掩模细化的单阶段实例分割网络[J].光学学报,2020,40(21):107-115. 被引量：7
7孙克强,缪君,江瑞祥,黄仕中,张桂梅.基于空洞卷积与多尺度特征融合的室内场景单图像分段平面三维重建[J].传感技术学报,2021,34(3):370-378. 被引量：11
8何文轩,胡健,柳小波,荆洪迪,孙效玉.矿石块度视觉识别判断方法[J].中国矿业,2021,30(6):100-105. 被引量：6
9周苏,吴迪,金杰.基于卷积神经网络的车道线实例分割算法[J].激光与光电子学进展,2021,58(8):373-380. 被引量：12
10谢和平,任世华,谢亚辰,焦小淼.碳中和目标下煤炭行业发展机遇[J].煤炭学报,2021,46(7):2197-2211. 被引量：293

引证文献5

1张敏,邓洋洋,李亚军,张苗辉.基于语义对齐与图节点交互的实例分割算法[J].激光与光电子学进展,2023,60(22):123-130.
2江松,饶彬舰,卢才武,顾清华,阮顺领,杨辉.基于点渲染的多分支融合露天矿爆堆块体精细分割方法[J].煤炭学报,2023,48(S02):542-552. 被引量：1
3郇宝乾,宋家威,张万忠,柴青平,王雪松,徐振洋.基于TAUNet分割模型的爆堆块度空间分布研究[J].矿业研究与开发,2024,44(5):37-44. 被引量：1
4吴马靖,张永爱,林珊玲,林志贤,林坚普.基于BiLevelNet的实时语义分割算法[J].光电工程,2024,51(5):21-33.
5闫景富,王鹏飞.多尺度特征融合下三维视觉图像场景分割算法[J].现代电子技术,2024,47(21):46-50.

二级引证文献2

1金圆,岳中文,王毅,陈佳瑶,赵颖.基于改进云模型的隧道爆破效果综合评价研究[J].工程爆破,2024,30(3):8-19.
2张杰,邱贤阳,田志刚,史秀志,李泽宇,李宜鑫,陈为中.地下矿山上向扇形中深孔爆破爆堆控制技术研究[J].矿业研究与开发,2024,44(10):58-64.

1王海瑞,赵江河,吴蕾,谢思远.针对CenterNet缺点的安全帽检测算法改进[J].湖南大学学报（自然科学版）,2023,50(8):125-133. 被引量：1
2苏田田,王慧敏,张小凤.基于多分支瓶颈结构的轻量型图像分类算法研究[J].电子学报,2023,51(5):1319-1326.
3周慧,袁新梅.Laplace分布参数的Bayes统计推断研究[J].应用数学进展,2023,12(7):3113-3120.
4余辉,杨波,朱剑林,陈晓燚.基于多重注意力机制的高分辨率遥感影像语义分割[J].中南民族大学学报（自然科学版）,2023,42(5):627-635.
5柏洁馨,汤泊川.基于深度学习的遥感影像语义分割研究[J].电子制作,2023,31(14):79-82.
6武钰清,徐青,马京振,温伯威,朱新铭,赵天明.基于空频双域滤波的SAR变化检测算法[J].光学学报,2023,43(12):289-302. 被引量：3
7郭琪周,袁春.基于空间语义信息特征融合的目标检测与分割[J].软件学报,2023,34(6):2776-2788. 被引量：4
8梁闯,陈长征,刘野,贾歆莹.半监督拉普拉斯分值在滚动轴承故障诊断中的应用[J].机械强度,2023,45(4):771-777.
9余伟群,刘佳涛,张亚萍.融合注意力的拉普拉斯金字塔单目深度估计[J].图学学报,2023,44(4):728-738.
10桑肖婷,李环宇,李春雷,汤水利,刘洲峰.面向稀疏神经网络的软硬件协同加速方法研究[J].中原工学院学报,2023,34(3):27-34. 被引量：1

激光与光电子学进展

2023年第12期

浏览历史

内容加载中请稍等...

多尺度特征融合的道路场景语义分割被引量：5

参考文献2

二级参考文献11

共引文献38

同被引文献43

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

多尺度特征融合的道路场景语义分割 被引量：5

参考文献2

二级参考文献11

共引文献38

同被引文献43

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

多尺度特征融合的道路场景语义分割被引量：5