利用卷积神经网络的自动驾驶场景语义分割被引量：33

Autonomous driving semantic segmentation with convolution neural networks

下载PDF

导出

摘要图像语义分割是现代自动驾驶系统的一个必要部分,因为对汽车周围场景的准确理解是导航和动作规划的关键。为提高自动驾驶场景的图像语义分割准确率,且考虑到当下流行的基于卷积神经网络的语义分割模型(DeepLab v3+)无法有效地利用注意力信息,导致分割边界粗糙等问题,提出一种融合底层像素信息与通道、空间信息的语义分割神经网络。在卷积神经网络中插入注意力模块,提取出图像语义级别的信息,通过学习图像的位置信息和通道信息得到更加丰富的特征;从卷积神经网络输出的各类别得分值计算出单点势能,且从初步分割图和原图得到成对势能,以便全连接条件随机场对图像的全部像素进行建模,并且优化图像的局部细节;全连接条件随机场通过迭代得到语义分割的最终结果。在CityScapes数据集上进行了测试,与DeepLab v3+相比较,改进后的模型分别提高了均交并比和均像素精度等关键指标1.07%和3.34%。它能够更加精细地分割目标,较好地解决分割边界粗糙,有效地抑制边界区域分割的过度平滑和不合理孤岛等问题。 Semantic image segmentation is an essential part of modern autonomous driving systems because accurate understanding of the scene around the car is the key to navigation and motion planning.The existing advanced convolutional neural network-based semantic segmentation model DeepLab v3+can not use attention information,which leads to rough segmentation boundary.To improve the semantic image segmentation accuracy for autonomous driving scenario,this paper proposed a segmentation model that combined the low pixel information with channel and spatial information.By inserting the attention module in the convolutional neural network,image semantic level information could be extracted,and more abundant features could be obtained through learning the position information and channel information of the image.The unary potential was figured out from the scores of each category output of the convolutional neural network,and the pairwise potential was obtained from the preliminary segmentation and the original input image,so that every pixel of the image could be modeled by fully connected conditional random fields,and the local details of the image could be optimized.The final result of semantic segmentation was obtained from fully connection conditional random fields through iteration.Compared with the existing DeepLab v3+network,the improved model can promote key indicators such as mean intersection over union(mIoU)and mean pixel accuracy(mPA)by 1.07 and 3.34 percentage points respectively.It is able to segment objects more finely,and suppress the excessive smoothness of the boundary region segmentation,unreasonable islands preferably.

作者王中宇倪显扬尚振东 WANG Zhong-yu;NI Xian-yang;SHANG Zhen-dong(School of Instrumentation Science and Opto-Electronics Engineering,Beihang University,Beijing 100191,China;School of Mechatronics Engineering,Henan University of Science and Technology,Luoyang 471023,China)

机构地区北京航空航天大学仪器科学与光电工程学院河南科技大学机电工程学院

出处《光学精密工程》 EI CAS CSCD 北大核心 2019年第11期2429-2438,共10页 Optics and Precision Engineering

基金北京市自然科学基金资助项目(No.3172020)

关键词自动驾驶图像语义分割卷积神经网络 DeepLab v3+ autonomous driving semantic image segmentation convolutional neural networks DeepLab v3+

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1潘仙张,张石清,郭文平.多模深度卷积神经网络应用于视频表情识别[J].光学精密工程,2019,27(4):963-970. 被引量：19
2李宇,刘雪莹,张洪群,李湘眷,孙晓瑶.基于卷积神经网络的光学遥感图像检索[J].光学精密工程,2018,26(1):200-207. 被引量：39
3郭保青,王宁.基于改进深度卷积网络的铁路入侵行人分类算法[J].光学精密工程,2018,26(12):3040-3050. 被引量：19

二级参考文献15

1董宏辉,葛大伟,秦勇,贾利民.基于智能视频分析的铁路入侵检测技术研究[J].中国铁道科学,2010,31(2):121-125. 被引量：36
2高恒振,万建伟,粘永健,王力宝,徐湛.组合核函数支持向量机高光谱图像融合分类[J].光学精密工程,2011,19(4):878-883. 被引量：23
3黄炎,范赐恩,朱秋平,张虎,邓德祥.联合梯度直方图和局部二值模式特征的人体检测[J].光学精密工程,2013,21(4):1047-1053. 被引量：13
4宁滨,余祖俊,朱力强,王尧.铁路远程瞭望系统研究与应用[J].铁道学报,2014,36(12):62-69. 被引量：7
5史红梅,柴华,王尧,余祖俊.基于目标识别与跟踪的嵌入式铁路异物侵限检测算法研究[J].铁道学报,2015,37(7):58-65. 被引量：41
6丁文秀,孙锐,闫晓星.基于分层深度学习的鲁棒行人分类[J].光电工程,2015,42(9):21-27. 被引量：4
7郭保青,杨柳旭,史红梅,王耀东,许西宁.基于快速背景差分的高速铁路异物侵入检测算法[J].仪器仪表学报,2016,37(6):1371-1378. 被引量：26
8罗家祥,林畅赫,王加朋,胡跃明.结合深度卷积网络与加速鲁棒特征配准的图像精准定位[J].光学精密工程,2017,25(2):469-476. 被引量：7
9熊昌镇,单艳梅,郭芬红.结合主体检测的图像检索方法[J].光学精密工程,2017,25(3):792-798. 被引量：17
10刘智,黄江涛,冯欣.构建多尺度深度卷积神经网络行为识别模型[J].光学精密工程,2017,25(3):799-805. 被引量：31

共引文献69

1倪洪印,李凤萍.T-CENTRIST特征的红外图像人体检测[J].红外与激光工程,2020,49(S02):268-275.
2万磊,佟鑫,盛明伟,秦洪德,唐松奇.Softmax分类器深度学习图像分类方法应用综述[J].导航与控制,2019,0(6):1-9. 被引量：58
3刘媛媛,张硕,于海业,王跃勇,王佳木.基于语义分割的复杂场景下的秸秆检测[J].光学精密工程,2020,28(1):200-211. 被引量：16
4施伟红.生物流化床在废水处理中的应用[J].上海化工,2000,25(6):15-16. 被引量：6
5梁华,宋玉龙,钱锋,宋策.基于深度学习的航空对地小目标检测[J].液晶与显示,2018,33(9):793-800. 被引量：28
6郑欣,田博,李晶晶.基于YOLO模型的宫颈细胞簇团智能识别方法[J].液晶与显示,2018,33(11):965-971. 被引量：17
7林贻翔.神经网络非线性智能控制在光电跟踪系统中的应用[J].光学精密工程,2018,26(12):2949-2955. 被引量：11
8左俊皓,赵聪,朱晓龙,任洪娥.Faster-RCNN和Level-Set结合的高分遥感影像建筑物提取[J].液晶与显示,2019,34(4):439-447. 被引量：9
9潘仙张,张石清,郭文平.多模深度卷积神经网络应用于视频表情识别[J].光学精密工程,2019,27(4):963-970. 被引量：19
10张朝柱,顾晓婷,张艺漫.基于深度卷积神经网络的手势动作识别[J].无线电工程,2019,49(7):587-591. 被引量：8

同被引文献194

1韩慧慧,李帷韬,王建平,焦点,孙百顺.编码—解码结构的语义分割[J].中国图象图形学报,2020,0(2):255-266. 被引量：10
2郑少武,李巍华,胡坚耀.基于激光点云与图像信息融合的交通环境车辆检测[J].仪器仪表学报,2019,40(12):143-151. 被引量：38
3杨晋生,杨雁南,李天骄.基于深度可分离卷积的交通标志识别算法[J].液晶与显示,2019,34(12):1191-1201. 被引量：13
4李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：38
5ZHENG Jianfeng,PAN Wenqing,SHEN Anjiang,YUAN Wenfang,HUANG Lili,NI Xinfeng,ZHU Yongjin.Reservoir geological modeling and significance of Cambrian Xiaoerblak Formation in Keping outcrop area, Tarim Basin, NW China[J].Petroleum Exploration and Development,2020,47(3):536-547. 被引量：1
6王建林,付雪松,黄展超,郭永奇,王汝童,赵利强.改进YOLOv2卷积神经网络的多类型合作目标检测[J].光学精密工程,2020,28(1):251-260. 被引量：23
7刘媛媛,张硕,于海业,王跃勇,王佳木.基于语义分割的复杂场景下的秸秆检测[J].光学精密工程,2020,28(1):200-211. 被引量：16
8王丹,张祥合.基于HOG和SVM的人体行为仿生识别方法[J].吉林大学学报（工学版）,2013,43(S1):489-492. 被引量：9
9万源,李欢欢,吴克风,童恒庆.LBP和HOG的分层特征融合的人脸识别[J].计算机辅助设计与图形学学报,2015,27(4):640-650. 被引量：71
10马德锋,李培军.加入多尺度图像纹理的岩性分类[J].岩石学报,2008,24(6):1425-1430. 被引量：16

引证文献33

1刘文祥,舒远仲,唐小敏,刘金梅.采用双注意力机制Deeplabv3+算法的遥感影像语义分割[J].热带地理,2020,40(2):303-313. 被引量：40
2裴晓敏,范慧杰,唐延东.多通道时空融合网络双人交互行为识别[J].红外与激光工程,2020,49(5):203-208. 被引量：7
3余永维,韩鑫,杜柳青.基于Inception-SSD算法的零件识别[J].光学精密工程,2020,28(8):1799-1809. 被引量：28
4雷俊锋,贺睿,肖进胜.融合空间注意力机制的行车障碍预测网络[J].光学精密工程,2020,28(8):1850-1860. 被引量：3
5杨其利,周炳红,郑伟,李明涛.注意力卷积长短时记忆网络的弱小目标轨迹检测[J].光学精密工程,2020,28(11):2535-2548. 被引量：10
6张桂梅,鲁飞飞,龙邦耀,缪君.结合自集成和对抗学习的域自适应城市场景语义分割[J].模式识别与人工智能,2021,34(1):58-67. 被引量：1
7李经宇,杨静,孔斌,王灿,张露.基于注意力机制的多尺度车辆行人检测算法[J].光学精密工程,2021,29(6):1448-1458. 被引量：21
8陈清江,胡倩楠,李金阳.多尺度交替连接残差网络用于图像去模糊[J].光学精密工程,2021,29(7):1686-1694. 被引量：6
9张丽娟,章润,李东明,李阳,王晓坤.区域生长全卷积神经网络交互分割肝脏CT图像[J].液晶与显示,2021,36(9):1294-1304. 被引量：4
10伍锡如,邱涛涛,王耀南.改进Mask R-CNN的交通场景多目标快速检测与分割[J].仪器仪表学报,2021,42(7):242-249. 被引量：23

二级引证文献234

1乌伦赛,胡一可,陈江为.景观可供性视角下小微公共空间的景观服务[J].风景园林,2023,30(S02):74-81.
2帖军,朱祖桐,郑禄,徐胜舟,马佳婷.基于混合空洞卷积与特征融合的肝脏肿瘤图像分割[J].电子测量技术,2023,46(22):122-130.
3娄文,郭杜杜,张杰,赵亮,徐勤功.基于YOLOv7的驾驶人使用手机与抽烟行为识别方法[J].电子测量技术,2023,46(21):123-131. 被引量：1
4李利荣,丁江,梅冰,戴俊伟,巩朋成.基于像素注意力特征融合的城市街景语义分割算法研究[J].电子测量技术,2023,46(20):184-190.
5王国桢,卢国杰,王桂棠.无人化起重装卸的目标物实例分割模型研究[J].电子测量技术,2023,46(18):139-146.
6张志杰,顾寄南,李静,余雪飞.基于深度学习的电子元器件快速检测算法研究[J].电子测量技术,2022,45(10):93-101. 被引量：7
7岳希,梁云浩,何磊.基于改进YOLO算法的船舰目标检测DT-YOLO方法研究[J].成都信息工程大学学报,2022,37(5):533-537.
8赵敬伟,林珊玲,梅婷,林志贤,郭太良.基于YOLACT与Transformer相结合的实例分割算法研究[J].半导体光电,2023,44(1):134-140.
9翟国栋,任聪,王帅,岳中文,潘涛,季如佳.多尺度特征融合的煤矿救援机器人目标检测模型[J].工矿自动化,2020,46(11):54-58. 被引量：6
10齐波,张鹏,张书琦,赵林杰,王红斌,黄猛,唐志国,冀茂,李成榕.数字孪生技术在输变电设备状态评估中的应用现状与发展展望[J].高电压技术,2021,47(5):1522-1538. 被引量：73

1邱康,王子磊.基于车载图像的目标车辆压线检测方法[J].计算机系统应用,2019,28(11):188-194. 被引量：2
2李慧.听力障碍儿童情绪智力发展状况及教育启示[J].教育导刊（下半月）,2019,0(10):44-47.
3江涛,王新杰.基于卷积神经网络的高分二号影像林分类型分类[J].北京林业大学学报,2019,41(9):20-29. 被引量：5
4许志敏,万欣,顾凯,魏海峰.基于图像识别的机械臂抓取系统[J].智能机器人,2019,0(5):74-77. 被引量：2
5许晓露,刘汉湖,蒋川东.基于斜坡单元的滑坡易发性评价——以易贡地区为例[J].河南科学,2019,37(11):1825-1832. 被引量：6
6李小林,李文国,李浩.基于视差与灰度双层支持窗的立体匹配算法[J].电子科技,2019,32(11):12-17. 被引量：1
7周鹏程,龚声蓉,钟珊,包宗铭,戴兴华.基于深度特征融合的图像语义分割[J].计算机科学,2020,47(2):126-134. 被引量：3
8陈惠容,欧凡,蔡锦华.诊疗因素对病种分值的影响[J].中国医院,2020,24(1):24-26. 被引量：1
9郑欢欢,张雅琼,白鱼秀.车道偏离预警系统关键技术设计[J].传感器与微系统,2019,38(11):111-113. 被引量：7
10罗会兰,卢飞,孔繁胜.基于区域与深度残差网络的图像语义分割[J].电子与信息学报,2019,41(11):2777-2786. 被引量：15

光学精密工程

2019年第11期

浏览历史

内容加载中请稍等...

利用卷积神经网络的自动驾驶场景语义分割被引量：33

参考文献3

二级参考文献15

共引文献69

同被引文献194

引证文献33

二级引证文献234

相关作者

相关机构

相关主题

浏览历史

利用卷积神经网络的自动驾驶场景语义分割 被引量：33

参考文献3

二级参考文献15

共引文献69

同被引文献194

引证文献33

二级引证文献234

相关作者

相关机构

相关主题

浏览历史

利用卷积神经网络的自动驾驶场景语义分割被引量：33