面向交通场景解析的局部和全局上下文注意力融合网络被引量：1

Local and global context attentive fusion network for traffic scene parsing

下载PDF

导出

摘要为解决交通场景解析中局部和全局上下文信息自适应聚合的问题,提出3模块架构的局部和全局上下文注意力融合网络(LGCAFN)。前端的特征提取模块由基于串联空洞空间金字塔池化(CASPP)单元改进的ResNet-101组成,能够更加有效地提取物体的多尺度局部特征;中端的结构化学习模块由8路长短期记忆(LSTM)网络分支组成,可以更加准确地推理物体邻近8个不同方向上场景区域的空间结构化特征;后端的特征融合模块采用基于注意力机制的3阶段融合方式,能够自适应地聚合有用的上下文信息并屏蔽噪声上下文信息,且生成的多模态融合特征能够更加全面且准确地表示物体的语义信息。在Cityscapes标准和扩展数据集上的实验结果表明,相较于逆变换网络(ITN)和对象上下文表示网络(OCRN)等方法,LGCAFN实现了最优的平均交并比(mIoU),达到了84.0%和86.3%,表明LGCAFN能够准确地解析交通场景,有助于实现车辆自动驾驶。 In order to solve the local and global contextual information adaptive aggregation problem in traffic scene parsing,a Local and Global Context Attentive Fusion Network(LGCAFN)with three-module architecture was proposed.The front-end feature extraction module consisted of the improved 101-layer Residual Network(ResNet-101)which was based on Cascaded Atrous Spatial Pyramid Pooling(CASPP)unit,and was able to extract object’s multi-scale local features more effectively.The mid-end structural learning module was composed of eight Long Short-Term Memory(LSTM)branches,and was able to infer spatial structural features of object’s adjacent scene regions in eight different directions more accurately.In the back-end feature fusion module,a three-stage fusion method based on attention mechanism was adopted to adaptively aggregate useful contextual information and shield from noisy contextual information,and the generated multimodal fusion features were able to represent object’s semantic information in a more comprehensive and accurate way.Experimental results on Cityscapes standard and extended datasets demonstrate that compared to the existing state-of-the-art methods such as Inverse Transformation Network(ITN),and Object Contextual Representation Network(OCRN),LGCAFN achieves the best mean Intersection over Union(mIoU),reaching 84.0%and 86.3%respectively,showing that LGCAFN can parse traffic scenes accurately and is helpful to realize autonomous driving of vehicles.

作者王泽宇布树辉黄伟郑远攀吴庆岗张旭 WANG Zeyu;BU Shuhui;HUANG Wei;ZHENG Yuanpan;WU Qinggang;ZHANG Xu(College of Computer and Communication Engineering,Zhengzhou University of Light Industry,Zhengzhou Henan 450002,China;School of Aeronautics,Northwestern Polytechnical University,Xi’an Shaanxi 710072,China)

机构地区郑州轻工业大学计算机与通信工程学院西北工业大学航空学院

出处《计算机应用》 CSCD 北大核心 2023年第3期713-722,共10页 journal of Computer Applications

基金河南省科技攻关项目(222102210021) 河南省高等学校重点科研项目计划支持(21A520049)。

关键词交通场景解析自适应聚合串联空洞空间金字塔池化长短期记忆注意力融合 traffic scene parsing adaptive aggregation Cascaded Atrous Spatial Pyramid Pooling(CASPP) Long Short-Term Memory(LSTM) attentive fusion

分类号 TP391.4 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1杨贞,彭小宝,朱强强,殷志坚.基于Deeplab V3 Plus的自适应注意力机制图像分割算法[J].计算机应用,2022,42(1):230-238. 被引量：11
2余娜,刘彦,魏雄炬,万源.基于注意力机制和金字塔融合的RGB-D室内场景语义分割[J].计算机应用,2022,42(3):844-853. 被引量：4
3段立娟,孙启超,乔元华,陈军成,崔国勤.基于注意力感知和语义感知的RGB-D室内图像语义分割算法[J].计算机学报,2021,44(2):275-291. 被引量：15
4吴绿,张馨月,唐茉,王梓,王永安.Focus+Context语义表征的场景图像分割[J].电子学报,2021,49(3):596-604. 被引量：4
5黄庭鸿,聂卓赟,王庆国,李帅,晏来成,郭东生.基于区块自适应特征融合的图像实时语义分割[J].自动化学报,2021,47(5):1137-1148. 被引量：7

二级参考文献20

1张长江,汪晓东,吴建斌,张浩然,汪金山.图像对比度增强的小波变换法[J].仪器仪表学报,2005,26(z1):630-631. 被引量：5
2杨盛春.知识表征研究述评[J].科技情报开发与经济,2012,22(19):145-147. 被引量：14
3张婷,李玉鑑,胡海鹤,张亚红.基于跨连卷积神经网络的性别分类模型[J].自动化学报,2016,42(6):858-865. 被引量：40
4夏剑峰.基于数学形态学的癌细胞的分割与识别[J].电子科技,2016,29(10):36-38. 被引量：5
5zhi-hua zhou.A brief introduction to weakly supervised learning[J].National Science Review,2018,5(1):44-53. 被引量：90
6白傑,郝培涵,陈思汉.用轻量化卷积神经网络图像语义分割的交通场景理解[J].汽车安全与节能学报,2018,9(4):433-440. 被引量：11
7孟楚楚,赵立宏.结合梯度边缘信息改进的全局阈值法与GVF Snake模型的宫颈细胞图像分割[J].智能计算机与应用,2019,9(2):28-32. 被引量：6
8田萱,王亮,丁琪.基于深度学习的图像语义分割方法综述[J].软件学报,2019,30(2):440-468. 被引量：201
9宫进昌,赵尚义,王远军.基于深度学习的医学图像分割研究进展[J].中国医学物理学杂志,2019,36(4):420-424. 被引量：28
10田艳玲,张维桐,张锲石,路纲,吴晓军.图像场景分类技术综述[J].电子学报,2019,47(4):915-926. 被引量：18

共引文献36

1黄扬林,胡凯,郭建强,彭诚.基于多尺度特征融合和双重注意力机制的肝脏CT图像分割[J].计算机科学,2022,49(S02):549-557.
2张兴国,周英迪,石新雨,罗霄月,顾杨旸.一种球机视频全景拼接及空间化方法[J].测绘科学,2022,47(5):203-211. 被引量：1
3程晓悦,赵龙章,胡穹,史家鹏.基于密集层和注意力机制的快速语义分割[J].计算机工程,2020,46(4):247-252. 被引量：8
4程晓悦,赵龙章,胡穹,史家鹏.基于膨胀卷积平滑及轻型上采样的实时语义分割[J].激光与光电子学进展,2020,57(2):177-184. 被引量：12
5郑斌军,孔玲君.基于DeepLabv3^(+)的图像语义分割优化方法[J].包装工程,2022,43(1):187-194. 被引量：3
6赵亮,张洁,陈志奎.基于双图正则化的自适应多模态鲁棒特征学习[J].计算机科学,2022,49(4):124-133. 被引量：1
7严良平,潘月梁,姜雄彪,陆秋雨,徐畅.深度图像引导的岩石颗粒分割方法[J].应用科技,2022,49(2):87-93. 被引量：2
8余俊辉,毛琳,杨大伟.一种粗细特征增强语义分割算法[J].大连民族大学学报,2022,24(1):18-23.
9任健,李鸿燕,张昱,邢璐.基于UNet自适应特征融合的语音增强[J].电子测量技术,2022,45(9):76-81. 被引量：4
10伏娜娜,许钢,陈玲,胡志锋,郑书展.基于通道特征融合的RGB-D图像语义分割方法[J].四川轻化工大学学报（自然科学版）,2022,35(4):42-48. 被引量：1

同被引文献3

1周金坤,王先兰,穆楠,王晨.基于多视角多监督网络的无人机图像定位方法[J].计算机应用,2022,42(10):3191-3199. 被引量：2
2申志军,穆丽娜,高静,史远航,刘志强.细粒度图像分类综述[J].计算机应用,2023,43(1):51-60. 被引量：4
3蒋三生,郭辉,王尚,秦雪良.无人机农业植保应用研究新进展[J].农业科学,2022,12(11):1136-1142. 被引量：1

引证文献1

1蔡美玉,朱润哲,吴飞,张开昱,李家乐.基于注意力机制和多粒度特征融合的跨视角匹配模型[J].计算机应用,2024,44(3):901-908.

1陈宇,梁媛,汤永恒,潘斌.基于改进型YOLO算法的垃圾分类方法[J].内蒙古大学学报（自然科学版）,2022,53(5):538-544. 被引量：1
2任浩,李丽,卢世博,陈静姚,张云峰.基于深度学习的复杂自然环境下桑树枝干识别方法[J].中国农机化学报,2023,44(2):182-188. 被引量：4
3胡东林,陈伟,董鑫,张鹏,杨鑫,桑江艳,张浩榛.基于双向GRU与注意力机制的调度操作票审核方法[J].云南电力技术,2022,50(S01):30-33.
4张学良,韩慧敏,许基兰.省际交界区空间发展格局及优化路径研究——以鄂豫陕三省交界区为例[J].重庆大学学报（社会科学版）,2023,29(1):10-23. 被引量：3
5黄泽青,刘予豪,方汉军,陈海诚,王海彬,陈镇秋,周驰.基于深度迁移学习模型实现股骨头坏死与其他髋部疾病的X线片鉴别诊断[J].中华骨科杂志,2023,43(1):72-80. 被引量：3
6金伟,李凤华,周紫妍,孙喜洋,郭云川.基于查询热度的密钥索引缓存[J].网络与信息安全学报,2023,9(1):83-91.

计算机应用

2023年第3期

浏览历史

内容加载中请稍等...

面向交通场景解析的局部和全局上下文注意力融合网络被引量：1

参考文献5

二级参考文献20

共引文献36

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向交通场景解析的局部和全局上下文注意力融合网络 被引量：1

参考文献5

二级参考文献20

共引文献36

同被引文献3

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向交通场景解析的局部和全局上下文注意力融合网络被引量：1