-
题名面向自动驾驶的交通场景语义分割
被引量:11
- 1
-
-
作者
何淼楹
崔宇超
-
机构
四川大学电子信息学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第S01期25-30,共6页
-
基金
四川省重点研发计划项目(2019YFG0409)。
-
文摘
交通场景语义分割在自动驾驶中必不可少。为了解决目前的交通场景语义分割方法中由于池化、卷积等操作而造成的目标边界分割模糊、多类别目标及相似物体分割精度低等问题,提出一种带注意力机制的卷积神经网络分割方法。特征提取时,引入多样化的扩张卷积,以挖掘多尺度的语义信息。在信息解码后,添加通道及空间双注意力模块,可以在通道和空间两个维度层面进行注意力特征提取,让网络在学习过程中更侧重于重要信息。在Cityscapes数据集上的实验结果表明,该语义分割网络的平均交并比(MIoU)可达71.6%,超过了基网络为ResNet50的DeepLabv3+语义分割网络。所提方法能更加精细地分割出近似物体及多类别目标,对复杂交通场景图像的理解力更强。
-
关键词
语义分割
自动驾驶
DeepLabv3+网络
场景理解
注意力机制
-
Keywords
semantic segmentation
autonomous driving
DeepLabv3+network
scene understanding
attention mechanism
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于帧间辅助的视频人群计数
被引量:1
- 2
-
-
作者
崔宇超
何淼楹
胡诗雨
-
机构
四川大学电子信息学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第S01期69-74,共6页
-
基金
四川省重点研发计划项目(2019YFG0409)。
-
文摘
当前流行的人群计数方法仅利用单张图片作为输入,但是,在很多实际的情况下,需要在视频监控器中部署人群计数任务。在视频中,相邻帧之间的上下文信息可以辅助人群计数。而相比与其他高计算损耗的视频人群计数方法,对视频人群计数提出了一种新的方法叫帧间辅助人群计数(CCIA)。该方法以级联卷积神经网络为基本网络模型,仅以相邻帧为输入,通过两阶段的训练实现了帧间关联。具体地,该方法利用空间转移网络获取相邻帧之间空间转移特性,同时添加了通道注意力机制模块以自适应融合相邻帧的特征,并最终获得了出色的性能。在Mall数据集中,结合空间转移网络和通道注意力机制的模型的方法的平均绝对误差(MAE)和均方误差(MSE)为1.71和2.20,相较于区域空间变换网络(LSTN)分别降低了14.50%和12.00%;在FDST数据集中,结合空间转移网络模型的方法的MAE和MSE为2.09和2.75,相较于LSTN分别降低了37.61%和38.20%。实验结果表明,结合空间转移网络和通道注意力机制的模型的方法可以更加准确地估计人群的数量。
-
关键词
相邻帧
空间变换网络
人群计数
注意力机制
神经网络
-
Keywords
neighbour frame
spatial transformer network
crowd counting
attention mechanism
neural network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-