基于注意力机制的交通场景图像描述生成算法

IMAGE CAPTION ALGORITHM OF TRAFFIC SCENE BASED ON ATTENTION MECHANISM

下载PDF

导出

摘要针对交通场景复杂多变,主要体现在道路拓扑结构复杂、道路元素和交通参与者类型的多样性问题,提出一种基于注意力机制的图像描述生成算法。在算法的编码阶段,利用卷积神经网络提取图像不同区域的图像特征,每个区域融合注意力机制用来获取具有注意力权值的图像特征,突出图像中的重点信息。解码阶段,利用多个长短期记忆网络模块作为交通场景图像描述生成任务的语言模型。实验结果表明:在MSCOCO验证数据集中,该算法在评估指标BLEU-1至BLEU-4上分值分别为0.735、0.652、0.368和0.323,所提算法能够很好地描述交通场景图像。 The traffic scene is complex and changeable,mainly reflected in the complexity of the road topology,the diversity of road elements and types of traffic participants.Focused on the above problem,this paper proposes an image caption algorithm based on attention mechanism.In the encoder phase of the algorithm,the convolutional neural network was used to extract the image features in different areas,and then the fusion attention mechanism was used to obtain the image features with attention weight and highlight the key information in the image.In the decoder stage,the multiple long short term memory network was used as a language model for generating a task of the traffic scene image caption.The experimental results show that on the MSCOCO dataset,the scores of BLEU-1,2,3,4 are 0.735,0.652,0.368 and 0.323.The proposed algorithm can describe the traffic scene image well.

作者宋禄琴玄祖兴王彩云 Song Luqin;Xuan Zuxing;Wang Caiyun(Beijing Key Laboratory of Information Service Engineering,Beijing Union University,Beijing 100101,China;Institute of Fundamental and Interdisciplinary Sciences,Beijing Union University,Beijing 100101,China)

机构地区北京联合大学北京市信息服务工程重点实验室北京联合大学基础与交叉科学研究所

出处《计算机应用与软件》北大核心 2022年第11期201-207,共7页 Computer Applications and Software

基金北京市属高校高水平教师队伍建设支持计划项目(IDHT20170511) 北京联合大学人才强校优选计划项目(BPHR2020EZ01) 北京联合大学研究生项目。

关键词交通场景图像注意力机制卷积神经网络长短期记忆网络图像描述生成 Traffic scene image Attention mechanism Convolutional neural networks Long short term memoryImage caption

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献3

1隋靓,党建武.基于运动目标轨迹的高速公路异常事件检测算法研究[J].计算机应用与软件,2018,35(1):246-252. 被引量：12
2曲仕茹,席玉玲,丁松涛.基于深度学习的交通场景语义描述[J].西北工业大学学报,2018,36(3):522-527. 被引量：6
3黄友文,游亚东,赵朋.融合卷积注意力机制的图像描述生成模型[J].计算机应用,2020,40(1):23-27. 被引量：13

二级参考文献29

1王殿海,胡宏宇,李志慧,曲昭伟.违章停车检测与识别算法[J].吉林大学学报（工学版）,2010,40(1):42-46. 被引量：17
2于万霞,杜太行.基于彩色空间的背景帧差法视频车辆检测[J].计算机仿真,2010,27(1):285-287. 被引量：13
3康晓晶,吴谨.基于高斯背景建模的目标检测技术[J].液晶与显示,2010,25(3):454-459. 被引量：25
4柴毅,阳小燕,尹宏鹏,匡金骏.基于运动区域检测的运动目标跟踪算法[J].计算机应用研究,2010,27(12):4787-4789. 被引量：13
5陈维荣,关佩,邹月娴.基于SVM的交通事件检测技术[J].西南交通大学学报,2011,46(1):63-67. 被引量：18
6贺强,晏立.基于LOG和Canny算子的边缘检测算法[J].计算机工程,2011,37(3):210-212. 被引量：76
7赵有婷,李熙莹,罗东华.基于视频车辆轨迹模型的交通事件自动检测方法研究[J].中山大学学报（自然科学版）,2011,50(4):56-60. 被引量：20
8余孟泽,刘正熙,骆键,杨丹.融合纹理特征和阴影属性的阴影检测方法[J].计算机工程与设计,2011,32(10):3431-3434. 被引量：12
9王卫锋,黄翰,郝志峰,谭志标.仿昆虫复眼的交通视频停车事件检测方法[J].计算机工程与应用,2012,48(6):246-248. 被引量：4
10马文罗,胡建新,钱东海.基于视觉的运动目标伺服跟踪研究[J].计算机工程,2012,38(8):183-185. 被引量：6

共引文献28

1周宇辉,何志琴.基于改进注意力机制的图像描述算法[J].智能计算机与应用,2022,12(2):58-63. 被引量：1
2赵怀鑫,张英杰,邓然然,丁明航,孙朝云,李伟.基于快速峰值聚类的高速公路异常事件识别方法[J].长安大学学报（自然科学版）,2018,38(5):205-212. 被引量：2
3康成龙,艾瑶.公路交通事件检测研究综述[J].交通工程,2019,19(2):19-24. 被引量：6
4孙梦婷,魏海平,李星滢,徐立.基于路况数据的城市道路交通事件点检测[J].地理与地理信息科学,2019,35(6):9-14. 被引量：5
5张桂梅,潘国峰.基于自适应对抗学习的半监督图像语义分割[J].南昌航空大学学报（自然科学版）,2019,33(3):32-40. 被引量：2
6张桂梅,潘国峰,刘建新.域自适应城市场景语义分割[J].中国图象图形学报,2020,25(5):913-925. 被引量：6
7李梦莹,王晓东,阮书岚,张琨,刘淇.基于双路注意力机制的学生成绩预测模型[J].计算机研究与发展,2020,57(8):1729-1740. 被引量：18
8高春艳,唐佳强,吕晓玲,张明路.移动机器人目标检测技术及其安保场合应用[J].机械设计,2020,37(6):58-64. 被引量：4
9王朋,张四海,吴非,孙永良,乔羽.基于双目视觉的违章车辆检测与跟踪系统设计[J].中小企业管理与科技,2020(19):194-196.
10豆秀梅,胡晓光,闫超德,沙月进.基于高清摄像机的高速公路路面散落物自动检测方法研究[J].地理信息世界,2020,27(4):90-94. 被引量：2

1刘名洋,宋瑞,周建华,曾立锵.自动驾驶轨迹预测规划技术及在交叉路口下的应用[J].北京汽车,2022(3):1-7. 被引量：1
2殷成竹.语言景观中参与者因素研究综述[J].现代语文,2022(2):84-90. 被引量：1
3周建华,宋瑞,刘名洋,邹志亮.交叉路口场景下自动驾驶感知识别关键技术研究[J].中国汽车,2022(5):32-38.
4于鑫,虞瑾蒨.境外市场国债期权大宗交易制度研究[J].债券,2022(6):89-96.
5朱寰,徐健翔,刘国静,岳芬,俞振华,张兴.英国储能相关政策机制与商业模式及对我国的启示[J].储能科学与技术,2022,11(1):370-378. 被引量：23
6刘伟,佟天旭,田咪,孙佳.自动驾驶车辆视觉全局定位研究综述[J].北京信息科技大学学报（自然科学版）,2022,37(5):74-83.
7姜文晖,占锟,程一波,夏雪,方玉明.结合多层级解码器和动态融合机制的图像描述[J].中国图象图形学报,2022,27(9):2775-2787. 被引量：3
8杨文瑞,沈韬,朱艳,曾凯,刘英莉.融合ELMo词嵌入的多模态Transformer的图像描述算法[J].计算机工程与应用,2022,58(21):223-231. 被引量：1
9刘皓,洪宇,朱巧明.无监督的领域自适应机器阅读理解方法[J].计算机学报,2022,45(10):2133-2150. 被引量：1
10魏祥野.尊重与保留、创新与融合、和谐与再生--以城市更新实践泉州市老年医院改建工程为例[J].福建建设科技,2022(6):5-9.

计算机应用与软件

2022年第11期

浏览历史

内容加载中请稍等...

基于注意力机制的交通场景图像描述生成算法

参考文献3

二级参考文献29

共引文献28

相关作者

相关机构

相关主题

浏览历史