基于问题增强的问题引导图像视觉问答算法被引量：1

Question-Guided Image Attention Based on Question Enhancement for Visual Question Answering

下载PDF

导出

摘要为解决视觉问答(Visual Question Answering,VQA)算法中问题与图像缺乏推理关系的难题,提出了增强问题有用信息的问题引导图像注意力机制(Question Guide Image Attention,QGIA)视觉问答算法。该算法在问题特征提取过程中对关键词进行筛选,加强对问题有效信息的关注,实现对问题的注意,同时,该算法加强了对图像属性特征的关注,使图像信息更加丰富。通过问题强化和图像强化,引导图像特征根据有效问题特征更好地对问题作出回答,提高了视觉问答算法的有效性。将该算法在VQA V2.0数据集上实验验证,准确率达到67.89%。研究结论为视觉问答技术的实现提供了理论支持。 To explore the problem of the lack of reasoning relationship between the questions and the images in the VQA(Visual Question Answering)algorithm,a QGIA(Question-Guided Image Attention)mechanism visual question answering algorithm that enhances the useful information of questions is proposed.This algorithm selects keywords in the process of question feature extraction by strengthening the attention to the effective information of the question,so as to realize the attention to the question;at the same time,the algorithm strengthens the attention to image attribute features to enrich the image information.Through question and image enhancement,image features are guided to better answer the questions based on effective question features,which improves the effectiveness of visual question answering algorithms.The algorithm is experimentally verified on the VQA V2.0 dataset,and the accuracy rate reaches 67.89%.The research conclusions provide theoretical support for the realization of visual question answering technology.

作者陈婷王玉德任志伟 CHEN Ting;WANG Yude;REN Zhiwei(Qufu Normal University,Qufu Shandong 273165,China)

机构地区曲阜师范大学

出处《通信技术》 2022年第2期166-173,共8页 Communications Technology

基金山东省研究生导师指导能力提升计划项目(SDYY18119) 山东省研究生教学案例库建设项目(SDYAL21090)。

关键词视觉问答推理关系问题引导图像注意力机制 visual question answering reasoning relationship question-guided image attention attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献4

1兰红,张蒲芬.问题引导的空间关系图推理视觉问答模型[J].中国图象图形学报,2022,27(7):2274-2286. 被引量：4
2邹品荣,肖锋,张文娟,黄姝娟,张万玉.融合场景语义与空间关系的视觉问答[J].西安工业大学学报,2023,43(1):56-65. 被引量：1
3邹芸竹,杜圣东,滕飞,李天瑞.一种基于多模态深度特征融合的视觉问答模型[J].计算机科学,2023,50(2):123-129. 被引量：3
4张昊雨,张德.基于图结构的级联注意力视觉问答模型[J].计算机工程与应用,2023,59(6):155-161. 被引量：1

引证文献1

1张一飞,孟春运,蒋洲,栾力,Ernest Domanaanmwi Ganaa.可解释的视觉问答研究进展[J].计算机应用研究,2024,41(1):10-20. 被引量：1

二级引证文献1

1唐蕾,牛园园,王瑞杰,行本贝,王一婷.强化学习的可解释方法分类研究[J].计算机应用研究,2024,41(6):1601-1609.

1郑志权.问题引导实验助力提高课堂互动的有效性--以鲁科版“自由落体运动”教学为例[J].数理化解题研究,2022(3):89-91. 被引量：2
2蒋雪鹏.基于有效问题的地理教材编写分析——以人教版必修一为例[J].地理教学,2017(19):11-14.
3权海波,杨颖.视觉问答语言先验性研究综述[J].信息与电脑,2022,34(1):55-58. 被引量：1
4王静,王丽君,顾晓英,肖俊杰.以学生为中心的线上课程建设——以“生命智能”课程为例[J].高校医学教学研究（电子版）,2021,11(6):34-38. 被引量：1
5马荣,孙浩,都琳.基于小班研讨课程的教学模式探索与实践[J].高等数学研究,2022,25(1):89-91. 被引量：2
6长佩坤.精心设计问题发展学生思维[J].小学语文教学,2022(5):61-61.
7陈婷,王玉德,任志伟,杨昊,高张弛.图像与问题双引导注意力机制视觉问答算法[J].通信技术,2022,55(1):36-42.
8王鹏.“问题驱动”教学在高中化学教学中的实践研究[J].数理化解题研究,2022(3):107-109. 被引量：1
9QuestMobile:2021"银发"经济洞察报告[J].国际品牌观察（媒介）,2022(1):17-17.
10刘舸.关于课程思政教学设计的思考[J].教学研究,2022,45(1):72-76. 被引量：6

通信技术

2022年第2期

浏览历史

内容加载中请稍等...

基于问题增强的问题引导图像视觉问答算法被引量：1

同被引文献4

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于问题增强的问题引导图像视觉问答算法 被引量：1

同被引文献4

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于问题增强的问题引导图像视觉问答算法被引量：1