基于深度学习的视觉问答系统被引量：1

Visual Question Answering System Based on Deep Learning

下载PDF

导出

摘要随着互联网的发展,人类可以获得的信息量呈指数型增长,我们能够从数据中获得的知识也大大增多,之前被搁置的人工智能再一次焕发活力。随着人工智能的不断发展,近年来,产生了视觉问答(VQA)这一课题,并发展成为人工智能的一大热门问题。视觉问答(VQA)系统需要将图片和问题作为输入,结合图片及问题中的信息,产生一条人类语言作为输出。视觉问答(VQA)的关键解决方案在于如何融合从输入图像和问题中提取的视觉和语言特征。本文围绕视觉问答问题,从概念、模型等方面对近年来的研究进展进行综述,同时探讨现有工作存在的不足;最后对视觉问答未来的研究方向进行了展望。 With the development of the internet,the amount of information available to human beings increases exponentially, and the amount of knowledge we can get from the data also increases greatly. Artificial intelligence,which had been put on hold, is radiate vitality. With the continuous development of artificial intelligence, in recent years,visual question answer (VQA) has emerged as a hot topic in the field of artificial intelligence. Visual question answer (VQA) system needs to take pictures and questions as input and combine these two parts of information to produce a human language as output. The key solution for VQA is how to fuse visual and linguistic features extracted from input images and questions. This paper focuses on the visual question and answer,summarizes the research progress in recent years from the aspects of concept and model,and discusses the existing deficiencies. Finally,the future research direction of VQA are prospected.

作者葛梦颖孙宝山 GE Mengying;SUN Baoshan(School of Computer Science and Technology,Tianjin Polytechnic University,Tianjin 300387,China)

机构地区天津工业大学计算机科学与技术学院

出处《现代信息科技》 2019年第11期11-13,16,共4页 Modern Information Technology

关键词深度学习人工智能视觉问答自然语言处理 deep learning artificial intelligence visual question answer natural language processing

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献1

1杨睿,刘瑞军,师于茜,李善玺.面向智能交互的视觉问答研究综述[J].电子测量与仪器学报,2019,31(2):117-124. 被引量：11

引证文献1

1王天星,袁家斌,刘昕.基于同等注意力图网络的视觉问答方法[J].计算机与现代化,2021(11):1-6.

1车力莫格,刘鹏飞.“乌力格尔”语言特征研究[J].北方文学,2019,0(23):257-257.
2刘诗琦.融媒体时代网络综艺节目的语言特点——以《奇葩说》为例[J].戏剧之家,2019,0(21):103-103. 被引量：2
3郭媛媛.空巢老人生活质量的影响因素及对策[J].大众投资指南,2019,0(7):289-289.
4燕晓山.让美工助力店铺流量——以淘宝店铺为例[J].戏剧之家,2019,0(21):144-145.
5陈瑛,陈昂轩,董玉博,赵筱钰,侯文俊.基于LSTM的食品安全自动问答系统方法研究[J].农业机械学报,2019,50(B07):380-384. 被引量：11
6胡婕,陶宏才.基于深度学习的领域问答系统的设计与实现[J].成都信息工程大学学报,2019,34(3):232-237. 被引量：2
7倪树森,丁月华,许小楠.图说编辑工作中批量信函的制作[J].黑龙江畜牧兽医,2019,0(12):31-33. 被引量：1
8唐燕飞.寿生的民歌理论及诗歌创作刍议[J].遵义师范学院学报,2019,21(4):89-92.
9范志生.经济增长与教育财政支出区域性差异分析[J].合作经济与科技,2019,0(16):6-9. 被引量：1

现代信息科技

2019年第11期

浏览历史

内容加载中请稍等...

基于深度学习的视觉问答系统被引量：1

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度学习的视觉问答系统 被引量：1

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度学习的视觉问答系统被引量：1