-
题名知识型视觉问答研究综述
- 1
-
-
作者
王瑞平
吴士泓
张美航
王小平
-
机构
华中科技大学人工智能与自动化学院
远光软件股份有限公司远光研究院
武汉科技大学机械自动化学院
-
出处
《计算机科学》
CSCD
北大核心
2023年第1期166-175,共10页
-
基金
国家自然科学基金(51975432)。
-
文摘
视觉问答作为人工智能完备性和视觉图灵测试的重要呈现形式,加上其具有潜在的应用价值,受到了计算机视觉和自然语言处理两个领域的广泛关注。知识在视觉问答中发挥着重要作用,特别是在处理复杂且开放的问题时,推理知识和外部知识对获取正确答案极为关键。蕴含知识的问答机制被称为知识型视觉问答,目前还没有针对知识型视觉问答的系统性调查。面向视觉问答中的知识参与方式和表达形式的研究能够有效填补知识型视觉问答体系中在文献综述方面存在的缺口。文中对知识型视觉问答的各组成单元进行了调查,对知识的存在形态进行了研究,提出了知识层级概念。进一步地,针对视觉特征提取、语言特征提取和多模态融合过程中的知识参与方式和表达形式进行了归纳和总结,并对未来发展趋势及研究方向进行了探讨。
-
关键词
视觉问答
知识分层
内部逻辑推理
外部知识库
知识表达形式
知识参与方式
-
Keywords
Visual question answering
Knowledge stratification
Internal logical reasoning
External knowledge base
Knowledge expression form
Knowledge participation method
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-