期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
可解释的视觉问答研究进展
被引量:
1
1
作者
张一飞
孟春运
+2 位作者
蒋洲
栾力
Ernest Domanaanmwi Ganaa
《计算机应用研究》
CSCD
北大核心
2024年第1期10-20,共11页
在视觉问答(VQA)任务中,“可解释”是指在特定的任务中通过各种方法去解释模型为什么有效。现有的一些VQA模型因为缺乏可解释性导致模型无法保证在生活中能安全使用,特别是自动驾驶和医疗相关的领域,将会引起一些伦理道德问题,导致无法...
在视觉问答(VQA)任务中,“可解释”是指在特定的任务中通过各种方法去解释模型为什么有效。现有的一些VQA模型因为缺乏可解释性导致模型无法保证在生活中能安全使用,特别是自动驾驶和医疗相关的领域,将会引起一些伦理道德问题,导致无法在工业界落地。主要介绍视觉问答任务中的各种可解释性实现方式,并分为了图像解释、文本解释、多模态解释、模块化解释和图解释五类,讨论了各种方法的特点并对其中的一些方法进行了细分。除此之外,还介绍了一些可以增强可解释性的视觉问答数据集,这些数据集主要通过结合外部知识库、标注图片信息等方法来增强可解释性。对现有常用的视觉问答可解释方法进行了总结,最后根据现有视觉问答任务中可解释性方法的不足提出了未来的研究方向。
展开更多
关键词
视觉问答
视觉推理
可解释性
人工智能
自然语言处理
计算机视觉
下载PDF
职称材料
题名
可解释的视觉问答研究进展
被引量:
1
1
作者
张一飞
孟春运
蒋洲
栾力
Ernest Domanaanmwi Ganaa
机构
江苏科技
大学
经济管理
学院
江苏
大学
计算机
科学与
通信工程
学院
中国
科学
技术
大学
公共事务
学院
希拉·利曼技术大学应用科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2024年第1期10-20,共11页
基金
国家社科基金重点项目(16AJL008)
江苏省社科基金青年项目(22EYC001)
江苏高校哲学社会科学研究一般项目(2019SJA1927)。
文摘
在视觉问答(VQA)任务中,“可解释”是指在特定的任务中通过各种方法去解释模型为什么有效。现有的一些VQA模型因为缺乏可解释性导致模型无法保证在生活中能安全使用,特别是自动驾驶和医疗相关的领域,将会引起一些伦理道德问题,导致无法在工业界落地。主要介绍视觉问答任务中的各种可解释性实现方式,并分为了图像解释、文本解释、多模态解释、模块化解释和图解释五类,讨论了各种方法的特点并对其中的一些方法进行了细分。除此之外,还介绍了一些可以增强可解释性的视觉问答数据集,这些数据集主要通过结合外部知识库、标注图片信息等方法来增强可解释性。对现有常用的视觉问答可解释方法进行了总结,最后根据现有视觉问答任务中可解释性方法的不足提出了未来的研究方向。
关键词
视觉问答
视觉推理
可解释性
人工智能
自然语言处理
计算机视觉
Keywords
visual question answering
visual reasoning
explainability
artificial intelligence
natural language processing
computer vision
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
可解释的视觉问答研究进展
张一飞
孟春运
蒋洲
栾力
Ernest Domanaanmwi Ganaa
《计算机应用研究》
CSCD
北大核心
2024
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部