期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
利用全局与局部帧级特征进行基于共享注意力的视频问答
被引量:
1
1
作者
王雷全
候文艳
+3 位作者
袁韶祖
赵欣
林瑶
吴春雷
《计算机科学》
CSCD
北大核心
2021年第8期145-149,共5页
视频问答是视觉理解领域中非常重要且具有挑战性的任务。目前的视觉问答(VQA)方法主要关注单个静态图片的问答,而现实生活中的数据是立体动态的视频。此外,由于问题的复杂性,视频问答任务必须根据问答问题恰当地处理多种视觉特征才能获...
视频问答是视觉理解领域中非常重要且具有挑战性的任务。目前的视觉问答(VQA)方法主要关注单个静态图片的问答,而现实生活中的数据是立体动态的视频。此外,由于问题的复杂性,视频问答任务必须根据问答问题恰当地处理多种视觉特征才能获得高质量的答案。文中提出了一个通过利用局部和全局帧级别的视觉信息来进行视频问答的多共享注意力网络。具体来说,以不同帧率提取视频帧,并以此提取帧级的全局与局部视觉特征,这两种特征包含了多个帧级别特征,用于对视频时间动态建模,再以共享注意力的形式建模全局与局部视觉特征的相关性,然后结合文本问题来推断答案。在天池视频问答数据集上进行了大量的实验,验证了所提方法的有效性。
展开更多
关键词
视频问答
共享注意力机制
全局和局部帧级特征
下载PDF
职称材料
基于多粒度视频信息和注意力机制的视频场景识别
被引量:
2
2
作者
袁韶祖
王雷全
吴春雷
《计算机系统应用》
2020年第5期252-256,共5页
视频场景识别是机器学习和计算机视觉一个重要的研究领域.但是当前对于视频场景识别的探索工作还远远不够,而且目前提出的模型大都使用视频级的特征信息,忽略了多粒度的视频特征关联.本文提出了一种基于多粒度的视频特征的注意力机制的...
视频场景识别是机器学习和计算机视觉一个重要的研究领域.但是当前对于视频场景识别的探索工作还远远不够,而且目前提出的模型大都使用视频级的特征信息,忽略了多粒度的视频特征关联.本文提出了一种基于多粒度的视频特征的注意力机制的模型架构,可以动态高效的利用各维度视频信息之间存在的丰富的语义关联,提高识别准确度.本文在中国多媒体大会(CCF ChinaMM 2019)最新推出的VideoNet数据集上进行了实验,实验结果表明基于多粒度的视频特征的注意力机制的模型与传统方法相比具有明显的优越性.
展开更多
关键词
视频场景识别
注意力机制
多粒度视频信息
卷积神经网络
检测网络
下载PDF
职称材料
题名
利用全局与局部帧级特征进行基于共享注意力的视频问答
被引量:
1
1
作者
王雷全
候文艳
袁韶祖
赵欣
林瑶
吴春雷
机构
中国石油大学(华东)计算机科学与技术学院
中国石油大学(华东)海洋与空间信息学院
出处
《计算机科学》
CSCD
北大核心
2021年第8期145-149,共5页
基金
科技部重点研发计划(2018YFC1406204),中央高校基本科研业务费专项资金(19CX05003A-11)。
文摘
视频问答是视觉理解领域中非常重要且具有挑战性的任务。目前的视觉问答(VQA)方法主要关注单个静态图片的问答,而现实生活中的数据是立体动态的视频。此外,由于问题的复杂性,视频问答任务必须根据问答问题恰当地处理多种视觉特征才能获得高质量的答案。文中提出了一个通过利用局部和全局帧级别的视觉信息来进行视频问答的多共享注意力网络。具体来说,以不同帧率提取视频帧,并以此提取帧级的全局与局部视觉特征,这两种特征包含了多个帧级别特征,用于对视频时间动态建模,再以共享注意力的形式建模全局与局部视觉特征的相关性,然后结合文本问题来推断答案。在天池视频问答数据集上进行了大量的实验,验证了所提方法的有效性。
关键词
视频问答
共享注意力机制
全局和局部帧级特征
Keywords
Video question answering
Shared attention mechanism
Global and local pathways
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多粒度视频信息和注意力机制的视频场景识别
被引量:
2
2
作者
袁韶祖
王雷全
吴春雷
机构
中国石油大学(华东)计算机科学与技术学院
出处
《计算机系统应用》
2020年第5期252-256,共5页
基金
山东省重点研发计划(2019GGX101015)
中央高校自主创新科研计划(17CX02041A,18CX02136A)。
文摘
视频场景识别是机器学习和计算机视觉一个重要的研究领域.但是当前对于视频场景识别的探索工作还远远不够,而且目前提出的模型大都使用视频级的特征信息,忽略了多粒度的视频特征关联.本文提出了一种基于多粒度的视频特征的注意力机制的模型架构,可以动态高效的利用各维度视频信息之间存在的丰富的语义关联,提高识别准确度.本文在中国多媒体大会(CCF ChinaMM 2019)最新推出的VideoNet数据集上进行了实验,实验结果表明基于多粒度的视频特征的注意力机制的模型与传统方法相比具有明显的优越性.
关键词
视频场景识别
注意力机制
多粒度视频信息
卷积神经网络
检测网络
Keywords
video scene recognition
attention mechanism
multi-granularity video features
CNN
detection network
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
利用全局与局部帧级特征进行基于共享注意力的视频问答
王雷全
候文艳
袁韶祖
赵欣
林瑶
吴春雷
《计算机科学》
CSCD
北大核心
2021
1
下载PDF
职称材料
2
基于多粒度视频信息和注意力机制的视频场景识别
袁韶祖
王雷全
吴春雷
《计算机系统应用》
2020
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部