期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种融合多模态特征的视频暴力检测方法
被引量:
4
1
作者
马境远
刘鲲
傅慧源
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2021年第5期861-867,共7页
暴力事件检测是视频内容智能分析的一个常见任务,在互联网视频内容审查、影视作品分析、安防视频监控等领域有重要应用。面向视频中暴力检测任务,提出了一个包含关系网络和注意力机制的方法来融合视频中的多模态特征,该方法首先使用深...
暴力事件检测是视频内容智能分析的一个常见任务,在互联网视频内容审查、影视作品分析、安防视频监控等领域有重要应用。面向视频中暴力检测任务,提出了一个包含关系网络和注意力机制的方法来融合视频中的多模态特征,该方法首先使用深度学习提取视频中多个模态特征,如音频特征、光流特征、视频帧特征,接着组合不同的模态特征,利用关系网络来建模多模态之间的关系;然后基于深度神经网络设计了多头注意力模块,学习多个不同的注意力权重来聚焦视频的不同方面,以生成区分力强的视频特征。该方法可以融合视频中多个模态,提高了暴力检测准确率。在公开数据集上训练和验证的实验结果表明,提出的多模态特征融合方法,与仅使用单模态数据的方法和现有多模态融合的方法相比,具有明显的优势,检测准确率分别提升了4.89%和1.66%。
展开更多
关键词
注意力机制
关系网络
多模态融合
暴力检测
视频内容分析
下载PDF
职称材料
一种多尺度光流预测与融合的实时视频插帧方法
被引量:
6
2
作者
马境远
王川铭
《小型微型计算机系统》
CSCD
北大核心
2021年第12期2567-2571,共5页
普通摄像设备拍摄的视频帧速率有限,从而影响观众的特殊观感体验,提高视频帧速率的后处理过程是必不可少的,视频插帧就是其中关键技术之一.视频插帧是指根据两个连续视频帧合成中间帧数据,在影视作品、体育比赛精彩视频片段慢动作回放...
普通摄像设备拍摄的视频帧速率有限,从而影响观众的特殊观感体验,提高视频帧速率的后处理过程是必不可少的,视频插帧就是其中关键技术之一.视频插帧是指根据两个连续视频帧合成中间帧数据,在影视作品、体育比赛精彩视频片段慢动作回放等方面有广泛的应用.基于光流的视频插帧方法能有效解决视频中场景、目标的移动估计问题,但是其受制于光流估计的速度,无法很好地应用于实时视频任务.本文提出一种新的光流预测模型,并将其用于视频插帧任务中.首先对于输入的两张连续视频帧数据进行多次信息无损的下采样,获得不同尺度的输入数据;之后通过卷积神经网络进行特征提取,并对提取的特征建立注意力掩码,增强特征表达能力,根据该特征生成对应尺度的光流;最后使用融合网络,将多尺度的光流信息聚合为统一的尺度作为最终输出.本文方法能够被端到端的优化训练,并在大规模视频插帧基准数据集上进行了训练和验证测试.结果表明该方法能够获得高质量的插帧效果并能够达到实时的插帧速率,而且比其它先进方法更具优越性.
展开更多
关键词
视频插帧
光流估计
端到端训练
特征融合
注意力机制
下载PDF
职称材料
题名
一种融合多模态特征的视频暴力检测方法
被引量:
4
1
作者
马境远
刘鲲
傅慧源
机构
北邮感知技术研究院(江苏)有限公司
北京邮电大学智能通信软件与多媒体北京市实验室
出处
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2021年第5期861-867,共7页
基金
国家自然科学基金(61872047)
北邮-传音“视觉感知与计算”联合实验室项目。
文摘
暴力事件检测是视频内容智能分析的一个常见任务,在互联网视频内容审查、影视作品分析、安防视频监控等领域有重要应用。面向视频中暴力检测任务,提出了一个包含关系网络和注意力机制的方法来融合视频中的多模态特征,该方法首先使用深度学习提取视频中多个模态特征,如音频特征、光流特征、视频帧特征,接着组合不同的模态特征,利用关系网络来建模多模态之间的关系;然后基于深度神经网络设计了多头注意力模块,学习多个不同的注意力权重来聚焦视频的不同方面,以生成区分力强的视频特征。该方法可以融合视频中多个模态,提高了暴力检测准确率。在公开数据集上训练和验证的实验结果表明,提出的多模态特征融合方法,与仅使用单模态数据的方法和现有多模态融合的方法相比,具有明显的优势,检测准确率分别提升了4.89%和1.66%。
关键词
注意力机制
关系网络
多模态融合
暴力检测
视频内容分析
Keywords
attention module
relation network
multimodal fusion
violence detection
video content analysis
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种多尺度光流预测与融合的实时视频插帧方法
被引量:
6
2
作者
马境远
王川铭
机构
北邮感知技术研究院(江苏)有限公司
北京邮电大学智能通信软件与多媒体北京市实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第12期2567-2571,共5页
基金
国家自然科学基金项目(61872047)资助
北邮-传音“视觉感知与计算”联合实验室项目资助。
文摘
普通摄像设备拍摄的视频帧速率有限,从而影响观众的特殊观感体验,提高视频帧速率的后处理过程是必不可少的,视频插帧就是其中关键技术之一.视频插帧是指根据两个连续视频帧合成中间帧数据,在影视作品、体育比赛精彩视频片段慢动作回放等方面有广泛的应用.基于光流的视频插帧方法能有效解决视频中场景、目标的移动估计问题,但是其受制于光流估计的速度,无法很好地应用于实时视频任务.本文提出一种新的光流预测模型,并将其用于视频插帧任务中.首先对于输入的两张连续视频帧数据进行多次信息无损的下采样,获得不同尺度的输入数据;之后通过卷积神经网络进行特征提取,并对提取的特征建立注意力掩码,增强特征表达能力,根据该特征生成对应尺度的光流;最后使用融合网络,将多尺度的光流信息聚合为统一的尺度作为最终输出.本文方法能够被端到端的优化训练,并在大规模视频插帧基准数据集上进行了训练和验证测试.结果表明该方法能够获得高质量的插帧效果并能够达到实时的插帧速率,而且比其它先进方法更具优越性.
关键词
视频插帧
光流估计
端到端训练
特征融合
注意力机制
Keywords
video frame interpolation
optical flow estimation
end-to-end training
feature fusion
attention mechanism
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种融合多模态特征的视频暴力检测方法
马境远
刘鲲
傅慧源
《重庆邮电大学学报(自然科学版)》
CSCD
北大核心
2021
4
下载PDF
职称材料
2
一种多尺度光流预测与融合的实时视频插帧方法
马境远
王川铭
《小型微型计算机系统》
CSCD
北大核心
2021
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部