-
题名面向视频行为识别深度模型的数据预处理方法
- 1
-
-
作者
安峰民
张冰冰
董微
张建新
-
机构
大连民族大学计算机科学与工程学院
大连理工大学信息与通信工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第2期281-287,共7页
-
基金
国家自然科学基金(61972062)
辽宁省应用基础研究计划项目(2023JH2/101300191,2023JH2/101300193)。
-
文摘
以视频帧采样和数据增强为代表的预处理操作是提升视频行为识别深度模型性能的重要手段。针对现有视频数据预处理存在的采样视频帧区分性不足、数据增强方式单一等问题,提出一种面向视频行为识别深度模型的数据预处理方法。在视频帧采样上设计动作指导的片段化视频采样策略,综合考虑视频帧间差异特征与视频片段短期时序特征,通过显著行为动作获取关键视频帧并对其邻近视频帧进行采样,有效提高所选取视频帧的时空区分能力。借鉴图像分类中的随机数据增强方法,以随机数据增强方式对采样后视频短片段进行数据增强处理,使视频识别深度模型学习到更复杂的空间变化信息。根据2个公开的视频识别数据集和2个代表性的网络模型的评估实验结果表明,所提预处理方法可以使基准模型获得2.5个百分点以上的准确率提升,最高可提升6.8个百分点。上述实验结果验证了所提预处理方法在视频行为识别任务中的有效性。
-
关键词
视频行为识别
预处理方法
动作指导的片段化视频采样
数据增强
深度学习
-
Keywords
video action recognition
preprocessing method
motion-guided fragmented video sampling
data augmentation
deep learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-