基于互信息熵和NetVLAD的视频关键帧提取方法

Video Keyframe Extraction Based on Mutual Information Entropy and NetVLAD

导出

摘要针对现有关键帧提取方法时间复杂度高、漏检率大、忽略视频语义信息等问题,提出一种基于互信息熵和局部聚合描述符向量网络(vector of local aggregated descriptors net,NetVLAD)的视频关键帧提取方法。首先计算视频帧互信息熵,将视频划分为视频子集;然后通过NetVLAD进行视频帧的特征提取与聚类,根据最近邻匹配算法计算帧间距离,提取候选关键帧;最后通过感知哈希减少冗余度,得到关键帧集合。基于UAV-123数据集进行了实验分析,结果表明,该方法高鲁棒地提高了关键帧的提取效率,保证了高保真度的同时降低了关键帧的冗余。 To solve the problems of existing key frame extraction methods, such as high time complexity, high miss rate and video semantic information neglect, we propose a video keyframe extraction method based on mutual information entropy and vector of local aggregated descriptors net(NetVLAD). First, we calculate the mutual information entropy of video frames and divide the video into video subsets. Then, feature extraction and clustering of video frames are carried out by NetVLAD. The similarity between frames is calculated by the nearest neighbor matching algorithm, and candidate keyframes are extracted. Finally, the redundancy is reduced by perceptual hashing, and the keyframe set is obtained. Experimental analysis based on UAV-123 data set proves that the proposed method improves the extraction efficiency of keyframes with high robustness and reduces the redundancy of key frames with high fidelity.

作者康佳慧纪松范大昭储光涵李林林 KANG Jiahui;JI Song;FAN Dazhao;CHU Guanghan;LI Linlin(Institute of Geospatial Information,Information Engineering University,Zhengzhou 450001,China;SongshanLaboratory,Zhengzhou450046,China;Henan College of Surveying and Mapping,Zhengzhou 450015,China)

机构地区信息工程大学地理空间信息学院嵩山实验室河南测绘职业学院

出处《测绘地理信息》 CSCD 2024年第2期62-67,共6页 Journal of Geomatics

基金国家自然科学基金(41971427) 高分遥感测绘应用示范系统(二期)(42-Y30B04-9001-19/21) 嵩山实验室项目(纳入河南省重大科技专项管理体系)(221100211000-4)。

关键词视频关键帧互信息熵局部聚合描述符感知哈希 video keyframe mutual information entropy local aggregated descriptor perceptual hashing

分类号 P237 [天文地球—摄影测量与遥感] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1王倩,张新明,蔡强,祝晓斌.基于改进VLAD算法的图像分类[J].计算机应用研究,2018,35(10):3151-3154. 被引量：3
2胡湘萍,代江华.多特征编码融合的图像分类研究[J].电子器件,2021,44(5):1227-1233. 被引量：2
3柳似霖,王颖,吴峰.基于局部特征词袋模型人体动作识别关键帧选取方法[J].应用光学,2019,40(2):265-270. 被引量：11
4张佳豪,千博.基于MI-SURF特征的关键帧提取算法[J].无线互联科技,2019,16(3):111-113. 被引量：1
5高永,郝晓丽,吕进来.互信息熵和Prewitt差测度的Lasso模型关键帧提取[J].中国科技论文,2017,12(20):2342-2348. 被引量：6
6胡志军,徐勇.基于内容的视频检索综述[J].计算机科学,2020,47(1):117-123. 被引量：15
7周育新,白宏阳,李伟,郭宏伟,徐啸康.基于关键帧的轻量化行为识别方法研究[J].仪器仪表学报,2020,41(7):196-204. 被引量：8

二级参考文献23

1时永刚,邹谋炎.图像配准中统计型相似性测度的比较与分析[J].计算机学报,2004,27(9):1278-1283. 被引量：16
2施游,黄少年,张友生.基于交互信息量和联合熵的镜头检测算法[J].计算机工程与应用,2006,42(30):54-56. 被引量：8
3王学军,丁红涛,陈贺新.一种基于镜头聚类的视频场景分割方法[J].中国图象图形学报,2007,12(12):2127-2131. 被引量：13
4蔡家楣,陈洋,陈铁明,张旭东.结合互信息量与模糊聚类的关键帧提取方法[J].计算机系统应用,2010,19(4):73-76. 被引量：6
5马天才,陈淑静.基于修补粒子群算法的红外目标跟踪[J].应用光学,2010,31(5):843-846. 被引量：1
6秦剑鹏,符茂胜,涂铮铮,罗斌.基于颜色直方图变化率的视频镜头检测[J].计算机应用与软件,2011,28(4):17-20. 被引量：12
7付朝霞,王黎明.基于时空兴趣点的人体行为识别[J].微电子学与计算机,2013,30(8):28-30. 被引量：7
8李瑞峰,王亮亮,王珂.人体动作行为识别研究综述[J].模式识别与人工智能,2014,27(1):35-48. 被引量：96
9钱钧,杨恒,刘培桢,姜文涛,周锋飞.一种基于词袋模型的大规模图像层次化分组算法[J].应用光学,2014,35(5):799-805. 被引量：4
10章亦葵,赵晖.基于预处理的视频镜头边界检测算法[J].计算机应用,2014,34(11):3327-3331. 被引量：3

共引文献38

1建中华,南静,刘鑫,代伟.基于时空张量融合的人体骨架行为自适应识别方法[J].仪器仪表学报,2023,44(6):74-85. 被引量：1
2彭玉青,刘璇,王纬华,赵晓松,魏铭.融合场景因素的视频内容理解模型[J].中国科技论文,2018,13(14):1584-1589.
3王琰,郭立强.基于中频滤波的聚焦测度研究[J].淮阴师范学院学报（自然科学版）,2019,18(4):307-312. 被引量：1
4张琳娜,梁列全,郑心炜,阚世超,岑翼刚.基于最近邻量化距离聚类的残差中心聚合图像表示[J].数据采集与处理,2020,35(1):79-88. 被引量：2
5张文慧,赵强.基于Prewitt算法的颅内CT图像病灶分割算法[J].生物医学工程研究,2020,39(2):156-160. 被引量：1
6彭岩,冯婷婷,王洁.基于集成学习的O3的质量浓度预测模型[J].山东大学学报（工学版）,2020,50(4):1-7. 被引量：3
7孔祥魁,向华.激光传感器感知信息的运动动作矫正研究[J].激光杂志,2020,41(11):179-182. 被引量：1
8许邓艳,卢民荣,王莹.基于知识注释的MOOC视频快速检索系统研究[J].实验技术与管理,2020,37(10):201-206. 被引量：2
9王晓艺,高挺挺.基于OCR光学字符识别的翻译优化方法[J].激光杂志,2020,41(12):156-160. 被引量：9
10聂上伟.运动图像关键帧快速跟踪系统的优化设计[J].现代电子技术,2021,44(3):30-34. 被引量：3

1李昱.基于改进BNN-LSTM的风电功率概率预测[J].微型电脑应用,2024,40(3):206-209.
2Xin Zhang,Junhao Wang,Mengyan Wang,Dongxu Liu,Zhuo Wang.In situ reduction strategy towards high conductivity,anti-freezing and super-stretchable rGO based hydrogel for diverse flexible electronics[J].Nano Research,2024,17(5):4016-4022. 被引量：2
3Abdulai Inusah.Extension of Paraconsistent Many-Valued Similarity Method to Group Decision[J].Journal of Applied Mathematics and Physics,2024,12(3):944-981.
4Laveen Bhatia,Saeed Samet.A decentralized data evaluation framework in federated learning[J].Blockchain(Research and Applications),2023,4(4):14-23. 被引量：1
5Sameh Zarif,Eman Morad,Khalid Amin,Abdullah Alharbi,Wail S.Elkilani,Shouze Tang.Video Summarization Approach Based on Binary Robust Invariant Scalable Keypoints and Bisecting K-Means[J].Computers, Materials & Continua,2024,78(3):3565-3583.
6Ming-Xia Zhao,Cheng-Lin Song,Qin-Chang Zhang,Hao-Jie Du,Shu-Qiong Zhang,Yu-Xian Shen,Yang Sun,Hai-Bo Cheng,Wen Lv.Network Pharmacology of Xian-Lian-Jie-Du Decoction in Ameliorating Colorectal Cancer[J].World Journal of Traditional Chinese Medicine,2024,10(1):83-92.
7王舰,张瑞,黄镇宇,蔡铭,楼文雨,王龑,Adem Gharsallaoui,Hynek Roubik,杨开,孙培龙.Preparation and characterization of octenyl succinic anhydride nano starch from tiger nut meals[J].Food Quality and Safety,2023,7(3):503-515.

测绘地理信息

2024年第2期

浏览历史

内容加载中请稍等...

基于互信息熵和NetVLAD的视频关键帧提取方法

参考文献7

二级参考文献23

共引文献38

相关作者

相关机构

相关主题

浏览历史