多模态特征融合的视频记忆度预测被引量：1

Video Memorability Prediction Based on Multi-Modal Features Fusion

下载PDF

导出

摘要随着网络视频的爆炸式增长,视频记忆度成为热点研究方向。视频记忆度是衡量一个视频令人难忘的程度指标,设计自动预测视频记忆度的计算模型有广泛的应用和前景。当前对视频记忆度预测的研究多集中于普遍的视觉特征或语义因素,没有考虑深度特征对视频记忆度的影响。着重探索了视频的深度特征,在视频预处理后利用现有的深度估计模型提取深度图,将视频原始图像和深度图一起输入预训练的ResNet152网络来提取深度特征;使用TF-IDF算法提取视频的语义特征,并对视频记忆度有影响的单词赋予不同的权重;将深度特征、语义特征和从视频内容中提取的C3D时空特征进行后期融合,提出了一个融合多模态的视频记忆度预测模型。在MediaEval 2019会议提供的大型公开数据集(VideoMem)上进行实验,在视频的短期记忆度预测任务中达到了0.545(长期记忆度预测任务:0.240)的Spearman相关性,证明了该模型的有效性。 With the explosive growth of online videos,video memorability has become a research hotspot.Video memora-bility is a metric to describe that how memorable the video is,designing calculation models for automatically predicting video memorability has a wide range of applications and prospects.Most of the current researches on video memorability prediction focused on the common visual features or semantic factors,while didn’t consider the influence of depth fea-tures on video memorability.This paper focuses on exploring the depth features of the video.After the video is prepro-cessed,the depth estimation model is used to extract the depth map.The original video images and the depth maps are input into the pre-trained ResNet152 network to extract the depth features;the TF-IDF algorithm is used to extract seman-tic features of the video,and different weights are assigned to words that have an impact on video memorability;finally,depth features,semantic features,and C3D spatiotemporal features extracted from video content are late fused.A fusion multi-modal video memorability prediction model is proposed.Experiments are conducted on the large public dataset(VideoMem)provided by the MediaEval 2019 conference.The experimenal tresults achieve a Spearman’s rank correla-tion of 0.545(respectively 0.240)for short-term(resp.long-term)memorability prediction,which proves the effective-ness of the model.

作者常诗颖胡燕 CHANG Shiying;HU Yan(School of Computer Science and Technology,Wuhan University of Technology,Wuhan 430070,China)

机构地区武汉理工大学计算机科学与技术学院

出处《计算机工程与应用》 CSCD 北大核心 2022年第14期219-226,共8页 Computer Engineering and Applications

基金湖北省自然科学基金(2019CFC919)。

关键词视频记忆度多模态特征融合 video memorability multi-modal features fusion

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1叶雪梅,毛雪岷,夏锦春,王波.文本分类TF-IDF算法的改进研究[J].计算机工程与应用,2019,55(2):104-109. 被引量：105
2王帅,王维莹,陈师哲,金琴.基于全局和局部信息的视频记忆度预测[J].软件学报,2020,31(7):1969-1979. 被引量：4

二级参考文献15

1徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量：56
2熊忠阳,黎刚,陈小莉,陈伟.文本分类中词语权重计算方法的改进与应用[J].计算机工程与应用,2008,44(5):187-189. 被引量：28
3史瑞芳.贝叶斯文本分类器的研究与改进[J].计算机工程与应用,2009,45(12):147-148. 被引量：12
4奉国和,郑伟.文本分类特征降维研究综述[J].图书情报工作,2011,55(9):109-113. 被引量：16
5朱云霞.结合聚类思想神经网络文本分类技术研究[J].计算机应用研究,2012,29(1):155-157. 被引量：13
6石静,吴云芳,邱立坤,吕学强.基于大规模语料库的汉语词义相似度计算方法[J].中文信息学报,2013,27(1):1-6. 被引量：25
7陈飞,刘奕群,魏超,张云亮,张敏,马少平.基于条件随机场方法的开放领域新词发现[J].软件学报,2013,24(5):1051-1060. 被引量：43
8郭红钰.基于信息熵理论的特征权重算法研究[J].计算机工程与应用,2013,49(10):140-146. 被引量：22
9刘哲,黄永峰,罗芳,陈跻,王丙坤.网络新词识别算法研究[J].计算机工程与科学,2013,35(9):141-145. 被引量：6
10郑霖,徐德华.基于改进TFIDF算法的文本分类研究[J].计算机与现代化,2014(9):6-9. 被引量：26

共引文献107

1吴晓春,洪晨,张岳.高校实验仪器与设备管理问答系统[J].中国科技论文在线精品论文,2023(2):179-185.
2侯宇豪,杨维芳,马文骏,王卓,余懿韬,闫香蓉,闫浩文.一种利用VSM检索微地图的方法[J].测绘科学,2023,48(12):225-233.
3何莉.改革开放的弄潮者——记大朗镇经济发展总公司[J].东莞科技,2000(3):29-29.
4马建国,杨金山,赵静,赵秀云.综合物探在宾州浸出油厂找水的应用[J].黑龙江水利科技,2000,28(2):64-65.
5菡冰.Windows95/NT环境下MFC多线程编程技术Step By Step[J].电脑编程技巧与维护,2000(5):40-48.
6佘广夫,曾涛,唐咏雪.工艺质量在线统计分析软件的设计与开发[J].四川冶金,2000,22(2):60-62.
7罗华容,程劲.基于机器学习技术的口令脆弱性评估[J].通信技术,2019,52(3):707-710. 被引量：1
8张弛,周艳玲,张贯虹.基于加权语义网的文本相似度计算方法研究[J].赤峰学院学报（自然科学版）,2019,35(5):19-23. 被引量：3
9胡学友,何明昌,张圆,蔡佳蕙,雷小龙.基于ISM模型的在线技术支持APP设计与实现[J].电脑与电信,2019,0(4):20-24.
10崔晓晖,师栋瑜,陈志泊,许福.基于Spark框架XGBoost的林业文本并行分类方法研究[J].农业机械学报,2019,50(6):280-287. 被引量：10

同被引文献7

1姜文涛,刘万军,袁姮.基于软特征理论的目标跟踪研究[J].计算机学报,2016,39(7):1334-1355. 被引量：18
2牛通,卿粼波,许盛宇,苏婕.基于深度学习的分层关联多行人跟踪[J].计算机工程与应用,2021,57(8):96-102. 被引量：3
3马珺,王昱皓.结合自适应更新策略和再检测技术的跟踪算法[J].计算机工程与应用,2021,57(9):217-224. 被引量：6
4栗俊杰,毛鹏军,淡文慧,苏坤.基于YOLOv2-Tiny的无人机火灾检测与云台跟踪研究[J].消防科学与技术,2022,41(1):108-112. 被引量：11
5邬开俊,黄涛,王迪聪,白晨帅,陶小苗.视频异常检测技术研究进展[J].计算机科学与探索,2022,16(3):529-540. 被引量：7
6董文轩,梁宏涛,刘国柱,胡强,于旭.深度卷积应用于目标检测算法综述[J].计算机科学与探索,2022,16(5):1025-1042. 被引量：44
7田建东,刘连庆.复杂气象条件下的机器人视觉[J].模式识别与人工智能,2019,32(1):24-35. 被引量：1

引证文献1

1姜文涛,王德强,张晟翀.非线性时空正则化的相关滤波目标跟踪算法[J].计算机工程与应用,2024,60(3):165-176.

1袁伟,侯文仲,王倩,庄坚伟,谢国喜,陈向林.基于机器学习预测自发性脑出血血肿扩大研究[J].广东药科大学学报,2022,38(3):76-84. 被引量：3
2杨昊,杨晓华.面向低碳的分布式光伏发电量自动预测研究[J].自动化应用,2022(3):97-100. 被引量：1
3章君,姚杭永,陆佳俊.高级氧化技术在印染废水处理的应用和前景研究[J].节能与环保,2022(6):65-66. 被引量：4
4孙明海,徐正和.儿童巧克力产品与包装的趣味性设计研究——以德芙“周游世界”系列巧克力为例[J].艺术科技,2022,35(13):147-149.
5王约拿,刘佳,李莉娟,张连生.TIGIT对血液淋巴系统恶性肿瘤的免疫调节作用[J].中国临床研究,2022,35(6):854-857. 被引量：2
6李秋慧,王晓武.经口腔前庭入路腔镜甲状腺手术的研究进展[J].临床医学进展,2022,12(6):5166-5172.
7金溪.应用护理程序对泌尿系结石病人实施健康教育效果[J].养生大世界,2021(17):204-205.
8何盛琪,李其超,宋巍,王文娟,高松,毕凡.基于近岸海面视频的浪高实时检测预测系统[J].计算机技术与发展,2022,32(7):138-143. 被引量：1

计算机工程与应用

2022年第14期

浏览历史

内容加载中请稍等...

多模态特征融合的视频记忆度预测被引量：1

参考文献2

二级参考文献15

共引文献107

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

多模态特征融合的视频记忆度预测 被引量：1

参考文献2

二级参考文献15

共引文献107

同被引文献7

引证文献1

相关作者

相关机构

相关主题

浏览历史

多模态特征融合的视频记忆度预测被引量：1