基于解码器注意力机制的视频摘要被引量：7

Video Summarization Based on Decoder Attention Mechanism

下载PDF

导出

摘要作为一种快速浏览和理解视频内容的方式,视频摘要技术引起了广泛的关注.本文将视频摘要任务看作是序列到序列的预测问题,设计了一种新颖的基于解码器的视觉注意力机制,并基于此提出一种有监督视频摘要算法.所提方法考虑到视频帧之间的内在关联性,利用长短时记忆网络将注意力集中在历史的解码序列,融合历史的解码信息有效地指导解码,提升模型预测的准确性.所提算法主要在TVSum和Sum Me数据集上进行了大量实验,验证了其有效性及先进性. As a way to quickly browse and understand video content,video summarization has attracted wide attention.This paper treats video summarization as a sequence-to-sequence prediction problem and proposes a novel visual attention model based on decoder,which is further applied to supervised video summarization.The proposed method pays attention to decoding sequence by using long short-term memory network.It considers the intrinsic association between video frames,and utilizes the previous decoding sequences to effectively guide the decoding process,which improves the prediction accuracy.Extensive experiments are mainly conducted on TVSum and SumMe datasets,which demonstrate the effectiveness and superiority of the proposed method.

作者冀中江俊杰 Ji Zhong;Jiang Junjie(School of Electrical and Information Engineering,Tianjin University,Tianjin 300072,China)

机构地区天津大学电气自动化与信息工程学院

出处《天津大学学报（自然科学与工程技术版）》 EI CSCD 北大核心 2018年第10期1023-1030,共8页 Journal of Tianjin University：Science and Technology

基金国家自然科学基金资助项目(61472273 61771329)~~

关键词视频摘要视觉注意力模型编解码模型长短时记忆网络 video summarization visual attention model encoder-decoder model long short-term memory network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1王娟,蒋兴浩,孙锬锋.视频摘要技术综述[J].中国图象图形学报,2014,19(12):1685-1695. 被引量：33
2冀中,樊帅飞.基于超图排序算法的视频摘要[J].电子学报,2017,45(5):1035-1043. 被引量：5

二级参考文献52

1Maybury M T. Broadcast news understanding and navigation [ C ]//Proceedings of the Fifteenth Conference on Innovative Ap- plications of Artificial Intelligence. Trier, German: DBLP,2003 : 117-122.
2Pfeiffer S, Lienhart R, Ktthne G, et al. The MoCA project. [ M ]//Informatik'98. Berlin, Heidelberg: Springer, 1998 : 329- 338.
3Chang S F, Chen W, Meng H J, et al. VideoQ: an automated content based video search system using visual cues [ C ]//Pro- ceedings of the 5th ACM International Conference on Multimedia. New York, USA:ACM, 1997: 313-324.
4Snoek C G M, Worring M. Time interval maximum entropy based event indexing in soccer [ C ]//Proceedings of IEEE Internation- al Conference on Multimedia and Expo. Washington DC, USA: IEEE, 2003:481-484.
5Uchihashi S, Foote J, Girgensohn A, et al. Video manga: gener- ating semantieally meaningful video summaries [ C ]//Proceedings of the seventh ACM International Conference on Multimedia ( Part 1). New York, USA:ACM, 1999: 383-392.
6Zhuang Y, Rui Y, Huang T S, et al. Adaptive key frame extrac- tion using unsupervised clustering [ C ]// Proceedings of Interna- tional Conference on Image Processing. Washington DC, USA: IEEE, 1998, 1:866-870. [DOI:10. 1109/ICIP. 1998.723655].
7Almeida J, Torres R D S, Leite N J. Rapid video summarization on compressed video [ C ]// IEEE International Symposium on Multimedia. Washington DC, USA: IEEE, 2010: 113-120. [ DOI : 10. 1109/ISM. 2010. 25 ].
8Coldefy F, Bouthemy P. Unsupervised soccer video abstraction based on pitch, dominant color and camera motion analysis [ C ]//Proceedings of the 12th Annual ACM International Confer- ence on Multimedia. New York, USA : ACM, 2004 : 268-271.
9Wolf W. Key frame selection by motion analysis [ C ]//Proceed- ings of IEEE International Conference on Acoustics, Speech, and Signal Processing. Washington DC, USA : IEEE, 1996, 2 : 1228- 1231. [DOI: 10. 1109/ICASSP. 1996. 543588 ].
10Chan W S, Au O C, Chong T S. Key frame selection by macrob- lock type and motion vector analysis [ C ]//Proceedings of Inter- national Conference on Multimedia and Expo. Washington DC, USA: IEEE, 2004, 1: 575-578. [DOI: 10.1109/ICME. 2004. 1394257 ].

共引文献35

1杨霜雪,刘晓丹.视频摘要技术的专利现状分析[J].中国发明与专利,2016,0(12):30-34.
2马元元,李向伟,刘艳飞.海量监控视频分级摘要生成系统研究[J].现代电子技术,2017,40(13):34-37. 被引量：5
3惠开发,成科扬,詹永照.基于改进ViBe算法的视频浓缩[J].山东大学学报（工学版）,2017,47(3):43-48. 被引量：1
4许彬,张海涛,胡豆豆.云计算平台中监控视频摘要任务调度方法研究[J].计算机应用与软件,2017,34(7):7-10. 被引量：6
5张亚洲,余正生.基于k-means++聚类的视频摘要生成算法[J].工业控制计算机,2017,30(7):129-130. 被引量：4
6叶锋,廖茜,汪敏,林贵增,陈超意,林晖.基于视频分析和多传感器融合的移动式监控系统[J].计算机系统应用,2017,26(8):88-93.
7张园,朱康,林荣生.汽车倒车影像抗干扰电路设计[J].自动化与仪器仪表,2017(10):58-59. 被引量：4
8冀中,樊帅飞.利用超图随机游走的视频摘要生成方法[J].小型微型计算机系统,2017,38(11):2535-2540. 被引量：2
9石亚玲,刘正熙,熊运余,李征.基于弱特征重识别的多目标长效摘要[J].计算机技术与发展,2018,28(5):27-31.
10徐艺琳,刘军,王琪.视频联合思维导图在行动静脉内瘘术患者健康教育中的应用[J].中西医结合护理（中英文）,2018,4(4):145-147. 被引量：18

同被引文献38

1王连喜.微博短文本预处理及学习研究综述[J].图书情报工作,2013,57(11):125-131. 被引量：36
2李婷婷,姬东鸿.基于SVM和CRF多特征组合的微博情感分析[J].计算机应用研究,2015,32(4):978-981. 被引量：83
3汤伟,王先通,王锋,王孟效,邱锦强.基于FPGA和CCD相机的纸病检测系统的设计与实现[J].中国造纸学报,2016,31(1):57-62. 被引量：16
4孙小军.基于Prim算法的度约束最小生成树问题研究[J].内蒙古师范大学学报（自然科学汉文版）,2016,45(4):445-448. 被引量：5
5冀中,樊帅飞.利用超图随机游走的视频摘要生成方法[J].小型微型计算机系统,2017,38(11):2535-2540. 被引量：2
6白培瑞,王金博,丁国梅.一种通用的基于图像分割的验证码识别方法[J].山东科技大学学报（自然科学版）,2018,37(3):106-113. 被引量：8
7王帅,赵翔,李博,葛斌,汤大权.TP-AS:一种面向长文本的两阶段自动摘要方法[J].中文信息学报,2018,32(6):71-79. 被引量：12
8张开生,韦逸野.数字化功能信息纸张的产品建模与图像识别研究[J].中国造纸学报,2018,33(1):61-66. 被引量：9
9Richard J.Kerekes,J.David McDonald.Fibre Treatment Uniformity in Pulp Refining[J].Paper And Biomaterials,2018,3(3):1-6. 被引量：2
10王鈃润,聂秀山,杨帆,吕鹏,尹义龙.基于排序学习的视频摘要[J].智能系统学报,2018,13(6):921-927. 被引量：3

引证文献7

1张云佐,郭亚宁,蔡昭权,张嘉煜.顾及方向信息的时空联合监控视频摘要方法[J].光电子．激光,2022,33(9):992-1000.
2滑蕊,吴心筱,赵文天.融合语义信息的视频摘要生成[J].北京航空航天大学学报,2021,47(3):650-657. 被引量：2
3张开生,王泽.基于磁性纤维的加密纸张图像采集与识别研究[J].中国造纸,2021,40(6):64-70. 被引量：4
4李雷霆,武光利,郭振洲.自注意力机制和随机森林回归的视频摘要生成[J].计算机工程与应用,2022,58(4):198-205. 被引量：4
5胡吉明,郑翔.基于主题聚类的新媒体政务互动内容摘要生成研究[J].数据分析与知识发现,2022,6(6):95-104. 被引量：3
6闫河,刘灵坤,黄俊滨,张烨,段思宇.结合多尺度注意力机制和双向门控循环网络的视频摘要模型[J].智能系统学报,2024,19(2):446-454.
7陈周元,陈平华,申建芳.融合GRU和非极大值抑制的视频摘要生成模型[J].计算机科学与应用,2021,11(3):604-617.

二级引证文献13

1卢璐,袁高腾,梅嘉,肖文美,李木子.数字人文视域下云锦图像本体识别模型构建及应用研究[J].智能计算机与应用,2021,11(12):47-53.
2张云佐,郭亚宁,蔡昭权,张嘉煜.顾及方向信息的时空联合监控视频摘要方法[J].光电子．激光,2022,33(9):992-1000.
3肖栩豪,李晓军,姚俊萍,李少臣.基于多特征视频关键片段提取研究--以健康类动画视频为例[J].中国电子科学研究院学报,2021,16(6):561-568. 被引量：1
4熊曙初,刘阳,胡文灿.基于Lambda架构的智慧社保数据融合模式研究[J].电脑知识与技术,2022,18(31):1-3. 被引量：2
5张晨,王圣焘,武光利.基于递归长短期记忆网络和镜头序列注意网络的视频摘要生成[J].科学技术与工程,2023,23(18):7852-7860.
6同剑飞.基于图像分析技术的纸病识别策略[J].造纸科学与技术,2023,42(4):42-45. 被引量：2
7薛媛.基于词共现与SOM神经网络的机器人研究[J].自动化与仪器仪表,2023(9):210-214.
8白晨,范涛,王文静,王国中.融合多模态特征与时区检测的视频摘要算法[J].计算机应用研究,2023,40(11):3276-3281.
9熊思斯,滕宇,胡珀.政务新媒体互动内容分析及诉求回应研究——以人民网留言板数据分析为例[J].情报杂志,2024,43(3):150-156. 被引量：2
10杨盼盼,马凌飞,平阳,索雅丽.移动AR+VR支持下跨媒体视频关键帧还原仿真[J].微型电脑应用,2024,40(3):32-36.

1李娜,赵歆波,杨勇佳,邹晓春.一种基于学习及视觉感知启发的目标分类方法[J].西北工业大学学报,2018,36(2):359-367. 被引量：1
2况杰.投资“微创新”[J].科技与金融,2018,0(8):47-48.
3Adam Kosiorek.神经网络中的注意力机制[J].机器人产业,2017(6):12-17. 被引量：15
4王凡,倪晋平,董涛,郭荣礼.结合视觉注意力机制和图像锐度的无参图像质量评价方法[J].应用光学,2018,39(1):51-56. 被引量：8
5朱艳霞.新形势下供电企业思想政治工作的思考[J].中小企业管理与科技,2018,2(28):119-120. 被引量：3
6冀中,樊帅飞.利用超图随机游走的视频摘要生成方法[J].小型微型计算机系统,2017,38(11):2535-2540. 被引量：2
7卢晶,张晓林,陈利利,李嘉茂.融合运动信息的三维视觉显著性算法研究[J].计算机工程,2018,44(1):238-246. 被引量：7
8谭忠毅,张秋阳.高校校园人文精神与社会主义核心价值观的有效耦合研究[J].内蒙古师范大学学报（教育科学版）,2018,31(9):38-41. 被引量：8
9岳新峰.大数据时代研究生思想政治工作创新研究[J].辽宁广播电视大学学报,2018(3):96-97. 被引量：1
10齐高龙,郑曙村.习近平新时代政治生态思想形成的必然性[J].天水行政学院学报（哲学社会科学版）,2018,19(5):3-6. 被引量：1

天津大学学报（自然科学与工程技术版）

2018年第10期

浏览历史

内容加载中请稍等...

基于解码器注意力机制的视频摘要被引量：7

参考文献2

二级参考文献52

共引文献35

同被引文献38

引证文献7

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于解码器注意力机制的视频摘要 被引量：7

参考文献2

二级参考文献52

共引文献35

同被引文献38

引证文献7

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于解码器注意力机制的视频摘要被引量：7