基于改进的全卷积网络的视频摘要算法被引量：2

Video Summarization Algorithm Based on Improved Fully Convolutional Network

导出

摘要面对海量的视频数据,视频摘要技术在视频检索、视频浏览等领域发挥着越来越重要的作用,其旨在通过生成简短的视频片段或选择关键帧集合来获取输入视频中的重要信息。现有的方法大多集中在研究视频摘要的代表性和多样性上,没有考虑到视频结构等多尺度上下文信息。针对上述问题,提出了一种基于全卷积序列网络的视频摘要模型,模型中利用时间金字塔池化对视频中的多尺度上下文信息进行提取,并利用全连接的条件随机场对视频帧序列进行标注。在SumMe和TVSum数据集上的实验表明,所提模型取得了比全卷积序列网络更好的性能,在这两个数据集上F分指标分别提高了1.6%和3.0%。 In the face of massive video data,video summarization technique plays an increasingly important role in video retrieval,video browsing and other fields.It aims to obtain important information in input videos by generating short video clips or selecting a set of key frames.Most of the existing methods focus on the representativeness and diversity of video summarization,without considering the multi-scale contextual information such as the structure of the video.To solve the above problems,a video summarization model based on improved fully convolutional network is proposed,in which time pyramid pooling is used to extract multi-scale contextual information,and the fully connected conditional random field is used to label the video frame sequence.Experiments on SumMe and TVSum datasets show that the proposed model achieves better performance than fully convolutional sequence networks,and the F-score indexes on these two data sets are improved by 1.6%and 3.0%,respectively.

作者王浩彭力 Wang Hao;Peng Li(School of Internet of Things Engineering,Jiangnan University,Wuari,Jiangsu 214122,China)

机构地区江南大学物联网工程学院

出处《激光与光电子学进展》 CSCD 北大核心 2021年第22期407-415,共9页 Laser & Optoelectronics Progress

基金国家自然科学基金(61873112)。

关键词机器视觉视频摘要深度学习全卷积序列网络卷积神经网络 machine vision video summarization deep learning fully convolutional sequence networks convolutional neural networks

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张祥甫,刘健,石章松,吴中红,王智.基于深度学习的语义分割问题研究综述[J].激光与光电子学进展,2019,56(15):12-26. 被引量：26
2董永峰,杨雨䜣,王利琴.基于多尺度特征提取和全连接条件随机场的图像语义分割方法[J].激光与光电子学进展,2019,56(13):101-109. 被引量：6

二级参考文献10

1蒋应锋,张桦,薛彦兵,周冕,徐光平,高赞.一种新的多尺度深度学习图像语义理解方法研究[J].光电子．激光,2016,27(2):224-230. 被引量：13
2程国建,刘丽婷.深度学习算法应用于岩石图像处理的可行性研究[J].软件导刊,2016,15(9):163-166. 被引量：16
3魏云超,赵耀.基于DCNN的图像语义分割综述[J].北京交通大学学报,2016,40(4):82-91. 被引量：44
4刘丹,刘学军,王美珍.一种多尺度CNN的图像语义分割算法[J].遥感信息,2017,32(1):57-64. 被引量：33
5张新明,祝晓斌,蔡强,刘新亮,邵玮,王磊.图像语义分割深度学习模型综述[J].高技术通讯,2017,27(9):808-815. 被引量：18
6王琳,刘强.基于局部特H2征的多目标图像分割算法[J].激光与光电子学进展,2018,55(6):103-110. 被引量：17
7安喆,徐熙平,杨进华,乔杨,刘洋.结合图像语义分割的增强现实型平视显示系统设计与研究[J].光学学报,2018,38(7):77-83. 被引量：21
8郭呈呈,于凤芹,陈莹.基于卷积神经网络特征和改进超像素匹配的图像语义分割[J].激光与光电子学进展,2018,55(8):224-230. 被引量：23
9刘辉,彭力,闻继伟.基于改进全卷积网络的多尺度感知行人检测算法[J].激光与光电子学进展,2018,55(9):312-318. 被引量：10
10熊志勇,张国丰,王江晴.基于多尺度特征提取的图像语义分割[J].中南民族大学学报（自然科学版）,2017,36(3):118-124. 被引量：11

共引文献29

1AI Sheng,CHEN Yitao,LIU Fang,ZHU Aoxiang.Pill Defect Detection Based on Improved YOLOv5s Network[J].Instrumentation,2022,9(3):27-36. 被引量：1
2陈玲玲,施政,廖凯涛,宋月君,张红梅.基于卷积神经网络的高分遥感影像耕地提取研究[J].农业机械学报,2022,53(9):168-177. 被引量：10
3郑健红,鲍官军,张立彬,荀一,陈教料.结合深度学习与支持向量机的金属零件识别[J].中国图象图形学报,2019,24(12):2233-2242. 被引量：12
4付阳阳,高志宇.基于梯度下降和滑动窗口混合算法的人体穴位定位研究[J].中医药信息,2020,37(2):106-110. 被引量：1
5张佳颖,赵晓丽,陈正.基于深度学习的点云语义分割综述[J].激光与光电子学进展,2020,57(4):20-38. 被引量：28
6何山,方利,张政.基于改进的区域全卷积神经网络和联合双边滤波的图像着色方法[J].激光与光电子学进展,2020,57(12):117-123. 被引量：1
7李立凯,卢炽华,邹斌.基于深度学习的目标检测与可行域分割研究[J].激光与光电子学进展,2020,57(12):181-189. 被引量：8
8史兴萍,徐江涛,蒋永唐,秦书臻,路凯歌.用于多光谱语义分割的LBP特征增强神经网络[J].激光与光电子学进展,2020,57(14):46-53. 被引量：1
9陶志勇,韩月明,林森.基于Mask-RCNN无分割手写数字字符串的识别[J].激光与光电子学进展,2020,57(14):114-121. 被引量：4
10夏英明.基于深度学习技术的图像语义分割综述[J].数码设计,2020,9(22):125-125.

同被引文献21

1杨瑞琴,吕进来.基于双重检测的视频镜头分割方法[J].计算机工程与设计,2018,39(5):1393-1398. 被引量：7
2马明阳,梅少辉,万帅.采用非线性块稀疏字典选择的视频总结[J].西安交通大学学报,2019,53(5):142-148. 被引量：1
3丁恩杰,刘忠育,刘亚峰,郁万里.基于多维度和多模态信息的视频描述方法[J].通信学报,2020,41(2):36-43. 被引量：8
4张航,卢小平,张晓强,路泽忠.面向矿山监管的无人机视频关键帧影像动态提取方法[J].遥感信息,2020,35(1):112-116. 被引量：11
5刘仁峰,黄诗瑶,聂勇鹏,徐胜勇.油菜角果数量及关键表型参数的自动化检测方法研究[J].中国油料作物学报,2020,42(1):71-77. 被引量：5
6李依依,王继龙.自注意力机制的视频摘要模型[J].计算机辅助设计与图形学学报,2020,32(4):652-659. 被引量：6
7陈勇,刘曦,刘焕淋.基于特征通道和空间联合注意机制的遮挡行人检测方法[J].电子与信息学报,2020,42(6):1486-1493. 被引量：14
8贺凤,张洪博,杜吉祥,汪冠鸿.长短时记忆网络的自由体操视频自动描述方法[J].华侨大学学报（自然科学版）,2020,41(6):808-815. 被引量：2
9田颖,桂彦,熊达铭.动态外观模型和高阶能量的双边视频目标分割方法[J].计算机科学与探索,2020,14(12):2108-2121. 被引量：4
10王俊玲,卢新明.基于语义相关的视频关键帧提取算法[J].计算机工程与应用,2021,57(4):192-198. 被引量：5

引证文献2

1张云佐,郭亚宁,李文博.融合时空切片和双注意力机制的视频摘要方法[J].西安交通大学学报,2022,56(12):127-135.
2杨盼盼,马凌飞,平阳,索雅丽.移动AR+VR支持下跨媒体视频关键帧还原仿真[J].微型电脑应用,2024,40(3):32-36.

1候聪颖,王鹏,朱丽霞,管晓宁.适用于RPA工具的卷积序列推荐算法[J].计算机与现代化,2021(12):96-102. 被引量：1
2付燕,韩泽,叶鸥.针对近重复视频的FD-means聚类清洗算法[J].计算机工程与应用,2022,58(1):197-203. 被引量：1

激光与光电子学进展

2021年第22期

浏览历史

内容加载中请稍等...

基于改进的全卷积网络的视频摘要算法被引量：2

参考文献2

二级参考文献10

共引文献29

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于改进的全卷积网络的视频摘要算法 被引量：2

参考文献2

二级参考文献10

共引文献29

同被引文献21

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于改进的全卷积网络的视频摘要算法被引量：2