基于卷积神经网络的多模态视频场景分割优化算法被引量：3

Multi-modal video scene segmentation optimization algorithm based on convolutional neural network

下载PDF

导出

摘要针对基于内容的视频检索中场景分割效率有待提高的问题,提出了一种基于卷积神经网络提取特征的多模态视频场景分割优化算法。首先利用改进的VGG19网络从视频镜头中提取多种模态的底层特征和语义特征,再将这些特征组成向量,然后通过三重损失学习与镜头相似度计算等方法,使场景分割问题转换为对镜头边界的二分类问题,最后建立评分机制优化所得结果,获取分割好的视频场景及对应的场景边界,完成场景分割任务。实验结果表明,该算法能对视频场景进行有效分割,整体查全率与查准率分别能达到85.77%、87.01%。 Aiming at the problem that the efficiency of scene segmentation in content-based video retrieval needs to be improved,this paper proposed a multi-modal video scene segmentation optimization algorithm based on feature extraction of convolutional neural network.Firstly,the algorithm applied the improved VGG19 network to extract underlying features and semantic features from each video shots.Secondly,this paper combined these features into vectors and applied the method of triplet loss learning and shot similarity calculation,so that converted the scene segmentation task to a binary classification problem for shot boundary.Finally,this paper established a scoring mechanism to optimize the results and obtained the segmented video scene and corresponding scene boundary.Experimental results show that the algorithm can be effective in video scene segmentation,and the overall recall and precision indicators can reach 85.77% and 87.01%.

作者黄清丰洪才刘立 Huang Qing;Feng Hongcai;Liu Li(School of Mathematics&Computer Sciences,Wuhan Polytechnic University,Wuhan 430023,China;Network&Information Center,Wuhan Polytechnic University,Wuhan 430023,China)

机构地区武汉轻工大学数学与计算机学院武汉轻工大学网络与信息中心

出处《计算机应用研究》 CSCD 北大核心 2022年第5期1595-1600,共6页 Application Research of Computers

基金湖北省教育厅重点科研计划资助项目(D20101703)。

关键词场景分割多模态卷积神经网络相似度度量 VGG19 scene segmentation multi-modal convolutional neural networks(CNN) similarity measure VGG19

分类号 TP37 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1田丽华,张咪,李晨.基于运动目标特征的关键帧提取算法[J].计算机应用研究,2019,36(10):3183-3186. 被引量：9
2李雯莉,张素兰,张继福,胡立华.基于卷积神经网络和概念格的图像语义完备标注[J].小型微型计算机系统,2020,41(9):1979-1986. 被引量：2

二级参考文献9

1张素兰,郭平,张继福,胡立华.图像语义自动标注及其粒度分析方法[J].自动化学报,2012,38(5):688-697. 被引量：20
2李海洋,文永革,何红洲.一种改进的SIFT特征点检测方法[J].计算机应用与软件,2013,30(9):147-150. 被引量：8
3刘杰,杜军平.基于潜在主题融合的跨媒体图像语义标注[J].电子学报,2014,42(5):987-991. 被引量：5
4於正强,潘赟,宦若虹.一种结合帧差法和混合高斯的运动检测算法[J].计算机应用与软件,2015,32(4):129-132. 被引量：25
5黎健成,袁春,宋友.基于卷积神经网络的多标签图像自动标注[J].计算机科学,2016,43(7):41-45. 被引量：20
6王亚平,张素兰,张继福,胡立华.基于模糊概念格的视觉单词生成方法[J].小型微型计算机系统,2016,37(8):1868-1872. 被引量：2
7崔智高,王华,李艾华,王涛,李辉.动态背景下基于光流场分析的运动目标检测算法[J].物理学报,2017,66(8):97-104. 被引量：15
8黄东军,杨颖华.基于改进混合高斯模型的运动物体检测研究[J].计算机应用研究,2017,34(6):1862-1866. 被引量：7
9周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1685

共引文献9

1李秋玲,邵宝民,赵磊,王振,姜雪.基于ViBe算法运动特征的关键帧提取算法[J].山东大学学报（工学版）,2020,50(1):8-13. 被引量：7
2向东,吉静,张景瑞,欧阳泉.基于改进K-Means的动态视频关键帧提取模型[J].现代信息科技,2021,5(3):9-12. 被引量：1
3周翰墨,王小凌,邱波.基于关键帧的快速宽视角匹配方法[J].航空精密制造技术,2021,57(6):42-44.
4曹春萍,苑凯歌.融合多路特征和注意力机制的强化学习关键帧提取算法[J].计算机应用研究,2022,39(4):1274-1280. 被引量：2
5黄为,汪毅,张龙,张煜昕,杨海民.面向经纬仪图像序列的关键帧提取算法[J].应用光学,2022,43(3):430-435. 被引量：1
6马璐.基于DR-CNN方法的图像质量评价[J].宿州学院学报,2022,37(6):12-15.
7高雪雪,谷林.基于骨骼点特征的运动视频关键帧提取模型[J].国外电子测量技术,2022,41(9):88-94. 被引量：1
8费莉梅,田翔,郑博仑.基于改进ViBe的自适应运动目标检测算法[J].计算机工程与设计,2024,45(6):1771-1779.
9曹扬.一种体育运动数据特征融合方法设计[J].信息技术,2024,48(6):118-123.

同被引文献26

1马彦卓,常义林,杨海涛.应用于视频编码的实时多测度联合突变场景切换检测算法[J].光子学报,2010,39(6):1058-1063. 被引量：5
2韩守东,赵勇,陶文兵,桑农.基于高斯超像素的快速Graph Cuts图像分割方法[J].自动化学报,2011,37(1):11-20. 被引量：56
3索春宝,杨东清,刘云鹏.多种角度比较SIFT、SURF、BRISK、ORB、FREAK算法[J].北京测绘,2014,28(4):23-26. 被引量：75
4李枫,赵岩,王世刚,陈贺新.结合SIFT算法的视频场景突变检测[J].中国光学,2016,9(1):74-80. 被引量：8
5蔡轶珩,胡朝阳,崔益泽.融合颜色信息与特征点的镜头边界检测算法[J].计算机应用,2017,37(A02):95-98. 被引量：6
6李大锦,高文冉,高俊杰.基于kuwahara滤波的视频风格化框架[J].电子学报,2020,48(3):538-544. 被引量：3
7桑高丽,郑增国,闫超.基于区域分割的表情鲁棒三维人脸识别方法[J].计算机应用研究,2020,37(3):914-918. 被引量：12
8杨鹏飞,刘波,党佳乐,吕文凯.面向条件受限环境的动态可重构异构计算平台[J].空间控制技术与应用,2020,46(3):11-17. 被引量：8
9李林聪,姚远志,张晓雅,张卫明,俞能海.基于修改概率转换和非加性嵌入失真的视频隐写方法[J].电子与信息学报,2020,42(10):2357-2364. 被引量：4
10郭欣,王红豆,孙连浩,陈向辉.基于改进姿态估计算法的嵌入式平台实时跌倒检测[J].科学技术与工程,2020,20(30):12500-12506. 被引量：11

引证文献3

1孙孟寒,任维政.基于动态阈值的视频场景切换检测[J].计算机系统应用,2023,32(2):234-241. 被引量：1
2龙建武,胡绪军.结合局部线性嵌入与种子信息流的交互式图像分割算法[J].计算机应用研究,2023,40(7):2235-2240. 被引量：1
3张士坤.基于嵌入式Linux平台的数字化视频格式转换系统设计[J].激光杂志,2023,44(10):184-188.

二级引证文献2

1马宏伟,张烨,王鹏,魏小荣,周文剑.多机械臂煤矸石智能分拣机器人关键共性技术研究[J].煤炭科学技术,2023,51(1):427-436. 被引量：11
2衣傲尘,尤俊杰.基于交互式目标分割算法的影视后期抠像方法研究[J].电子设计工程,2024,32(11):188-191.

1林哲,陈平华,申建芳,王越超.基于改进Faster-RCNN的矿工检测[J].计算机科学与应用,2022,12(4):953-964.
2李湘,刘奕.船舶轨迹快速相似度度量与改进自适应密度聚类[J].武汉理工大学学报（交通科学与工程版）,2022,46(2):350-355. 被引量：1
3李广帅,苏娟,李响.基于数字表面模型深度影像的建筑物多特征联合检测算法[J].火箭军工程大学学报,2019(4):91-95.
4王苗,肖明芳,康凯,张林科.基于SABS的维修案例检索方法[J].火箭军工程大学学报,2019(4):44-49.
5吴新辉,毛政元,翁谦,施文灶.利用基于残差多注意力和ACON激活函数的神经网络提取建筑物[J].地球信息科学学报,2022,24(4):792-801. 被引量：3
6成科扬,王宁,崔宏纲,詹永照.基于局部注意力图互迁移的可解释性优化方法[J].计算机科学,2022,49(5):64-70.
7胡聪娟,王艺.基于现代光传感技术的扫地机器人垃圾检测研究[J].激光杂志,2022,43(4):173-177. 被引量：2
8宋志平,朱亚俐,吾尔尼沙·买买提,库尔班·吾布力.一种海量图像下的高精度特征检索算法[J].计算机仿真,2022,39(4):185-188. 被引量：1
9杨月.数字图书馆交互式信息分类检索模型设计[J].科技通报,2021,37(12):112-116. 被引量：2
10莱夫泰里斯·赫拉塔基斯,汪芸(翻译).行动研究:自由、自由思考与即兴创作[J].装饰,2022(1):66-74. 被引量：1

计算机应用研究

2022年第5期

浏览历史

内容加载中请稍等...

基于卷积神经网络的多模态视频场景分割优化算法被引量：3

参考文献2

二级参考文献9

共引文献9

同被引文献26

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络的多模态视频场景分割优化算法 被引量：3

参考文献2

二级参考文献9

共引文献9

同被引文献26

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络的多模态视频场景分割优化算法被引量：3