基于多模态融合和竞争力的视频场景分割算法被引量：1

Algorithm of Video Scene Segmentation Based on Multimodal Feature Fusion and Competition

下载PDF

导出

摘要针对视频分割中底层特征与高层语义之间的"语义鸿沟"问题,提出了一种基于多模态融合和镜头间竞争力的场景分割算法,对视频帧的图像、文本、音频等模态进行特征提取,用欧式距离、余弦距离计算出同种模态数据的相似性,用典型相关分析法计算出不同模态数据的相关度,分别对各模态数据的相似性和相关度进行融合得到镜头之间的相似度和相关度,采用镜头间竞争力的方法分别对相似镜头和相关镜头进行场景分割并对分割出的两个场景边界集合取交集得到最终的场景边界,从而实现对视频的场景分割。实验结果表明,该方法在场景分割中具有较高的性能,查全率和查准率分别达到82.1%和86.7%。 To solve the problem of＆quot;semantic gap＆quot;between low-level features and high-level semantic in video scene seg-mentation, an algorithm of video scene segmentation was put forward based on multimodal feature fusion and competition.The im-age, text and audio features were abstracted as the low-level features of the video frame.Euclidean distance, cosine similarity distance were used to calculate the similarity of homogeneous data, and the method of canonical correlation analysis was used to calculate the heterogeneous data correlation, respectively.The shot similarity and shot relevance were obtained by similarity fu-sion and correlation fusion.Then a competition analysis of splitting and merging forces for scene segmentation was adopted.The final scene was obtained by take the intersection of two segmented scenarios border sets.Thus the video scene segmentation was realized.The results of experiments show that the video scene can be effectively separated by the proposed method, and the recall ratio, precision reached 82.1%and 86.7%respectively.

作者杨亭丰洪才金凯赵杰雪

机构地区武汉轻工大学数学与计算机学院

出处《武汉理工大学学报（信息与管理工程版）》 CAS 2014年第6期759-763,共5页 Journal of Wuhan University of Technology：Information & Management Engineering

基金湖北省自然科学基金资助项目(2009Chb008 2010CDB06603) 湖北省教育厅重点科研基金资助项目(D20101703)

关键词竞争力多模态融合相似性度量典型相关性场景分割 competition multi-modality similarity measurement canonical correlation scene segmentation

分类号 TP37 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1张玉珍,丁思捷,王建宇,戴跃伟,陈钱.基于HMM的融合多模态的事件检测[J].系统仿真学报,2012,24(8):1638-1642. 被引量：4
2刘嘉琦,封化民,闫建鹏.基于多模态特征融合的新闻故事单元分割[J].计算机工程,2012,38(24):161-165. 被引量：8
3张鸿,吴飞,庄越挺,陈建勋.一种基于内容相关性的跨媒体检索方法[J].计算机学报,2008,31(5):820-826. 被引量：34
4张玉珍,夏肇霖,王建宇,戴跃伟.基于音频和文本融合的广告单元分割[J].南京理工大学学报,2012,36(3):396-401. 被引量：3

二级参考文献46

1彭培华,曲波,陈荣胜.基于支持向量机的小波域视频字幕检测与提取[J].华南理工大学学报（自然科学版）,2004,32(z1):63-66. 被引量：4
2刘华咏.基于音视频特征和文字信息自动分段新闻故事[J].系统仿真学报,2004,16(11):2608-2610. 被引量：8
3程文刚,须德,郎丛妍.一种有效的视频场景检测方法[J].中国图象图形学报（A辑）,2004,9(8):984-990. 被引量：6
4严明,苏新宁.数字视频信息的索引研究[J].现代图书情报技术,2005(7):46-50. 被引量：6
5刘宇驰,吴玲达.基于HMM的足球视频语义结构分析[J].计算机工程与应用,2006,42(28):174-176. 被引量：1
6刘宇驰,栾悉道,戴端辉,吴玲达.多模态体育视频语义分析[J].计算机科学,2007,34(1):109-111. 被引量：6
7金国英,陶霖密,徐光,张翔.基于HHMM的多线索融合和事件推理方法[J].清华大学学报（自然科学版）,2007,47(1):112-115. 被引量：4
8张亮,朱振峰,赵耀,卢汉清.基于镜头的鲁棒视频广告检测[J].智能系统学报,2007,2(2):83-88. 被引量：6
9赵黎.基于OpenCV的人脸检测系统设计与实现.科技信息,2008,(18):351-351.
10赵亚琴,周献中,何新.一种层次的电影视频摘要生成方法[J].中国图象图形学报,2007,12(8):1412-1417. 被引量：5

共引文献44

1吴飞,刘亚楠,庄越挺.基于张量表示的直推式多模态视频语义概念检测[J].软件学报,2008,19(11):2853-2868. 被引量：10
2陈铭,郭同强,吴飞,王叶钧,庄越挺.情景式跨媒体数字城市系统[J].计算机辅助设计与图形学学报,2008,20(11):1432-1439. 被引量：3
3刘扬,郑逢斌,姜保庆,蔡坤.基于多模态融合和时空上下文语义的跨媒体检索模型的研究[J].计算机应用,2009,29(4):1182-1187. 被引量：7
4杨易,郭同强,庄越挺,王文华.基于综合推理的多媒体语义挖掘和跨媒体检索[J].计算机辅助设计与图形学学报,2009,21(9):1307-1314. 被引量：12
5吴飞,庄越挺.互联网跨媒体分析与检索:理论与算法[J].计算机辅助设计与图形学学报,2010,22(1):1-9. 被引量：34
6柳培忠,王守觉.适用于视觉媒体检索的视频镜头分割算法[J].计算机应用研究,2010,27(5):1935-1937. 被引量：4
7吴飞,韩亚洪,庄越挺,邵健.图像-文本相关性挖掘的Web图像聚类方法[J].软件学报,2010,21(7):1561-1575. 被引量：10
8张鸿,顾进广.数据网格环境下的多媒体资源检索[J].计算机工程,2011,37(8):275-277. 被引量：1
9王琦,鲁东明.知识发现在古代壁画展示中的应用[J].中国图象图形学报,2011,16(7):1326-1334.
10张鸿,吴飞,张晓龙.基于关系矩阵融合的多媒体数据聚类[J].计算机学报,2011,34(9):1705-1711. 被引量：4

同被引文献11

1BABER J, AFZULPURKAR N, SATOH S. A frame- work for video segmentation using global and local fea- tures[ J ]. International Journal of Pattern Recognition and Artificial Intelligence, 2013, 27 (5) : 13550071 - 135500729.
2YANG H, YI J, ZHAO J, et al. Extreme learning ma- chine based genetic algorithm and its application in power system economic dispatch [ J ]. Neurocomput- ing, 2013,102 ( 15 ) : 154 - 162.
3NGOC T A, HIRAMATSU K, HARADA M. Optimizing the rule curves of multi - use reservoir operation using a genetic algorithm with a penalty strategy [ J ]. Paddy and Water Environment, 2014,12( 1 ) : 125 - 137.
4GUPTA N, SHEKHAR R, KALRA P K. Congestion management based roulette wheel simulation for opti- mal capacity selection: probabilistie transmission ex- pansion planning[ J ]. International Journal of Electri- cal Power and Energy Systems, 2012,43 ( 1 ) : 1259 - 1266.
5HWANG S F, HSU Y C, CHEN Y. A genetic algo- rithm for the optimization of fiber angles in composite laminates [ J ]. Journal of Mechanical Science and Technology, 2014,28 ( 8 ) : 3163 - 3169.
6张鸿,吴飞,庄越挺,陈建勋.一种基于内容相关性的跨媒体检索方法[J].计算机学报,2008,31(5):820-826. 被引量：34
7印勇,王旭军.基于主色跟踪和质心运动的视频场景分割[J].计算机应用研究,2010,27(4):1563-1565. 被引量：1
8华漫.基于语义的体育视频场景分割方法[J].计算机工程,2010,36(15):206-207. 被引量：2
9郭小川,刘明杰,王婧璐,董道国,万乾荣.基于频繁镜头集合的视频场景分割方法[J].计算机应用与软件,2011,28(6):116-120. 被引量：1
10刘嘉琦,封化民,闫建鹏.基于多模态特征融合的新闻故事单元分割[J].计算机工程,2012,38(24):161-165. 被引量：8

引证文献1

1赵杰雪,丰洪才,杨琳.基于遗传算法的多模态视频场景分割算法[J].武汉理工大学学报（信息与管理工程版）,2015,37(6):841-845. 被引量：4

二级引证文献4

1程瑞,雷璟,程静.基于条件Shannon熵和VPRS的网络攻击策略评价方法[J].武汉理工大学学报（信息与管理工程版）,2017,39(2):162-167. 被引量：3
2梁平,刘明周.一种多染色体交叉的小生境遗传算法[J].计算机工程与应用,2016,52(18):162-166. 被引量：1
3王金鹤,衣家欣,孟凡云.基于分层算法立体图像匹配[J].计算机仿真,2019,36(12):224-227. 被引量：1
4姜燕宁,郝书池.云服务模式下基于集合覆盖的库存-选址模型[J].武汉理工大学学报（信息与管理工程版）,2020,42(5):414-419. 被引量：2

1刘倩兰,张奇志,周亚丽.基于颜色和深度的场景分割[J].北京信息科技大学学报（自然科学版）,2014,29(1):48-52. 被引量：1
2邓兆祥,叶常景,卢海峰.VB.NET和OpenGL环境下的模态数据显示控件设计[J].现代制造工程,2008(7):70-74. 被引量：3
3周方正,周治平.融合边缘特征的Prim快速目标定位算法[J].计算机辅助设计与图形学学报,2017,29(1):108-114. 被引量：4
4朱映映,周洞汝,蔡波.基于DC系数和运动矢量的快速场景分割算法[J].小型微型计算机系统,2004,25(4):540-542. 被引量：2
5N.Charara,I.Jarkass,M.Sokhn,O.AbouKhaled,E.Mugellini.Tracking a Screen and Detecting Its Rate of Change in 3-D Video Scenes of Multipurpose Halls[J].Journal of Electronic Science and Technology,2014,12(1):116-121.
6杨敬安.任意两多边形相交点最大可能数目的计算法[J].计算机学报,1995,18(2):141-145.
7陈超,刘静华,马金盛.场景分割算法及其在实时漫游系统中的应用[J].计算机工程,2001,27(8):86-88. 被引量：2
8邓燕子,卢朝阳,李静.交通场景的多视觉特征图像分割方法[J].西安电子科技大学学报,2015,42(6):11-16. 被引量：2
9宋小敏,张国防,袁放建,王瑾,邢淑兰.数据挖掘技术在课程相关性分析中的应用[J].中国校外教育,2012(10):155-156. 被引量：2
10李根,邓兆祥,阳小光,张杨,李泉.模态仿真分析数据重用技术研究[J].机械科学与技术,2014,33(3):344-347.

武汉理工大学学报（信息与管理工程版）

2014年第6期

浏览历史

内容加载中请稍等...

基于多模态融合和竞争力的视频场景分割算法被引量：1

参考文献4

二级参考文献46

共引文献44

同被引文献11

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于多模态融合和竞争力的视频场景分割算法 被引量：1

参考文献4

二级参考文献46

共引文献44

同被引文献11

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于多模态融合和竞争力的视频场景分割算法被引量：1