基于多模态融合的足球视频语义分析被引量：3

Semantic Analysis for Soccer Video Based on Fusion of Multimodal Features

下载PDF

导出

摘要提出一种有效地融合多模态信息来检测足球视频精彩事件的系统算法和框架。首先从视频中抽取音频流,然后基于CHMM进行音频分类。接着根据时间对应关系在包含激昂解说音和欢呼声的相邻镜头里结合球门和慢镜头检测射门事件,其中慢镜头检测是基于徽标的。对射门事件进一步根据激昂解说音和欢呼声的长短、慢镜头的长短及比分字幕的出现检测进球事件。在哨音出现的相邻镜头中结合是否有慢镜头回放及回放长度来检测犯规事件。实验表明,提出的系统算法及框架是高效率的。 This paper proposed a framework to fuse multimodal features to detect soccer highlights. First the audio stream was extracted from video and classified based on CHMM. Then according to time corresponding relationship, shoot event was detected based on the combination of goal and replay in the shots near to those including excited speech of commenter and cheer from audience, where replay was detected based on logos. For shoots scoring could be judged according to the length of excited speech and cheer and the one of replay and the caption appearance. In the shots close to those including whistles fouls could be detected based on the combination of replay appearance and the length of replay. Experiments prove the high efficiency of the proposed system.

作者张玉珍魏带娣王建宇戴跃伟

机构地区南京理工大学自动化学院

出处《计算机科学》 CSCD 北大核心 2010年第7期273-276,共4页 Computer Science

基金南京理工大学科技发展基金(XKF09023)资助

关键词多模态融合音频分类徽标慢镜头球门 Fusion of multimodal features, Audio classification, Logo, Slow-motion replay, Goal

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1金国英,陶霖密,徐光,张翔.基于HHMM的多线索融合和事件推理方法[J].清华大学学报（自然科学版）,2007,47(1):112-115. 被引量：4
2Chen J Y,Li Y H,Wu L D,et al.Semantic event detection in soccer video by integrating multi-features using Bayesian network[C] ∥Proceedings of 2004 International Symposium on Intelligent Multimedia,Video and Speedh Procceding.Oct.2004.
3刘宇驰,栾悉道,戴端辉,吴玲达.多模态体育视频语义分析[J].计算机科学,2007,34(1):109-111. 被引量：6
4Yang Y,Lin S X,et al.Highlights extraction in soccer videos based on goal_mouth detection[C] ∥IEEE Proc.ISSPA 2007.2007:1-4.
5Barnard M,Odobez J M,Bengio S.Multi-modal audio-visual event recognition for football analysis[C] ∥IEEE Workshop on Neural Networks for Signal Processing,NNSP.2003:469.
6Kolekar M H,Palaniappan K,Sengupta S.A Novel Framework for Semantic Annotation of Soccer Sports Video Sequences[A] ∥Proceedings of 5th European Conference on Visual Media Production[C].London,UK,2008:1-9.
7刘国翌,杜威,李华.足球场地标志线的自动提取[J].计算机辅助设计与图形学学报,2003,15(7):870-874. 被引量：19
8王建宇,张峰,周献中,史迎春,骆文.利用小波变换和K均值聚类实现字幕区域分割[J].计算机辅助设计与图形学学报,2006,18(10):1508-1512. 被引量：10
9张玉珍,王建宇,戴跃伟.基于自适应双阈值和主色率的足球视频镜头的分割[J].南京理工大学学报,2009,33(4):432-437. 被引量：10
10魏维,游静,刘凤玉,许满武.音频高层语义分析[J].中国图象图形学报,2007,12(1):141-147. 被引量：4

二级参考文献45

1杜威,李华.足球比赛场景的三维重建和动画生成[J].计算机应用,2000,20(S1):210-212. 被引量：4
2刘彦宏,杜威,李华.足球视频序列中球员的分割与跟踪算法[J].系统仿真学报,2001,13(S2):90-93. 被引量：7
3谢毓湘,栾悉道,吴玲达,老松杨.新闻视频帧中的字幕探测[J].计算机工程,2004,30(20):167-168. 被引量：15
4章东平,祝金标,刘济林.自动定位彩色图像中的文本[J].浙江大学学报（工学版）,2005,39(2):229-233. 被引量：5
5肖鸿开,吴飞.视频内容分析与检索技术研究现状和未来发展趋势[J].广播与电视技术,2005,32(6):50-54. 被引量：7
6智敏,蔡安妮.基于基色调的镜头边界检测方法[J].自动化学报,2007,33(6):655-657. 被引量：6
7庄越廷,潘云鹤,吴飞.网上多媒体信息分析与检索[M].北京:清华大学出版社,2002.
8Zhang H J, Kankanhalli A, Smoliar S W. Automatic partitioning of full motion video [ J ]. Multimedia System, 1993, 1(1): 10-28.
9Wang J Y, Luo W. A self-adapting dual-threshold method for video shot transition detection [ A ]. IEEE International Conference on Networking, Sensing and Control [ C ]. Nanjing, China: Nanjing University, 2008. 704 - 707.
10Ekin A, Tekalp A M. Automatic soccer video analysis and summarization [ J ]. IEEE Transactions on Image Processing, 2003, 12 (7) : 796 - 807.

共引文献45

1周献中,郑华利.基于可变形模型及区域流向分析的等高线自适应矢量化算法[J].计算机学报,2004,27(8):1056-1063. 被引量：8
2王珂娜,邹北骥,钟志华,黄文梅.基于Hough变换的焊接接头自动识别技术研究[J].湖南大学学报（自然科学版）,2004,31(5):99-103. 被引量：5
3罗峰,余艳梅,吴晓红,滕奇志.曲线矢量化中的背景去噪方法[J].计算机应用,2005,25(4):929-931. 被引量：4
4罗峰,余艳梅,刘飞,滕奇志.测井曲线矢量化中的预处理方法研究[J].中国测试技术,2005,31(3):40-41. 被引量：5
5杨化超,邓喀中.利用2维DLT和共线方程分解相机外方位元素[J].测绘科学技术学报,2006,23(3):232-234.
6杨化超,邓喀中,张书毕.基于Hough变换的航空影像建筑物半自动提取[J].测绘科学,2006,31(6):93-94. 被引量：19
7于宁锋.数字摄影测量系统中非量测CCD相机标定算法[J].辽宁工程技术大学学报（自然科学版）,2007,26(2):190-193. 被引量：12
8魏维,叶斌,张元茂.视频语义分析内容表征方式研究[J].计算机工程,2007,33(13):218-220.
9杨化超,邓喀中,张书毕,郭广礼.基于平面格网的非量测CCD相机自标定[J].中国图象图形学报,2007,12(4):613-617. 被引量：2
10闫龙川,杜军.基于SVM的足球场地禁区检测[J].计算机应用,2007,27(B12):80-82. 被引量：2

同被引文献23

1彭培华,曲波,陈荣胜.基于支持向量机的小波域视频字幕检测与提取[J].华南理工大学学报（自然科学版）,2004,32(z1):63-66. 被引量：4
2赵丕锡,胡滨,王秀坤,李国辉.足球视频的结构分析与概要[J].计算机工程与应用,2005,41(30):166-168. 被引量：6
3刘宇驰,吴玲达.基于HMM的足球视频语义结构分析[J].计算机工程与应用,2006,42(28):174-176. 被引量：1
4刘宇驰,栾悉道,戴端辉,吴玲达.多模态体育视频语义分析[J].计算机科学,2007,34(1):109-111. 被引量：6
5金国英,陶霖密,徐光,张翔.基于HHMM的多线索融合和事件推理方法[J].清华大学学报（自然科学版）,2007,47(1):112-115. 被引量：4
6智敏,蔡安妮.基于基色调的镜头边界检测方法[J].自动化学报,2007,33(6):655-657. 被引量：6
7J Y Chen, Y H Li, L D Wu, S Y Lao. Semantic event detection in soccer video by integrating multi-features using Bayesian network [C]// Proceedings of 2004 International Symposium on Intelligent Multimedia, Video and Speed Proceeding, 2004, Oct.
8Y Yang, S X Lin, Y D Zhang, et al. Highlights extraction in soccer avideos based on goal_mouth detection [C]//IEEE Proc. ISSPA 2007. USA: IEEE, 2007: 1-4.
9AYERS D, SHAH M. Monitoring human behavior from video taken in an office environment[ J]. Image and Vision Computing, 2001, 19(12) : 833 - 846.
10XU PENG, XIE LEXING, CHANG S-F, et al. Algorithms and systems for segmentation and structure analysis in soccer video[C]// IEEE International Conference on Multimedia and Expo. Washington, DC: IEEE Computer Society, 2001:721-724.

引证文献3

1张玉珍,丁思捷,王建宇,戴跃伟,陈钱.基于HMM的融合多模态的事件检测[J].系统仿真学报,2012,24(8):1638-1642. 被引量：4
2任梅,詹永照,潘道远,孙佳瑶.基于概率超图的视频事件语义检测[J].计算机应用,2012,32(11):3014-3017. 被引量：1
3张晓丽,智敏.网球视频中慢镜头的自适应阈值探测法[J].计算机工程与科学,2013,35(4):99-103. 被引量：5

二级引证文献10

1同鸣,丁力伟,姬成龙.融合HCRF和AAM的足球视频精彩事件检测[J].计算机研究与发展,2014,51(1):225-236. 被引量：3
2王妍茹.计算机视频分析技术在网球训练中的应用[J].网友世界,2014(12):1-1. 被引量：1
3杨亭,丰洪才,金凯,赵杰雪.基于多模态融合和竞争力的视频场景分割算法[J].武汉理工大学学报（信息与管理工程版）,2014,36(6):759-763. 被引量：1
4同鸣,王硕,丁力伟,王纲.HCRF和网络文本的精彩事件自动检测定位[J].西安电子科技大学学报,2015,42(4):81-87.
5杨章琼,李征.一种基于多尺度实例学习的视频事件检测算法[J].电视技术,2017,41(7):157-163.
6范柏超,朱涛.一种基于主颜色聚类的网球视频比赛场景检测方法[J].电脑与信息技术,2017,25(3):18-21. 被引量：1
7杨静.体育视频中羽毛球运动员的动作识别[J].自动化技术与应用,2018,37(10):120-124. 被引量：11
8李军.乒乓球训练中计算机视频分析技术的应用[J].当代体育科技,2018,8(34):24-25. 被引量：1
9熊辉,王文雯.应用主成分分析和KL变换的体育视频压缩算法[J].微型电脑应用,2022,38(1):126-129.
10王红斌,郜洪奎,沈强,线岩团.泰语人名、地名、机构名实体识别研究[J].系统仿真学报,2019,31(5):1010-1018. 被引量：6

1流言.浪漫视频慢镜头[J].电脑爱好者,2014(3):111-112.
2张晓丽,智敏.网球视频中慢镜头的自适应阈值探测法[J].计算机工程与科学,2013,35(4):99-103. 被引量：5
3刘军.Google的颠覆之路[J].中国计算机用户,2006(2):8-8.
4丹科斯塔(Dan Coast).微软的现实：必须正视并理解触摸的力量[J].电脑时空,2012(8):65-65.
5凝固的色彩喷墨打印机大阅兵[J].新电脑,2003(8):142-145.
6石剑.重磅来袭情定Win8“超级本”[J].优品,2013,0(3):198-201.
7张玉珍,丁思捷,王建宇,戴跃伟,陈钱.基于HMM的融合多模态的事件检测[J].系统仿真学报,2012,24(8):1638-1642. 被引量：4
8林彬,刘群,王群,聂燕柳.足球视频镜头分类方法[J].计算机工程与设计,2012,33(4):1467-1471. 被引量：6
9李树.简单实用的三星VP-HMX20C摄录机[J].摄影与摄像,2009(1):98-99.
10飘零雪.浏览越界，N种超爽犯规玩法（二）[J].网友世界,2008(13):58-59.

计算机科学

2010年第7期

浏览历史

内容加载中请稍等...

基于多模态融合的足球视频语义分析被引量：3

参考文献10

二级参考文献45

共引文献45

同被引文献23

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于多模态融合的足球视频语义分析 被引量：3

参考文献10

二级参考文献45

共引文献45

同被引文献23

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于多模态融合的足球视频语义分析被引量：3