基于 MPEG 国际标准压缩视频流的镜头切分算法被引量：7

Approach for shot segmentation using MPEG compressed data

导出

摘要镜头切分是实现对动态视频基于内容检索的第一步，以检测出来的镜头作为基本单元，可以进一步对视频内容进行分析和建立索引。从实用角度看，目前越来越多的动态视频资料都是以压缩形式存储和传输，所以，研究基于压缩视频流的算法更有实际意义。本文旨在提出一种基于ＭＰＥＧ国际标准压缩视频流的镜头自动切分算法，通过利用ＭＰＥＧ数据流中已有的信息，如离散余弦变换（ＤＣＴ）系数和运动向量，只进行最小程度的解码，来检测镜头间的边界，从而实现镜头切分。针对实际视频流中镜头切换方式的复杂性，本文提出了三个算法分别处理不同情况，并将这三个算法以树形分类器的方式组织在一起，形成一个系统。通过对十段不同类型的ＭＰＥＧ－Ⅰ压缩视频节目进行镜头切分实验，取得了９０％以上的正确率。 Segmenting video sequences into individual shots is one of the fundamental processes in content based video retrieval. We can further parse and index the video content based on the basic unit of shot. Up to now, more and more video materials are stored and transmitted in the compression form, so it is practical to study the shot segmentation algorithms based on compressed video data. This paper presents an integrated approach to detect the boundaries between shots by using the discret cosine transform (DCT) coefficients and motion vectors encoded in MPEG compressed data. Only minimal decoding is needed for the algorithm. Considering the complicated situation in real world video sequences, three algorithms are developed to deal with different situations, and we also present a tree like classifier to organize the three algorithms together to form a system. By testing ten video sequences for various types, we get over 90% correct percentage.

作者祁卫钟玉琢

机构地区清华大学计算机科学与技术系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 1997年第9期50-54,共5页 Journal of Tsinghua University(Science and Technology)

基金国家"八六三"高技术项目

关键词镜头切分 MPEG 视频流多媒体压缩视频流 shot segmentation content based retrieval tree like classifier discret cosine transform motion vector MPEG 

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1Yeo B L，Proc IEEE Int conf on multimedia computing and systems，1995年
2Meng J H，SPIE.2419，1995年
3Zhang H J，Multimedia Tools Appl，1995年，1期，89页

同被引文献78

1徐建华.图象处理与分析[M].北京:科学出版社,1992..
2-.运动图象及其伴音通用编码国际标准-MPEG-1[M].南京大学出版社,1995..
3Zhang H.J., Chien Y.L., Smoliar S.W.. Video parsing and browsing using compressed data. Multimedia Tools and Applications, 1995,(1): 89～113
4Shahraray B.. Scene change detection and content-based sampling of video sequences. In: Proceedings of IS&T/SPIE Symposium on Digital Video Compression: Algorithm and Technologies. Bellingham, Washington D.C.: SPIE Press, 1995, 2419: 2～13
5Zhang H.J. et al.. Video parsing, retrieval and browsing: An integrated and content- based solution. In: Proceedings of ACM Multimedia'95, San Francisco, 1995, 15～24
6Nagasaka A., Tanaka Y.. Automatic video indexing and full-video search for object appearances. In: Knuth E., Wegner L.M. eds. IFIP Proceedings of Visual Database Systems. Amsterdam, The Netherlands: North-Holland, 1992, 113～127
7Srinivasan M.V., Venkatesh S.,Hosie R.. Qualitative estimation of camera motion parameters from video sequence. Pattern Recognition, 1997, 30(4): 593～606
8Ueda H., Miyatake T., Yoshizawa S. IMPACT. An interactive natural-motion picture dedicated multimedia authoring system. In: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems: Reaching Through Technology. New York: ACM Press, 1991, 343～350
9Toller M.S., Lewis, Nixon M.S.. Video segmentation using combined cues. In: Proceedings of the SPIE, San Jose, CA, 1997, 3312: 414～425
10Alattar A.M.. Detecting and compressing dissolve regions in video sequences with a DVI multimedia image compression algorithm. In: Proceedings of IEEE International Symposium Circuits and Systems (ISCAS), Chicago, 1993, 1: 13～16

引证文献7

1朱曦,林行刚.视频镜头时域分割方法的研究[J].计算机学报,2004,27(8):1027-1035. 被引量：20
2韩冰,高新波,姬红兵.一种分层的和多分辨的镜头边界检测方法[J].计算机科学,2006,33(6):225-231. 被引量：2
3沈琳,邬小鲁.视频图像压缩编码标准分析[J].舰船电子工程,2007,27(3):36-41. 被引量：1
4杨胜,钟玉琢.一种从MPEG压缩视频流中提取关键帧的方法[J].中国图象图形学报（A辑）,2001,6(3):254-258. 被引量：21
5傅庆冬,程义民,王以孝.含有复杂运动的MPEG压缩域镜头分割算法[J].电路与系统学报,2002,7(2):30-34. 被引量：4
6朱小俊,老松杨,吴作顺,谢毓湘.一种有效的镜头探测方法[J].计算机工程与应用,2003,39(8):59-61.
7孙季丰,李颖雄.视频镜头自动分割的若干方法[J].华南理工大学学报（自然科学版）,2003,31(8):10-14. 被引量：12

二级引证文献57

1周兵,张兆东,郭健.MPEG-2传输流中Ⅰ-帧的统计分析[J].中国有线电视,2007(20):1806-1809.
2隗华,陈晓鸥.一种格式无关的视频序列关键帧提取策略[J].计算机应用,2003,23(z1):189-190. 被引量：4
3韩放,周祖旭.学校体育对培养人的竞争意识的思考[J].哈尔滨体育学院学报,2002,20(1).
4孟宇,李文辉.一种基于PSO分类器的镜头边界检测算法[J].计算机研究与发展,2007,44(z2):246-250.
5朱曦,林行刚.视频镜头时域分割方法的研究[J].计算机学报,2004,27(8):1027-1035. 被引量：20
6钱刚,曾贵华.典型视频镜头分割方法的比较[J].计算机工程与应用,2004,40(32):51-55. 被引量：29
7张晓燕,赵荣椿,聂烜.基于内容视频分析的发展研究[J].计算机应用研究,2005,22(4):12-14. 被引量：5
8王一拙,石峰.基于自动镜头分割的视频压缩编码算法[J].计算机辅助设计与图形学学报,2005,17(7):1620-1624. 被引量：5
9许先斌,陈勇华,汪长城.基于压缩域的关键帧快速提取方法[J].计算机工程与设计,2005,26(12):3304-3306.
10冯驰,谭枫.一种改进的自动分割镜头的方法[J].应用科技,2006,33(6):90-92. 被引量：3

1吴绍根.基于小波变换的视频流镜头切分及关键帧提取[J].计算机与数字工程,2016,44(9):1816-1820. 被引量：1
2薛向阳,肖友能,丁长明.压缩视频流中主要运动的定性分析[J].计算机学报,2002,25(12):1428-1433. 被引量：7
3朱映映,周洞汝,蔡波.基于DC系数和运动矢量的快速场景分割算法[J].小型微型计算机系统,2004,25(4):540-542. 被引量：2
4邱林海,余胜生,周敬利.视频压缩流简化帧处理中若干问题研究[J].小型微型计算机系统,2000,21(3):292-294.
5王利霞,杨克俭.关于数字音频的探讨[J].福建电脑,2004,20(8):32-33. 被引量：1
6张子银,白雪生,徐光祐,鄢恒权.闪光灯和标题条对新闻视频镜头检测影响的研究[J].清华大学学报（自然科学版）,2003,43(1):71-74. 被引量：5
7夏正达.从对联戏说镜头切分和摄录窍门[J].DV@时代,2009(1):104-105.
8熊异.基于块分类的自适应视频水印算法在TMS320DM643x DSP上的编程实现[J].信息与电脑（理论版）,2011(12):189-190. 被引量：1
9朱映映,周洞汝.一种从压缩视频流中提取关键帧的方法[J].计算机工程与应用,2003,39(18):13-14. 被引量：23
10李永刚,魏远旺,叶利华,朱蓉.压缩视频流关键帧快速抽取方法[J].计算机工程与应用,2011,47(33):162-164. 被引量：1

清华大学学报（自然科学版）

1997年第9期

浏览历史

内容加载中请稍等...

基于 MPEG 国际标准压缩视频流的镜头切分算法被引量：7

参考文献3

同被引文献78

引证文献7

二级引证文献57

相关作者

相关机构

相关主题

浏览历史

基于 MPEG 国际标准压缩视频流的镜头切分算法 被引量：7

参考文献3

同被引文献78

引证文献7

二级引证文献57

相关作者

相关机构

相关主题

浏览历史

基于 MPEG 国际标准压缩视频流的镜头切分算法被引量：7