一种面向基于内容视频检索的音频场景分割方法

Audio Scene Segmentation Method for Content-based Video Retrieval

下载PDF

导出

摘要视频数据中的音频流包含了丰富的语义信息.在基于内容的视频检索中,对音频信息的分析是不可分割的一部分.本文主要讨论基于内容的音频场景分割,分析各种音频特征及提取方法,并在此基础上提出一种新的音频流分割方法,根据六种音频类型(语音、音乐、静音、环境音、纯语音、音乐背景下的语音和环境音背景下的语音)的音频特征对视频数据中的音频流分割音频场景.实验证明该方法是有效的,在保证一定的分割精度的同时,准确率和查全率都得到了较大的提高. Audio streams in video contain a lot of semantic information. In content-based video retrieval, it is indivisible to analyze audio signals. Having discussed various audio features and their extracting methods, we bring forward a new method for audio scene segmentation, according to the features of six kinds of audio signal types （silence, music, environmental sound, pure speech, speech with music and speech with environmental sound） to segment audio stream. Experimental results show that this proposed approach not only ensures segmented precision, but also improves greatly the recall and precision.

作者朱映映明仲周景洲

机构地区深圳大学信息工程学院哈尔滨工业大学软件工程有限公司

出处《小型微型计算机系统》 CSCD 北大核心 2008年第3期557-562,共6页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(60673122)资助广东省自然科学基金项目(5301029)资助深圳大学科研启动基金项目(200515)资助

关键词音频场景分割基于内容的音频分析音频特征音频分类 audio scene segmentation content-based audio analysis audio features audio classification

分类号 TP391 [自动化与计算机技术—计算机应用技术] TP941.1 [自动化与计算机技术]

引文网络
相关文献

参考文献2

1白亮,老松杨,陈剑赟,吴玲达.音频自动分类中的特征分析和抽取[J].小型微型计算机系统,2005,26(11):2029-2034. 被引量：13
2张一彬,周杰,边肇祺,张大鹏.一种基于内容的音频流二级分割方法[J].计算机学报,2006,29(3):457-465. 被引量：7

二级参考文献14

1Chou W.,Gu L..Robust singing detection in speech/music discriminator design.In:Proceedings of the IEEE ICASSP,Salt Lake City,USA,2001,2:865～868
2Ajmera J.,Mccowan I.A.,Bourlard H..Robust HMM-based speech/music segmentation.In:Proceedings of the IEEE ICASSP,Orlando,USA,2002,1:297～300
3Sundaram H.,Chang S.F..Audio scene segmentation using multiple features,models and time scales.In:Proceedings of the IEEE ICASSP,Istanbul,Turkey,2000,4:2441～2444
4Foote J..Automatic audio segmentation using a measure of audio novelty.In:Proceedings of the IEEE Multimedia and Expo,New York,USA,2000,1:452～455
5Kemp T.,Schmidt M.,Waibel A..Strategies for automatic segmentation of audio data.In:Proceedings of the IEEE ICASSP,Istanbul,Turkey,2000,3:1423～1426
6Zhang T.,Kuo C.J..Audio content analysis for online audiovisual data segmentation and classification.IEEE Transactions on Speech and Audio Processing,2000,9(4):441～457
7Lu L.,Zhang H.J.,Jiang H..Content analysis for audio classification and segmentation.IEEE Transactions on Speech and Audio Processing,2002,10(7):504～516
8Bobrek M.,Koch D.B..Music signal segmentation using tree-structured filter banks.Journal of the Audio Engineering Society,1998,46(5):412～427
9Zhang Y.B.,Zhou J..A study on content-based music classification.In:Proceedings of the 7th IEEE International Symposium on Signal Processing and Its Applications,Paris,France,2003,2:113～116
10Li D.G.,Sethi I.K.,Dimitrova N.,Mcgee T..Classification of general audio data for content-based retrieval.Pattern Recognition Letters,2001,22(5):533～544

共引文献18

1万旺根,常辽豫,余小清,崔滨,刘晗.音频信息检索研究现状与发展趋势[J].上海大学学报（自然科学版）,2007,13(4):363-370. 被引量：3
2于俊清,崔玉强,何云峰.足球比赛中的音频信息提取与自动分类[J].华中科技大学学报（自然科学版）,2007,35(10):35-38. 被引量：1
3杨圣云,袁德辉,赖国明.基于串核的音乐风格聚类[J].计算机工程与设计,2008,29(3):687-689.
4史东承,韩玲艳,于明会.基于HMM/SVM的音频自动分类[J].长春工业大学学报,2008,29(2):178-182. 被引量：9
5杨圣云,赖国明,袁德辉.基于串核的音乐分类研究[J].计算机工程与应用,2008,44(16):243-245. 被引量：1
6张小梅,杨鼎才.基于支持向量机模型的环境音分类研究[J].电子测量技术,2008,31(9):121-123. 被引量：4
7李志忠,滕光辉.基于改进MFCC的家禽发声特征提取方法[J].农业工程学报,2008,24(11):202-205. 被引量：24
8张新彩,张德同,耿国华,王小凤,吴江.基于PCA和CHMM的音频自动分类[J].计算机应用研究,2009,26(4):1257-1259. 被引量：4
9王天江,陈刚,刘芳.一种按节拍动态分帧的歌曲有歌唱部分检测新方法[J].小型微型计算机系统,2009,30(8):1561-1564. 被引量：2
10于俊清,胡小强,孙凯.改进的音频混合分割方法[J].计算机辅助设计与图形学学报,2010,22(7):1174-1181. 被引量：4

1李超,熊璋,朱成军.基于距离相关图的音频相似性度量方法[J].北京航空航天大学学报,2006,32(2):224-227. 被引量：6
2郑继明,邢峰,吴渝,李婧.基于小波变换和支持向量机的音频分类[J].重庆邮电大学学报（自然科学版）,2008,20(2):212-216. 被引量：4
3魏宇虹,韩纪庆,张磊.一种基于HMM模型的音频场景分析技术[J].计算机工程与应用,2003,39(20):85-86. 被引量：2
4颜景斌,吴石,伊戈尔·艾杜阿尔达维奇.基于单类支持向量机的音频分类[J].计算机应用,2009,29(5):1419-1422. 被引量：4
5沈乐君,程小平.音频流分割和多模式控制的设计与实现[J].西南师范大学学报（自然科学版）,2004,29(6):942-944.
6肖沙里,周长国,唐跃林.基于DirectShow的镜头检测系统[J].重庆大学学报（自然科学版）,2006,29(1):33-35. 被引量：1
7蔡肯,梁晓莹.基于内容的视频检索技术[J].现代计算机,2007,13(12):59-61. 被引量：1
8胡双演,李俊山,王蕊,杨威,陈磊.基于运动轨迹的视频检索方法[J].计算机工程与设计,2008,29(7):1764-1765. 被引量：1
9冬霜.为QQ语聊加情景音效[J].计算机应用文摘,2006,22(20):87-87.
10黄知义,周宁.基于内容视频检索的关键技术研究[J].现代情报,2005,25(10):126-129. 被引量：7

小型微型计算机系统

2008年第3期

浏览历史

内容加载中请稍等...

一种面向基于内容视频检索的音频场景分割方法

参考文献2

二级参考文献14

共引文献18

相关作者

相关机构

相关主题

浏览历史