基于分形布朗运动和Ada Boosting的多类音频例子识别被引量：8

Recognition of Multiple Audio Clip Classes Based on FBM and Ada Boosting

下载PDF

导出

摘要提出了一种基于分形布朗运动的音频特征提取和识别方法这种方法使用分形布朗运动模型计算出音频例子的分形维数 ,并作为其分形特征针对音频分形特征符合高斯分布的特点 ,使用AdaBoosting算法进行特征约减然后分别使用Ada 加权高斯分类器和支持向量机对约减特征后的音频分类 ,并在两类分类的基础上构造多类分类的模型实验表明。 A novel method for audio feature extraction and recognition is presented In this method, FBM (fractional brownian motion) based fractal dimension is defined as audio fractal feature According to Gaussian distribution characteristic of audio fractal feature, Ada boosting algorithm is used for feature reduction Then two classifiers, weighted Ada Gaussian classifier and support vector machine, are implemented respectively for audio classification Based on these two classifiers, a multiple classifier model is finally constructed Experimental data shows that audio fractal feature achieves better performance than other audio features for music and speech classification

作者吴飞庄永真潘红

机构地区浙江大学人工智能研究所杭州师范学院信息工程学院

出处《计算机研究与发展》 EI CSCD 北大核心 2003年第7期941-949,共9页 Journal of Computer Research and Development

基金国家自然科学基金项目 ( 60 2 72 0 3 1) 浙江省自然科学基金重点项目 (ZD0 2 12 ) 浙江省科技计划重点科研项目 ( 2 0 0 3C2 10 10 )

关键词分形布朗运动音频分形维数音频分形特征特征约减 FBM (fractional Brownian motion) audio fractal dimension audio fractal feature

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1吴飞,庄越挺,张引,潘云鹤.基于隐马尔可夫链的音频语义检索[J].模式识别与人工智能,2001,14(1):104-108. 被引量：10
2庄越挺,毛祎,吴飞,潘云鹤.基于隐马尔可夫链的广播新闻分割分类[J].计算机研究与发展,2002,39(9):1057-1063. 被引量：7
3庄越挺,刘骏伟,吴飞,潘云鹤,张引.基于支持向量机的视频字幕自动定位与提取[J].计算机辅助设计与图形学学报,2002,14(8):750-753. 被引量：38
4J T Foote. An overview of audio information retrieval .Multimedia Systems, 1999, 7(1): 2--11.
5John Saunders. Real time discrimination of broadcast speech/music. IEEE Int'l Cord on Acoustic, Speech, and Signal Processing (ICASSP-96), Atla, 1996.
6Eric Scheirer, M Slaney. Construction and evaluation of a robust multifeature music/speech discriminator. Int' 1 Cord on Acoustic,Speech, and Signal Processing ( ICASSP' 97 ), Munich,Germany, 1997.
7J T Foote. A similarity measure for automatic audio classification.AAAI 1997 Spring Symposium on Intelligent Integration and Use of Text, Image, Video, and Audio Corpora, Stanford, 1997.
8B B Mandlebrot. The Fractal Geometry. of Nature. New York: W H Freeman & Co, 1982.
9R F Voss, J Clarke. 1/f noise in music and speech. Nature,1975, 258:317--318.
10R F Moss, J Clark. 1/f noise in music: Music from 1/f noise.Journal of the Acoustical Sodety of America, 1978, 63 (1) : 258--263.

二级参考文献25

1[1]Y Wang, Z Liu, J Huang. Multimedia content analysis using audio and visual information[J]. IEEE Signal Processing Magazine, 2000, 17(6):12～36
2[2]R Lienhart, F Stuber. Automatic text recognition in digital videos[A]. In: Proceedings of ACM Multimedia, Boston, 1996.11～20
3[3]Zhong Yu, Zhang Hongjiang, Jain Anil K. Automatic caption localization in compressed video[J]. Pattern Analysis and Machine Intelligence, 2000, 22(4):385～392
4[4]V Vapnik. The Nature of Statistical Learning Theory[M]. New York: Springer, 1995
5[5]M Schmidt. Identifying speaker with support vector networks[A]. In: Proceedings of Interface'96, Sydney, 1996
6[6]T Joachims. Text categorization with support vector machines: Learning with many relevant features[A]. In: Proceedings of the 10th European Conference on Machine Learning, Chemnitz, Germany, 1998.137～142
7[7]Yuan Qi. Learning algorithms for video and audio processing: Independent component analysis and support vector machine based approaches[R].College Park: University of Maryland at College Park, LAMP-TR-056(CAR-TR-951), 2000
8[8]Edgar Osuna, Robert Freund, Federico Girosi. Training support vector machines: An application to face detection[A]. In: Proceedings of Computer Vision and Pattern Recognition, Puerto Rico, 1997.130～136
9[9]C J C Burges. A tutorial on support vector machines for pattern recognition[J]. Data Mining, and Knowledge Discovery, 1998, 2(2):121～167
10[10]T M Cover. Geometrical and statistical properties of systems and linear inequalities with applications in pattern recognition[J]. IEEE Transactions on Electronic Computers, 1965, 14(3):326～334

共引文献51

1杨玉莲,谢磊.基于子词链的中文新闻广播故事自动分割[J].计算机应用研究,2009,26(2):583-586. 被引量：2
2王勇,郑辉,胡德文.图像和视频中的文字获取技术[J].中国图象图形学报（A辑）,2004,9(5):532-538. 被引量：13
3陈忠克,郭振江,刘骏伟,吴飞,庄越挺.足球比赛精彩场景的自动分析与提取[J].计算机辅助设计与图形学学报,2004,16(6):856-860.
4古红英,潘红,吴飞,庄越挺,潘云鹤.虹膜自相似性识别方法研究[J].计算机辅助设计与图形学学报,2004,16(7):973-977. 被引量：7
5史迎春,王韬,周献中.基于语义的新闻视频检索研究[J].计算机工程,2004,30(16):155-157. 被引量：7
6余棉水,黎绍发.基于边缘与SVM的车牌自动定位与提取[J].计算机应用研究,2004,21(10):131-133. 被引量：8
7史迎春,方鹏飞,周献中.综合利用声视特征的新闻视频结构化模型[J].计算机工程与应用,2004,40(32):99-101. 被引量：6
8史迎春,周献中,方鹏飞.综合利用形状和颜色特征的台标识别[J].模式识别与人工智能,2005,18(2):216-222. 被引量：13
9周献中,史迎春,王韬.基于HSV颜色空间加权Hu不变矩的台标识别[J].南京理工大学学报,2005,29(3):363-367. 被引量：11
10闫丽颖,王欢,杨颖.模糊c均值聚类在wav格式音频检索中的研究[J].中国科技信息,2006(02A):15-15. 被引量：1

同被引文献37

1陈莘萌,陈刚,姚昱.基于最小平均复杂度的矢量量化音频分类方法[J].武汉大学学报（理学版）,2005,51(1):69-73. 被引量：1
2佟春生,黄强,刘涵,刘俊萍.基于近似熵的径流序列复杂性研究[J].西北农林科技大学学报（自然科学版）,2005,33(6):121-126. 被引量：15
3白亮,老松杨,陈剑赟,吴玲达.基于支持向量机的音频分类与分割[J].计算机科学,2005,32(4):87-90. 被引量：13
4姚靠华,蒋艳辉.基于决策树的财务预警[J].系统工程,2005,23(10):102-106. 被引量：29
5薄翠梅,张湜,王执铨,李俊.基于滑动时间窗的支持向量机软测量建模研究[J].自动化仪表,2006,27(1):45-48. 被引量：14
6马志欣,付少锋,周利华.哼唱检索中一种新的旋律模糊匹配方法[J].西安电子科技大学学报,2006,33(1):85-88. 被引量：8
7刘韶跃,杨向群.分数布朗运动环境中混合期权定价[J].工程数学学报,2006,23(1):153-157. 被引量：18
8张静,朱悦心.采用人声输入的网络音乐检索系统[J].微电子学与计算机,2006,23(5):173-178. 被引量：4
9马志欣,周利华.哼唱检索中一种新颖有效的哼唱信息处理方法[J].计算机科学,2006,33(5):169-172. 被引量：5
10李应.音频数据检索技术的研究[J].集美大学学报（自然科学版）,2006,11(2):102-105. 被引量：1

引证文献8

1王若恩,陈锦昌.一类分形曲线的构造算法及维数[J].工程图学学报,2005,26(5):105-109. 被引量：2
2董乐红,耿国华,高原.Boosting算法综述[J].计算机应用与软件,2006,23(8):27-29. 被引量：26
3张燕,唐振民,李燕萍,钱博.基于内容的音乐检索综述[J].金陵科技学院学报,2007,23(2):25-29. 被引量：7
4谭爱平,成亚玲.基于支持向量机的网络入侵检测集成学习算法[J].湖南工业职业技术学院学报,2013,13(2):3-7. 被引量：1
5胡序懿,万丽,陈鹏.分数布朗运动序列近似熵的估计[J].统计与决策,2013,29(15):64-66.
6谭爱平,陈浩,吴伯桥.基于SVM的网络入侵检测集成学习算法[J].计算机科学,2014,41(2):197-200. 被引量：34
7周国雄,沈学杰,李琳,贺超英.基于AdaBoost的网络入侵智能检测[J].系统仿真学报,2014,26(7):1517-1521. 被引量：9
8Yu Ren.An Integrated Intrusion Detection System by Combining SVM with AdaBoost[J].Journal of Software Engineering and Applications,2014,7(12):1031-1038.

二级引证文献77

1李文斌,陈嶷瑛,刘椿年,刘泰峰.邮件过滤算法的比较[J].计算机工程与设计,2008,29(17):4433-4436. 被引量：3
2尹福成,刘正君.基于混沌现象构建分形图形[J].计算机工程与设计,2008,29(20):5403-5404.
3兰帆,黄明和.一种改进旋律匹配算法在MIDI演奏系统中的应用[J].计算机与现代化,2009(6):151-154.
4张玮,刘婷婷.Boosting算法在某移动通信公司客户离网预测中的应用研究[J].价值工程,2009,28(8):102-103.
5陈正宇,张燕,郑玮.基于内容的音频检索系统的前端抗噪技术[J].电子设计工程,2009,17(12):60-61.
6胡云苹,赵英凯,李丽娟.基于组合Boosting回归的软测量建模[J].计算机工程与应用,2010,46(25):235-237.
7邓育林.基于Adaboost算法的车牌检测在OpenCV上的研究与实现[J].广西师范学院学报（自然科学版）,2011,28(1):109-112.
8李会英,曹凯,王晓原.道路线形特征自动分类方法[J].计算机应用,2011,31(6):1692-1695. 被引量：1
9余剑.基于多层支撑矢量机分类算法提取最优抗体集的研究[J].煤炭技术,2011,30(7):207-208. 被引量：1
10张建华,汪鑫.基于内容音频检索综述[J].商情,2012(2):215-217. 被引量：2

1马娜.文本聚类研究[J].电脑知识与技术（过刊）,2009,15(7X):5487-5489. 被引量：2
2蒋盛益,王连喜.基于特征相关性的特征选择[J].计算机工程与应用,2010,46(20):153-156. 被引量：16
3赵爱军,谢林柏.基于粗糙集特征约减的网络异常检测方法[J].南通纺织职业技术学院学报,2010,10(1):26-29.
4王连喜,蒋盛益.一种基于特征聚类的特征选择方法[J].计算机应用研究,2015,32(5):1305-1308. 被引量：20
5冶晓隆,兰巨龙,郭通.基于主成分分析禁忌搜索和决策树分类的异常流量检测方法[J].计算机应用,2013,33(10):2846-2850. 被引量：10
6冶晓隆,兰巨龙,郭通.基于PCA和禁忌搜索的网络流量特征选择算法[J].计算机科学,2014,41(1):187-191. 被引量：5
7赵春华,汪成康,华露,郑思宇,梁志鹏.基于融合特征约减和支持向量机的控制图模式识别[J].中国机械工程,2017,28(8):930-935. 被引量：9
8钱玲飞,刘玉树,李侃.朴素贝叶斯分类器在地形评估中的应用方法[J].计算机工程与应用,2005,41(12):189-191. 被引量：6
9宋博,须德.音频信息检索的研究及实现[J].计算机应用,2003,23(12):52-54. 被引量：11
10陶晓玲,王勇,罗鹏.基于AdaBoost特征约减的入侵检测分类方法[J].计算机工程,2008,34(18):199-201. 被引量：3

计算机研究与发展

2003年第7期

浏览历史

内容加载中请稍等...

基于分形布朗运动和Ada Boosting的多类音频例子识别被引量：8

参考文献16

二级参考文献25

共引文献51

同被引文献37

引证文献8

二级引证文献77

相关作者

相关机构

相关主题

浏览历史

基于分形布朗运动和Ada Boosting的多类音频例子识别 被引量：8

参考文献16

二级参考文献25

共引文献51

同被引文献37

引证文献8

二级引证文献77

相关作者

相关机构

相关主题

浏览历史

基于分形布朗运动和Ada Boosting的多类音频例子识别被引量：8