基于支持向量机的多类音频分类被引量：4

MULTI-CLASS AUDIO CLASSIFICATION BASED ON SUPPORT VECTOR MACHINE

下载PDF

导出

摘要研究一种用支持向量机(SVM)进行多类音频分类的方法,其中引入增广两类分类法(AB法)设计多类分类器。该算法把音频分为四类:音乐、纯语音、带背景音的语音和典型的环境音,并分析了这几类音频的八个区别性特征,包括修正低能量成分比率(MLER)和修正基频(MPF)两个新特征以及频域总能量、子带能量、频率中心等其它六个基本特征,综合考察了不同特征集在基于SVM分类器中的分类精度。实验结果表明,提取的音频特征有效,基于SVM的多类音频分类效果良好。 In this paper we studied a multi-class audio classification algorithm performed by the support vector machine（SVM）,in which augmented binary-class（AB） classification method was introduced to design the multi-class classifier.Four classes were considered in audio frequency：music,pure speech,speech over background and typical environment sound,and eight discriminating features of these audio classes were analysed,including the two new ones proposed by the author-modified low energy component ratio（MLER） and modified pitch frequency（MPF）,and other six basic features such as spectrum energy,sub-band powers,frequency centroid,etc.The classification accuracies of different features＇ set in SVM-based audio classifier were evaluated comprehensively.Experiment results show that the audio features selected in this paper are effective for audio classification,and the result of applying SVM to multi-class audio classification is good.

作者俞玉莲郭世杰

机构地区上海电子信息职业技术学院通信与信息工程系上海航天技术研究院信号处理部

出处《计算机应用与软件》 CSCD 2010年第4期98-101,共4页 Computer Applications and Software

基金上海高校选拔培养优秀青年教师科研专项基金项目(DXZ06007)

关键词支持向量机音频分类增广两类分类法 Support vector machine Audio classification Augmented binary-class classification method

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1边肇祺,张学工.模式识别[M].2版.北京:清华大学出版社,2002.
2John Saunders.Real-time discrimination of broadcast speech/music[C]//Int'1 Conf Acoustic,Speech,and Signal Processing,Atlanta,1996.
3Scheirer E,Slaney M.Construction and evaluation of a robust multifeature music/speech discriminator[C]//Int'1 Conf Acoustic,speech,and Signal Processing,Munich:IEEE Press,1997:1331-1334.
4郑怡文.典型的音频分类算法[J].计算机与现代化,2007(8):59-63. 被引量：3
5李国正王猛增华军译 NelloCristianini JohnShawe-Taylor著.支持向量机导论[M].北京:电子工业出版社,2004..
6卢坚,陈毅松,孙正兴,张福炎.语音/音乐自动分类中的特征分析[J].计算机辅助设计与图形学学报,2002,14(3):233-237. 被引量：26
7Platt J C.Sequential minimal optimizer:A fast algorithm for training support vector machines.Technical ReportMSR-TR-98-14[R].Microsoft Research,Redmond,1998.

二级参考文献14

1齐俊英,孙劲光,高爱东.基于内容的音频自动分类方法[J].辽宁工程技术大学学报（自然科学版）,2005,24(z1):170-172. 被引量：5
2续鸿飞,肖明.音频检索综述[J].晋图学刊,2005(6):15-19. 被引量：8
3张一彬,周杰,边肇祺.基于内容的戏曲分类与分析[J].计算机工程,2006,32(12):182-183. 被引量：4
4[1]Hao Jiang, Tony Lin, Hongjiang Zhang. Video segmentation with the support of audio segmentation and classification[C]. In: Proceedings of ICME'2000-IEEE International Conference on Multimedia and Expo, New York, 2000,3:1507～1510
5[2]Tong Zhang, C-C Jay Kuo. Heuristic approach for generic audio data segmentation and annotation[C]. In: Proceedings of the 7 th ACM International Conference on Multimedia, Orlando, 1999. 67～76
6[3]Savitha Srinivasan, Dragutin Petkovic, Dulce Ponceleon. Towards robust features for classifying audio in the cudeVideo system[C]. In: Proceedings of the 7th ACM International Conference on Multimedia, Orlando, 1999. 393～400
7[4]Guojun Lu, Templar Hankinson. A technique towards automatic audio classification and retrieval[C]. In: Proceedings of the 4th IEEE International Conference on Signal Processing, ICSP 1998, Beijing, 1998,2:1142～1145
8[5]L Rabiner, B H Juang. Fundamentals of Speech Recognition[M]. New Jersey: Prentice-Hall International, 1993
9[6]Rivarol Vergin, Douglas O'Shaughnessay. Generalized mel-frequency cepstral coefficients for large-vocabulary speaker-independent continuous speech recognition[J]. IEEE Transactions on Speech and Audio Processing, 1999, 7(5):525～53
10[7]J T Foote. Content-based retrieval of music and audio[C]. C-C J Kuo, et al. editor. In: Proceedings of SPIE, Multimedia Storage and Archiving Systems II, 1997, 32(29):138～147

<12 >

共引文献110

1郑勇涛,刘玉树.一种基于支持向量机的空间数据分类方法[J].微机发展,2005,15(7):76-78.
2林杨华.中学历史教学提问技巧谈[J].宁德师专学报（哲学社会科学版）,2005(3):102-104.
3白亮,老松杨,陈剑赟,吴玲达.基于支持向量机的音频分类与分割[J].计算机科学,2005,32(4):87-90. 被引量：13
4陈功,张雄伟.灰关联分析与语音/音乐信号识别[J].电子技术应用,2005,31(10):21-23. 被引量：2
5白亮,老松杨,陈剑赟,吴玲达.音频自动分类中的特征分析和抽取[J].小型微型计算机系统,2005,26(11):2029-2034. 被引量：13
6王春林,周昊,周樟华,凌忠钱,李国能,岑可法.基于支持向量机的大型电厂锅炉飞灰含碳量建模[J].中国电机工程学报,2005,25(20):72-76. 被引量：98
7祁正兴.多环芳烃致癌活性的支持向量机分类模型[J].青海师范大学学报（自然科学版）,2005,21(4):71-75. 被引量：2
8黄勇,郑春颖,宋忠虎.多类支持向量机算法综述[J].计算技术与自动化,2005,24(4):61-63. 被引量：33
9陈功,王振力,张建兵.基于短时能量的语音/音乐快速分类[J].电子技术应用,2006,32(1):53-55. 被引量：3
10印家健,邹平,祁正兴,王显祥.多环芳烃致癌性预测模型比较研究[J].四川农业大学学报,2006,24(1):55-60. 被引量：3

<12 3 4 5…11 >

同被引文献39

1郑惠强,朱卫,宓为建.基于神经网络的大型回转支承典型故障诊断方法[J].中国工程机械学报,2004,2(3):332-335. 被引量：3
2李航航,周敏.飞机结冰探测技术及防除冰系统工程应用[J].航空工程进展,2010,1(2):112-115. 被引量：19
3杜恩祥,李科杰.基于多重分形和小波变换的声目标信号特征提取[J].自动化学报,2004,30(5):742-746. 被引量：8
4唐发明,王仲东,陈绵云.支持向量机多类分类算法研究[J].控制与决策,2005,20(7):746-749. 被引量：90
5栗苹,崔占忠,施聚生.声目标识别技术及其在坦克目标识别中的应用[J].兵工学报,1996,17(1):51-54. 被引量：11
6周德廉,邵国友.现代测试技术与信号分析[M].徐州:中国矿业大学出版社,2005.
7Kiyashchenko D, Smirnova N, Troyan V, et al. Seismic hazard precursory evolution : fractal and multifractal aspects [ J ]. Physics and Chemistry of the Earth,2004,29:367 - 378.
8GUAN Jian,LIU Ning-bo, ZHANG Jian, et al. Muhifractal correla- tion characteristic for radar detecting low-observahle target in sea clutter[ J ]. Signal Processing,2010,90:523 - 535.
9Alan V O, Alan S W. Signals & systems[ M]. 2nd ed. New Jersey : Prentice-Hall Inc, 1997.
10文智,王寅观.Wigner_vill分布在多普勒胎儿心率提取中的应用研究[J].声学技术,2007,26(5):1042-1043. 被引量：1

<12 3 4 >

引证文献4

1祝晓燕,田希,朱霄珣,李文华.基于内禀模态能量熵与支持向量机的转子故障智能诊断方法的研究[J].汽轮机技术,2011,53(5):375-377. 被引量：4
2邢志伟,张辉.基于支持向量机的飞机地面结冰冰型分类预测[J].计算机技术与发展,2012,22(6):247-250. 被引量：5
3丁凯,方向,张卫平,范磊,李兴华,谢立军.基于声信号多重分形和支持向量机的目标识别研究[J].兵工学报,2012,33(12):1521-1526. 被引量：6
4俞鹏飞,张新峰,王敏捷.基于乐纹特征和倒排索引的音乐检索系统[J].计算机应用与软件,2014,31(10):45-48. 被引量：2

二级引证文献17

1张梅军,陈灏,曹勤,王闯.EMD分解、分形理论和RBF神经网络相结合的轴承智能故障诊断研究[J].机械,2012,39(11):10-15. 被引量：5
2张丽,李静,葛汝冰.全国主要城市空气质量级别的分类预测——基于支持向量机的视角[J].管理工程师,2013,18(1):55-57. 被引量：4
3李如发,卢文科.SVR在传感器预测中的研究[J].信息通信,2013,26(8):37-40.
4汪旭颖,闫冲.基于支持向量回归机的油田生产预警模型研究[J].计算技术与自动化,2014,33(2):130-132. 被引量：2
5李春生,苏晓伟,魏军,王丽丽.基于支持向量机的抽油机井功图识别研究[J].计算机技术与发展,2014,24(8):215-218. 被引量：9
6孟庆昕,杨士莪,于盛齐.基于波形结构特征和支持向量机的水面目标识别[J].电子与信息学报,2015,37(9):2117-2123. 被引量：15
7王鹏,郭朝勇,刘红宁.基于支持向量机的枪弹外观缺陷识别与分类[J].计算机工程与科学,2016,38(9):1943-1949. 被引量：4
8宋佳星,雷祺,方向,张卫平,曹伟.基于小波的装甲声信号特征分析及滤波方法[J].探测与控制学报,2017,39(4):61-66. 被引量：3
9崔建国,高波,蒋丽英,于明月,郑蔚.基于灰色和LSSVM的航空发动机状态预测[J].计算机工程与设计,2017,38(10):2809-2813. 被引量：5
10王星,呙鹏程,田元荣,王玉冰.基于BDS-GD的低截获概率雷达信号识别[J].北京航空航天大学学报,2018,44(3):583-592. 被引量：11

<12 >

1俞玉莲,郭世杰.音频分类中的特征分析[J].信息技术,2009,33(6):31-33. 被引量：1
2郑继明,俞佳.基于小波变换和支持向量机的音频分类[J].计算机工程与应用,2009,45(11):158-161. 被引量：5
3颜景斌,吴石,伊戈尔·艾杜阿尔达维奇.基于单类支持向量机的音频分类[J].计算机应用,2009,29(5):1419-1422. 被引量：4
4郑展恒,曾庆宁,张少兵.一种语音端点检测方法的研究[J].桂林电子科技大学学报,2008,28(1):23-26. 被引量：3
5有一说一[J].商业故事（数字通讯）,2012(9):124-125.
6郑展恒,曾庆宁.噪声环境下端点检测方法的研究[J].大众科技,2008,10(4):69-70.
7张绍宁,张兵,李景.一类实时的数字仿真算法[J].计算机仿真,2013,30(3):251-255.
8吴婷,颜国正,杨帮华.基于小波包分解的脑电信号特征提取[J].仪器仪表学报,2007,28(12):2230-2234. 被引量：24
9罗忠亮,林土胜,李碧,杨军,张地.用于虹膜识别的轮廓波特征提取[J].计算机工程与科学,2011,33(1):77-81.
10屏蔽声音的“口罩”[J].发明与创新（大科技）,2017,0(5):63-63.

<12 >

计算机应用与软件

2010年第4期

职称评审材料打包下载

基于支持向量机的多类音频分类被引量：4

参考文献7

二级参考文献14

共引文献110

同被引文献39

引证文献4

二级引证文献17

相关作者

相关机构

相关主题

基于支持向量机的多类音频分类 被引量：4

参考文献7

二级参考文献14

共引文献110

同被引文献39

引证文献4

二级引证文献17

相关作者

相关机构

相关主题

微信扫一扫：分享

基于支持向量机的多类音频分类被引量：4