一种稳健的语音/音乐分类法被引量：3

A Robust Speech/Music Discrimination Approach

下载PDF

导出

摘要提出了一种把音频片段分类成语音或音乐的新系统。系统能自动选取在相应的信噪比下具有最高分类精度的特征参数。将从音频片段提取的特征参数值与门限值相比较进行语音/音乐的分类,其中的门限值与一定的信噪比相适应。介绍了一种新特征参数,即低频带能量率方差,在低信噪比环境下,它对分类精度有很大地提高。考察了系统在不同的信噪比环境下的分类性能。实验结果表明,所提系统分类性能良好。 A new system for classifying audio segments as speech or music is presented. The system selects the features with the highest classification accuracy and corresponding SNR value. The value of this features extracted from each window-level segment arc compared to certain thresholds, which are also adapted to the SNR. Multiexpert method of combining the features is employed to improve the classification accuracy. A new feature, the variance of low-band energy ratio, is also introduced, which produces large improvements in classification accuracy at low SNR. Performance of the proposed system is evaluated for different SNR. The experiment results show that the classification accuracy is excellent.

作者贾兰兰冯小平

机构地区西安电子科技大学电子工程学院空军工程大学理学院

出处《电声技术》 2009年第1期55-57,62,共4页 Audio Engineering

关键词特征提取音频分类多专家系统自适应门限 feature extraction audio classification multi-experts systems adaptive threshold

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献5

1SCHEIRER E, SLANER M. Construction and evaluation of a robust multifeature speech/music discriminator[C]// Proceedings of International Conference on Acoustics, Speech,and Signal Processing. Munich:IEEE Press, 1997, 2:1331-1334.
2PINQUIER J, ROUAS J L, ANDRE-OBRECHT R. A fusion study in speech/music classification[C]//Proceedings of International Conference on Acoustics, Speech, and Signal Processing. Hong Kong :IEEE Press, 2003,2 : 17-20.
3SCHULLER B, SCHMITT B J B, ARSIC D, et al. Feature selection and stacking for robust discrimination of speech, monophonic singing, and polyphonic music[C]// Proceedings of International Conference on Multimedia and Expo. Amsterdam:IEEE Press, 2005:840-843.
4ABU-EL-QURAN A R, GOUBRAN R A. Adaptive pitchbased speech detection for hands-free applications[C]// Proceedings of International Conference on Acoustics, Speech, and Signal Processing. Philadelphia:IEEE Press, 2005,3 : 305-308.
5RODRIGUEZ J, RIOS F, ESCANO-QUERO R, et al. Adaptive method for SNR estimation in speech signal Electronics Letters, 1996(12) :421-422.

同被引文献23

1齐俊英,孙劲光,高爱东.基于内容的音频自动分类方法[J].辽宁工程技术大学学报（自然科学版）,2005,24(z1):170-172. 被引量：5
2许劲,杨秀平.P2P下的语音聊天软件实现[J].湖南城市学院学报（自然科学版）,2005,14(2):66-68. 被引量：4
3陈功,王振力,张建兵.基于短时能量的语音/音乐快速分类[J].电子技术应用,2006,32(1):53-55. 被引量：3
4吕萍,颜永红.广播新闻语料识别中的自动分段和分类算法[J].电子与信息学报,2006,28(12):2292-2295. 被引量：2
5陈功,张雄伟.一种基于灰关联分析的语音/音乐分类方法[J].声学技术,2007,26(2):262-267. 被引量：8
6张一彬,周杰,边肇祺,郭军.基于内容的音频与音乐分析综述[J].计算机学报,2007,30(5):712-728. 被引量：18
7郑怡文.典型的音频分类算法[J].计算机与现代化,2007(8):59-63. 被引量：3
8于俊清,崔玉强,何云峰.足球比赛中的音频信息提取与自动分类[J].华中科技大学学报（自然科学版）,2007,35(10):35-38. 被引量：1
9LI Y,WANG D. Separation of singing voice from music accompaniment for monaural recordings[J].Proceedings of the IEEE International Conference on Acoustics Speech and Signal Processing,2007,(04):1475-1486.
10EVERY M R,SZYMANSKI J E. A spectral-filtering approach to musical signal separation[A].Naples,Italy:[s.n.],2004.197-200.

引证文献3

1容宝华.基于最小距离的音频分类方法的研究[J].电声技术,2012,36(11):46-51. 被引量：3
2汤政.歌唱人声分离算法改进研究[J].电声技术,2013,37(12):61-65. 被引量：1
3田旺兰.语音/音乐的深度置信网络高准确度识别方法[J].吉首大学学报（自然科学版）,2017,38(1):36-39. 被引量：3

二级引证文献6

1辛欣,陈曙东,仝明磊,胡文皓,刘陈伟,葛浩栋.采用潜在概率语义模型和K近邻分类器的音频分类算法[J].华侨大学学报（自然科学版）,2016,37(2):196-200. 被引量：1
2陈琼,张守劲.基于多媒体混声效果的音频扩声系统研究分析[J].广播电视信息,2017,0(4):35-37. 被引量：1
3董兴宁,蔡宇航.基于循环神经网络的歌曲旋律与人声分离系统设计与实现[J].现代计算机,2019,0(25):96-100. 被引量：1
4钱甜.声纹特征在音乐识别方法中的研究与应用[J].微型电脑应用,2020,36(6):127-129. 被引量：5
5杨贵安,邵玉斌,龙华,杜庆治.一种基于音频分割的音频分类算法[J].通信技术,2021,54(2):317-322. 被引量：1
6孙慧芳,龙华,邵玉斌,杜庆治.基于过零率及频谱的语音音乐分类算法[J].云南大学学报（自然科学版）,2019,0(5):925-931. 被引量：20

1薛笑芳.专家系统及专家系统开发工具发展现状及动向[J].重庆通信学院学报,2000,19(2):34-39. 被引量：1
2韩春元,王政平.光纤传感器的系统分类与识别[J].现代科技译丛（哈尔滨）,1995(2):29-36.
3李海燕,张岩.移动通信网络的移动台定位技术及应用[J].邮电设计技术,2006(3):27-34. 被引量：20
4杨尚国,杨金龙.语音识别技术概述[J].福建电脑,2006,22(8):50-50. 被引量：9
5李允博,张成良.1.6Tbit/s与800Gbit/s光波分复用系统(WDM)技术要求[J].电信网技术,2003(1):27-30. 被引量：2
6高宗敏.卫星信号的转发过程和接收系统分类[J].有线电视技术,2000,7(1):78-80.
7杨玉斌.智能手机概念及其系统分类简介[J].电子乐园,2011(5):103-105.
8贾兰兰.一种快速稳健的语音/音乐分类方法[J].信息与电子工程,2008,6(4):281-283. 被引量：4
9医用电子技术与设备[J].电子科技文摘,2000(11):147-149.
10陈宝江.大屏幕显示系统及其应用[J].中国传媒科技,2011(10):66-67. 被引量：5

电声技术

2009年第1期

浏览历史

内容加载中请稍等...

一种稳健的语音/音乐分类法被引量：3

参考文献5

同被引文献23

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种稳健的语音/音乐分类法 被引量：3

参考文献5

同被引文献23

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种稳健的语音/音乐分类法被引量：3