基于SVM的说话声实时检测

Real-time Voice Detection Based on SVM

下载PDF

导出

摘要研究了说话声音频数据的音频特征,并且利用SVM实现了说话声的实时检测.首先,对原始音频数据做预处理,然后对音频数据进行了3层小波分解,并提取了第3层低频系数的MFCC特征,同时提取了音频数据的质心、谱熵特征;其次,计算MFCC特征的均值、质心和谱熵的方差,由此构造了特征向量集;最后,利用SVM模型训练音频样本,并对测试集中的样本进行了测试和实时检测.实验表明,所提取的音频特征有效、合理,并且表现出良好的分类与检测性能. The voice features are researched,and real-time detection of voice is achieved by using SVM.Firstly,in the stage of preprocessing for the audio data,the MFCC of 3rd layer low frequency coefficients were extracted after performing 3-layer wavelet decomposition,furthermore,the centroid and spectral entropy were also extracted for audio data.Secondly,the features vector set was constructed,including the mean MFCC,the variance of centroid and spectral entropy.Finally,the audio data were trained and tested by making use of SVM for implementing real-time voice detection.The experimental results show that the extracted audio features are effective and reasonable,and reprensent the satisfactory classification and detection performance.

作者王红丽崔荣一

机构地区延边大学工学院计算机科学与技术系智能信息处理研究室

出处《延边大学学报（自然科学版）》 CAS 2010年第3期257-262,共6页 Journal of Yanbian University（Natural Science Edition）

基金吉林省科技厅资助项目(20050703-1)

关键词说话声检测 MFCC 小波变换质心谱熵支持向量机 voice detection MFCC wavelet transform centroid spectral entropy SVM

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1李晨,周明全.音频检索技术研究[J].计算机技术与发展,2008,18(8):215-218. 被引量：7
2郑贵滨,韩纪庆,李海峰.基于响度主分量模糊直方图的音频检索方法[J].信号处理,2006,22(4):471-475. 被引量：1
3颜景斌,吴石,伊戈尔·艾杜阿尔达维奇.基于单类支持向量机的音频分类[J].计算机应用,2009,29(5):1419-1422. 被引量：4
4余建潮,张瑞林.基于MFCC和LPCC的说话人识别[J].计算机工程与设计,2009,30(5):1189-1191. 被引量：46
5郑继明,俞佳.基于小波变换和支持向量机的音频分类[J].计算机工程与应用,2009,45(11):158-161. 被引量：5
6刑峰.基于小波变换的音频特征提取与分类研究[D].重庆邮电大学,2007:14-16.
7袁正午,肖旺辉.改进的混合MFCC语音识别算法研究[J].计算机工程与应用,2009,45(33):108-110. 被引量：18
8Mcloughlin L.Applied Speech and Audio Processing[M].New York:Cambridge University Press,2009:40-46.
9张铮,周会平.一种基于支持向量机的演唱片段划分方法[J].计算机与现代化,2009(3):127-129. 被引量：1
10刘荣,刘珩.低信噪比下基于功率谱熵的语音端点检测算法[J].计算机工程与应用,2009,45(33):122-124. 被引量：9

二级参考文献59

1胡艳芳,吴及,刘慧星.基于MLER的语音/音乐分类方法[J].清华大学学报（自然科学版）,2008,48(S1):720-724. 被引量：6
2郑贵滨,韩纪庆,李海峰,郑铁然.分段式音频检索算法[J].计算机科学,2005,32(3):73-75. 被引量：3
3白亮,老松杨,陈剑赟,吴玲达.基于支持向量机的音频分类与分割[J].计算机科学,2005,32(4):87-90. 被引量：13
4赵彦平,赵晓晖.用于语音端点检测的鲁棒性特征提取新方法[J].吉林大学学报（工学版）,2006,36(1):77-81. 被引量：6
5丁爱明.作为说话人识别特征参量的M FCC的提取过程[J].电子工程师,2006,32(1):51-53. 被引量：10
6于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14
7任江涛,孙婧昊,施潇潇,黄焕宇,印鉴.一种用于文本聚类的改进的K均值算法[J].计算机应用,2006,26(B06):73-75. 被引量：24
8李晋,王玲.一种改进的孤立词端点检测方法[J].计算机工程与应用,2006,42(30):69-71. 被引量：3
9董婧,赵晓晖,应娜.基于二进小波变换的基音检测算法[J].吉林大学学报（工学版）,2006,36(6):978-982. 被引量：2
10朴春俊,马静霞,徐鹏.噪音情况下语音端点检测方法的研究[J].计算机工程与应用,2007,43(8):49-50. 被引量：3

共引文献93

1曹西征,张磊,范海菊.一种可控虚拟乐器音色模型[J].计算机技术与发展,2009,19(7):203-205.
2郑继明,俞佳.基于Mean-Shift的广播音频聚类算法[J].计算机应用,2009,29(10):2741-2743. 被引量：3
3张飞云,王红艳.噪声环境中基于VQ说话人识别[J].现代电子技术,2009,32(22):119-122.
4叶蕾,方鹏.文本无关的说话人识别系统抗噪方法研究[J].计算机与现代化,2010(10):16-19.
5阙大顺,赵永安,文先林,李蓓.基于DHMM和VQ的关键词识别系统研究[J].武汉理工大学学报,2011,33(2):140-143. 被引量：3
6周夕良.基于不同背景噪声的联合检测技术[J].计算机与现代化,2011(3):153-155.
7王润舵.一种基于DBN信息融合的说话人识别方法[J].桂林电子科技大学学报,2010,30(6):581-585.
8方凡泉,李心广,王桂珍,林江豪.语音质量客观评价方法研究及实现[J].广州大学学报（自然科学版）,2011,10(1):65-69. 被引量：4
9王钟斐,王彪.基于MATLAB的皮肤听声器系统的研究[J].电子设计工程,2011,19(8):38-40.
10王钟斐,王彪.基于小波包的皮肤听声器语音特征提取研究[J].电子设计工程,2011,19(9):71-75.

1MoonBoy.乐音缤纷话声卡[J].新潮电子,1998(10):8-10.
2王静婷.基于语义相似度的Web文本分类研究[J].图书馆学研究,2012(9):64-69. 被引量：2
3申雷华,孙立辉.基于SURF特征的交通标志识别算法[J].信息与电脑,2016,28(1):68-69. 被引量：2
4录音带玄机[J].学苑创造（B版）,2010(5):55-55.
5日本公司推出“复制自己”迷你机器人服务[J].机器人技术与应用,2009(1):47-47. 被引量：1
6王渝生.留住声音的机器[J].科学世界,2011(3):82-83.
7王一.美国如何控制噪音[J].教师博览（上旬刊）,2017,0(3):20-21.
8何江平,文俊浩,邓恬洁,王道乾.基于支持向量机的图像识别[J].重庆大学学报（自然科学版）,2006,29(1):57-60. 被引量：9
9盖赟.基于微分算子的三维人脸表情识别[J].计算机科学,2014,41(B11):128-132.
10晓道.走马观花话声卡──5款FM801声卡一览[J].电脑,2000(12):6-8.

延边大学学报（自然科学版）

2010年第3期

浏览历史

内容加载中请稍等...

基于SVM的说话声实时检测

参考文献11

二级参考文献59

共引文献93

相关作者

相关机构

相关主题

浏览历史