基于共振峰谐波能量的语音端点检测被引量：11

Speech endpoint detection based on the formant-consonance energy

导出

摘要共振峰和谐波成分是语音的一个典型特征。由于语音和环境的多变性,采用普通的方法提取这些特征存在很多困难。该文提出了一种在窄带语谱图上通过图像增强的方法,通过sobel算子计算窄带语谱图的方向场,通过Gabor滤波增强谐波区域,通过门限方法得到二值化图,去除方向大于45°和依赖度低的点,得到连续的水平方向的带状分布,即谐波分布区域,求取谐波分布区域内的能量,以此作为门限判决的特征。实验结果表明,在不同信噪比、多种非平稳噪声环境下都能够达到较好的语音检出效果;同时这个特征不但能抑制高能量突发噪声,而且在非平稳噪声背景下的语音检测也表现出了优秀性能。其优点为,不需要噪声的先验知识,充分利用了语音在频率域和时间域的相关性,适应于各种非平稳复杂噪声。 Formant and consonance are two discriminable features of speech,but these features are difficult to extract due to the wide variety of speech and many complex backgrounds.This paper presents an image enhancement method to calculate the formant consonance energy parameter by identifying the consonance region in a narrow-band spectrogram.The consonance region is identified through orientation estimation,consonance enhancement,binarisation,and post-processing using the Sobel operator,the Gabor filter,a thresho...

作者刘红星戴蓓蒨陆伟

机构地区中国科学与技术大学电子科学与技术系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2008年第S1期754-759,共6页 Journal of Tsinghua University(Science and Technology)

关键词语音端点检测共振峰谐波能量图像增强窄带语谱图 speech endpoint detection formant-consonance energy image enhancement narrow-band spectrogram

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1Shen J L,,Hung J W,Lee L S.Robust entropy-basedendpoint detection for speech recognition in noisyenvironments[].International Conference on SpokenLanguage Processing.1998
2Tucker R.Voice activity detection using a periodicitymeasure[].IEEE Proceedings of CommunicationsSpeechand Vision.1992
3Beritelli F,Casale S,Ruggeri G,et al.Performanceevaluation and comparison of G.729/AMR/fuzzy voiceactivity detectors[].IEEE Signal Processing Letters.2002
4Hong L,Wan Y,Jain A K.Fingerprint image enhancement:Algorithm and performance evaluation[].IEEETransactions on Pattern Analysis and Machine Intelligence.1998
5Daugman J G.Uncertainty relation for resolution in space,spatial frequency,and orientation optimized bytwo-dimensional visual cortical filters[].Journal of the Optical Society of America.1985
6Asadi A,Schwartz R,Makhoul J.Automatic modeling foradding new words to a large-vocabulary continuous speechrecognition system[].Proc of the IEEE Int Conf onAcousticsSpeech and Signal Processing.1991
7Wu G D,Lin C T.Word boundary detection with mel-scale frequency bank in noisy environment[].IEEE Transactions on Speech and Audio Processing.2000
8Nemer E.Robust voice activity detection using higher-order statistics in the LPC residual domain[].IEEE Transactions on Speech and Audio Processing.2001
9Kyoung-Ho Woo.Robust voice activity detection algorithm for estimating noise spectrum[].Electronics Letters.2000
10Anil K. and Farshid Farrokhnia.Unsupervised texture segmentation using gabor filters[].Pattern Recognition.1991

同被引文献106

1颜彪,杨娟.关于希尔伯特变换的分析和研究[J].电气电子教学学报,2004,26(5):27-29. 被引量：17
2栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
3朱淑琴,裘雪红.一种精确检测语音端点的方法[J].计算机仿真,2005,22(3):214-216. 被引量：15
4陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
5刘晓明,覃胜,刘宗行,江泽佳.语音端点检测的仿真研究[J].系统仿真学报,2005,17(8):1974-1976. 被引量：21
6刘鹏,王作英.多模式语音端点检测[J].清华大学学报（自然科学版）,2005,45(7):896-899. 被引量：6
7宋牟平,赵斌.希尔伯特变换处理的布里渊散射DOFS的研究[J].光子学报,2005,34(9):1328-1331. 被引量：9
8李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
9冯凯,刘珩.基于分形理论的语音端点检测[J].中国农业大学学报,2006,11(4):114-116. 被引量：5
10李朝晖,迟惠生.听觉外周计算模型研究进展[J].声学学报,2006,31(5):449-465. 被引量：22

引证文献11

1姜占才,孙燕,王得芳.基于复合能量和自适应阈值的语音端点检测[J].计算机工程与科学,2010,32(4):136-138. 被引量：1
2顾亚强,赵晖,吴波.一种语音信号端点检测的改进方法[J].计算机仿真,2010,27(5):340-343. 被引量：13
3张华,李忠海,王文龙,赵义.基于Hilbert-Huang算法的缺时检测问题的研究[J].沈阳师范大学学报（自然科学版）,2013,31(1):95-99. 被引量：1
4宫朝辉,刁麓弘.改进共振峰提取的语音端点检测[J].计算机辅助设计与图形学学报,2013,25(8):1230-1236. 被引量：4
5李正友,李天伟,黄谦,隋振庚.一种新的VDR浊语音检测方法[J].计算机应用研究,2013,30(8):2461-2463.
6李正友,李天伟,黄谦,隋振庚.噪声环境中的汉语浊语音检测[J].声学学报,2014,39(4):517-522. 被引量：1
7冯辉宗,王芸芳.语谱特征的身份认证向量识别方法[J].重庆大学学报（自然科学版）,2017,40(5):88-94. 被引量：4
8贾艳洁,陈曦,于洁琼,王连明.基于特征语谱图和自适应聚类SOM的快速说话人识别[J].科学技术与工程,2019,19(15):211-218. 被引量：5
9罗庆,包亚萍,俞强.基于改进语音特征与极限学习机的语音端点检测[J].微电子学与计算机,2020,37(3):37-41.
10陈爱华,张石清.基于深度神经网络和多特征融合的语音端点检测[J].台州学院学报,2021,43(3):1-6. 被引量：3

二级引证文献34

1王钟斐,王彪,李建文.基于小波包的语音谱熵端点检测方法研究[J].计算机与数字工程,2011,39(4):1-4. 被引量：1
2王彪.一种改进的语音端点检测方法研究[J].电子设计工程,2012,20(4):47-49. 被引量：3
3王彪.基于小波分析的语音端点检测方法研究[J].科学技术与工程,2012,20(7):1667-1669.
4魏艳娜,张景峰,金永涛.有限状态矢量量化在语音端点检测中的应用[J].计算机工程与应用,2012,48(17):161-164. 被引量：3
5冯璐,陈威兵,吴宇.基于语音拖音段的端点检测算法研究[J].计算机工程与科学,2012,34(10):187-191. 被引量：1
6张华,李忠海,王文龙,赵义.基于Hilbert-Huang算法的缺时检测问题的研究[J].沈阳师范大学学报（自然科学版）,2013,31(1):95-99. 被引量：1
7王辉,袁淑丹.基于EMD与功率谱熵的语音端点检测[J].电声技术,2013,37(11):40-44. 被引量：6
8孙战先,储飞黄,王江.一种自适应语音端点检测算法[J].计算机工程与应用,2014,50(1):206-210. 被引量：6
9蒋永平,卢传泽,于琪,赵冲.有效的哼唱旋律基音提取方法研究与实现[J].计算机工程与应用,2014,50(3):215-220. 被引量：1
10鲁远耀,周妮,肖珂,叶青.强噪声环境下改进的语音端点检测算法[J].计算机应用,2014,34(5):1386-1390. 被引量：24

1刘红星,戴蓓蒨,陆伟.非平稳噪声环境下基于谐波能量的语音检测[J].计算机仿真,2008,25(11):305-308. 被引量：2
2宫朝辉,刁麓弘.改进共振峰提取的语音端点检测[J].计算机辅助设计与图形学学报,2013,25(8):1230-1236. 被引量：4
3花兴艳,吴宗佳.基于灰色系统理论的经纬仪噪声图像处理方法[J].四川兵工学报,2014,35(6):98-100. 被引量：3
4况鹏,黄海,毛少帅,王康利.基于TMS320C6678的合成语音检测系统的设计与实现[J].电子设计工程,2016,24(19):98-101. 被引量：1
5杨永超,付中华,蒋冬梅.基于DSP的实时语音检测的设计与实现[J].计算机应用,2008,28(2):491-493. 被引量：3
6刘娜,唐毅谦,赵悦.基于小波神经模糊系统的一种非线性滤波方法[J].石油化工高等学校学报,2007,20(z1):40-43.
7王朋,塔维娜,陈树中.带噪汉语语音识别的端点检测方法[J].计算机工程,2003,29(17):120-121. 被引量：3
8宋寅卯,袁端磊.用于织物疵点检测的最优Gabor滤波器设计[J].信息与控制,2006,35(3):374-377. 被引量：2
9路游,郭江涛,孟庆鑫.基于Hausdorff距离的图像边缘检测方法[J].计算机技术与发展,2015,25(8):71-74. 被引量：3
10朱君波,朱夏君,王守觉.PCA在语音检测中的应用研究[J].模式识别与人工智能,2006,19(5):629-633. 被引量：1

清华大学学报（自然科学版）

2008年第S1期

浏览历史

内容加载中请稍等...

基于共振峰谐波能量的语音端点检测被引量：11

参考文献10

同被引文献106

引证文献11

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于共振峰谐波能量的语音端点检测 被引量：11

参考文献10

同被引文献106

引证文献11

二级引证文献34

相关作者

相关机构

相关主题

浏览历史

基于共振峰谐波能量的语音端点检测被引量：11