低信噪比下采用感知语谱结构边界参数的语音端点检测算法被引量：8

Speech endpoint detection in low-SNRs environment based on perception spectrogram structure boundary parameter

下载PDF

导出

摘要提出了一种采用感知语谱结构边界参数(PSSB)的语音端点检测算法,用于在低信噪比环境下的语音信号预处理。在对含噪语音进行基于听觉感知特性的语音增强之后,针对语音信号的连续分布特性与残留噪声的随机分布特性之间的不同点,对增强后语音的时-频语谱进行二维增强,从而进一步突出连续分布的纯净语音的语谱结构。通过对增强后语音语谱结构的二维边界检测,提出PSSB参数,并用于端点检测。实验结果表明,在白噪声-10 dB到10 dB的各种信噪比环境下,采用PSSB参数的端点检测算法,相对于其它端点检测算法,更有效地检测出语音的端点。在-10 dB的极低信噪比下,提出的方法仍然有75.2%的正确率。采用PSSB参数的端点检测算法,更适合于低信噪比白噪声环境下的语音端点检测。 A Perception Spectrogram Structure Boundary （PSSB） parameter is proposed for speech endpoint detection as a preprocess of speech signal. A hearing perception speech enhancement is made as a first step, then a two-dimensional enhancement is performed upon the speech spectrogram according to the difference between the continuous distribution characteristic of pure speech and the random distribution characteristic of noise, in order to emphasize the continuous spectrogram structure of pure speech. PSSB parameter is proposed based on the two-dimensional boundary detection of the enhanced speech spectrogram structure. Experimental results show that, in a variety of SNR environments from -10 dB to 10 dB, the algorithm proposed in this paper can achieve higher accuracy in comparison to the extant endpoint detection algorithms. With our algorithm, accuracy of 75.2% can be reached even in the extreme low SNR at -10 dB. The endpoint detection algorithm using PSSB, is suitable for speech endpoint detection in low-SNRs environment with white noise.

作者吴迪赵鹤鸣陶智张晓俊肖仲喆许宜申

机构地区苏州大学物理与光电.能源学部苏州大学电子信息学院

出处《声学学报》 EI CSCD 北大核心 2014年第3期392-399,共8页 Acta Acustica

基金国家自然科学基金(61071215 61271359 61372146) 苏州市科技发展计划(应用基础研究)(SYG201033)资助

关键词语音信号预处理端点检测算法极低信噪比感知特性边界检测谱结构语音端点检测噪声环境 Audition Signal detection Signal to noise ratio Spectrographs Speech enhancement Two dimensional White noise

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献19

1Shen J, Hung J, Lee L. Robust entropy-based endpoint de- tection for speech recognition in noisy environments. In: Proc IEEE ICSLP, 1998:232-235.
2Junqua J C, Mak B, Reaves B. A robust algorithm for word boundary detection in the presence of noise. IEEE Trans. On Speech and Audio Processing, 1994; 2(3): 406-412.
3Bou-Ghazale S E, Assaleh K. A robust endpoint detection of speech for noisy environments with application to auto- matic speech recognition. In: Proc. IEEE ICASSP, 2002; 4(2): 3808--3811.
4Shafran I, Rose R. Robust speech detection and segmen- tation for real-time ASR applications. Acoustics, Speech, and Signal Processing, Proceedings, 2003(1): 6-10.
5Gu Lingyun, Zahorian S A. A new robust algorithm for iso- lated endpoint detection. In: Proc. IEEE ICASSP, 2002; 4:4161-4164.
6Gin-Der W, Chin-Teng L. Word boundary detection with mel-scMe frequency bank in noisy environment. IEEE Transactions on Speech and Audio Processing, 2000; 8: 541- 544.
7Ganapathiraju Aet al. Comparison of energy-based end- point detectors for speech signal processing. In: Proc. 1EEE Publications, 1996:500- 503.
8陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
9Zhang Xueying et al. A speech endpoint detection method based on wavelet coefficient variance and sub-band ampli- tude variance. In: Proc. 1EEE ICICIC, 2006:105- 109.
10Wu Bingfei, Wang Kun-Ching. Robust endpoint detection algorithm based on the adaptive band-partitioning spectral entropy in adverse environments. IEEE Transactions on Speech and Audio Processing, 2005; 13(5): 762-775.

二级参考文献12

1果永振,何遵文.一种多特征语音端点检测算法及实现[J].通信技术,2003,36(1):8-10. 被引量：8
2Wu G D, Lin C T. Word boundary detection with mel-scale frequency bank in noisy environment. IEEE Transactions on Speech and Audio Processing, 2000; 8(5): 541-554.
3Ramalingam Hariharan et al. Robust end of utterance detection for real-time speech recognition applications. In Proc. ICASSP'2001.
4CHEN Shaoyan et al. A robust method based on likelihood estimation for speech signal detection. International Symposium on Chinese Spoken Language Processing, 2000.
5HUANG Liangsheng et al. A novel approach to robust speech endpoint detection in car environments. International Conference on Acoustics Speech and Signal Processing, 2000.
6Johan de Veth e~ al. Comparison of channel normalization techniques for automatic speech recognition over the phone. Proceedings of the Fourth International Conference on Spoken Language Processing (ICSLP96), 1996; 4:2332-2335.
7Li Qi et al. A Robust real-time endpoint detector with energy normalization for ASR in adverse environments. In Proc. ICASSP'2001, Salt Lake City, 2001.
8Canny J. A computational approach to edge detection.IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986; 8:679-698.
9Petrou M et al. Optimal edge detectors for ramp edge.IEEE Trans on Pattern Analysis and Machine Intelligence, 1991; 13:483-491.
10胡光锐,韦晓东.基于倒谱特征的带噪语音端点检测[J].电子学报,2000,28(10):95-97. 被引量：70

共引文献21

1王秀丽,王树勋,林琳.基于扩展谱相减与SAP的带噪语音端点检测[J].吉林大学学报（信息科学版）,2006,24(4):351-357. 被引量：2
2国雁萌,付强,颜永红.复杂噪声环境中的语音端点检测[J].声学学报,2006,31(6):549-554. 被引量：17
3王欢良,韩纪庆,李海峰.基于特征似然度加权和维数缩减的Robust语音端点检测[J].声学学报,2007,32(1):62-68. 被引量：7
4郑展恒,曾庆宁,张少兵.一种语音端点检测方法的研究[J].桂林电子科技大学学报,2008,28(1):23-26. 被引量：3
5刘泽琛.语音端点检测的常用方法及改进[J].高等函授学报（自然科学版）,2008,21(3):52-53. 被引量：4
6李志忠,滕光辉.子带特征参数在家禽应激发声识别中的应用[J].农业机械学报,2009,40(3):143-146. 被引量：13
7李晋,刘甫,王玲,许慧燕.改进的语音端点检测技术[J].计算机工程与应用,2009,45(24):133-135. 被引量：9
8康广玉,郭世泽,孙圣和.基于子带能量的GMM含噪语音分类算法[J].仪器仪表学报,2009,30(9):1950-1955. 被引量：2
9姜占才,孙燕,王得芳.基于复合能量和自适应阈值的语音端点检测[J].计算机工程与科学,2010,32(4):136-138. 被引量：1
10周夕良.基于不同背景噪声的联合检测技术[J].计算机与现代化,2011(3):153-155.

同被引文献51

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
3马义德,袁敏,齐春亮,刘悦,刘映杰.基于PCNN的语谱图特征提取在说话人识别中的应用[J].计算机工程与应用,2005,41(20):81-84. 被引量：23
4潘凌云,孙达传,吴美朝.语音识别中基于语谱图的语音音素分割方法[J].杭州大学学报（自然科学版）,1995,22(1):42-46. 被引量：7
5刘鹏,王作英.多模式语音端点检测[J].清华大学学报（自然科学版）,2005,45(7):896-899. 被引量：6
6李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
7李富强,万红,黄俊杰.基于MATLAB的语谱图显示与分析[J].微计算机信息,2005,21(10X):172-174. 被引量：27
8陈向民,张军,韦岗.基于语谱图的语音端点检测算法[J].电声技术,2006,30(4):46-49. 被引量：4
9徐向华,朱杰,郭强.语音识别中基于最小描述长度准则的决策树动态剪枝算法[J].声学学报,2006,31(4):370-376. 被引量：7
10国雁萌,付强,颜永红.复杂噪声环境中的语音端点检测[J].声学学报,2006,31(6):549-554. 被引量：17

引证文献8

1罗雅琴,吴小培,吕钊,彭奎,桂雅骏.滑动窗累积量的递推估计算法及其在语音端点检测中的应用[J].声学学报,2015,40(5):730-738. 被引量：4
2王洋,冯瑶,丁喜波,陈德运.基于时频结合的带噪语音端点检测算法[J].黑龙江大学自然科学学报,2016,33(3):410-415. 被引量：2
3梁士利,魏莹,潘迪,张玲,许廷发,王双维.基于语谱图行投影的特定人二字汉语词汇识别[J].吉林大学学报（工学版）,2017,47(1):294-300. 被引量：6
4潘迪,梁士利,魏莹,李广岩,许廷发,王双维.语谱图二次傅里叶变换特定人二字汉语词汇识别[J].东北师大学报（自然科学版）,2017,49(2):95-100. 被引量：2
5许春冬,张震,战鸽,应冬文,李军锋,颜永红.面向语音增强的约束序贯高斯混合模型噪声功率谱估计[J].声学学报,2017,42(5):633-640. 被引量：6
6陈莹莹,简磊.基于最大熵谱估计和时频特性的语音端点检测[J].计算机应用与软件,2017,34(11):91-96. 被引量：4
7杨花,江涛,董华珍,陈绍雄,傅美君,潘文林.基于PSO-SVM的普米语语谱图识别[J].云南民族大学学报（自然科学版）,2018,27(5):439-443. 被引量：5
8韦金泉,罗丽燕,王玫,刘争红,何锐彬,莫清麟.一种基于能零积的改进端点检测算法[J].计算机应用与软件,2024,41(7):215-221.

二级引证文献28

1王文益,伊雪.基于改进语音存在概率的自适应噪声跟踪算法[J].信号处理,2020,36(1):32-41. 被引量：8
2马辉栋,刘振宇.语音端点检测算法在猪咳嗽检测中的应用研究[J].山西农业大学学报（自然科学版）,2016,36(6):445-449. 被引量：9
3孙佳婷.低码率音频质量客观评价算法研究[J].黑龙江大学工程学报,2017,8(2):80-87. 被引量：3
4董红松,刘振宇,马辉栋,闫静.语音增强在去除猪咳嗽噪声中的应用研究[J].山西农业大学学报（自然科学版）,2017,37(11):831-836. 被引量：3
5姜囡,谢俊仪.低信噪比下语音端点检测算法改进设计[J].中国刑警学院学报,2018(1):123-128. 被引量：2
6杨花,江涛,董华珍,陈绍雄,傅美君,潘文林.基于PSO-SVM的普米语语谱图识别[J].云南民族大学学报（自然科学版）,2018,27(5):439-443. 被引量：5
7李小林,许春冬,杜燕.非特定人语音识别关键技术研究[J].物联网技术,2017,7(10):99-101.
8凌贤鹏,李绽蕾,刘昊,张钐钐,俞芸芸.基于智能语音的智能家居系统设计[J].物联网技术,2019,9(1):73-74. 被引量：3
9和丽华,江涛,潘文林,杨建香,解雪琴,王璐,余彩裙.佤语语音语料端点检测算法[J].云南民族大学学报（自然科学版）,2019,28(2):186-190. 被引量：2
10黄成龙.2018年羌语支语言研究前沿[J].阿坝师范学院学报,2019,36(1):5-10. 被引量：1

1赵鹤鸣.DSP56001多信号处理器系统及语音信号预处理级的实时实现[J].信号处理,1991,7(3):135-140. 被引量：3
2汪一鸣,左晓莹,张烨.采用二维增强的三维小波视频编码[J].数据采集与处理,2003,18(3):327-330.
3王祯飞.语音信号模块化预处理的分析实现[J].科技风,2010(20):203-204.
4唐舒岩.录音教材产品后期制作中的语音信号预处理[J].演艺科技,2015(6):24-29.
5徐济仁,陈家松,徐屹.语音信号预处理技术综述[J].电子工程师,2001,27(6):26-27. 被引量：5
6王德胜,朱光喜,刘应状,刘德明,胡臻平.基于虚拟MIMO子信道的多用户分集资源调度算法[J].计算机科学,2008,35(6):114-117. 被引量：1
7朱琼瑶.结合人眼特征和几何方法的虹膜定位方法[J].计算机工程与应用,2013,49(8):182-184. 被引量：2
8马林华,常义林,王晟达.非规则LDPC码随机性结构的分布规律研究和在短环消除算法中的应用[J].中国科学（E辑）,2007,37(4):589-594. 被引量：1
9张艳萍,张延盛.基于平均路径长度的语音识别算法的研究与仿真[J].南京信息工程大学学报（自然科学版）,2011,3(1):62-66.
10刘纪承,周传荣.机载电子设备中印制板边界条件的识别[J].振动与冲击,2004,23(4):96-98. 被引量：3

声学学报

2014年第3期

浏览历史

内容加载中请稍等...

低信噪比下采用感知语谱结构边界参数的语音端点检测算法被引量：8

参考文献19

二级参考文献12

共引文献21

同被引文献51

引证文献8

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

低信噪比下采用感知语谱结构边界参数的语音端点检测算法 被引量：8

参考文献19

二级参考文献12

共引文献21

同被引文献51

引证文献8

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

低信噪比下采用感知语谱结构边界参数的语音端点检测算法被引量：8