改进的基于长时谱能量差异和基音比例的语音检测方法被引量：1

Improved Voice Activity Detection Based on Long-term Spectral Divergence and Pitch Ratio Features

下载PDF

导出

摘要语音检测是语音信号处理的前端,利用长时谱能量差异特征的语音检测无法区分突发噪声和语音,掺杂着突发噪声的语音信号会对语音处理系统带来不良影响。提出了一种基于长时谱能量差异特征和基音比例特征相结合的语音检测方法,该方法的优点是,在利用长时谱能量差异特征基础上引入基音比例特征,从而有效减少了将信号中突发噪声误判为语音的错误。实验显示,该算法能够在多种信噪比环境下取得很好的检测结果。 Voice Activity Detection（VAD） is the front-end of speech processing and the VAD algorithm which uses long-term spectral divergence（LTSD） feature can′t discriminate abrupt noise from speech.The speech signal with abrupt noise will adversely affect the speech processing system.This paper proposes a VAD algorithm which combines LTSD feature and pitch ratio feature.The advantage of the algorithm is that by introducing pitch ratio feature,it can effectively reduce the false alarms of taking abrupt noise as speech.Experimental results show that the algorithm achieves good performance for VAD under various signal-to-noise ratios.

作者孟一鸣欧智坚

机构地区清华大学电子工程系

出处《电讯技术》北大核心 2013年第8期1039-1043,共5页 Telecommunication Engineering

关键词语音信号处理语音检测长时谱能量差异基音比例突发噪声 speech processing voice activity detection long-term spectral divergence pitch ratio burst noise

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献8

1Jongseo S, Kim N, Sung W. A statistical model-based voiceactivity delection[j] . lE'.EK Signal Processing I x^tlers, 1999,6(1):1-3.
2陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
3国雁萌,付强,颜永红.复杂噪声环境中的语音端点检测[J].声学学报,2006,31(6):549-554. 被引量：17
4Ramirez J, Segura J, Benitez C, et al. Efficient voice activi-ty detection algorithms using long-term speech information[J]. Speech Communication,2004,42(3) :271 - 287.
5Kumar P, Tsiartas A, Narayanan S. Robust voice activity de- tection using long-term signal variability [ J]. IEEE Transac- tions on Audio, Speech, and Language Processing,2011,19 (3):600-613.
6李晔,张仁智,崔慧娟,唐昆.低信噪比下基于谱熵的语音端点检测算法[J].清华大学学报（自然科学版）,2005,45(10):1397-1400. 被引量：37
7杨行竣.语音信号数字处理[M].北京:电子工业出版社,1995..
8Douglas R A, Rose R C. Robust text-independent speaker i-dentification using Gaussian mixture speaker models [ J ].IEEE Transactions on Audio, Speech and Language Process-ing, 1995(3) :72 - 83.

二级参考文献33

1果永振,何遵文.一种多特征语音端点检测算法及实现[J].通信技术,2003,36(1):8-10. 被引量：8
2栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
3陈振标,徐波.基于子带能量特征的最优化语音端点检测算法研究[J].声学学报,2005,30(2):171-176. 被引量：22
4Junqua J C, Mak B, Reaves B. A robust algorithm for word boundary detection in the presence of noise [J]. IEEE Transactions on speech and Audio Processing, 1994, 2(3):406-412.
5Beritelli F, Casale S, Ruggeri G, et al. Performances evaluation and comparision of G. 729/AMR/fuzzy voice activity detectors [J]. IEEE Signal Processing Letters,2002, 9(3): 85-88.
6Pencak J, Neloson D. The NP speech activity detection algorithm [J]. Int Conf Acoustics, Speech and Signal Processing, 1995. 381 - 384.
7Nemer E, Goubran R, Mahmoud S. Robust voice activity detection using higher-order statistics in the LPC residual domain [J]. IEEE Trans Speech and Audio Processing,2001, 9(3): 217-231.
8Woo K H, Yang T Y, Park K J, et al. Robust voice activity detection algorithm for estimating noise spectrum [J].Electronics Letters, 2000, 36(2) : 180 - 181.
9迟惠生杨行峻唐昆.语音信号数字处理[M].北京:电子工业出版社,1995..
10Wu G D, Lin C T. Word boundary detection with mel-scale frequency bank in noisy environment. IEEE Transactions on Speech and Audio Processing, 2000; 8(5): 541-554.

共引文献72

1沈亚强.低信噪比下基于短时分形维数的语音端点检测[J].仪器仪表学报,2006,27(z3):2310-2312. 被引量：3
2吴伟,彭永恒,朴泽星,马荣.声振法混凝土路面的声学特征检测研究[J].哈尔滨商业大学学报（自然科学版）,2005,21(4):509-511. 被引量：1
3封伶刚,王秀萍.一种新的基于LBG和DTW的模板训练算法[J].计算机工程与应用,2005,41(26):85-88. 被引量：3
4王秀丽,王树勋,林琳.基于扩展谱相减与SAP的带噪语音端点检测[J].吉林大学学报（信息科学版）,2006,24(4):351-357. 被引量：2
5国雁萌,付强,颜永红.复杂噪声环境中的语音端点检测[J].声学学报,2006,31(6):549-554. 被引量：17
6王欢良,韩纪庆,李海峰.基于特征似然度加权和维数缩减的Robust语音端点检测[J].声学学报,2007,32(1):62-68. 被引量：7
7胡军辉,邵忍平,曾泽君.基于谱熵的齿轮故障诊断方法研究[J].机械传动,2007,31(5):84-87. 被引量：5
8郑展恒,曾庆宁,张少兵.一种语音端点检测方法的研究[J].桂林电子科技大学学报,2008,28(1):23-26. 被引量：3
9刘泽琛.语音端点检测的常用方法及改进[J].高等函授学报（自然科学版）,2008,21(3):52-53. 被引量：4
10刘华平,李昕,徐柏龄,姜宁.语音信号端点检测方法综述及展望[J].计算机应用研究,2008,25(8):2278-2283. 被引量：40

同被引文献9

1刘静,王建国,孙文杰,张帆.机载环境下的语音端点检测[J].电讯技术,2008,48(10):59-62. 被引量：5
2吕燚,李平,孟丽,吴文焘.基于TMS320VC5502的电子耳蜗CIS算法实现[J].现代电子技术,2012,35(15):66-69. 被引量：2
3盛晓伟,郑淑涛,韩俊伟.飞行模拟器音效系统声音分析与合成技术[J].吉林大学学报（工学版）,2013,43(5):1433-1440. 被引量：4
4蒋建中,张东方,张连海.一种新的强噪声环境下的语音增强算法[J].计算机工程与应用,2013,49(20):222-225. 被引量：3
5张勇.一种二/四线转换话音检测技术的设计[J].舰船电子工程,2014,34(1):78-82. 被引量：1
6李强,谢虹恩.改进的基于MELP的非连续传输语音编码算法[J].重庆邮电大学学报（自然科学版）,2014,26(5):636-641. 被引量：6
7吕燚.能量重心法在机载选呼系统解码中的应用[J].电讯技术,2015,55(4):413-418. 被引量：3
8原晨,高勇.高质量信道上回声隐藏法秘密信息提取出错原因分析[J].现代电子技术,2015,38(11):103-106. 被引量：3
9赵新燕,王炼红,彭林哲.基于自适应倒谱距离的强噪声语音端点检测[J].计算机科学,2015,42(9):83-85. 被引量：15

引证文献1

1李锋,孙文杰,张帆.适应强旋翼噪声环境的语音系统设计与实现[J].信息技术与信息化,2016(12):74-78.

1陈亚楠,王让定,陶表犁.基于低频区信息量分布的回放语音检测方法[J].数据通信,2016(6):37-41. 被引量：4
2余金培,晨阳,姚庆栋.R—S码在ADSL传输中的抗突发噪声性能[J].通信技术与发展,1997(4):12-16. 被引量：1
3席志红,田洪艳.基于无线ATM的OFDM传输系统设计与仿真[J].应用科技,2006,33(7):34-36. 被引量：1
4王强元.浅谈数字电视信号的测量[J].电子世界,2012(17):107-108.
5张应芳.谱能量传感及USRP实现[J].电子世界,2014(2):72-73.
6林祎,彭华,王彬,钟润添.基于码元分布特性的FSK信号识别算法[J].信息工程大学学报,2012,13(3):274-280. 被引量：2
7YANG Cui WEI Gang.Fast sinusoidal analysis algorithm based on energy of narrowband spectrum[J].Chinese Journal of Acoustics,2010,29(4):413-427.
8陈俊斌,王琳,徐位凯.突发信道下多进制LDPC码的性能研究[J].现代电子技术,2006,29(9):1-3. 被引量：1
9李正友,李天伟,黄谦,隋振庚.一种新的VDR浊语音检测方法[J].计算机应用研究,2013,30(8):2461-2463.
10李正友,李天伟,黄谦,隋振庚.噪声环境中的汉语浊语音检测[J].声学学报,2014,39(4):517-522. 被引量：1

电讯技术

2013年第8期

浏览历史

内容加载中请稍等...

改进的基于长时谱能量差异和基音比例的语音检测方法被引量：1

参考文献8

二级参考文献33

共引文献72

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

改进的基于长时谱能量差异和基音比例的语音检测方法 被引量：1

参考文献8

二级参考文献33

共引文献72

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

改进的基于长时谱能量差异和基音比例的语音检测方法被引量：1