期刊文献+

基于伽马通频率倒谱系数的短语音说话人确认 被引量:1

Short Utterance Speaker Verification Based on Gammatone Frequency Cepstrum Coefficient
下载PDF
导出
摘要 针对梅尔倒谱系数特征难以满足短语音说话人确认的问题,本文从同样是模仿人耳听觉机理的伽马通滤波器为基础,提出让抗噪性能更佳的伽马通频率倒谱系数作为输入特征。首先,在短语音条件下,提取伽马通频率倒谱系数,采用加减特征分量法计算其不同维数的贡献度大小。其次,选取其中贡献较高的分量作为特征,保留那些最能表征不同说话人之间差异的维数,直接实现了特征参数降维。最后,采用多种特征及其混合,通过i-vector说话人确认系统验证伽马通频率倒谱系数在短语音下的有效性。实验数据表明,不同测试语音长度条件下,相较其他声学及衍生特征,伽马通频率倒谱系数具有较强短语音的表征能力,单独使用或融合其他参数都进一步提升识别等误差率。
作者 瞿于荃 龙华 段荧 Qu Yuquan;Long Hua;Duan Ying
出处 《数据通信》 2021年第2期36-41,共6页
  • 相关文献

参考文献6

二级参考文献40

  • 1王伟,邓辉文.基于MFCC参数和VQ的说话人识别系统[J].仪器仪表学报,2006,27(z3):2253-2255. 被引量:30
  • 2杨行峻 迟惠生.数字语音信号处理[M].北京:电子工业出版社,1995..
  • 3von Bekesy G. Concerning the pleasures of observing, and the mechanics of the inner ear pC]// Nobel Lectures in Physiology or Medicine. Amsterdam, Netherlands: Elsevier Science, 1964: 722-746.
  • 4Lyon R F, Mead C. An analog electronic cochlea [J]. Acoustics, Speech, and Signal Processing, 1988, 36(7) : 1119- 1134.
  • 5Patterson R D, Moore B C J. Auditory filters and excitation patterns as representations of frequency resolution [C]// Frequency Selectivity in Hearing. London: Academic Press, 1986: 123- 177.
  • 6Johannesma P I M. The pre-response stimulus ensemble of neurons in the cochlear nucleus [C]//Proc of the Symposium on Hearing Theory. Eindhoven, Netherlands : IPO, 1972: 58 - 69.
  • 7Glasberg B R, Moore B C J. Derivation of auditory filter shapes from notched noise data [J]. Hearing Research, 1990, 47(1): 103- 108.
  • 8Martin C. Modelling auditory processing and organisation [D]. Sheffield, Britain: University of Sheffield, 1991.
  • 9Greenwood D D. A Cochlear frequency-position function for several species-29 years later [J]. J Acoust Soc Am, 1990, 87(6): 2592- 2605.
  • 10S Furui. Digital Speech Processing, Synthesis, and Recognition [ M]. New York: Marcel Dekker, 2001.

共引文献173

同被引文献21

引证文献1

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部