期刊文献+

一个快速说话人识别系统的设计和实现 被引量:1

The Application of a Fast Multi-language Recognition System
下载PDF
导出
摘要 基于美国国家科学技术标准局的说话人识别评测任务,提出了快速说话人识别技术框架。在此框架下,低层的声学特征向量首先经过高斯混合建模和非线性映射,转变为高层的高维特征向量(超向量);接着利用区分性分类器支持向量机,对超向量进行分类;最后依据假设检验理论,进行最终判决。相比较传统的说话人识别系统,以超向量作为特征进行分类,比直接采用声学特征更为稳健。实现了一个快速说话人识别系统,并在电话数据集上进行测试,取得了不错的效果。 We proposed a fast language recognition framework based on National Institute of Standards and Technology Speaker Recognition Evaluation (NIST SRE). In the framework, low-level acoustic feature vector is firstly converted to high -level feature vector (Super Vector) through Gaussian Mixture Modeling and nonlinear mapping methods. Then, the super vector is classified by backend classifier. Finally, decision is given out based on hypothesis test theory. The proposed system is much more robust compared with traditional speaker recognition system. Besides, a fast speaker recognition system is built and achieved a good result based on telephone dataset.
作者 安茂波 刘建
出处 《网络新媒体技术》 2012年第3期37-41,共5页 Network New Media Technology
关键词 说话人识别 高斯混合建模 支持向量机 超向量 Speaker Recognition, Gaussian Mixture Modeling, Support Vector Machine, Super Vector
  • 相关文献

参考文献1

  • 1杨行峻;迟惠生.语音信号数字处理[M]北京:电子工业出版社,1995.

同被引文献3

引证文献1

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部