基于快速DGMM的随机提示文本的话者确认系统

THE SYSTEM FOR TEXT RANDOM PROMPTED SPEAKER VERIFICATION BASED ON FAST DYNAMIC GAUSSIAN MIXTURE MODEL

下载PDF

导出

摘要研究了随机提示文本的话者确认技术中的几个关键技术，包括确认算法的训练和识别速度、话者确认文本和说话方式的选择、测试文本长度的选择、阈值的设定及话者语音的中长期变异的自适应算法．为提高训练和识别速度，该文提出了快速动态高斯混合话者模型，讨论了音素对话者确认系统的影响及测试文本长度对话者确认系统性能的影响．提出话者语音特性的中长期变异性的自适应增量学习的方法．同时文中详细地分析了一次和多次测试时话者的弃真率和取假率的关系，提出一种确定阈值的新方法．话者确认实验表明，快速的动态高斯模型的训练速度和识别速度比隐马尔柯夫模型快很多，并且两者的识别率相当，该文提出的阈值设定方法及话者语音特性的中长期变异性的自适应学习的方法十分有效． This paper describes several key techniques for text random prompted speaker verification problem, including the training and test speed of the recognition algorithm, the selection of speaker text and speaking styles, the length of test text,the threshold setting and the adaptive algorithm for long term speaker characteristics variations. To increase the training and test speed, this paper proposes the fast dynamic gaussian mixture model(FDGMM) for speaker verification, discusses the influence of different phonemes, speaking styles and the length of test text on the speaker verification, introduces an adaptive algorithm for long term speaker characteristics variations, analyzes the relationships between false accept rate and false reject rate of one try and multiple tries and proposed an approach for threshold setting. The experimental results have shown that the speed of FDGMM is much faster than that of HMM and the recognition rates of the two methods are almost the same, the algorithms for threshold setting and the adaptive algorithms for long term speaker characteristics variations are very effective.

作者马继涌高文

机构地区哈尔滨工业大学计算机科学系

出处《计算机学报》 EI CSCD 北大核心 1999年第11期1127-1132,共6页 Chinese Journal of Computers

基金国家"八六三"高技术研究发展计划国家自然科学基金

关键词话者确认系统语音识别 DGMM 文本 Speaker verification, threshold setting, long term speaker adaptation.

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1马继涌，博士学位论文，1998年

1张保轩,王连军,田岚.基于PC机的汉语话者确认系统[J].山东电子,1995(3):16-17.
2李勃,杨腾祥,胡建华,赵琳.智能卡话者确认系统的研究[J].昆明理工大学学报（理工版）,1999,24(2):12-17.
3贺庆玮,李辉,许敏强.基于分类特征映射的SVM话者确认[J].通信技术,2010,43(3):147-149.
4解焱陆,吴礼福,戴蓓蒨,李辉.基于SVM评分融合的分类短语音话者确认系统[J].数据采集与处理,2005,20(2):213-217.
5李霄寒,戴蓓倩,方绍武,刘鸣.基于子带HMM和MLP的话者确认系统的噪声鲁棒性研究[J].电路与系统学报,2002,7(2):72-76. 被引量：1
6刘明辉,黄中伟,戴蓓蒨,熊继平.用于SVM话者模型训练的冒认话者选取[J].计算机工程,2009,35(16):4-6. 被引量：1
7周毓,李辉,刘青松.基于话者因子评分的说话人确认[J].电子技术（上海）,2011,38(7):20-22.
8王炜,张志华,王波,王炳锡.一个改进的基于DSP的说话人确认系统[J].计算机工程与应用,2004,40(31):204-207.
9吴礼福,姚志强,戴蓓蒨,李辉.音源特征用于提高话者确认系统的鲁棒性[J].中国科学技术大学学报,2006,36(5):476-480. 被引量：2
10王金明,张雄伟.基于子带加权和GMM的鲁棒性话者确认的研究[J].信号处理,2003,19(z1):117-120.

计算机学报

1999年第11期

浏览历史

内容加载中请稍等...

基于快速DGMM的随机提示文本的话者确认系统

参考文献1

相关作者

相关机构

相关主题

浏览历史