基于话者分类和HMM的话者自适应语音识别被引量：2

Speaker Clustering and HMM Based Speaker Adaptation Speech Recognition

下载PDF

导出

摘要本文提出了一种基于话者分类和ＨＭＭ的话者自适应语音识别方法，采用对参考话者聚类、并按话者类分别建立ＨＭＭ模板的策略，对于新注册的用户，系统只需利用其极少量的语音，便可将与之最相近的一类模板指派给新用户，再采用基于谱空间映射的两级自适应方法，使系统自适应到用户的模式下工作．这种方法既提高了识别性能，又降低了自适应的难度，还有利于ＨＭＭ的建立．讨论了话者分类数和自适应语音数据对话者自适应效果及识别性能的影响，提出了一种在自适应语音数据不足情况下仍具有较好自适应效果的基于ＦＶＱ的码本自适应改进算法，该算法还具有对自适应字表不敏感的特点． in this paper,a speaker adaptation speech recognition based on speaker clustering and HMMs is presented. For a new user,only using some samples of his data and using the two-step speaker adaptation technique based on spectral mapping,the system adapts the nearest original models to the pattern of the user. It can improve recognition performance and reduce adaption difficulty. Also it is easy to build HMM models.The adaptive effect by speaker classification and adaptation training data are discussed.Because the general codebook ad aptation technique is unsatisfactory when the adaptation data is insufficient.A improved FVQ based codebook adaptation algorithm is proposed and good adaptive performance is obtained especially when the adaptive data is insufficient.

作者戴蓓倩郁正庆戴任飞张劲松王长富司虎

出处《中国科学技术大学学报》 CAS CSCD 北大核心 1996年第2期147-153,共7页 JUSTC

基金国家自然科学基金

关键词话者自适应话者聚类语音识别隐马氏模型 Speaker adaptation speech recognition Speaker clustering spectral mapping hidden Markov models

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1戴蓓倩，中国科学技术大学学报，1994年，24卷，2期，161页

同被引文献7

1朱斌，硕士学位论文，1994年
2张春涛,吴善培.最大互信息用于语音识别[J].北京邮电大学学报,1998,21(3):82-85. 被引量：3
3刘加.汉语大词汇量连续语音识别系统研究进展[J].电子学报,2000,28(1):85-91. 被引量：50
4张琳,王珊,秦晓瑜,陈海霞,王连明.基于听觉仿生模型的乐器识别[J].东北师大学报（自然科学版）,2014,46(1):75-79. 被引量：5
5张晴晴,刘勇,王智超,潘接林,颜永红.卷积神经网络在语音识别中的应用[J].网络新媒体技术,2014,3(6):39-42. 被引量：15
6王山海,景新幸,杨海燕.基于深度学习神经网络的孤立词语音识别的研究[J].计算机应用研究,2015,32(8):2289-2291. 被引量：58
7陈耀丹,王连明.基于卷积神经网络的人脸识别方法[J].东北师大学报（自然科学版）,2016,48(2):70-76. 被引量：51

引证文献2

1戴蓓倩,朱斌,张劲松,王长富,李辉.基于组合神经网络和模糊聚类的话者分类[J].中国科学技术大学学报,1997,27(1):25-30. 被引量：2
2白璐,王连明.基于卷积神经网络的大容量汉语孤立字语音识别方法[J].东北师大学报（自然科学版）,2020,52(2):52-57. 被引量：7

二级引证文献9

1刘建英,徐爱萍.自组织神经网络在模糊聚类中的应用研究[J].微机发展,2005,15(12):81-83. 被引量：7
2徐爱萍,徐武平.基于自组织竞争神经网络技术的模糊聚类研究[J].计算机工程与科学,2006,28(11):119-122. 被引量：4
3赵力瑾,高攀.基于连续隐马尔科夫模型的英语翻译机器人语音识别系统[J].自动化与仪器仪表,2022(6):191-194. 被引量：9
4张添添,王婧.基于At-LSTM模型的音/视频双流语音识别算法仿真[J].计算机仿真,2023,40(1):251-254. 被引量：3
5金豪圣.基于深度学习的智能机器人语音自动校准系统[J].电子设计工程,2023,31(24):95-99. 被引量：1
6肖宜,葛罗,胡凯,严斌俊,邵立政.基于PNCC特征的录音语音自动识别方法[J].自动化技术与应用,2024,43(5):163-167.
7李瑾辉,张国梁,苏杨,朱晓鸿,王鑫.基于深度卷积神经网络的端到端语音识别方法研究[J].自动化技术与应用,2024,43(6):55-59. 被引量：1
8郭敬东,吴飞,何德明,卢伟龙,潘建宏.基于语音识别的智能问答机器人语音交互控制方法[J].微型电脑应用,2024,40(9):65-68.
9岳莉,李柯景,赵剑.改进粒子滤波跟踪的视听双模态语音识别仿真[J].计算机仿真,2024,41(9):213-216.

1李国强,杜利民.语音识别的话者自适应研究[J].电子科技导报,1999(9):21-24.
2黄盈椿,王欢良,冯涛.应用MAP方差估计的话者自适应训练方法[J].计算机工程,2006,32(20):203-204.
3刘国亭,赵瑞云.隐马尔柯夫模型在信号检测中的应用[J].上海交通大学学报,1997,31(4):114-117. 被引量：2
4张锡英,李光琪,张艳秋.隐马尔柯夫模型在话者识别中的应用[J].佳木斯大学学报（自然科学版）,2000,18(1):53-55. 被引量：2
5上官葳,戴蓓蒨.基于话者聚类的多系统输出评分融合话者确认[J].兰州大学学报（自然科学版）,2008,44(3):81-86. 被引量：1
6路迎晨,李兵.一个计算隐马氏模型相似度的改进方法[J].信息与电子工程,2004,2(4):284-286. 被引量：1
7朱扬明.谱分析的谱空间方法[J].电子学报,1994,22(7):48-53.
8吕晓秀,李四信.连续型隐马尔可夫模型(HMM)参数迭代算法[J].安庆师范学院学报（自然科学版）,1997,3(4):36-39.
9叶飞,王翼飞.高阶隐马氏模型研究进展[J].数学进展,2014,43(2):219-231. 被引量：3
10马晓川,刘冬,赵荣椿.孤立短语隐马尔可夫模型自动建模软件的实现[J].西北工业大学学报,1997,15(3):482-486.

中国科学技术大学学报

1996年第2期

浏览历史

内容加载中请稍等...

基于话者分类和HMM的话者自适应语音识别被引量：2

参考文献1

同被引文献7

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于话者分类和HMM的话者自适应语音识别 被引量：2

参考文献1

同被引文献7

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于话者分类和HMM的话者自适应语音识别被引量：2