基于最大似然线性回归的随机段模型说话人自适应研究

Research of speaker adaptation of stochastic segment models using maximum likelihood linear regression

下载PDF

导出

摘要提出了一种随机段模型系统的说话人自适应方法。根据随机段模型的模型特性,将最大似然线性回归方法引入到随机段模型系统中。在"863-test"测试集上进行的汉语连续语音识别实验显示,在不同的解码速度下,说话人自适应后汉字错误率均有明显的下降。实验结果表明,最大似然线性回归方法在随机段模型系统中同样能取得较好的效果。 A speaker adaptation method of Stochastic Segment Model （SSM） is proposed.According to the SSM＇s characteristics,the theory of Maximum Likelihood Linear Regression （MLLR） method is introduced into the SSM-based systems.Continuous Chinese speech recognition experiment on ＂ 863test＂ test suite shows that the proposed method makes the error rate of Chinese characters decrease obvi ously under different decoding speeds.Experiment results indicate that the proposal can also improve the recognition performance on the SSM-based systems.

作者晁浩杨占磊刘文举

机构地区河南理工大学计算机科学与技术学院中国科学院自动化研究所模式识别国家重点实验室

出处《计算机工程与科学》 CSCD 北大核心 2014年第8期1604-1608,共5页 Computer Engineering & Science

基金国家自然科学基金资助项目(91120303 90820303 90820011) 国家973计划资助项目(2004CB318105) 国家863计划资助项目(20060101Z4073 2006AA01Z194)

关键词语音识别说话人自适应最大似然线性回归随机段模型 speech recognition speaker adaptation maximum likelihood linear regression stochastic segment model

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1唐赟,刘文举,徐波.基于后验概率解码段模型的汉语语音数字串识别[J].计算机学报,2006,29(4):635-641. 被引量：12
2罗骏,欧智坚,王作英.基于相关子空间本征音分析的MAP快速自适应[J].清华大学学报（自然科学版）,2004,44(6):829-832. 被引量：2
3李虎生,刘加,刘润生.语音识别说话人自适应研究现状及发展趋势[J].电子学报,2003,31(1):103-108. 被引量：32

二级参考文献26

1张昊天.[D].北京:清华大学电子工程系,2000.
2Chengalvarayan R,LI Deng.A maximum a posteriori approach to speaker adaptation using the trended hidden Markov model [J].IEEE Trans on Speech and Audio Processing,2001,9(5):549-557.
3Lee C-H,Lin C-H,Juang B-H.Speaker adaptation of continuous density HMM's using linear regression [A].Proc 3rd Int Conf on Spoken Language Processing (ICSLP'94) [C].Yokohama:IEEE Press,1994.451-454.
4Kuhn R,Junqua J-C,Nguyen P,et al.Rapid speaker adaptation in eigenvoice space [J].IEEE Trans on Speech and Audio Processing,2000,8(6):695-707.
5Botterweck H.Very fast adaptation for large vocabulary continuous speech recognition using eigenvoices [A].Proc 6th Int Conf on Spoken Language Processing (ICSLP'00) [C].Piscataway,NJ,USA:IEEE Press,2000.354-357.
6Jolliffe I T.Principal Component Analysis [M].Berlin:Springer-Verlag,1986.
7CHEN Kuan-ting,LIAU Wen-wei,WANG Hsin-min,et al.Fast speaker adaptation using eigenspace-based maximum likelihood linear regression [A].Proc 6th Int Conf on Spoken Language Processing (ICSLP'00) [C].Piscataway,NJ,USA:IEEE Press,2000.742-745.
8Lee C-H,Lin C-H,Juang B-H.A study on speaker adaptation of the parameters of continuous density hidden Markov models [J].IEEE Trans on Signal Processing,1991,39(4):806-814.
9Dugakakis V.V,Ostendorf M,Rohlicek J.R..Fast algorithms for phone classification and recognition using segment-based models.IEEE Transactions Speech Audio Processing,1992,40(12):2885～2896
10Lee C,Glass R..Real-time probabilistic segmentation for segment-based speech recognition.In:Proceedings of the International Conference on Spoken Language Processing,Sydney,Australia,1998,1803～1806

共引文献43

1杨吉斌,邢艳玲,曹铁勇,张雄伟.基于Mellin变换和Mel频率分析的非特定人语音识别特征研究[J].模式识别与人工智能,2005,18(3):350-353. 被引量：2
2李财莲,赵小阳,王丽娟,岳振军.说话人识别中关键技术的现状与发展[J].军事通信技术,2005,26(2):62-65. 被引量：3
3蔡铁,朱杰.基于支持说话人权重的快速说话人自适应算法[J].上海交通大学学报,2005,39(12):1997-2001.
4徐向华,朱杰,郭强.决策树结构对说话人自适应影响的研究[J].声学学报,2006,31(1):42-47. 被引量：3
5李生,赵铁军.Chinese Information Processing and Its Prospects[J].Journal of Computer Science & Technology,2006,21(5):838-846. 被引量：1
6黄盈椿,王欢良,冯涛.应用MAP方差估计的话者自适应训练方法[J].计算机工程,2006,32(20):203-204.
7倪建克,曾虹,张翔.基于最大均值似然判决规则的说话人辨认研究[J].杭州电子科技大学学报（自然科学版）,2006,26(5):96-99.
8申朝文,何家峰,蔡继祖.说话人识别技术的方法与展望[J].中国科技信息,2007(4):269-270.
9王晶莹,王作英.利用隐空间投影算法的模型自适应方法[J].清华大学学报（自然科学版）,2007,47(7):1159-1161.
10朱浩冰,郭东辉.声纹识别系统原理及其关键技术[J].计算机安全,2007(9):14-17. 被引量：15

1王晶莹,王作英.利用隐空间投影算法的模型自适应方法[J].清华大学学报（自然科学版）,2007,47(7):1159-1161.
2晁浩,宋成,薛霄,刘志中.基于模型自适应的声效鲁棒性语音识别算法[J].计算机工程与应用,2016,52(2):156-160. 被引量：1
3张文林,张卫强,刘加,李弼程,屈丹.一种新的基于子空间的说话人自适应方法[J].自动化学报,2011,37(12):1495-1502. 被引量：3
4丰洪才,卢正鼎.基于MAP和MLLR的综合渐进自适应方法研究[J].计算机工程,2005,31(5):4-7. 被引量：3
5尉洪,杨鉴,普园媛.非母语语音识别中的说话人自适应方法[J].计算机工程与应用,2004,40(7):56-57.
6张爱英,倪崇嘉.基于音频事件检测和分类的音频监控系统背景模型自适应方法研究[J].计算机科学,2016,43(9):310-314. 被引量：1
7丁国宏,徐波.基于三对角和共享分块对角转换矩阵的快速说话人自适应方法[J].电子学报,2004,32(10):1709-1712.
8钱洪伟,贺苏宁.说话人模型参数自适应技术研究[J].电信技术研究,2008(5):16-22.
9张文林,张连海,牛铜,屈丹,李弼程.基于正则化的本征音说话人自适应方法[J].自动化学报,2012,38(12):1950-1957. 被引量：9
10丰洪才,卢正鼎.基于置信度的无监督说话人自适应语音识别[J].计算机工程与科学,2005,27(9):93-96. 被引量：1

计算机工程与科学

2014年第8期

浏览历史

内容加载中请稍等...

基于最大似然线性回归的随机段模型说话人自适应研究

参考文献3

二级参考文献26

共引文献43

相关作者

相关机构

相关主题

浏览历史