说话人自适应技术在维吾尔语语音识别中的应用研究被引量：4

Speaker Adaptation Technology in Uyghur Continuous Speech Recognition

下载PDF

导出

摘要该文针对维吾尔语说话人之间的发音差异会在一定程度上影响维吾尔语语音识别系统的性能这一情况研究了说话人自适应技术,将目前较为常用的MLLR和MAP以及MLLR和MAP相结合的自适应方法应用于维吾尔语连续语音识别的声学模型训练中,并用这三种方法自适应后的声学模型分别在测试集上进行识别实验。实验结果表明MLLR、MAP以及MAP+MLLR自适应方法使基线识别系统的单词错误识别率分别降低了0.6%、2.34%和2.57%。 Researches show that pronunciation differences between the speakers can cause serious effects on the Uy- ghur speech recognition system. Focused on the speaker adaptation technology,this paper applies MLLR, MAP and MLLR＋ MAP methods to the training of acoustic models of Uyghur Continuous Speech Recognition system. Exper- imental results show that with the three speaker adaptation methods,the word error rate is reduced by 0. 6%,2. 34% and 2.57%, respectively.

作者努尔麦麦提.尤鲁瓦斯张力文吾守尔.斯拉木

机构地区新疆大学信息科学与工程学院

出处《中文信息学报》 CSCD 北大核心 2016年第3期79-84,共6页 Journal of Chinese Information Processing

基金国家自然科学基金(61363064) 新疆维吾尔自治区科技计划项目(201312104) 清华大学腾讯科技有限公司互联网创新技术联合实验室创新课题(2012-04)

关键词维吾尔语语音识别说话人自适应 MLLR MAP Uyghur speech recognition speaker adaptation MLLR MAP

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木.面向大词汇量的维吾尔语连续语音识别研究[J].计算机工程与应用,2013,49(9):115-119. 被引量：7
2那斯尔江.吐尔逊,吾守尔.斯拉木.基于隐马尔可夫模型的维吾尔语连续语音识别系统[J].计算机应用,2009,29(7):2009-2011. 被引量：17
3C HLee,C HLin,B HJuang. A study on speaker adaptation of the parameters of continuous density hidden Markov models[J]. IEEE Trans.on Acoustic and Speech Signal Processing.1991,39 (4): 806-814.
4C J Leggetter. Improved acoustic modeling for HMMs using linear transformations[D]. Cambridge University,1995.
5李虎生,刘加,刘润生.语音识别说话人自适应研究现状及发展趋势[J].电子学报,2003,31(1):103-108. 被引量：32
6罗骏,欧智坚,王作英.说话人自适应训练方法在连续语音识别中的应用[J].中文信息学报,2004,18(3):61-65. 被引量：1
7C J Leggetter,P C Woodland.Maximum likelihood linear regression for speaker adaptation of continuous density hidden Markov models[J].Computer Speech and Language,1995,9 (2): 171-185.
8J L Gauvain,C HLee.Maximum a posteriori estimation for multivariate Gaussian observations[J]. IEEE Trans. on Speech and Audio Processing,1994,2 (2): 291-298.
9de la Torre A,Segura J C.Non-linear transformations of the feature space for robust speech recognition[C]//Proceedings of the ICASSP,2002: 401-404.
10Steve Young,etc.The HTK Book(for HTK Version 3.4)[R].Cambridge University Engineering Department.2006,12.

二级参考文献23

1徐波,史晓东,刘群,宗成庆,庞薇,陈振标,杨振东,魏玮,杜金华,陈毅东,刘洋,熊德意,侯宏旭,何中军.2005统计机器翻译研讨班研究报告[J].中文信息学报,2006,20(5):1-9. 被引量：10
2张昊天.[D].北京:清华大学电子工程系,2000.
3BROWN P, COCKE J, PIETRA S, et al. A statistical approach to machine translation[J]. Computational Linguistics, 1990, 16(2):79 -85.
4KOEHN P, OCH F J, MARCU D. Statistical phrase-based translation[ C] // Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language. Morristown, N J: Association for Computational Linguistics, 2003:48 -54.
5OCH F J, NEY H. Discriminative training and maximum entropy models for statistical machine translation[ C]// Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. Morristown, NJ: Association for Computational Linguistics, 2001: 295 - 302.
6STOLKE A. Srilm - An extensible language modeling toolkit [ EB / OL]. [ 2008 - 09 - 20]. http://web, iti. upv. es/-evidal/ students/doct/sht/transp/srlim2p, pdf.
7OCH F J, NEY H, A systematic comparison of various statistical alignment models[ J]. Computational Linguistics, 2003, 29(!) : 19 - 51.
8KOEHN P. Pharaoh: a beam search decoder for phrase-based statistical machine translation models[ EB/OL]. [ 2008 - 08 - 20]. http://www, iccs. inf. ed. ac. uk/- pkoehn/publications/pharaoh - amta2004, ps.
9Lee C-H,Lin C-H,Juang B-H.A Study on Speaker Adaptation of the Parameters of Continuous Density Hidden Markov Models [J].IEEE TRANSACTIONS ON SIGNAL PROCESSING,1991,39(4):806-814.
10M.J.F.Gales.Maximum likelihood linear transformations for HMM-based speech recognition [J].Computer Speech and Language,1998,Volume 12.

共引文献51

1杨吉斌,邢艳玲,曹铁勇,张雄伟.基于Mellin变换和Mel频率分析的非特定人语音识别特征研究[J].模式识别与人工智能,2005,18(3):350-353. 被引量：2
2李财莲,赵小阳,王丽娟,岳振军.说话人识别中关键技术的现状与发展[J].军事通信技术,2005,26(2):62-65. 被引量：3
3蔡铁,朱杰.基于支持说话人权重的快速说话人自适应算法[J].上海交通大学学报,2005,39(12):1997-2001.
4徐向华,朱杰,郭强.决策树结构对说话人自适应影响的研究[J].声学学报,2006,31(1):42-47. 被引量：3
5黄盈椿,王欢良,冯涛.应用MAP方差估计的话者自适应训练方法[J].计算机工程,2006,32(20):203-204.
6倪建克,曾虹,张翔.基于最大均值似然判决规则的说话人辨认研究[J].杭州电子科技大学学报（自然科学版）,2006,26(5):96-99.
7申朝文,何家峰,蔡继祖.说话人识别技术的方法与展望[J].中国科技信息,2007(4):269-270.
8朱浩冰,郭东辉.声纹识别系统原理及其关键技术[J].计算机安全,2007(9):14-17. 被引量：15
9武永星,郑海,周波,杨常青,李茂林.基于距离和相关性准则的混合参数说话人识别[J].系统仿真学报,2008,20(4):926-930.
10雷建军,杨震,刘刚,郭军.噪声鲁棒语音识别研究综述[J].计算机应用研究,2009,26(4):1210-1216. 被引量：13

同被引文献35

1胡明扬.现代汉语语法的开创性著作——《新著国语文法》的再认识和再评价[J].语言科学,2002,1(1):92-101. 被引量：17
2丁信善.试论拉波夫的社会语言学观及其方法论[J].外国语,1999,22(2):1-9. 被引量：10
3鲍怀翘,阿西木.维吾尔语元音声学初步分析[J].民族语文,1988(5):4-13. 被引量：22
4木哈拜提·哈斯木.现代维吾尔语方言词拾零[J].民族语文,2005(5):69-73. 被引量：2
5胡明扬. 当代语言学[J]. 广播电视大学学报(哲学社会科学版),2000,(04): 72-77.
6詹卫东. 现代汉语树库标注常见问题举例[EB/OL]. 2009-07-30. http: //ccl.pku.edu.cn/doubtfire/Projects/Treebank_spec1.0_appendix.pdf.
7邱立坤. 多视图汉语树库构建的理论研究与实践[R]. 北京: 北京大学博士后研究工作报告,2012.
8朱德熙. 语法分折和语法体系[C] // 《中国语文》杂志社. 汉语析句方法讨论集. 上海: 上海教育出版社,1984: 205-215.
9Jing He,Weiming Peng,Jihua Song,and Hongzhang Liu. Annotation Schema for Contemporary Chinese Based on JinXi Li’s Grammar System.[C]//Proceedings of The 14th Chinese Lexical Semantics Workshop (CLSW2013),LNAI,Volume 8229,Springer,2013: 668-681.
10牛汝极.现代维吾尔语方言土语的划分与历史人文地理[J].语言与翻译,1997,0(2):13-14. 被引量：9

引证文献4

1彭炜明,宋继华,王宁.汉语析句的形式化问题[J].中文信息学报,2016,30(3):30-35.
2全龙翔,阿不力克木·吾甫尔,马超,武江波.基于上下文敏感区块的模糊语音准确识别方法[J].电子设计工程,2020,28(1):32-35.
3娄英丹,徐静林,黄丽霞,张雪英.MLLR和MAP在远场噪声混响下的语音识别研究[J].计算机工程与应用,2020,56(10):122-126. 被引量：7
4姜玉璞,赵澄东.基于音素的方言识别方法[J].大众标准化,2021(3):67-69.

二级引证文献7

1赵霞.噪声环境下的语音识别算法研究[J].电脑知识与技术,2019,15(10):224-225.
2黄友鹏.关于人工智能中远场语音识别技术的探究[J].科学大众（科技创新）,2021(6):111-111.
3张开生,赵小芬.复杂环境下基于自适应深度神经网络的鲁棒语音识别[J].计算机工程与科学,2022,44(6):1105-1113. 被引量：8
4赵力瑾,高攀.基于连续隐马尔科夫模型的英语翻译机器人语音识别系统[J].自动化与仪器仪表,2022(6):191-194. 被引量：9
5郁小强,田毅帅,韩磊,王忠军,李寿荣.语音识别技术在配电网工程建设中的应用[J].信息技术,2023,47(8):65-69. 被引量：1
6董胡.基于嵌入式平台与DNN-HMM的中文儿童语音能力评估研究[J].办公自动化,2024,29(4):84-86.
7相增辉,张国梁,庞渊源,陈鑫,王鑫.基于深度卷积神经网络的智能机器人语音自动识别方法[J].自动化技术与应用,2024,43(4):43-46. 被引量：1

1钱洪伟,贺苏宁.说话人模型参数自适应技术研究[J].电信技术研究,2008(5):16-22.
2丰洪才,卢正鼎.基于MAP和MLLR的综合渐进自适应方法研究[J].计算机工程,2005,31(5):4-7. 被引量：3
3徐向华,朱杰,郭强.决策树结构对说话人自适应影响的研究[J].声学学报,2006,31(1):42-47. 被引量：3
4罗骏,欧智坚,王作英.说话人自适应训练方法在连续语音识别中的应用[J].中文信息学报,2004,18(3):61-65. 被引量：1
5陈雷,杨俊安,王一,王龙.LVCSR系统中一种基于区分性和自适应瓶颈深度置信网络的特征提取方法[J].信号处理,2015,31(3):290-298. 被引量：9
6王守觉,曲延锋,李卫军,覃鸿.基于仿生模式识别与传统模式识别的人脸识别效果比较研究[J].电子学报,2004,32(7):1057-1061. 被引量：46
7蒋泰,张林军.语音识别自适应算法在智能家居中的应用[J].计算机系统应用,2017,26(3):150-155. 被引量：3
8丁国宏,徐波.基于三对角和共享分块对角转换矩阵的快速说话人自适应方法[J].电子学报,2004,32(10):1709-1712.
9丰洪才,卢正鼎.基于置信度的无监督说话人自适应语音识别[J].计算机工程与科学,2005,27(9):93-96. 被引量：1
10宋寅,梁维谦.Experimental Study of Discriminative Adaptive Training and MLLR for Automatic Pronunciation Evaluation[J].Tsinghua Science and Technology,2011,16(2):189-193. 被引量：3

中文信息学报

2016年第3期

浏览历史

内容加载中请稍等...

说话人自适应技术在维吾尔语语音识别中的应用研究被引量：4

参考文献13

二级参考文献23

共引文献51

同被引文献35

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

说话人自适应技术在维吾尔语语音识别中的应用研究 被引量：4

参考文献13

二级参考文献23

共引文献51

同被引文献35

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

说话人自适应技术在维吾尔语语音识别中的应用研究被引量：4