面向大词汇量的维吾尔语连续语音识别研究被引量：7

Research on large vocabulary continuous speech recognition for Uyghur

下载PDF

导出

摘要近年来大词汇量连续语音识别技术得到了迅速的发展,国内外研究机构加大了对汉语和英语语音识别技术的研究,然而,维吾尔语语音识别技术的研究工作最近才起步。建立了面向大词汇量的维吾尔语语音语料库,研究了维吾尔语声学模型和语言模型建模技术、解码技术,进行了面向大词汇量的维吾尔语连续语音识别实验。对维吾尔语大词汇量连续语音识别技术进一步发展中存在的问题进行了讨论。 The technology of Large Vocabulary Continuous Speech Recognition（LVCSR） has developed quickly, and many scientific institutions have reinforced the speech recognition research on the Mandarin Chinese and English. However, the study of Uyghur speech recognition technology has started recently. This paper introduces the research on main aspect of Uyghur LVCSR system, such as construction of Uyghur speech corpus, acoustic and language modeling techniques, decoding techniques, and performed experiments for Uyghur LVCSR. At the end, the issues affecting Uyghur LVCSR system are discussed in detail.

作者努尔麦麦提.尤鲁瓦斯吾守尔.斯拉木

机构地区新疆大学信息科学与工程学院

出处《计算机工程与应用》 CSCD 2013年第9期115-119,共5页 Computer Engineering and Applications

基金国家自然科学基金(No.61063024) 新疆大学联合科研项目(No.XY110122)

关键词维吾尔语语音语料库大词汇识别技术 Uyghur language speech corpus large vocabulary recognition technology

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1Lee K F, Hon H W, Reddy R.An overview of the SPHINX speech recognition system[J].IEEE Trans on Acoustics, Speech and Signal Processing, 1990,38( 1 ) : 35-45.
2王昆仑.维吾尔语音节语音识别与识别基元的研究[J].计算机科学,2003,30(7):182-184. 被引量：7
3陶梅,吾守尔.斯拉木,那斯尔江.吐尔逊.基于HTK的维吾尔语连续语音声学建模[J].中文信息学报,2008,22(5):56-59. 被引量：12
4那斯尔江.吐尔逊,吾守尔.斯拉木.基于隐马尔可夫模型的维吾尔语连续语音识别系统[J].计算机应用,2009,29(7):2009-2011. 被引量：17
5Young S J.Tree-based state tying for high accuracy acoustic modeling[C]//Proc ACL, 1994: 307-312.
6de la Torre A, Segura J C.Non-linear transformations of the feature space for robust speech recognition[C]//Proc 1CASSP, 2002 : 401-404.
7Young S.The HTK book[EB/OL].[2012-03-03].http://htk.eng, cam.ac.uk/.
8Stolcke A.SRILM an extensible language modeling tool- kit[C]//Proc ICSLP2002,2002 : 901-904.

二级参考文献17

1徐波,史晓东,刘群,宗成庆,庞薇,陈振标,杨振东,魏玮,杜金华,陈毅东,刘洋,熊德意,侯宏旭,何中军.2005统计机器翻译研讨班研究报告[J].中文信息学报,2006,20(5):1-9. 被引量：10
2石现峰,张学智,张峰.基于HTK的语音识别系统设计[J].计算机技术与发展,2006,16(10):37-38. 被引量：23
3郑方吴文虎等.CDCPM及其在语音识别中的应用[J].软件学报,1996,7(10):69-75.
4方晓华.现代维语教程(上册，语音篇)[M].乌鲁木齐，新疆师范大学,1987..
5王昆仑樊志锦吐尔洪江等.维吾尔语综合语音数据库系统[A]..哈尔滨工业大学第五届全国人机语音通讯学术会议论文集.NCMMSC-96[C].,1996.366.C.
6BROWN P, COCKE J, PIETRA S, et al. A statistical approach to machine translation[J]. Computational Linguistics, 1990, 16(2):79 -85.
7KOEHN P, OCH F J, MARCU D. Statistical phrase-based translation[ C] // Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language. Morristown, N J: Association for Computational Linguistics, 2003:48 -54.
8OCH F J, NEY H. Discriminative training and maximum entropy models for statistical machine translation[ C]// Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. Morristown, NJ: Association for Computational Linguistics, 2001: 295 - 302.
9STOLKE A. Srilm - An extensible language modeling toolkit [ EB / OL]. [ 2008 - 09 - 20]. http://web, iti. upv. es/-evidal/ students/doct/sht/transp/srlim2p, pdf.
10OCH F J, NEY H, A systematic comparison of various statistical alignment models[ J]. Computational Linguistics, 2003, 29(!) : 19 - 51.

共引文献25

1王昆仑,张贯虹,吐尔洪江.阿布都克力木.维吾尔语元音的声频特性分析和识别[J].中文信息学报,2010,24(2):122-128. 被引量：10
2车士伟,吾守尔.斯拉木.浅谈连续语音识别中的关键技术[J].电脑与信息技术,2010,18(2):6-9. 被引量：1
3伊·达瓦,匂坂芳典,中村哲.语料资源缺乏的连续语音识别方法的研究[J].自动化学报,2010,36(4):550-557. 被引量：9
4彭丽莉,周传斌,田永涛.关于HMM模型算法的一种改进[J].绵阳师范学院学报,2010,29(8):110-112.
5赵剑辉,凌卫新,陈卓铭,何敏聪,欧阳静明.基于模糊多类支持向量机的声母识别方法[J].计算机工程与科学,2011,33(5):160-164. 被引量：2
6热娜古丽.达古提,艾斯卡尔.艾木都拉,地里木拉提.吐尔逊.维吾尔语CVC型音节韵律特征声学分析[J].计算机工程,2011,37(9):193-195. 被引量：2
7木合塔尔.沙地克,李晓,布合力齐姑丽.瓦斯力.维吾尔语广播新闻敏感词检索系统的研究[J].中文信息学报,2011,25(4):3-10. 被引量：1
8薛化建,董兴华,周喜,吐尔洪.吾司曼,李晓.基于子字单元的维吾尔语语音识别研究[J].计算机工程,2011,37(20):208-210. 被引量：5
9木合塔尔.沙地克,李晓,布合力齐姑丽.瓦斯力.维吾尔语广播新闻连续语音敏感词检索系统[J].计算机系统应用,2012,21(3):29-35. 被引量：2
10武晓敏,达瓦·伊德木草,吾守尔·斯拉木.自然语料缺乏的民族语言连续语音识别[J].计算机工程,2012,38(12):129-131. 被引量：2

同被引文献84

1热依曼.吐尔逊,吾守尔.斯拉木,努尔麦麦提.多文种手机混合输入/输出技术及实现[J].计算机工程与科学,2006,28(4):103-104. 被引量：5
2郑方.连续无限制语音流中关键词识别方法研究[D],1997.
3A Hauptmann,H Wactlar.Indexing andSearch of Multimodal Information[A].Proceedings of IEEE International Conference of Acoustics Speech and Signal Processing,Munich,Germany,1997[C]:195-198.
4G J.E Jones,J.T.Foote,K Sparck Jones et al.Video mail retrieval:the Effect of Word Spotting Accuracy on Precision[A].International Conference on Acoustics,Speech,and Signal Processing 1995[C].ICASSP' 95,1995,1(1):309-312P.
5GOOG-411[DB/OL],http://en.wikipedia.org/wiki/ GOOG-411,2008,12.
6Hsin-min Wang.Mandarin Spoken Document Retrieval Based on Syllable Lattice Matching[J].Pattem Recog nition Letters.2000:615-624P.
7L.Mangu,E.Brill,A.Stolcke.Finding Consensus in Speech Recognition:Word Error Minimization and Other Applications of Confusion Networks[J].Computer Speech And Language,2000,14:373-400.
8Ville T.Turunen,Mikko Kurimo.Indexing Confusion Network for Morph-based Spoken document Retrieval[A],Proceedings of the SIGIR[C]//2007:631-638.
9F K Soong,W K Lo,S Nakamura.Generalized Word Posterior Probablity(GWPP) for Measuring Reliability of Recognized Words[A].Proceeding of the SWIM2004,2004:127-128.
10F Wessel,R Schluter,K Macherey et al.Confidence Maesures for Large Vocabulary Continuous Speech Recognition[A].IEEE Transactions on Speech and Audio Processing,2001,9(3):288-298.

引证文献7

1张力文,努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木.维吾尔语语音检索技术研究[J].中文信息学报,2014,28(5):182-186. 被引量：3
2亚尔肯.阿吉,许辉,木合塔尔.霍加.腭裂语音理解度评估方法研究进展[J].中华实用诊断与治疗杂志,2016,30(6):525-527. 被引量：2
3努尔麦麦提.尤鲁瓦斯,张力文,吾守尔.斯拉木.说话人自适应技术在维吾尔语语音识别中的应用研究[J].中文信息学报,2016,30(3):79-84. 被引量：4
4亚尔肯·阿吉,努尔麦麦提·尤鲁瓦斯,许辉,木合塔尔·霍加,白慧子.基于HMM的维吾尔语腭裂患儿语音理解度评估方法[J].电脑知识与技术,2017,13(1):200-203. 被引量：1
5米尔阿迪力江·麦麦提,吾守尔·斯拉木,努尔麦麦提·尤鲁瓦斯,热依曼·吐尔逊,艾尼宛尔·托乎提.基于智能手机的维吾尔语语音控制系统的开发[J].计算机应用与软件,2016,33(6):220-223. 被引量：2
6李云红,王成,王延年.基于混合DBNN-BLSTM模型的大词汇量连续语音识别[J].纺织高校基础科学学报,2018,31(1):103-107. 被引量：9
7贾嘉敏,程振,潘文林,王欣.基于DNN-HMM的佤语语音声学建模[J].计算机时代,2022(8):61-64. 被引量：1

二级引证文献21

1彭炜明,宋继华,王宁.汉语析句的形式化问题[J].中文信息学报,2016,30(3):30-35.
2亚尔肯·阿吉,努尔麦麦提·尤鲁瓦斯,许辉,木合塔尔·霍加,白慧子.基于HMM的维吾尔语腭裂患儿语音理解度评估方法[J].电脑知识与技术,2017,13(1):200-203. 被引量：1
3李如雄.基于语音分析的智能质检系统设计[J].自动化与仪器仪表,2017(6):114-116. 被引量：8
4热合曼.吾拉音,吾守尔.斯拉木,热依曼.吐尔逊,努尔麦麦提.尤鲁瓦斯.基于移动智能设备的汉语学习软件的研究与实现[J].电脑知识与技术（过刊）,2016,22(10X):183-186.
5苏立伟,刘振华,陈海燕.95598电力客服智能质检系统问题语音检出方法研究[J].微型电脑应用,2019,35(8):98-100. 被引量：7
6南措吉,才让卓玛,都格草.基于BLSTM和CTC的藏语语音识别[J].青海师范大学学报（自然科学版）,2019,35(4):26-33. 被引量：2
7全龙翔,阿不力克木·吾甫尔,马超,武江波.基于上下文敏感区块的模糊语音准确识别方法[J].电子设计工程,2020,28(1):32-35.
8杨志杰,张梅,李冠龙,黄昌达.基于长短时记忆元的语音智能识别系统设计[J].电子设计工程,2020,28(1):55-58. 被引量：4
9娄英丹,徐静林,黄丽霞,张雪英.MLLR和MAP在远场噪声混响下的语音识别研究[J].计算机工程与应用,2020,56(10):122-126. 被引量：7
10马仕瑛.基于语音识别技术的维蒙藏语音产品开发及应用[J].计算机时代,2020,0(5):27-29. 被引量：1

1陆国丽,王小华,王荣波.最大词重降维算法与模拟退火算法相结合的文本聚类方法研究[J].现代图书情报技术,2008(12):43-47. 被引量：2
2桑农,张涛,李斌,吴翔.基于字典学习的背景建模[J].华中科技大学学报（自然科学版）,2013,41(9):28-31. 被引量：2
3热依曼.吐尔逊,依皮提哈尔.买买提.维吾尔语语音语料库管理软件的研究与实现[J].新疆大学学报（自然科学版）,2011,28(2):242-247. 被引量：7
4努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木,热依曼.吐尔逊.维吾尔语大词汇语音识别系统识别单元研究[J].北京大学学报（自然科学版）,2014,50(1):149-152. 被引量：4
5章森,刘磊,刁麓弘.大规模语音语料库及其在TTS中应用的几个问题[J].计算机学报,2010,33(4):687-696. 被引量：12
6努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木,热依曼.吐尔逊.基于音节的维吾尔语大词汇连续语音识别系统[J].清华大学学报（自然科学版）,2013,53(6):741-744. 被引量：5
7肉克艳木.买买提,热依曼.吐尔逊,吾守尔.斯拉木.维吾尔语语音标注复查软件的研究与实现[J].新疆大学学报（自然科学版）,2013,30(1):87-90. 被引量：2
8袁家宏.大规模语音语料库的采集、处理和研究[J].语言学研究,2017(1):34-42. 被引量：5
9刘芳芳,王晶,沈奇威.一种引入动态词库更新的中文分词架构[J].计算机系统应用,2013,22(3):100-103. 被引量：2
10颜龙,刘刚,郭军.基于小波分析的大词汇汉语连续语音识别系统鲁棒性的研究[J].中文信息学报,2006,20(2):60-65. 被引量：6

计算机工程与应用

2013年第9期

浏览历史

内容加载中请稍等...

面向大词汇量的维吾尔语连续语音识别研究被引量：7

参考文献8

二级参考文献17

共引文献25

同被引文献84

引证文献7

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

面向大词汇量的维吾尔语连续语音识别研究 被引量：7

参考文献8

二级参考文献17

共引文献25

同被引文献84

引证文献7

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

面向大词汇量的维吾尔语连续语音识别研究被引量：7