基于HTK的维吾尔语连续音素识别技术研究

Research on technologies of HTK based Uyghur continuous phoneme recognition

下载PDF

导出

摘要以建立维吾尔语连续音素识别基础平台为目标,在HTK(基于隐马尔可夫模型的工具箱)的基础上,首次研究了其语言相关环节的几项关键技术;结合维吾尔语的语言特征,完成了用于语言模型建立和语音语料库建设的维吾尔语基础文本设计;根据具体技术指标,录制了较大规模语音语料库;确定音素作为基元,训练了维吾尔语声学模型;在基于字母的N-gram语言模型下,得出了从语音句子向字母序列句子的识别结果;统计了维吾尔语32个音素的识别率,给出了容易混淆的音素及其根源分析,为进一步提高识别率奠定了基础。 In this paper, HTK （Hidden Markov model-based Toolkit） based Uyghur continuous phoneme recognition baseline system is presented, and its several language-depended key technologies are addressed. According to the characteristics of Uyghur language, it designs the text corpus for language modeling and speech corpus construction, and records a large-scale speech data for training the phoneme based Uyghur acoustic model. The different recognition rates with different N-gram language models are also given. The statistics of the recognition rates of 32 Uyghur phonemes, the list of the confused phonemes and their possible reasons are analyzed. And then it gives some research directions for further improvements to the baseline system.

作者米日古力.阿布都热素米吉提.阿不力米提艾克白尔.帕塔尔艾斯卡尔.艾木都拉

机构地区新疆大学信息科学与工程学院

出处《计算机工程与应用》 CSCD 2013年第22期150-154,172,共6页 Computer Engineering and Applications

基金国家自然科学基金(No.61163032 No.61065005)

关键词维吾尔语声学模型语言模型维吾尔语音素基于隐马尔可夫模型的工具箱(HTK) Uyghur language acoustic model language model Uyghur phoneme Hidden Markov model-based Toolkit（HTK）

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Ablimit M,Neubig G, Mimura M, et al.Uyghur morpheme-based language models and ASR[C]//IEEE Signal Processing (ICSP) ,2010.
2Ablimit M, Kawahara T, Hamdulla A.Lexicon optimizations for automatic speech recognition based on discriminative learning[C]//Asia-Pacific Signal and Information Processing Association Annual Summit and Conference(APSIPA ASC), Xi' an, China, 2011.
3Ablimit M, Hamdulla A, Kawahara T.Morpheme concatena- tion approach in language modeling for large-vocabulary Uyghur speech recognition[C]//Oriental-COCODA, Taiwan, China, 2011.
4祖丽皮亚.阿曼,艾斯卡尔.艾木都拉,地里木拉提.吐尔逊.维吾尔语三音节词韵律特征声学分析[J].计算机应用,2009,29(7):2032-2034. 被引量：6
5Young S,Evermann G, Gales M, et al.The HTK book for HTK version 3.4[M].Cambridge, UK: Cambridge University Press, 2006.

二级参考文献7

1吴宏伟.突厥语族语言的词重音问题[J].民族语文,1995(5):71-77. 被引量：4
2徐思益,高莉琴.关于维吾尔语的重音、声调问题[J].语言与翻译,1992(3):12-15. 被引量：21
3郑玉玲,鲍怀翘.蒙古语三音节词韵律特征[c]//新世纪的现代语音学——第五届全国现代语音学学术会议论文集.北京:清华大学出版社,2001:84-92.
4BOERSMA P, WEENINK D. Praat: doing phonetics by computer [ EB/OL]. [2008 -09 -23]. http://www, fon. hum. uva. nl/praat/.
5HARNUD H. A Basic Study of Mongolian Prosody[ M]. Helsinki: Publications of University of Helsinki: the Department of Phonetics, 2003.
6呼和.蒙古语词重音问题[J].民族语文,2007(4):58-67. 被引量：10
7帕尔哈提.季兰,魏江.维吾尔语的重音[J].语言与翻译,1985,0(1):53-57. 被引量：9

共引文献5

1艾合买提江.祖农,地理木拉提.吐尔逊,艾斯卡尔.艾木都拉.维吾尔语边音的声学特征分析[J].信息通信,2011,24(2):31-34. 被引量：2
2艾斯卡尔.艾木都拉.从实验语音学角度探析维吾尔语鼻音的声学特征[J].中文信息学报,2012,26(1):110-118. 被引量：3
3Guljamal Mamateli,Askar Hamdulla.Acoustic Analysis and Decision Tree-Based Shifting Hierarchical Approach for Prediction of Uyghur Prosodic Boundary[J].Wuhan University Journal of Natural Sciences,2013,18(4):363-368.
4吐尔逊.卡得.维吾尔语词重音的形式判断[J].语言与翻译,2015(4):38-46.
5古力米热.依玛木,姑丽加玛丽.麦麦提艾力,玛依努尔.阿吾力提甫,艾斯卡尔.艾木都拉.维吾尔语韵律建模[J].清华大学学报（自然科学版）,2017,57(12):1259-1264.

1杨虹倩.用Excel函数快速录入26个英文字母[J].电子乐园,2009(23):17-17.
2胡奇光,钟波.多媒体课件的脚本设计[J].株洲工学院学报,2004,18(2):149-150.
3王伟军.网络信息安全问题的根源分析[J].图书馆杂志,2000,19(4):6-9. 被引量：26
4卢先宁,高泽华,高峰.Web日志挖掘中的会话识别技术研究[J].数据通信,2012(4):19-21.
5江铭虎,朱小燕,袁保宗.一种适应域的汉语N-gram语言模型平滑算法[J].清华大学学报（自然科学版）,1999,39(9):99-102. 被引量：9
6刘雪飞,王申强,吴伯桥,马恒太,文伟平.基于IDS报警信息源的入侵检测[J].计算机应用研究,2007,24(1):161-163. 被引量：2
7姜兰兰.传感器电路中噪声的抑制[J].时代报告（学术版）,2013(2):72-73.
8黄海霞.如何做好PowerPoint的教学文本设计[J].中小企业管理与科技,2010(24):180-180. 被引量：1
9热依曼.吐尔逊,依皮提哈尔.买买提.维吾尔语语音语料库管理软件的研究与实现[J].新疆大学学报（自然科学版）,2011,28(2):242-247. 被引量：7
10努尔麦麦提.尤鲁瓦斯,吾守尔.斯拉木.面向大词汇量的维吾尔语连续语音识别研究[J].计算机工程与应用,2013,49(9):115-119. 被引量：7

计算机工程与应用

2013年第22期

浏览历史

内容加载中请稍等...

基于HTK的维吾尔语连续音素识别技术研究

参考文献5

二级参考文献7

共引文献5

相关作者

相关机构

相关主题

浏览历史